JP2011091859A - Video recording apparatus, video recording method, video and audio recording apparatus, and video and audio recording method - Google Patents

Video recording apparatus, video recording method, video and audio recording apparatus, and video and audio recording method Download PDF

Info

Publication number
JP2011091859A
JP2011091859A JP2011006173A JP2011006173A JP2011091859A JP 2011091859 A JP2011091859 A JP 2011091859A JP 2011006173 A JP2011006173 A JP 2011006173A JP 2011006173 A JP2011006173 A JP 2011006173A JP 2011091859 A JP2011091859 A JP 2011091859A
Authority
JP
Japan
Prior art keywords
recording
video
scene change
broadcast section
stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011006173A
Other languages
Japanese (ja)
Other versions
JP5036882B2 (en
Inventor
Yoshiaki Kusunoki
恵明 楠
Isao Otsuka
功 大塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2011006173A priority Critical patent/JP5036882B2/en
Publication of JP2011091859A publication Critical patent/JP2011091859A/en
Application granted granted Critical
Publication of JP5036882B2 publication Critical patent/JP5036882B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a video recording apparatus, video recording method, video and audio recording apparatus, and video and audio recording method in which scene changes in video images can be extracted, in parallel with the recording of video images. <P>SOLUTION: The video recording apparatus includes: an encoder 101; an HDD 105; a stream control section 103 for controlling transfer of an encoded stream to the HDD 105; a scene change extracting section 110 for extracting scene changes in video data for each encoded unit of the encoded stream for the encoded stream controlled by the stream control section 103; and a recording control section 102 for acquiring an encoding completion notice for each encoded unit of the encoded stream from the encoder 101, and outputting a scene change extraction instruction to the scene change extraction section 101, when encoding completion notice is acquired. The scene change extracting section 110 is provided with a decoding unit. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、映像の記録と並行して映像のシーンチェンジを検出することができる映像記録装置、及びこの映像記録装置によって実施されるシーンチェンジ抽出方法に関するものである。また、本発明は、テレビジョン放送番組の録画と並行して、録画されるテレビジョン放送番組の本編の間に挟まれているコマーシャルメッセージ(Commercial Message)放送の検出を行うことができる映像音声記録装置に関するものである。   The present invention relates to a video recording apparatus capable of detecting a video scene change in parallel with video recording, and a scene change extraction method implemented by the video recording apparatus. Further, the present invention is a video / audio recording capable of detecting a commercial message broadcast sandwiched between the main parts of a recorded television broadcast program in parallel with the recording of the television broadcast program. It relates to the device.

従来、映像を符号化して記録する映像記録装置において、記録した映像から希望する映像シーンを探し出すためには、早送り又は巻戻しなどの特殊再生を利用しながら、人間の目で該当するシーンを探し出しており、非常に多くの時間と労力を費やす必要があった。   Conventionally, in a video recording apparatus that encodes and records a video, in order to search for a desired video scene from the recorded video, a corresponding scene is searched for by the human eye using special playback such as fast-forward or rewind. And had to spend a great deal of time and effort.

このような問題を解消するために、映像の場面転換シーン(以後「シーンチェンジ」と言う。)を見つけるための方法が提案されてきた(例えば、特許文献1及び2参照)。特許文献1には、符号化を行うエンコーダの前段のプリ映像信号処理装置において、時間的に前後する2つの映像のヒストグラムの差の絶対値を算出し、算出された絶対値が所定の閾値を超えた場合にシーンチェンジであると判定する方法が示されている。また、特許文献2には、既にHDDなどのストレージメディアに蓄積された映像データを読み出してシーンチェンジを抽出する方法が示されている。   In order to solve such a problem, a method for finding a scene change scene (hereinafter referred to as “scene change”) of a video has been proposed (for example, see Patent Documents 1 and 2). In Patent Document 1, in the pre-video signal processing apparatus in the preceding stage of the encoder that performs the encoding, the absolute value of the difference between the histograms of two videos that are temporally mixed is calculated, and the calculated absolute value has a predetermined threshold value. A method for determining that a scene change has occurred is shown. Japanese Patent Application Laid-Open No. 2004-228688 discloses a method for reading out video data already stored in a storage medium such as an HDD and extracting a scene change.

また、テレビジョン放送は、その内容から「番組本編放送」と「コマーシャルメッセージ放送」に分類することができる。番組本編放送は、映画番組の場合には映画の内容自体の映像音声データに基づく放送部分である。一方、コマーシャルメッセージ放送は、広告主や広告代理店などの依頼主が放送局と契約を結んで、依頼主から提供を受けた映像音声データに基づく放送部分であり、番組本編放送の合間に放送されるものである。また、コマーシャルメッセージ放送には、放送局が自らの広告宣伝をするための放送も含まれる。本出願においては、「番組本編放送」を「番組本編」と、「コマーシャルメッセージ放送」を「CM放送」とも記す。番組本編とCM放送とは、内容の関連が希薄である場合が多く、番組本編の視聴に集中したい視聴者にとっては、テレビジョン放送を録画する際又は視聴する際に、CM放送を効率よく削除したい、又は見飛ばしたい、とする要望がある。   Also, television broadcasts can be classified into “main program broadcast” and “commercial message broadcast” based on the contents. In the case of a movie program, the main program broadcast is a broadcast part based on video / audio data of the content of the movie itself. On the other hand, commercial message broadcasting is a broadcast part based on video and audio data provided by a client who has a contract with a broadcaster, such as an advertiser or an advertising agency, and is broadcast between the main program broadcasts. It is what is done. The commercial message broadcast also includes a broadcast for a broadcasting station to advertise itself. In the present application, “program main broadcast” is also referred to as “program main broadcast”, and “commercial message broadcast” is also referred to as “CM broadcast”. The relationship between the main part of the program and the CM broadcast is often sparse, and for viewers who want to concentrate on watching the main part of the program, the CM broadcast is efficiently deleted when recording or viewing the television broadcast. There is a demand to do or want to overlook.

従来の映像音声記録装置は、テレビジョン放送の音声方式を検出し、検出された音声方式に基づいて番組本編とCM放送との識別を行っていた。番組本編の音声方式は、モノラル音声又は二ヶ国語音声(洋画における日本語と英語、など)であることが多く、また、一般に、CM放送の音声方式は、ステレオ音声であることが多い。このような違いを利用して、ステレオ音声が検出された区間をCM放送区間と判別して、録画時にはCM放送区間の録画を行わない(すなわち、削除する)、又は、視聴時にはCM放送区間を見飛ばす(すなわち、スキップする)処理を行うようにしていた。   The conventional video / audio recording apparatus detects the audio system of television broadcasting, and identifies the main program and the CM broadcast based on the detected audio system. The audio system of the main part of the program is often monaural audio or bilingual audio (Japanese and English in a Western movie, etc.). In general, the audio system of CM broadcasting is often stereo audio. By utilizing such a difference, a section in which stereo audio is detected is determined as a CM broadcast section, and the CM broadcast section is not recorded (that is, deleted) at the time of recording, or the CM broadcast section is set at the time of viewing. The process of skipping (that is, skipping) was performed.

上記従来のCM検出方式は、番組本編の音声方式がCM放送の音声方式と同じステレオ音声である場合には、機能しなくなる。この改善策として、番組本編とCM放送との境界に挿入される「ブラック・フレーム」と呼ばれる全画面黒色のフレーム映像を検出してCM放送区間を特定する提案がある(例えば、特許文献3参照。)。また、番組本編とCM放送との境界に生じる無音区間を検出し、検出された無音区間の出現間隔からCM放送区間を特定する提案もある(例えば、特許文献4参照。)。また、映像のシーンチェンジの発生頻度を利用してCM放送を抽出する提案もある(特許文献5参照)。さらに、視聴時に、ユーザーのボタン操作によって、15秒などの固定時間を見飛ばし(すなわち、スキップ)するユーザーインターフェースを提供する提案もある。   The above-described conventional CM detection method does not function when the audio system of the main program is the same stereo sound as the audio system of the CM broadcast. As an improvement measure, there is a proposal for specifying a CM broadcast section by detecting a full-screen black frame image called “black frame” inserted at the boundary between the main program and the CM broadcast (see, for example, Patent Document 3). .) There is also a proposal for detecting a silent section that occurs at the boundary between the main program and the CM broadcast, and specifying the CM broadcast section from the appearance interval of the detected silent section (see, for example, Patent Document 4). There is also a proposal for extracting CM broadcasts using the frequency of occurrence of scene changes (see Patent Document 5). In addition, there is also a proposal for providing a user interface that skips (ie, skips) a fixed time such as 15 seconds by the user's button operation during viewing.

特開2004−282318号公報(第7頁、図2)JP 2004-282318 A (Page 7, FIG. 2) 特開2002−064823号公報(第5頁、図1)JP 2002-064823 A (5th page, FIG. 1) 特表平8−507633号公報(第12−15頁、図1)JP-T 8-507633 (pages 12-15, FIG. 1) 特開2003−47031号公報(第5−8頁、図1)Japanese Patent Laying-Open No. 2003-47031 (page 5-8, FIG. 1) 特開2000−165796号公報(第7頁、図14)Japanese Patent Laying-Open No. 2000-16596 (page 7, FIG. 14)

しかしながら、特許文献1に示される方法は、エンコーダの前段に設けられたプリ映像信号処理装置によってシーンチェンジを検出する方法であるので、ビデオエンコーダからエンコーダまでの構成が一体になっているエンコーダチップセットであってシーンチェンジ抽出結果を外部に出力しないものを備えた映像記録装置には適用することができなかった。また、エンコーダチップセットがシーンチェンジ抽出結果を出力する場合においても、使用するエンコーダチップセットの種類が変わる毎にシーンチェンジ抽出結果が変わってしまうので、エンコーダチップセットの種類が変わる毎に映像記録装置における調整が必要になるという問題があった。   However, since the method disclosed in Patent Document 1 is a method of detecting a scene change by a pre-video signal processing device provided in the previous stage of the encoder, an encoder chip set in which the configuration from the video encoder to the encoder is integrated. However, it could not be applied to a video recording apparatus equipped with a scene change extraction result that is not output to the outside. Even when the encoder chip set outputs a scene change extraction result, the scene change extraction result changes every time the type of encoder chip set to be used changes. There was a problem that adjustments were required.

また、特許文献2に示される方法は、既に圧縮されHDD上に記録された映像ストリームからシーンチェンジを検出する方法であるので、記録処理が完了した後に、オフラインで多大な時間のかかる処理を行う必要があり、実用的ではなかった。   The method disclosed in Patent Document 2 is a method for detecting a scene change from a video stream that has already been compressed and recorded on an HDD. Therefore, after the recording process is completed, a long time-consuming process is performed offline. It was necessary and not practical.

また、ブラック・フレームを検出してCM放送区間を特定する特許文献3に記載の方法では、国や地域、又は放送局によってはブラック・フレームが挿入されていないことがあるので(実際に、国内放送において、ブラック・フレームの挿入は法令で義務付けられてはいない)、CM放送区間の自動検出の確度を十分に高くできないという問題がある。   Further, in the method described in Patent Document 3 for detecting a black frame and specifying a CM broadcast section, a black frame may not be inserted depending on the country, region, or broadcasting station (in fact, domestic In broadcasting, the insertion of black frames is not required by law), and there is a problem that the accuracy of automatic detection of CM broadcast sections cannot be made sufficiently high.

また、特許文献4又は5に記載の方法では、無音区間やシーンチェンジが番組本編の中にも多数存在するので、CM放送区間を高精度に特定することは困難であるという問題がある。   Further, the method described in Patent Document 4 or 5 has a problem that it is difficult to specify the CM broadcast section with high accuracy because there are many silent sections and scene changes in the main program.

さらに、ユーザーのボタン操作によって15秒スキップさせる方法では、15秒の倍数系列にない既定外の時間長(例えば、5秒の番組スポット宣伝など)を持つCM放送には対応することができないという問題がある。   Furthermore, the method of skipping 15 seconds by the user's button operation cannot cope with CM broadcasting having a non-default time length (for example, a program spot advertisement of 5 seconds) that is not in a multiple of 15 seconds. There is.

そこで、本発明は、上記従来技術の課題を解決するためになされたものであり、その目的は、映像の記録と並行して映像のシーンチェンジ抽出を行うことができる映像記録装置及びこの映像記録装置において実施されるシーンチェンジ抽出方法を提供することである。また、本発明の他の目的は、テレビジョン放送番組の記録と並行して、CM放送区間の抽出を可能とする映像音声記録装置を提供することである。   Accordingly, the present invention has been made to solve the above-described problems of the prior art, and an object of the present invention is to provide a video recording apparatus capable of extracting a scene change of a video in parallel with video recording, and the video recording To provide a scene change extraction method implemented in an apparatus. Another object of the present invention is to provide a video / audio recording apparatus capable of extracting a CM broadcast section in parallel with the recording of a television broadcast program.

本発明の映像記録装置は、映像データを符号化して符号化ストリームを出力する符号化手段と、前記記録手段に対する符号化ストリームの転送を制御するストリーム制御手段と、前記ストリーム制御手段が制御する符号化ストリームに対して、該符号化ストリームの符号化単位毎に映像データのシーンチェンジを抽出する映像変化点抽出手段と、前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに前記映像変化点抽出手段に対するシーンチェンジ抽出指示を出力する録画制御手段とを有し、前記映像変化点抽出手段は、符号化ストリームを復号化する復号化手段を有することを特徴とするものである。   The video recording apparatus of the present invention includes an encoding unit that encodes video data and outputs an encoded stream, a stream control unit that controls transfer of the encoded stream to the recording unit, and a code controlled by the stream control unit A video change point extracting means for extracting a scene change of the video data for each coding unit of the coded stream, and a coding completion notification for each coding unit of the coded stream from the coding means. And a recording control unit that outputs a scene change extraction instruction to the video change point extraction unit when the encoding completion notification is acquired. The video change point extraction unit decodes the encoded stream. It has a decoding means.

本発明の映像音声記録装置は、映像及び音声の符号化ストリームを記録する記録手段と、前記記録手段に符号化ストリームを記録する前に、符号化ストリームを一時的に保持するストリーム保持手段と、前記ストリーム保持手段に保持されている符号化ストリームの映像データからシーンチェンジを検出する映像変化点検出手段と、音声信号から無音を検出する無音検出手段と、前記映像変化点検出手段によって検出されたシーンチェンジ情報と前記無音検出手段によって検出された無音情報を一時的に保持する一時記憶手段と、前記一時記憶手段に保持されたシーンチェンジ情報と無音情報から、シーンチェンジと無音が同時に発生する変移点を検出する変移点検出手段と、前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段とを有することを特徴としている。   The video / audio recording apparatus of the present invention includes a recording unit that records an encoded stream of video and audio, a stream holding unit that temporarily stores the encoded stream before recording the encoded stream in the recording unit, Video change point detection means for detecting a scene change from the video data of the encoded stream held in the stream holding means, silence detection means for detecting silence from the audio signal, and detected by the video change point detection means Temporary storage means for temporarily holding scene change information and silence information detected by the silence detection means, and a transition in which scene change and silence occur simultaneously from the scene change information and silence information held in the temporary storage means Transition point detection means for detecting points, and intervals between transition points detected by the transition point detection means are preset. CM broadcast section determination means for determining a section in which two or more transition point combinations that fall within a predetermined time range centered on the specified reference time continue as a CM broadcast section, and the CM broadcast section determination means And CM broadcast section information recording means for recording the time information of the determined CM broadcast section.

本発明の映像記録装置及び方法によれば、映像が符号化される毎にシーンチェンジ抽出処理を行うので、リアルタイムにシーンチェンジの抽出を行うことができるという効果がある。   According to the video recording apparatus and method of the present invention, the scene change extraction process is performed every time the video is encoded. Therefore, there is an effect that the scene change can be extracted in real time.

本発明の映像音声記録装置及び方法によれば、放送番組の記録と並行してCM放送区間検出処理を実行するのでリアルタイムにCM放送区間検出を行うことができるという効果がある。   According to the video / audio recording apparatus and method of the present invention, the CM broadcast section detection process is executed in parallel with the recording of the broadcast program, so that the CM broadcast section can be detected in real time.

本発明の実施の形態1の映像記録装置の構成を示すブロック図である。It is a block diagram which shows the structure of the video recording device of Embodiment 1 of this invention. 実施の形態1の映像記録装置のシーンチェンジ抽出部の構成を示すブロック図である。3 is a block diagram illustrating a configuration of a scene change extraction unit of the video recording apparatus according to Embodiment 1. FIG. 本発明の実施の形態2の映像記録装置のシーンチェンジコマンド制御部の構成を示すブロック図である。It is a block diagram which shows the structure of the scene change command control part of the video recording device of Embodiment 2 of this invention. 実施の形態2の映像記録装置の動作を示すフローチャートである。6 is a flowchart illustrating an operation of the video recording apparatus according to the second embodiment. 実施の形態2の映像記録装置のシーンチェンジコマンド制御部のAPI部の動作を示すフローチャートである。10 is a flowchart illustrating an operation of an API unit of a scene change command control unit of the video recording apparatus according to the second embodiment. 実施の形態2の映像記録装置のシーンチェンジコマンド制御部の状態制御部の動作を示すフローチャートである。10 is a flowchart illustrating an operation of a state control unit of a scene change command control unit of the video recording apparatus according to the second embodiment. 本発明の実施の形態3の映像記録装置の復号化部の構成を示すブロック図である。It is a block diagram which shows the structure of the decoding part of the video recording device of Embodiment 3 of this invention. (A)乃至(D)は、実施の形態3の映像記録装置のDCT係数削減処理を説明するための図である。(A) thru | or (D) are the figures for demonstrating the DCT coefficient reduction process of the video recording device of Embodiment 3. FIG. 本発明の実施の形態4の映像記録装置の復号化部の構成を示すブロック図である。It is a block diagram which shows the structure of the decoding part of the video recording device of Embodiment 4 of this invention. 本発明の実施の形態5の映像記録装置におけるYUV領域を示す図である。It is a figure which shows the YUV area | region in the video recording device of Embodiment 5 of this invention. 実施の形態5の映像記録装置の動作を示すフローチャートである。10 is a flowchart illustrating an operation of the video recording apparatus according to the fifth embodiment. 本発明の実施の形態6の映像音声記録装置の構成を概略的に示すブロック図である。It is a block diagram which shows schematically the structure of the audiovisual recording apparatus of Embodiment 6 of this invention. 実施の形態6の映像音声記録装置の変移点検出部の動作を示すフローチャートである。18 is a flowchart illustrating an operation of a transition point detection unit of the video / audio recording apparatus according to the sixth embodiment. 実施の形態6の映像音声記録装置の変移点スタックテーブルの一例を示す図である。FIG. 25 is a diagram illustrating an example of a transition point stack table of the video / audio recording apparatus according to the sixth embodiment. (A)乃至(E)は、実施の形態6の映像音声記録装置におけるCM放送区間検出動作を説明するための図である。(A) thru | or (E) are the figures for demonstrating the CM broadcast area detection operation | movement in the audio video recording apparatus of Embodiment 6. FIG. 実施の形態6の映像音声記録装置のCM放送区間検出動作を示すフローチャートである。18 is a flowchart showing a CM broadcast section detection operation of the video / audio recording apparatus of the sixth embodiment. (A)乃至(C)は、本発明の実施の形態7の映像音声記録装置における変移点検出方法を示す図である。(A) thru | or (C) is a figure which shows the transition point detection method in the audiovisual recording apparatus of Embodiment 7 of this invention. 本発明の実施の形態8の映像音声記録装置におけるCM間の無音時間長の測定結果を示すグラフである。It is a graph which shows the measurement result of the silence time length between CM in the audiovisual recording apparatus of Embodiment 8 of this invention. 実施の形態8の映像音声記録装置においてCMから番組本編に移行するときの無音時間長の測定結果を示すグラフである。29 is a graph showing a measurement result of silent time length when moving from CM to the main program in the video / audio recording apparatus of the eighth embodiment. 実施の形態8の映像音声記録装置における、無音時間長を利用したCM放送区間検出動作を示すフローチャートである。29 is a flowchart showing a CM broadcast section detection operation using a silent time length in the video / audio recording apparatus of the eighth embodiment. 本発明の実施の形態9の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出動作を示すフローチャートである。It is a flowchart which shows CM broadcast area detection operation using the scene change difference value in the video / audio recording apparatus of Embodiment 9 of the present invention. 実施の形態9の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出動作を説明するための図である。FIG. 25 is a diagram for explaining a CM broadcast section detection operation using a scene change difference value in the video / audio recording apparatus of the ninth embodiment. 実施の形態10の映像音声記録装置における動作を説明するための図である。FIG. 38 is a diagram for explaining an operation in the video / audio recording apparatus of the tenth embodiment.

実施の形態1.
図1は、本発明の実施の形態1の映像記録装置100の構成を示すブロック図である。図1に示されるように、映像記録装置100は、図示しないチューナから又は外部から入力された入力映像データに対して、MPEG−2(Moving Picture Experts Group)に準拠した符号化を行う符号化手段としての符号化部101と、符号化部101によって生成された符号化ストリームが記録される記録手段としてのHDD(ハードディスクドライブ)105と、HDD105に対して符号化ストリームを安定的に書き込み及び読み出しを行うためのストリーム制御を行うストリーム制御手段としてのストリーム制御部103とを有している。また、映像記録装置100は、ストリーム制御部103が符号化ストリームを一時的に記憶しておく一時記憶手段としてのストリームバッファ104と、符号化部101に対して符号化の開始・終了などを指示する録画制御手段としての録画制御部102と、符号化部101によって生成された符号化ストリームからシーンチェンジを抽出する映像変化点抽出手段としてのシーンチェンジ抽出部110とを有している。図1には、記録手段としてHDD105が示されているが、記録手段は、DVDのような光ディスクや磁気テープなどの他の情報記録媒体であってもよい。また、映像記録装置100は、DVD/HDDハイブリッドレコーダであってもよい。さらに、映像記録装置100は、家庭用のビデオレコーダに限らず、パーソナルコンピュータ、映像サーバ、又は、監視システム用の監視レコーダなどの各種用途に適用できる。
Embodiment 1 FIG.
FIG. 1 is a block diagram showing a configuration of a video recording apparatus 100 according to Embodiment 1 of the present invention. As shown in FIG. 1, the video recording apparatus 100 includes encoding means that performs encoding in accordance with MPEG-2 (Moving Picture Experts Group) on input video data input from a tuner (not shown) or from the outside. , An HDD (Hard Disk Drive) 105 as recording means for recording the encoded stream generated by the encoding unit 101, and writing and reading the encoded stream to and from the HDD 105 stably. And a stream control unit 103 as stream control means for performing stream control. The video recording apparatus 100 also instructs the stream control unit 103 to temporarily store the encoded stream, the stream buffer 104 as a temporary storage unit, and the encoding unit 101 to start and end encoding. A recording control unit 102 serving as a recording control unit, and a scene change extracting unit 110 serving as a video change point extracting unit configured to extract a scene change from the encoded stream generated by the encoding unit 101. Although FIG. 1 shows the HDD 105 as the recording means, the recording means may be another information recording medium such as an optical disk such as a DVD or a magnetic tape. Further, the video recording apparatus 100 may be a DVD / HDD hybrid recorder. Furthermore, the video recording apparatus 100 is applicable not only to a home video recorder but also to various uses such as a personal computer, a video server, or a surveillance recorder for a surveillance system.

符号化部101による符号化方式であるMPEG−2は可変レートに対応しており、そのため、1秒間に発生する符号量(ビットレート)は時間によって大きく変動する。そのため、ストリーム制御部103は、HDD105へのデータ書き込み及びHDD105からのデータ読み出しによって符号化ストリームがオーバーフロー又はアンダーフローしないように、符号化ストリームをストリームバッファ104に一時的に保持させ、HDD105の状態に応じて符号化ストリームのHDD105への書き出し及びHDD105からの読み込みを行っている。ストリームバッファ104は、リングバッファで構成されており、書き込み位置ポインタと読み出し位置ポインタによって有効なデータ領域が管理されている。すなわち、データの書き込み時には、書き込み位置ポインタを先頭にデータサイズ分書き込みを行い、書き込んだデータサイズ分だけ書き込み位置ポインタを進める。一方、データの読み出し時には、読み出し位置ポインタを先頭にデータサイズ分読み出しを行い、読み出したデータサイズ分だけ読み出し位置ポインタを進める。ただし、リングバッファの終了位置に来たときは、ポインタを先頭の位置に戻す処理を行う。   MPEG-2, which is an encoding method by the encoding unit 101, supports a variable rate, and therefore, the amount of code (bit rate) generated per second varies greatly with time. Therefore, the stream control unit 103 temporarily stores the encoded stream in the stream buffer 104 so that the encoded stream does not overflow or underflow due to data writing to the HDD 105 and data reading from the HDD 105, and the HDD 105 enters the state of the HDD 105. Accordingly, the encoded stream is written to the HDD 105 and read from the HDD 105. The stream buffer 104 includes a ring buffer, and a valid data area is managed by a write position pointer and a read position pointer. That is, when data is written, writing is performed for the data size with the writing position pointer at the head, and the writing position pointer is advanced by the written data size. On the other hand, when reading data, reading is performed for the data size starting from the reading position pointer, and the reading position pointer is advanced by the read data size. However, when the end position of the ring buffer is reached, processing for returning the pointer to the head position is performed.

図2は、図1に示されるシーンチェンジ抽出部110の構成を示すブロック図である。図2に示されるように、シーンチェンジ抽出部110は、入力された符号化ストリームの復号化を行う復号化手段としての復号化部111と、復号化された映像データのヒストグラムを生成するヒストグラム生成手段としてのヒストグラム生成器112と、ヒストグラム生成器112によって生成されたヒストグラムを保持する第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114と、第1のヒストグラムバッファ113に保持されたヒストグラムと第2のヒストグラムバッファ114に保持されたヒストグラムの差異を求める差分抽出手段としての差分抽出器115とを有している。また、シーンチェンジ抽出部110は、差分抽出器115で求めた差異値と予め設定された閾値を比較するシーンチェンジ判定手段としてのシーンチェンジ判定器116と、録画制御部102からのシーンチェンジ開始命令などの制御信号に基づいてシーンチェンジ抽出部110を制御するシーンチェンジコマンド制御手段としてのシーンチェンジコマンド制御部120とを有している。   FIG. 2 is a block diagram showing a configuration of the scene change extraction unit 110 shown in FIG. As shown in FIG. 2, the scene change extraction unit 110 includes a decoding unit 111 serving as a decoding unit that decodes an input encoded stream, and a histogram generation that generates a histogram of the decoded video data. The histogram generator 112 as means, the first histogram buffer 113 and the second histogram buffer 114 for holding the histogram generated by the histogram generator 112, the histogram stored in the first histogram buffer 113, and the second And a difference extractor 115 as a difference extracting means for obtaining a difference between histograms held in the histogram buffer 114. The scene change extraction unit 110 also includes a scene change determination unit 116 as a scene change determination unit that compares the difference value obtained by the difference extractor 115 with a preset threshold value, and a scene change start command from the recording control unit 102. And a scene change command control unit 120 as a scene change command control means for controlling the scene change extraction unit 110 based on a control signal such as.

次に、映像記録装置100の録画動作について説明する。録画が開始されると、録画制御部102は、符号化部101に対して制御信号CENを出力して符号化開始を指示し、符号化部101は入力された映像データPINの符号化処理を開始する。符号化部101は、例えば、符号化単位であるGOP(Group of Pictures)の符号化が完了する毎に、録画制御部102にGOP符号化完了通知IENを送る。ストリーム制御部103は、符号化部101によって符号化された符号化ストリームをストリームバッファ104の書き込み位置ポインタを先頭に順次書き込んでいく。一方、ストリーム制御部103は、HDD105が書き込み状態になっているのを確認しながら、ストリームバッファ104の読み出し位置ポインタから符号化ストリームを読み出し、HDD105に書き込みを行う。録画が実行されている間、前記動作が繰り返し行われる。録画終了時には、録画制御部102は、符号化部101に対して符号化終了を指示し、符号化部101は符号化を停止する。ストリーム制御部103は、ストリームバッファ104に残っている符号化ストリームをすべてHDD105に書き込む。 Next, the recording operation of the video recording apparatus 100 will be described. When recording is started, the recording control unit 102 outputs a control signal CEN to the encoding unit 101 to instruct the start of encoding, and the encoding unit 101 encodes the input video data PIN . Start processing. For example, every time encoding of a GOP (Group of Pictures) that is an encoding unit is completed, the encoding unit 101 sends a GOP encoding completion notification I EN to the recording control unit 102. The stream control unit 103 sequentially writes the encoded stream encoded by the encoding unit 101 with the write position pointer of the stream buffer 104 at the head. On the other hand, the stream control unit 103 reads the encoded stream from the read position pointer of the stream buffer 104 and writes it to the HDD 105 while confirming that the HDD 105 is in a write state. While the recording is being performed, the above operation is repeated. At the end of recording, the recording control unit 102 instructs the encoding unit 101 to end encoding, and the encoding unit 101 stops encoding. The stream control unit 103 writes all the encoded streams remaining in the stream buffer 104 to the HDD 105.

次に、録画を行いながらシーンチェンジを抽出する方法について説明する。録画制御部102は、例えば、GOPの符号化完了通知IENを符号化部101から受け取る毎に、シーンチェンジ抽出部110に対してシーンチェンジ抽出コマンドCSCを送る。シーンチェンジ抽出コマンドCSCは、シーンチェンジ抽出部110内のシーンチェンジ制御部120を経由して、復号化開始コマンドCDEとして復号化部111に送られる。復号化部111は、符号化ストリームPSTをストリーム制御部103を経由してストリームバッファ104から呼び出し、復号化を開始する。復号化部111によってMPEG−2からYUVに復号化された映像データはヒストグラム生成器112に入力され、ヒストグラム生成器112によって映像データのYUVの各区画に含まれる計数に基づいてヒストグラムが作成される。ここで、ヒストグラム生成のための区画分けは、値の取り得る範囲を一定間隔に区切る方法、又は、予め複数の閾値を定めておいて、各閾値に対する大小関係に応じて区画分けをする方法などがある。また、ここでは、輝度成分Yと色差成分U、Vのすべての成分に対してヒストグラムを作成する場合を説明しているが、輝度成分Yのみについてヒストグラムを生成する方法を採用してもよい。また、輝度成分Yと色差成分U、Vのすべての成分に対してヒストグラムを作成するが、色差成分U及びVに対しては重みを加えて区画分けを荒くする方法を採用してもよい。また、ヒストグラムの区画分けの方法は、以上に説明した例に限定されず、他の区画分け方法を採用してもよい。 Next, a method for extracting scene changes while recording will be described. Recording control unit 102, for example, each time it receives a coding completion notice I EN of the GOP from the coding unit 101 sends the scene change extraction command C SC against the scene change extracting unit 110. The scene change extraction command CSC is sent to the decoding unit 111 via the scene change control unit 120 in the scene change extraction unit 110 as a decoding start command CDE . Decoding unit 111, an encoded stream P ST via the stream control unit 103 calls from the stream buffer 104, starts decoding. The video data decoded from MPEG-2 to YUV by the decoding unit 111 is input to the histogram generator 112, and a histogram is created based on the count included in each YUV section of the video data by the histogram generator 112. . Here, the partitioning for generating the histogram is a method of partitioning a range of values that can be taken at a constant interval, or a method of partitioning in accordance with a magnitude relationship with respect to each threshold by setting a plurality of thresholds in advance. There is. Although the case where a histogram is created for all of the luminance component Y and the color difference components U and V has been described here, a method of generating a histogram for only the luminance component Y may be employed. In addition, although histograms are created for all components of the luminance component Y and the color difference components U and V, a method may be adopted in which weighting is applied to the color difference components U and V to roughen the division. Further, the method of dividing the histogram is not limited to the example described above, and other partitioning methods may be adopted.

ヒストグラム生成器112で生成されたヒストグラムは、第1のヒストグラムバッファ113又は第2のヒストグラムバッファ114に交互に送られ保持される。差分抽出器115は、第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114に交互に記憶されたヒストグラムを用いて、現在の映像データと1つ前の映像データの映像の比較を行い(例えば、現在のフレームの映像データと、1フレーム前のフレームの映像データの比較を行い)、差異値を求める。2つのヒストグラムの差異値を求める方法としては、例えば、2つのヒストグラムの対応する成分の値の差を、すべての成分について累積する方法がある。ここで、i番目の映像のヒストグラムをH
={h(1),h(2),・・・,h(K)}
とすると、i番目の映像のヒストグラムHと、1つ前のiー1番目の映像のヒストグラムHi−1との差異値dを以下の式で求める。なお、Kは、所定の正の整数である。

Figure 2011091859
ここで、Nは1フレーム内の画素数である。これによって、差異値dは0から1までの値をとり、i番目のフレームの映像とiー1番目のフレームの映像が同じ映像であれば差異値dは0になり、i番目のフレームの映像とiー1番目のフレームの映像の違いが大きければ差異値dは1に近づくことになる。 The histogram generated by the histogram generator 112 is alternately sent to and held in the first histogram buffer 113 or the second histogram buffer 114. The difference extractor 115 uses the histograms alternately stored in the first histogram buffer 113 and the second histogram buffer 114 to compare the current video data with the previous video data (for example, The video data of the current frame is compared with the video data of the previous frame), and the difference value is obtained. As a method for obtaining a difference value between two histograms, for example, there is a method of accumulating a difference between values of corresponding components of two histograms for all components. Here, the histogram of the i-th video is represented as H i
H i = {h i (1 ), h i (2), ···, h i (K)}
When a histogram H i of i-th image, obtaining the difference value d between the histogram H i-1 of the preceding i-1 -th image by the following equation. K is a predetermined positive integer.
Figure 2011091859
Here, N is the number of pixels in one frame. Thus, the difference value d takes a value from 0 to 1, and if the video of the i-th frame and the video of the i-1th frame are the same video, the difference value d is 0, and the difference value d of the i-th frame If the difference between the video and the video of the i-1st frame is large, the difference value d approaches 1.

差分抽出器115で求められた差異値dは、シーンチェンジ判定器116に送られ、予めシーンチェンジコマンド制御部120によって設定された閾値ETHと比較され、設定された閾値ETHより大きな値であればシーンチェンジと判定し、その判定結果RSCをシーンチェンジコマンド制御部120に送る。さらに、録画終了時などに判定結果RSCを録画制御部102に送る。 The difference value d obtained by the difference extractor 115 is sent to the scene change determiner 116 and compared with a threshold value E TH set in advance by the scene change command control unit 120, and is a value larger than the set threshold value E TH. if determined that the scene change, and sends the determination result R SC in the scene change command controller 120. Furthermore, the judgment result, such as during recording end sends the R SC in the recording control unit 102.

以上に説明したように、符号化部101によってGOPの符号化が完了する毎に(すなわち、実施の形態1においては、GOPの符号化完了に同期して)、シーンチェンジ抽出部110でシーンチェンジ判定を行う処理を、映像の録画開始から終了までの間において継続的に行うことによって、映像ストリームPSTを録画しながら、映像ストリームPSTのシーンチェンジを抽出することができる。すなわち、符号化の最小単位であるGOPの符号化完了毎にシーンチェンジ抽出処理を実行するので、符号化と並行してシーンチェンジ抽出を行うことができる。 As described above, every time GOP encoding is completed by encoding section 101 (that is, in synchronization with completion of GOP encoding in Embodiment 1, scene change extraction section 110 performs scene change). the process for determining, by continuously be carried out during the period until completion of the recording start of the video, while recording a video stream P ST, it is possible to extract a scene change of the video stream P ST. In other words, the scene change extraction process is executed every time GOP encoding, which is the minimum unit of encoding, is completed, so that scene change extraction can be performed in parallel with encoding.

また、リアルタイムにシーンチェンジ抽出を行うので、シーンチェンジ抽出機能を有していないエンコーダを符号化部101に用いることができる。そのため、映像記録装置に採用するエンコーダの選定に際して、シーンチェンジ抽出機能を有しないエンコーダを選ぶことが可能になり、エンコーダ選択の幅が広がり、コストや調達性を重視したエンコーダの選択が可能になる。   Since scene change extraction is performed in real time, an encoder that does not have a scene change extraction function can be used for the encoding unit 101. Therefore, when selecting an encoder to be used in a video recording device, it is possible to select an encoder that does not have a scene change extraction function, which broadens the range of encoder selection and makes it possible to select an encoder that emphasizes cost and availability. .

また、既にHDDなどに蓄積された符号化ストリームを解析してシーンチェンジを抽出する方法では、符号化ストリームを記憶装置であるHDDから読み出すための時間が、シーンチェンジの解析時間に加えて、必要とされる。しかしながら、実施の形態1の映像記録装置100においては、HDD105よりも書き込み及び読出し速度が速く、ストリームを一時的に記憶しておくストリームバッファ104(通常は、揮発性半導体メモリを用いる)から読み出すため高速に読み出すことができ、結果として処理時間が早くなる。   Also, in the method of extracting a scene change by analyzing an encoded stream already stored in an HDD or the like, a time for reading the encoded stream from the HDD as a storage device is required in addition to the scene change analysis time. It is said. However, in the video recording apparatus 100 according to the first embodiment, the writing and reading speed is faster than that of the HDD 105, and the stream is read from the stream buffer 104 (usually using a volatile semiconductor memory) that temporarily stores the stream. Data can be read out at high speed, resulting in faster processing time.

また、シーンチェンジ抽出部110は符号化部101(エンコーダ)の動作よって影響されないので、エンコーダの種類や仕様が変更されたとしても、シーンチェンジの抽出基準を一定範囲に維持することができる。   Further, since the scene change extraction unit 110 is not affected by the operation of the encoding unit 101 (encoder), the scene change extraction reference can be maintained within a certain range even if the type or specification of the encoder is changed.

また、実施の形態1の映像記録装置は、録画と並行してシーンチェンジを抽出できる機能のほかに、符号化ストリームを直接解析する機能をも有する。このため、直接HDDに記録された符号化ストリームに対してもストリーム制御部103を介して符号化ストリームを読み出すことによってシーンチェンジ抽出を行うことができる。   In addition to the function of extracting a scene change in parallel with recording, the video recording apparatus of Embodiment 1 also has a function of directly analyzing an encoded stream. Therefore, scene change extraction can be performed by reading the encoded stream via the stream control unit 103 even for the encoded stream directly recorded on the HDD.

さらに、一般的にハードウェアで構成されるエンコーダチップ内のシーンチェンジ機能を利用するわけではなく、録画再生装置のファームウェアのみで構成することも可能なので、シーンチェンジ抽出のためのアルゴリズムを比較的容易に改変したり、録画再生装置の状態等に合わせてシーンチェンジ抽出処理の状態遷移や閾値を動的に変更したりすることができる。   In addition, the scene change function in the encoder chip, which is generally composed of hardware, is not used, but it can be configured only by the firmware of the recording / playback device, so the algorithm for scene change extraction is relatively easy. Or the state transition of the scene change extraction process and the threshold value can be dynamically changed according to the state of the recording / playback apparatus.

例えば、入力映像データがCM映像データである期間は、シーンチェンジの判定の閾値ETHを大きくして、シーンチェンジであると判定され難くして、CM映像データに対するシーンチェンジ検出を実行させないように制御する方法を採用してもよい。 For example, during a period in which the input video data is CM video data, the scene change determination threshold ETH is increased to make it difficult to determine that it is a scene change, so that scene change detection for the CM video data is not executed. A control method may be employed.

また、シーンチェンジにおいて音声信号が無音になる瞬間が存在することに着目し、音声信号が無音(すなわち、所定の閾値よりも低いレベル)のときに、シーンチェンジの判定の閾値ETHを小さくすることによって、シーンチェンジを映像データだけでなく、音声データをも考慮して検出し、シーンチェンジの検出精度を向上させる制御方法を採用してもよい。 Also, focusing on the fact that there is a moment when the audio signal becomes silent in a scene change, when the audio signal is silent (that is, at a level lower than a predetermined threshold), the scene change determination threshold E TH is reduced. Accordingly, a control method may be employed in which a scene change is detected in consideration of not only video data but also audio data, and scene change detection accuracy is improved.

また、以上の説明においては、シーンチェンジ抽出単位を1GOPとしているが、シーンチェンジ抽出単位を複数のGOP単位としてもよい。また、シーンチェンジ抽出単位を、1又は複数のスライス単位又は1又は複数のマクロブロック単位としてもよい。   In the above description, the scene change extraction unit is 1 GOP, but the scene change extraction unit may be a plurality of GOP units. The scene change extraction unit may be one or more slice units or one or more macroblock units.

また、以上の説明においては、復号化処理を行う方法としてソフトウェアによる例を示したが、ハードウェアによって実行してもよい。   In the above description, an example using software is shown as a method for performing the decoding process, but the method may be executed by hardware.

実施の形態2.
本発明の実施の形態2の映像記録装置は、図2に示されるシーンチェンジコマンド制御部120の構成及び動作のみが、実施の形態1の映像記録装置と相違する。したがって、実施の形態2の説明においては、図1及び図2をも参照する。
Embodiment 2. FIG.
The video recording apparatus according to the second embodiment of the present invention is different from the video recording apparatus according to the first embodiment only in the configuration and operation of the scene change command control unit 120 shown in FIG. Therefore, in description of Embodiment 2, FIG.1 and FIG.2 is also referred.

実施の形態2の映像記録装置は、録画と並行してシーンチェンジ抽出を行う場合に、シーンチェンジ抽出動作をGOPの符号化処理と非同期に行う。この非同期に行われる符号化処理を、単に「非同期処理」とも言う。この非同期処理は、符号化部101による符号化処理が完了したGOPに対して実行されるシーンチェンジ抽出処理の開始タイミングが、符号化処理の完了タイミングと必ずしも一致しない状態でも実行できることである。非同期処理の実際の動作としては、あるGOPについて着目すると、符号化処理が完了した後、直ぐにシーンチェンジ抽出処理が行うのではなく、しばらく時間を置いてからシーンチェンジ抽出処理を実行する方法である。   The video recording apparatus according to the second embodiment performs the scene change extraction operation asynchronously with the GOP encoding process when performing the scene change extraction in parallel with the recording. This asynchronous encoding process is also simply referred to as “asynchronous process”. This asynchronous process can be executed even when the start timing of the scene change extraction process executed for the GOP for which the encoding process by the encoding unit 101 has been completed does not necessarily coincide with the completion timing of the encoding process. As an actual operation of the asynchronous processing, focusing on a certain GOP, the scene change extraction processing is not performed immediately after the encoding processing is completed, but the scene change extraction processing is executed after a while. .

一般的に、映像を記録する装置、例えば、HDD/DVDハイブリッドレコーダなどにおいては録画動作に並行して、再生やダビング等のような装置のCPUの負荷が上昇する動作が発生し得る。また、ユーザーによって不定期に行われる行為、例えば、DVDのトレーオープン、機能設定画面の表示、及び電子番組表の閲覧などの動作は、装置の一時的なCPUの負荷上昇を招く。これらの動作によって負荷上昇が発生した場合、シーンチェンジ抽出処理のために、CPUを占有し続けることができる保障はなく、他の処理の完了を待つ間、シーンチェンジ抽出処理をしばらく遅らせることが望ましい場合があり得る。一方、シーンチェンジ抽出処理によって、装置の基本機能である映像の記録機能が妨げられることがあってはならず、よってシーンチェンジ抽出処理は記録処理よりも優先度を落とした処理にすることが望ましい。このような機能を実現するために、実施の形態2の映像記録装置においては、シーンチェンジ抽出処理を録画動作と非同期に行うことができるように構成している。   Generally, in an apparatus for recording video, such as an HDD / DVD hybrid recorder, an operation that increases the load on the CPU of the apparatus, such as playback or dubbing, may occur in parallel with the recording operation. In addition, actions that are performed irregularly by the user, for example, operations such as opening a DVD tray, displaying a function setting screen, and viewing an electronic program guide, cause a temporary increase in the CPU load of the apparatus. When a load increase occurs due to these operations, there is no guarantee that the CPU can continue to be occupied for the scene change extraction process, and it is desirable to delay the scene change extraction process for a while while waiting for the completion of other processes. There may be cases. On the other hand, the scene change extraction process should not interfere with the video recording function, which is the basic function of the apparatus. Therefore, it is desirable that the scene change extraction process has a lower priority than the recording process. . In order to realize such a function, the video recording apparatus of the second embodiment is configured so that the scene change extraction process can be performed asynchronously with the recording operation.

図3は、実施の形態2の映像記録装置のシーンチェンジコマンド制御部120(図2に示される)の構成を示すブロック図である。図3に示されるように、シーンチェンジコマンド制御部120は、録画制御部102からのコマンドの受け付けを行うAPI(アプリケーション プログラム インターフェース)部121と、受け付けたコマンドを複数保持するコマンドバッファ122と、シーンチェンジ抽出部の状態遷移を司り、受け付けたコマンドを処理する状態制御部124と、シーンチェンジ抽出結果やエラー状態を保持し、録画制御部102に返すためのシーンチェンジ抽出結果バッファ123とを有している。実施の形態2の映像記録装置が実施の形態1の映像記録装置と相違する点は、録画制御部102から発行されたシーンチェンジ抽出コマンドがシーンチェンジコマンド制御部120内のAPI部121に伝えられ、コマンドバッファ122に一旦保持されることである。コマンドバッファ122が保持できるコマンドの数はストリームバッファ104の容量に応じて設定すればよい。例えば、ストリームバッファ104のサイズが実施の形態1で示した20Mバイトである仮定すると、符号化ストリームの約15秒分(すなわち、1GOPあたり15ピクチャ、0.5秒の時間長とすると、30GOPのデータ)が一時的に保持できることになり、よって、30個分のシーンチェンジ抽出コマンドを保持できるように構成すればよい。コマンドバッファ122が30個のシーンチェンジ抽出コマンドを保持でき、且つ、ストリームバッファ104に30GOP分のデータが残っていれば、最新のGOPから30個前のGOPまで遡ってシーンチェンジ抽出が可能であることを意味し、30個のGOP分、すなわち、15秒遅延したシーンチェンジ抽出処理が可能であることをも意味する。シーンチェンジコマンド制御部120のシーンチェンジ抽出結果バッファ123は、シーンチェンジ抽出部110の状態制御部124が実行したシーンチェンジ抽出結果の複数回分保持することが可能で、コマンドバッファ122に保持できるコマンド数と同数分を保持できるものとすればよい。   FIG. 3 is a block diagram showing a configuration of the scene change command control unit 120 (shown in FIG. 2) of the video recording apparatus according to the second embodiment. As shown in FIG. 3, the scene change command control unit 120 includes an API (application program interface) unit 121 that receives a command from the recording control unit 102, a command buffer 122 that holds a plurality of received commands, a scene It has a state control unit 124 that manages the state transition of the change extraction unit and processes received commands, and a scene change extraction result buffer 123 for holding the scene change extraction result and error state and returning them to the recording control unit 102. ing. The video recording device of the second embodiment is different from the video recording device of the first embodiment in that the scene change extraction command issued from the recording control unit 102 is transmitted to the API unit 121 in the scene change command control unit 120. This is temporarily held in the command buffer 122. The number of commands that can be held in the command buffer 122 may be set according to the capacity of the stream buffer 104. For example, assuming that the size of the stream buffer 104 is 20 Mbytes shown in the first embodiment, if the encoded stream is about 15 seconds (ie, 15 pictures per GOP and a time length of 0.5 seconds), 30 GOP (Data) can be temporarily stored, and therefore, it is sufficient that 30 scene change extraction commands can be stored. If the command buffer 122 can hold 30 scene change extraction commands and 30 GOPs of data remain in the stream buffer 104, it is possible to extract scene changes retroactively from the latest GOP to the 30th previous GOP. This also means that scene change extraction processing delayed by 30 GOPs, that is, by 15 seconds is possible. The scene change extraction result buffer 123 of the scene change command control unit 120 can hold a plurality of scene change extraction results executed by the state control unit 124 of the scene change extraction unit 110, and the number of commands that can be held in the command buffer 122. It is sufficient that the same number can be held.

これによって、先行するGOPのシーンチェンジ抽出処理が完了していない状態(例えば、ユーザーが既に録画されているストリームの再生要求をしたために、システムの負荷が上昇し、シーンチェンジ抽出処理が完了できなかった場合)において、次のGOPの符号化が完了し、録画制御部102からシーンチェンジ抽出コマンドが発行された場合であっても、新しいシーンチェンジ抽出コマンドはコマンドバッファ122に保持される。コマンドバッファ122に保持されているシーンチェンジ抽出コマンドによって、現在実行中のシーンチェンジ抽出処理が完了後に、先行するGOPのシーンチェンジ抽出処理を実行できるので、GOPの符号化毎にシーンチェンジ抽出処理が完了しないために次のシーンチェンジ抽出処理が実行できないという問題を防ぐことができる。   As a result, the scene change extraction process of the preceding GOP has not been completed (for example, because the user has requested playback of a stream that has already been recorded, the system load increases and the scene change extraction process cannot be completed. In this case, even when the encoding of the next GOP is completed and a scene change extraction command is issued from the recording control unit 102, the new scene change extraction command is held in the command buffer 122. The scene change extraction process stored in the command buffer 122 can execute the scene change extraction process of the preceding GOP after the currently executed scene change extraction process is completed, so that the scene change extraction process is performed every time the GOP is encoded. This prevents the problem that the next scene change extraction process cannot be executed because it is not completed.

次に、図4、図5、及び図6のフローチャートを用いて録画動作と非同期で動作するシーンチェンジ抽出処理の説明を行う。まず、録画制御部102の動作について説明する。映像記録装置100に電源が投入されると、システム起動(ステップS201)され、定期的にシステム終了の確認(ステップS202)と録画開始の確認(ステップS204)が行われ、システム終了の要求があれば、システム終了(ステップS202)に遷移する。一方、録画開始の要求があれば、シーンチェンジコマンド制御部120に対して、録画開始コマンド発行(ステップS205)が行われる。録画開始コマンドの発行の後は、録画終了を確認(ステップS206)し、録画終了であれば録画終了コマンドをシーンチェンジコマンド制御部120に発行する(ステップS207)。録画状態においては、GOP単位の符号化が完了すると(ステップS208)、シーンチェンジコマンド制御部120に対してシーンチェンジ検出コマンドが発行される(ステップS209)。GOP符号化検出(ステップS208)は、録画が完了するまで続けられる。録画制御部102から発行された制御コマンドは、シーンチェンジコマンド制御部120のAPI部121内で処理される。シーンチェンジ制御コマンドCSCが発行されるとコマンドバッファ122の空きをチェックし(ステップS223)、コマンドバッファ122の空きがあれば、コマンドバッファ122にコマンドを格納する(ステップS224)。コマンドバッファ122に格納できなかった場合も含めて、次にシーンチェンジ状態制御部124からシーンチェンジ結果バッファ123に蓄えられたシーンチェンジ抽出結果の取得を行う(ステップS225)。最後に、シーンチェンジ抽出結果とコマンドが受け付けられたか否かを録画制御部102に返す(ステップS226)。 Next, scene change extraction processing that operates asynchronously with the recording operation will be described with reference to the flowcharts of FIGS. 4, 5, and 6. First, the operation of the recording control unit 102 will be described. When the video recording apparatus 100 is turned on, the system is activated (step S201), the system end is confirmed (step S202) and the recording start is confirmed (step S204), and the system end is requested. For example, the process proceeds to the system end (step S202). On the other hand, if there is a request to start recording, a recording start command is issued to the scene change command control unit 120 (step S205). After the recording start command is issued, the end of recording is confirmed (step S206). If the recording is ended, a recording end command is issued to the scene change command control unit 120 (step S207). In the recording state, when encoding in units of GOP is completed (step S208), a scene change detection command is issued to the scene change command control unit 120 (step S209). The GOP encoding detection (step S208) is continued until the recording is completed. The control command issued from the recording control unit 102 is processed in the API unit 121 of the scene change command control unit 120. When the scene change control command CSC is issued, the vacancy of the command buffer 122 is checked (step S223), and if the command buffer 122 is vacant, the command is stored in the command buffer 122 (step S224). The scene change extraction result stored in the scene change result buffer 123 is then acquired from the scene change state control unit 124, including the case where it cannot be stored in the command buffer 122 (step S225). Finally, the scene change extraction result and whether or not the command is accepted are returned to the recording control unit 102 (step S226).

一方、シーンチェンジ状態制御部124では電源起動されると(ステップS241)、コマンド待ち状態になり(ステップS242)、受け取ったコマンドがシステム終了(ステップS243)であればシステム終了に移る(ステップS245)。また、コマンドが録画開始コマンドであれば(ステップS252)、録画開始のための例えばメモリの確保や変数の初期化などの録画開始処理(ステップS253)を実行し、録画終了コマンド(ステップS254)であれば、例えば確保したメモリの開放やシーンチェンジ抽出結果を録画制御部102に送る録画終了処理(ステップS255)を行う。一方、受け取ったコマンドがシーンチェンジ抽出コマンドであれば、シーンチェンジ抽出コマンドに付けて渡される符号化ストリームのストリームバッファ104における先頭アドレスを元に、符号化ストリームの復号化を行う(ステップS246)。復号化部111によってYUVに変換された映像データからヒストグラムを生成し(ステップS247)、そのヒストグラムを第1のヒストグラムバッファ113(又は第2のヒストグラムバッファ114)に格納する(ステップS248)。生成したヒストグラムと第2のヒストグラムバッファ114(又は第1のヒストグラムバッファ113)に格納されている1つ前の映像のヒストグラムの差異値を求め(ステップS249)、予め設定されている閾値以上であればシーンチェンジと判定する(ステップS250)。この結果を、結果バッファ123に格納する(ステップS251)。   On the other hand, when the scene change state control unit 124 is powered on (step S241), it enters a command waiting state (step S242). If the received command is the system end (step S243), the system end is performed (step S245). . If the command is a recording start command (step S252), a recording start process (step S253) such as securing a memory or initializing variables for recording start is executed, and a recording end command (step S254) is executed. If there is, for example, a recording end process (step S255) for releasing the secured memory and sending the scene change extraction result to the recording control unit 102 is performed. On the other hand, if the received command is a scene change extraction command, the encoded stream is decoded based on the head address in the stream buffer 104 of the encoded stream passed along with the scene change extraction command (step S246). A histogram is generated from the video data converted into YUV by the decoding unit 111 (step S247), and the histogram is stored in the first histogram buffer 113 (or the second histogram buffer 114) (step S248). A difference value between the generated histogram and the histogram of the previous video stored in the second histogram buffer 114 (or the first histogram buffer 113) is obtained (step S249), and if it is equal to or greater than a preset threshold value. If it is a scene change, it is determined (step S250). This result is stored in the result buffer 123 (step S251).

1つのGOPに対するシーンチェンジ抽出処理が終わると、次の処理を行うためにコマンド待ち(ステップS242)に移る。ここでもし既にコマンドバッファ122にコマンドが格納されていれば、即座に、次のGOPの解析が開始されるが、次のコマンドバッファがまだ設定されていなければ、コマンド待ちを継続する(ステップS242)。   When the scene change extraction process for one GOP is completed, the process proceeds to a command wait (step S242) to perform the next process. If a command has already been stored in the command buffer 122, analysis of the next GOP is immediately started, but if the next command buffer has not yet been set, the command waiting is continued (step S242). ).

実施の形態2の映像記録装置においては、シーンチェンジ抽出を行うソフトウェアモジュールのタスク又はスレッドの優先度は録画再生を行うモジュール群より低くしている。この理由は、シーンチェンジ抽出を行うモジュールは、MPEGのソフトウェアデコード処理を伴うために、非常に処理負荷が高く、よって図示しないがソフトウェアを処理するCPUを占有する時間が他のモジュールに比べて極めて大きくなるからである。そのため、もしシーンチェンジ抽出モジュールの優先度を録画再生モジュールの優先度と同じ又はそれ以上にしていると、録画再生時にCPUの処理時間の多くを占有し、そのために映像の記録に関するモジュールの処理が遅れ、結果記録又は再生ができない問題を引き起こす可能性があるからである。さらに、ユーザー入力によって動作するモジュール、例えば、キー入力、画面表示等を司るモジュールの動作も同様にシーンチェンジ抽出モジュールによってその動作を遅延させることが想定しうる。よって、シーンチェンジ抽出モジュールの優先度は、その他のモジュールの優先度に比べて、低くすることが望ましい。一方、次々と録画によって生成されるGOPに対してシーンチェンジの解析を実行していかなければ、シーンチェンジ検出を行うことはできない。しなしながら、符号化部101による符号化処理はリアルタイムに行われていくが、生成された符号化ストリームはHDD105に書き込みを行うために一時的にストリームバッファ104に保持されている。よって、符号化ストリームがストリームバッファ104に保持されている間にシーンチェンジモジュールがストリームバッファ104上の符号化ストリームを処理すれば、すべてのGOPに対してシーンチェンジ抽出処理を行うことができることになる。   In the video recording apparatus of the second embodiment, the priority of the task or thread of the software module that performs scene change extraction is set lower than the module group that performs recording and reproduction. The reason for this is that the scene change extraction module is accompanied by MPEG software decoding processing, and therefore has a very high processing load. Therefore, although not shown, the time required to occupy the CPU for processing the software is extremely high compared to other modules. Because it grows. Therefore, if the priority of the scene change extraction module is equal to or higher than the priority of the recording / playback module, it takes up much of the processing time of the CPU during recording / playback, and the processing of the module related to video recording is This is because there is a possibility of causing a problem that delays and results cannot be recorded or reproduced. Furthermore, it can be assumed that the operation of a module that operates by user input, for example, a module that performs key input, screen display, and the like is also delayed by the scene change extraction module. Therefore, it is desirable that the priority of the scene change extraction module is lower than the priority of other modules. On the other hand, scene change detection cannot be performed unless scene change analysis is executed for GOPs generated by recording one after another. However, although the encoding process by the encoding unit 101 is performed in real time, the generated encoded stream is temporarily held in the stream buffer 104 for writing to the HDD 105. Therefore, if the scene change module processes the encoded stream on the stream buffer 104 while the encoded stream is held in the stream buffer 104, the scene change extraction process can be performed on all GOPs. .

実際に、シーンチェンジ抽出動作が継続して実行されている最中において、例えば、ユーザーによる別番組の再生要求やEPG番組表の表示などシステム的に負荷の大きな処理が起動された場合を想定してみる。先行するGOPのシーンチェンジ抽出実行時に大きな負荷がかかり、その処理の進行があまり進んでいない状況で、次のGOPの符号化完了通知が符号化部101から録画制御部102に上がってくる。録画制御部102は、即座にシーンチェンジ抽出部110のシーンチェンジコマンド制御部120に対して、シーンチェンジ抽出コマンドを発行する。シーンチェンジコマンド制御部120のAPI部は、コマンドバッファの空きを見て(ステップS223)、空きがあればコマンドバッファにシーンチェンジ抽出コマンドを格納する。シーンチェンジコマンド制御部120は、シーンチェンジ抽出コマンドの格納だけを行い、即座に録画制御部102にリターンを返す。さらに、次のGOPの符号化完了までに、先行するGOPのシーンチェンジ抽出が完了していなければ、さらにその次のGOPに対するシーンチェンジ抽出コマンドもコマンドバッファに格納する。その後シーンチェンジ抽出が完了すると、シーンチェンジ状態制御部はコマンド待ち(ステップS242)に移り、コマンドバッファより最古のコマンドを受け取り、次のGOPのシーンチェンジ抽出の実行を開始する。その後システムの負荷が定常状態になると、シーンチェンジ抽出処理の処理頻度が増加し、コマンドバッファの遅延されたコマンドを順次と実行する。ただし、この遅延に許された最大数は20GOP分であり、それ以上のシーンチェンジ処理要求が生じた場合はコマンドバッファにコマンドの空きがないため、該当するGOPに対してシーンチェンジ処理が実行されないことになる。このとき録画制御部102は何らかのエラー処理を実行してもよく、また、装置の主たる目的である録画動作が正常に行われているという理由で特にエラー処理を実行せずにそのまま処理を継続してもよい。   Actually, it is assumed that, while the scene change extraction operation is continuously executed, a system-intensive process such as a request for reproducing another program by the user or display of an EPG program guide is started. Try. When a scene change extraction of the preceding GOP is performed, a large load is applied and the progress of the process is not progressing so much, and the next GOP encoding completion notification is sent from the encoding unit 101 to the recording control unit 102. The recording control unit 102 immediately issues a scene change extraction command to the scene change command control unit 120 of the scene change extraction unit 110. The API unit of the scene change command control unit 120 looks at the empty space in the command buffer (step S223), and if there is a free space, stores the scene change extraction command in the command buffer. The scene change command control unit 120 only stores the scene change extraction command and immediately returns a return to the recording control unit 102. Further, if the scene change extraction of the preceding GOP is not completed by the completion of the encoding of the next GOP, a scene change extraction command for the next GOP is also stored in the command buffer. Thereafter, when the scene change extraction is completed, the scene change state control unit waits for a command (step S242), receives the oldest command from the command buffer, and starts executing the scene change extraction of the next GOP. Thereafter, when the system load becomes steady, the processing frequency of the scene change extraction process increases, and the delayed commands in the command buffer are sequentially executed. However, the maximum number allowed for this delay is 20 GOPs, and when there are more scene change processing requests, there is no command space in the command buffer, so no scene change processing is executed for the corresponding GOP. It will be. At this time, the recording control unit 102 may execute some error processing, and the processing is continued without performing error processing especially because the recording operation which is the main purpose of the apparatus is normally performed. May be.

このようにストリームバッファ104上に一時的に保持されたストリームを解析することに加え、録画制御部102から発行されるコマンドをバッファリングすることによって、必ずしも映像が符号化される毎に符号化されたストリームに対してシーンチェンジ抽出を実行する必要がなく、遅延処理が可能である。そのため、録画制御部102による符号化処理における符号化単位とシーンチェンジ抽出部120における解析単位を連続的に処理する必要がなく、よって符号化処理とシーンチェンジ抽出処理を独立した処理単位として設計できる。   In addition to analyzing the stream temporarily held in the stream buffer 104 in this way, by buffering a command issued from the recording control unit 102, the video is not necessarily encoded every time it is encoded. It is not necessary to perform scene change extraction on the stream, and delay processing is possible. Therefore, it is not necessary to continuously process the encoding unit in the encoding process by the recording control unit 102 and the analysis unit in the scene change extraction unit 120, and therefore the encoding process and the scene change extraction process can be designed as independent processing units. .

また、録画制御部102とシーンチェンジ抽出部120は独立して動作することが可能であり、さらにシーンチェンジ抽出部120の処理優先度を録画に関する処理のそれより低くすることによって、処理時間が長くかかるシーンチェンジ抽出部120の動作によって、録画制御部102の処理が遅れ、結果として通常の録画処理に影響を及ぼすといった悪影響を発生させることがない。   In addition, the recording control unit 102 and the scene change extraction unit 120 can operate independently, and the processing time of the scene change extraction unit 120 is made lower than that of the processing related to recording, thereby increasing the processing time. The operation of the scene change extraction unit 120 does not cause the adverse effect of delaying the process of the recording control unit 102 and consequently affecting the normal recording process.

また、シーンチェンジ抽出処理は遅延処理が可能なため、システムの一時的な負荷上昇によってシーンチェンジ抽出処理がGOPの再生時間内で完了できなかった場合や、シーンチェンジ抽出処理に処理が回ってこない場合であっても、コマンドバッファ122に格納されたシーンチェンジ抽出コマンドを使って、過去に符号化されたストリームに対して順次抽出処理を実行できるため、シーンチェンジ抽出処理が飛ばされて実行されないといった問題を回避することができる。   In addition, since the scene change extraction process can be delayed, if the scene change extraction process cannot be completed within the GOP playback time due to a temporary increase in system load, or the process does not go to the scene change extraction process. Even in this case, the scene change extraction process is skipped and not executed because the scene change extraction command stored in the command buffer 122 can be used to sequentially execute the extraction process on the previously encoded stream. The problem can be avoided.

なお、上記シーンチェンジ抽出処理の遅延可能な時間若しくは回数は、ストリームバッファ104及びコマンドバッファの数によって決定される。   Note that the time or number of times that the scene change extraction process can be delayed is determined by the number of stream buffers 104 and command buffers.

また、実施の形態2において、上記以外の点は、上記実施の形態1の場合と同じである。   In the second embodiment, the points other than the above are the same as those in the first embodiment.

実施の形態3.
本発明の実施の形態3の映像記録装置は、実施の形態1の映像記録装置の復号化部111の構成を特定した点が、実施の形態1の映像記録装置と相違する。したがって、実施の形態3の説明においては、図1及び図2をも参照する。
Embodiment 3 FIG.
The video recording apparatus according to the third embodiment of the present invention is different from the video recording apparatus according to the first embodiment in that the configuration of the decoding unit 111 of the video recording apparatus according to the first embodiment is specified. Therefore, in description of Embodiment 3, FIG.1 and FIG.2 is also referred.

図7は、図1の復号化部111の構成を示すブロック図である。実施の形態3の映像記録装置は、図7に符号化ストリームからシーンチェンジの抽出処理を行う場合の復号化処理において、DCT(離散コサイン変換)係数の復号化次数を制御する方法に特徴がある。図7に示されるように、復号化部111は、入力された符号化ストリームのヘッダから画素サイズを求める画素サイズ検出部301と、画素サイズ検出部301によって検出された画素サイズからDCTブロックの使用する成分(次数)を決定する次数決定部302と、符号化ストリームに対して次数決定部302で決定した次数まで逆量子化を行いながらDCT係数を抽出するDCT係数抽出部303と、抽出されたDCT係数から逆DCTを実行するIDCT部304と、削減された次数で実行された逆DCTによって離散化してしまった画素データを詰めて縮小された画像を生成する画像整形部305とを有している。   FIG. 7 is a block diagram showing a configuration of the decoding unit 111 in FIG. The video recording apparatus of the third embodiment is characterized in that the decoding order of the DCT (discrete cosine transform) coefficient is controlled in the decoding process when the scene change extraction process is performed from the encoded stream in FIG. . As illustrated in FIG. 7, the decoding unit 111 includes a pixel size detection unit 301 that obtains a pixel size from the header of the input encoded stream, and uses a DCT block based on the pixel size detected by the pixel size detection unit 301. An order determination unit 302 that determines a component (order) to be performed, a DCT coefficient extraction unit 303 that extracts a DCT coefficient while performing inverse quantization on the encoded stream to the order determined by the order determination unit 302, An IDCT unit 304 that performs inverse DCT from DCT coefficients, and an image shaping unit 305 that generates a reduced image by packing pixel data that has been discretized by inverse DCT performed with a reduced order. Yes.

図8(A)乃至(D)は、実施の形態3の映像記録装置のDCT係数削減処理を説明するための図である。図8(A)は、符号化ストリーム画素サイズを示し、図8(B)は、DCTブロック(2×2を使用する場合)とDCTブロック(4×4を使用する場合)を示し、図8(C)は、復号済DCTブロック(2×2以外を無効とする場合)と復号済DCTブロック(4×4以外を無効とする場合)を示し、図8(D)は、復号画像を示す。実施の形態3においては、ユーザーの希望により符号化する映像の画素サイズを704×480画素と352×240画素から選択できる映像記録装置について説明する。よって、復号化部111に入力されるストリームは、704×480画素の符号化ストリーム又は352×240画素の符号化ストリームの2種類の画素サイズのものが存在する。復号化部111に符号化ストリームが入力されると、まず最初に画素サイズ検出部301が符号化ストリームの画素サイズの検出を行い、検出した画素サイズを次数決定部302に送る。次数決定部302では、検出した画素サイズに応じて、符号化ストリームに含まれるDCT係数のうちの処理する次数Deを決定する。例えば、704×480画素の符号化ストリームの場合はDCTブロックの内の次数2まで、一方、352×240画素の符号化ストリームの場合は次数4まで処理すると予め設定しておく。この次数に従ってDCT係数抽出部303とIDCT部304は、DCTブロックの処理対象とする次数を設定し、復号化を行う。IDCT部304から出力された復号化された映像データは、DCTブロック単位でDCT係数の間引きを行ったため復号化されたDCTブロックをつなぎ合わせて生成された復号化された映像の画素は離散的な映像になっている。この画素間が離散的な映像に対して画素の隙間をつめる処理を画素整形部305で行う。これによって、復号化された映像は、704×480画素の符号化ストリームの場合は176×120画素、352×240画素の符号化ストリームの場合は176×120画素となり、入力された符号化ストリームの画素サイズが違っていたにもかかわらず同じサイズの画像を得ることができる。このように復号化された映像を次のヒストグラム生成器112に送れば、実施の形態1と同様にシーンチェンジの検出を行うことができる。   8A to 8D are diagrams for explaining DCT coefficient reduction processing of the video recording apparatus according to the third embodiment. 8A shows the encoded stream pixel size, FIG. 8B shows the DCT block (when 2 × 2 is used) and the DCT block (when 4 × 4 is used), and FIG. (C) shows a decoded DCT block (when invalidating other than 2 × 2) and a decoded DCT block (when invalidating other than 4 × 4), and FIG. 8 (D) shows a decoded image. . In the third embodiment, a video recording apparatus will be described in which the pixel size of a video to be encoded can be selected from 704 × 480 pixels and 352 × 240 pixels as desired by the user. Therefore, the stream input to the decoding unit 111 has two types of pixel sizes, that is, an encoded stream of 704 × 480 pixels or an encoded stream of 352 × 240 pixels. When an encoded stream is input to the decoding unit 111, the pixel size detection unit 301 first detects the pixel size of the encoded stream and sends the detected pixel size to the order determination unit 302. The order determination unit 302 determines the order De to be processed among the DCT coefficients included in the encoded stream according to the detected pixel size. For example, in the case of an encoded stream of 704 × 480 pixels, processing is set in advance to process up to degree 2 in the DCT block, while in the case of an encoded stream of 352 × 240 pixels, processing up to order 4. According to this order, DCT coefficient extraction section 303 and IDCT section 304 set the order to be processed by the DCT block, and perform decoding. Since the decoded video data output from the IDCT unit 304 is subjected to DCT coefficient decimation in units of DCT blocks, the decoded video pixels generated by connecting the decoded DCT blocks are discrete. It is a video. The pixel shaping unit 305 performs a process of filling the pixel gaps with respect to an image having discrete pixels. As a result, the decoded video is 176 × 120 pixels in the case of an encoded stream of 704 × 480 pixels, and 176 × 120 pixels in the case of an encoded stream of 352 × 240 pixels. Even though the pixel size is different, an image of the same size can be obtained. By sending the decoded video to the next histogram generator 112, the scene change can be detected as in the first embodiment.

すなわち、実施の形態3においては、復号化部111にDCT係数の制御を行う機能が付加されることによって、符号化部101によって異なる画素サイズとして符号化された符号化ストリームであってもシーンチェンジ抽出に使う映像は同じ画素サイズで行うことができることを示すと共に、シーンチェンジ抽出で解析対象とする映像の周波数帯域の上限を同じ帯域に揃えることができることを示している。また、ヒストグラム生成器112以降では常に同じ画素サイズの符号化ストリームに対してシーンチェンジ抽出を行うことができるので、次のヒストグラム生成器112以降の処理は画素サイズに依存することなく同じ処理を行うことができる。   That is, in the third embodiment, a function for controlling the DCT coefficient is added to the decoding unit 111, so that even if the encoded stream is encoded with a different pixel size by the encoding unit 101, a scene change is performed. This indicates that the video used for extraction can be performed with the same pixel size, and that the upper limit of the frequency band of the video to be analyzed by scene change extraction can be made uniform. In addition, since scene change extraction can always be performed on an encoded stream having the same pixel size in the histogram generator 112 and later, the processing in the subsequent histogram generator 112 and later does the same processing without depending on the pixel size. be able to.

上記のように構成することによって、符号化ストリームの画素サイズが違う場合であっても、同じ又は同程度の画素サイズに復号化された映像を得ることができる。   By configuring as described above, it is possible to obtain video decoded to the same or similar pixel size even when the pixel sizes of the encoded streams are different.

また、符号化ストリームの画素サイズが違う場合でも同じ画素サイズの復号化された映像に対して、シーンチェンジ抽出処理を行うことができるので、符号化ストリームの画素サイズが違っているストリームに対しても、同じシーンチェンジの評価方法と評価基準を用いることができ、結果として画素サイズを変えて同じ映像を録画した場合においても、同じ時間位置をシーンチェンジとして検出することができる。   Also, even if the pixel size of the encoded stream is different, the scene change extraction process can be performed on the decoded video of the same pixel size, so that the stream having a different pixel size of the encoded stream can be performed. However, the same scene change evaluation method and evaluation standard can be used. As a result, even when the same video is recorded while changing the pixel size, the same time position can be detected as a scene change.

また、画素サイズが異なる符号化ストリームに対してDCT係数を制御することによって、復号化された画像の周波数帯域を揃えることができるので、画素サイズを変えて同じ映像を録画した場合においても、同じ時間位置をシーンチェンジとして検出することができる。   Also, by controlling the DCT coefficients for encoded streams with different pixel sizes, the frequency band of the decoded image can be made uniform, so the same video can be recorded even when the pixel size is changed. The time position can be detected as a scene change.

また、高解像度の符号化データほど間引きを多くすることができるので、処理時間がかかる高解像度な符号化データであっても高速にシーンチェンジ抽出することができる。   Further, since the higher resolution encoded data can be thinned out more, scene change extraction can be performed at high speed even for high resolution encoded data that requires processing time.

また、高解像度の符号化データほど高周波の次数を間引きくことができるように構成できるので、比較的高周波ノイズの発生し易い高解像度の符号化データほどノイズ除去を効果的に行うことができる。   Further, since the higher-order encoded data can be configured so that the high-frequency order can be thinned out, the higher-resolution encoded data that is relatively easy to generate high-frequency noise can effectively perform noise removal.

また、解像度によらず同一の復号化映像を生成するために、復号化映像を記憶するメモリサイズを同一にすることができる。   Further, in order to generate the same decoded video regardless of the resolution, the memory size for storing the decoded video can be made the same.

また、本来復号化映像を記憶するために大きなメモリサイズを必要とする高解像度映像ほど間引き処理を行うために、復号化処理のために用意しておくべきメモリ領域を小さくすることができる。   In addition, since a thinning process is performed for a high-resolution video that originally requires a large memory size to store the decoded video, a memory area that should be prepared for the decoding process can be reduced.

なお、実施の形態3において、上記以外の点は、上記実施の形態1乃至2の場合と同じである。   The third embodiment is the same as the first and second embodiments except for the points described above.

実施の形態4.
本発明の実施の形態4の映像記録装置は、実施の形態1の映像記録装置の復号化部111の構成を特定した点が、実施の形態1の映像記録装置と相違する。したがって、実施の形態4の説明においては、図1及び図2をも参照する。
Embodiment 4 FIG.
The video recording apparatus according to the fourth embodiment of the present invention is different from the video recording apparatus according to the first embodiment in that the configuration of the decoding unit 111 of the video recording apparatus according to the first embodiment is specified. Therefore, in description of Embodiment 4, FIG.1 and FIG.2 is also referred.

図9は、本発明の実施の形態4の映像記録装置の復号化部の構成を示すブロック図である。図9を用いて符号化ストリームからシーンチェンジの抽出処理を行う場合の復号化処理において、復号化を実行するスライスを限定する処理について説明する。実施の形態4の映像記録装置の復号化部111は、入力された符号化ストリームのヘッダから画素サイズを求める画素サイズ検出部301と、画素サイズ検出部301の検出した画素サイズからシーンチェンジ抽出の処理対象とするスライスを決定する使用スライス決定部306と、符号化ストリームのヘッダを解析するヘッダ検出部307と、符号化ストリームの逆量子化を行う逆量子化部308と、周波数領域に変換された係数値を逆DCT処理するIDCT部304とを有している。   FIG. 9 is a block diagram showing the configuration of the decoding unit of the video recording apparatus according to Embodiment 4 of the present invention. With reference to FIG. 9, a description will be given of a process of limiting the slices to be decoded in the decoding process when the scene change extraction process is performed from the encoded stream. The decoding unit 111 of the video recording apparatus according to the fourth embodiment includes a pixel size detection unit 301 that obtains a pixel size from the header of the input encoded stream, and scene change extraction from the pixel size detected by the pixel size detection unit 301. The slice to be processed is used slice determining unit 306, the header detecting unit 307 that analyzes the header of the encoded stream, the inverse quantizing unit 308 that performs inverse quantization of the encoded stream, and the frequency domain. And an IDCT unit 304 that performs inverse DCT processing on the coefficient values.

次に、スライス削減と合わせて動作するシーンチェンジ抽出処理の動作について説明する。画素サイズ検出部301が画素サイズの検出を行い、使用スライス決定部306が使用するスライスを決定する。ここでは、例えば、符号化部101で生成される符号化ストリームの解像度は720×480画素と352×240画素の2種類のみしか存在しない場合には、垂直方向の画素数が480のときには、上下5スライス、すなわち、
(16画素×5スライス)×2=80画素×2
を使用しないものとし、一方、画素数が240のときには、上下2スライス、すなわち、
(16画素×2スライス)×2=32画素×2
を使用しないものとしている。ここで解像度によって使用しない画素数が異なるが、垂直方向に対する割合は、480画素の場合、全30スライスに対して10スライスを使用しないので、1/3を使用しないことになり、一方、240画素の場合、全15スライスに対して4スライスを使用しないので、4/15を使用しないことになり、ほぼ同じ割合をシーンチェンジ抽出対象としていることが分かる。
Next, the operation of the scene change extraction process that operates in conjunction with slice reduction will be described. The pixel size detection unit 301 detects the pixel size, and the use slice determination unit 306 determines a slice to be used. Here, for example, when there are only two types of resolutions of the encoded stream generated by the encoding unit 101, 720 × 480 pixels and 352 × 240 pixels, when the number of pixels in the vertical direction is 480, 5 slices, ie
(16 pixels × 5 slices) × 2 = 80 pixels × 2
On the other hand, when the number of pixels is 240, the upper and lower slices, that is,
(16 pixels × 2 slices) × 2 = 32 pixels × 2
Not to use. Here, the number of pixels that are not used differs depending on the resolution, but in the case of 480 pixels, 10 slices are not used for all 30 slices, so that 1/3 is not used, whereas 240 pixels. In this case, since 4 slices are not used for all 15 slices, 4/15 is not used, and it can be seen that almost the same ratio is targeted for scene change extraction.

このようにして使用スライス決定部306において使用するスライス数を求め、ヘッダ検出部307で符号化ストリームのヘッダを解析し、スライスヘッダを抽出する毎に先の使用スライス決定部306で使用しないスライスと判定したスライスであれば、次のスライスヘッダまでジャンプし、一方、使用するスライスであれば、該当するスライスを逆量子化部308に送る。逆量子化部308は、符号化ストリームの逆量子化を行い、IDCT部304は、逆DCTを実行する。上記構成によって、使用するスライスのみが復号化処理され、結果として垂直解像度が480画素であれば垂直解像度320画素の映像を、一方、垂直解像度が240画素であれば垂直172画素の復号化された映像を求めることができる。復号化部111によって上記のように垂直方向に削減され復号化された映像に対して、ヒストグラム生成器112では有効なスライス領域と同じ位置の画素を対象にヒストグラムの生成を行う。差分抽出器115で求める差異値dを導出するためにフレーム内の画素数を表すN(1フレーム内の画素数)を利用している。実施の形態4においては、垂直方向に画素を削減したので、フレーム内の画素数Nは以下のように補正される。まず、元が垂直解像度720画素の場合であれば、削減された垂直解像度が320画素で、水平解像度は720画素なので、
N=320×720=230400
となる。また、垂直解像度240画素の場合、削減された垂直解像度が172画素で、水平解像度は352画素であれば
N=172×352=60544
に補正を行う。本補正を行ったうえで求められる差異値dを用いて、シーンチェンジ判定器116は、実施の形態1と同様のシーンチェンジ判定を行うことができる。
In this way, the number of slices used in the used slice determination unit 306 is obtained, the header of the encoded stream is analyzed by the header detection unit 307, and a slice that is not used by the previous use slice determination unit 306 each time a slice header is extracted. If it is the determined slice, it jumps to the next slice header, and if it is a slice to be used, the corresponding slice is sent to the inverse quantization unit 308. The inverse quantization unit 308 performs inverse quantization on the encoded stream, and the IDCT unit 304 performs inverse DCT. With the above configuration, only the slice to be used is decoded. As a result, if the vertical resolution is 480 pixels, the video having the vertical resolution of 320 pixels is decoded, while if the vertical resolution is 240 pixels, the video having the vertical resolution of 172 pixels is decoded. You can ask for a video. The histogram generator 112 generates a histogram for a pixel at the same position as an effective slice area for the video that has been reduced and decoded in the vertical direction as described above by the decoding unit 111. In order to derive the difference value d obtained by the difference extractor 115, N (number of pixels in one frame) representing the number of pixels in the frame is used. In the fourth embodiment, since the number of pixels is reduced in the vertical direction, the number N of pixels in the frame is corrected as follows. First, if the original is a vertical resolution of 720 pixels, the reduced vertical resolution is 320 pixels and the horizontal resolution is 720 pixels.
N = 320 × 720 = 230400
It becomes. Further, in the case of a vertical resolution of 240 pixels, if the reduced vertical resolution is 172 pixels and the horizontal resolution is 352 pixels, N = 172 × 352 = 60544
Make corrections. Using the difference value d obtained after performing this correction, the scene change determination unit 116 can perform the same scene change determination as in the first embodiment.

上記説明においては、スライス単位で復号化をするか否かを設定しているが、シーンチェンジに利用する領域を画素位置又はマクロブロック単位で設定してもよい。この場合、シーンチェンジを検出する位置を特定できるので、検出精度を向上することができる。また、画素毎にシーンチェンジ抽出を行うか否かを設定する場合、すべての画素について復号化を行い、復号化した後に抽出したいエリアのヒストグラム及びヒストグラムの差異値をとることによって実現可能であるが、検出単位をマクロブロック単位で指定するようにすると、ヘッダ検出部又は復号化処理部においてマクロブロック単位で処理を実行するか否かを制御できるので、不必要な復号化を実行しないよう構成でき、処理速度を向上することができる。   In the above description, whether or not to perform decoding is set in units of slices, but an area used for scene change may be set in units of pixel positions or macroblocks. In this case, since the position where the scene change is detected can be specified, the detection accuracy can be improved. Also, when setting whether or not to perform scene change extraction for each pixel, it is possible to perform decoding for all the pixels and take the histogram of the area to be extracted after decoding and the difference value of the histogram. If the unit of detection is designated in units of macroblocks, the header detection unit or decoding processing unit can control whether or not to execute processing in units of macroblocks, so that it can be configured not to perform unnecessary decoding. , Processing speed can be improved.

以上のように構成することによって、復号化及びシーンチェンジ抽出する画素サイズがスライス単位で削減できるので、処理の高速化を実現できる。   With the above configuration, the pixel size for decoding and scene change extraction can be reduced in units of slices, so that the processing speed can be increased.

また、スライスの削減によって復号した画像のサイズも小さくなるので使用するメモリサイズも小さくなる。   Further, since the size of the decoded image is reduced by reducing the slices, the memory size to be used is also reduced.

また、シーンチェンジを検出する対象が放送番組であれば、映像の上下位置のスライスを使用しないように構成することによって、番組の本編との関連性が低い、又は、余り重要ではない情報である、時刻表示、臨時ニュースの文字表示、又はテロップなどに影響されることなくシーンチェンジ抽出を行うことができる。   In addition, if the target of the scene change is a broadcast program, it is information that is less relevant or less important by configuring so that slices at the top and bottom of the video are not used. The scene change can be extracted without being influenced by the time display, the text display of the special news, or the telop.

また、マクロブロック単位で復号化及びシーンチェンジ抽出処理の実行を指定することによって、任意の1つ若しくは複数のマクロブロックに対してのみシーンチェンジ検出が可能になり、位置を特定したシーンチェンジ抽出が可能になる。   In addition, by specifying the execution of decoding and scene change extraction processing in units of macroblocks, it becomes possible to detect scene changes only for any one or more macroblocks, and scene change extraction with a specified position can be performed. It becomes possible.

なお、実施の形態4において、上記以外の点は、上記実施の形態1乃至3の場合と同じである。   The fourth embodiment is the same as the first to third embodiments except for the points described above.

実施の形態5.
実施の形態5の映像記録装置は、差分抽出器115の動作が実施の形態1の映像記録装置と相違する。したがって、実施の形態5の説明においては、図1及び図2をも参照する。
Embodiment 5 FIG.
The video recording apparatus of the fifth embodiment is different from the video recording apparatus of the first embodiment in the operation of the difference extractor 115. Therefore, in description of Embodiment 5, FIG.1 and FIG.2 is also referred.

実施の形態5においては、シーンチェンジ抽出対象となる映像によってシーンチェンジの判定基準を切り替える方法について説明する。図10は映像の画素値のYUV分布を示している。一般的にYUVは各256値で表現され、輝度信号Yは0から255まで、色差信号U及びVは、−128から127までの値をとる。そのとき人間の目でほぼ白と感じる領域及びほぼ黒と感じる領域を、図10において、それぞれW及びBで示している。実施の形態5においては、抽出対象となる映像が、全体として白に近い色の領域が多い映像(以下「白映像」とも言う。)である場合は、領域W以外の領域で差異値を算出し、一方、全体として黒に近い色の領域が多い映像(以下「黒映像」とも言う。)である場合は、領域B以外の領域で差異値を算出する方法によって、比較する2つの映像がよく似た映像であっても的確にシーンチェンジを検出することを目的とする。   In the fifth embodiment, a method of switching a scene change determination criterion according to a scene change extraction target video will be described. FIG. 10 shows a YUV distribution of image pixel values. In general, YUV is expressed by 256 values, the luminance signal Y takes values from 0 to 255, and the color difference signals U and V take values from −128 to 127. At this time, an area that is almost white and an area that is almost black by human eyes are indicated by W and B in FIG. In the fifth embodiment, when the video to be extracted is a video having a large number of regions close to white as a whole (hereinafter also referred to as “white video”), the difference value is calculated in a region other than the region W. On the other hand, in the case of an image having a large number of areas close to black as a whole (hereinafter also referred to as “black image”), the two images to be compared are calculated by a method of calculating a difference value in an area other than area B. The purpose is to detect scene changes accurately even for similar images.

実施の形態5の差分抽出器115の動作を、図11にフローチャートで示す。まず、第1のヒストグラムバッファ113及び第2のヒストグラムバッファ114からi番目のフレーム(以下「iフレーム」とも言う。)及びi−1番目のフレーム(以下「i−1フレーム」とも言う。)のヒストグラムを取得する(ステップS301)。次にそれぞれのフレームの白領域Wの画素数をカウントする(ステップS302)。iフレーム及びi−1フレームの白画素数CWi、CWi−1は次式で表される。

Figure 2011091859
FIG. 11 is a flowchart showing the operation of the difference extractor 115 according to the fifth embodiment. First, the i-th frame (hereinafter also referred to as “i-frame”) and the i−1-th frame (hereinafter also referred to as “i-1 frame”) from the first histogram buffer 113 and the second histogram buffer 114. A histogram is acquired (step S301). Next, the number of pixels in the white area W of each frame is counted (step S302). The numbers of white pixels C Wi and C Wi−1 in the i frame and the i−1 frame are expressed by the following equations.
Figure 2011091859

次に、白領域Wの累積差異rを次式で求める(ステップS303)。

Figure 2011091859
Next, determine the cumulative difference r W of the white area W by the following equation (step S303).
Figure 2011091859

一方、黒領域Bについても同様に、黒画素数CBi、CBi−1を次式で求める(ステップS304)。

Figure 2011091859
On the other hand, for the black region B, the numbers of black pixels C Bi and C Bi−1 are similarly obtained by the following equation (step S304).
Figure 2011091859

また、黒領域Bの累積差異rを次式で求める(ステップS305)。

Figure 2011091859
Moreover, determining cumulative difference r B of the black region B by the following equation (step S305).
Figure 2011091859

次に、iフレーム及びi−1フレームが共に以下の条件式を満足すれば、白に近い色の領域が多い映像(「白映像」とも言う。)であると判断する(ステップS306)。
_MAX>CWi>C_MIN 且つ
_MAX>CWi−1>C_MIN
上記は、全体として白に近い色の領域が多い映像と判定する条件として、白領域Wの画素数が下限C_MINより大きく、上限C_MAX未満であることを条件としている。このように、白画素数が下限より大きいことを満足するだけでなく、上限を設けている理由は、白画素数がある値より大きい場合は、白に近い色の領域以外の画素数が非常に少なくなり、全体の画素数に対して非常に少ない白以外の画素で画像全体のシーンチェンジを判定を行ってしまうことを避けるためである。
Next, if both of the i frame and the i-1 frame satisfy the following conditional expression, it is determined that the video has a lot of white areas (also referred to as “white video”) (step S306).
C W _MAX> C Wi> C W _MIN and C W _MAX> C Wi-1 > C W _MIN
Above, as the color area determining conditions often video close to white as a whole, the number of pixels in the white region W is greater than the lower limit C W _MIN, with the proviso that is less than the upper limit C W _MAX. In this way, not only is the number of white pixels satisfied more than the lower limit, but the reason why the upper limit is set is that when the number of white pixels is larger than a certain value, the number of pixels other than the area close to white is very large. This is to prevent the scene change of the entire image from being determined with pixels other than white, which is very small relative to the total number of pixels.

上記条件を満足できれば、白領域Wを除いた領域について次式で差異値を求める(ステップS307)。

Figure 2011091859
If the above condition can be satisfied, a difference value is obtained for the area excluding the white area W by the following equation (step S307).
Figure 2011091859

一方、白に近い色の領域が多い映像と判断されなかった場合は、以下の条件式で黒に近い色の領域が多い映像であるか否かを判定する(ステップS308)。
_MAX>CBi>C_MIN 且つ
_MAX>CBi−1>C_MIN
上記は、黒に近い色の領域が多い映像と判定する条件として、黒領域Bの画素数が下限C_MINより大きく、上限C_MAX未満であることを条件としている。上記条件を満足できれば、黒領域Bを除いた領域について次式で差異値を求める(ステップS309)。

Figure 2011091859
On the other hand, if it is not determined that the image has many areas close to white, it is determined whether the image has many areas close to black according to the following conditional expression (step S308).
C B _MAX> C Bi > C B _MIN and C B _MAX> C Bi-1 > C B _MIN
Above, as conditions for determining the color of the region is large image close to black, the number of pixels the black region B is greater than the lower limit C B _MIN, with the proviso that is less than the upper limit C B _MAX. If the above condition can be satisfied, a difference value is obtained for the area excluding the black area B by the following equation (step S309).
Figure 2011091859

一方、白に近い色の領域が多い映像と判断されず、且つ、黒に近い色の領域が多い映像とも判断されなかった場合は、実施の形態1で示した差異値の導出式

Figure 2011091859
によって差異値を求める(ステップS310)。 On the other hand, if it is not determined that the image has many areas of colors close to white and the image has many areas of colors close to black, the difference value derivation formula described in the first embodiment is used.
Figure 2011091859
To obtain the difference value (step S310).

以上によって求めた差異値dを用いて、実施の形態1で示した手法と同様に、シーンチェンジ判定器116によってシーンチェンジの判定が行われる。   Using the difference value d obtained as described above, the scene change determination unit 116 determines the scene change in the same manner as the method described in the first embodiment.

上記動作により、比較する2つの映像が共に白に近い色の領域が多い映像であれば白領域Wを除いた領域で映像の変化を比較し、一方、比較する2つの映像が共に黒に近い色の領域が多い映像であれば黒領域Bを除いた領域で映像の変化を比較することができるので、特定の色領域を除いた映像のシーンチェンジを抽出することができる。   By the above operation, if both of the two images to be compared are images having many areas of colors close to white, the change in the image is compared in the area excluding the white area W, while the two images to be compared are both close to black. If the image has many color areas, the change in the image can be compared in the area excluding the black area B, so that the scene change of the image excluding the specific color area can be extracted.

そのために、全体的に白に近い色の領域が多い映像又は黒に近い色の領域が多い映像が続いたシーンにおいてもシーンチェンジを検出することが可能である。   For this reason, it is possible to detect a scene change even in a scene in which an image with many color areas close to white as a whole or an image with many color areas close to black continues.

特に、放送番組のCM(Commercial Message)間のつなぎ目において、白い背景(又は黒い背景)に企業名や製品名が示されたシーンから同じように白い背景(又は黒い背景)に異なる企業名や製品名が示されるシーンに切り替わる場合において、白い背景や黒い背景を除いたエリアでシーンチェンジ判定を行うので、結果として企業名や製品名の領域からシーンチェンジとして検出することができ、CMの区切りを検出するのに非常に有効に動作することができる。   In particular, in a joint between commercial programs (CMs) of a broadcast program, a company name or product that is different on a white background (or black background) in the same way from a scene where the company name or product name is shown on a white background (or black background) When switching to a scene where the name is shown, scene change determination is performed in the area excluding the white background and black background. As a result, it can be detected as a scene change from the area of the company name and product name, and the CM is separated. It can operate very effectively to detect.

なお、実施の形態5において、上記以外の点は、上記実施の形態1乃至4の場合と同じである。   The fifth embodiment is the same as the first to fourth embodiments except for the points described above.

実施の形態6.
図12は、本発明の実施の形態6の映像音声記録装置20の構成を概略的に示すブロック図である。図12に示されるように、映像音声記録装置20は、アンテナ1によって受信された放送波から録画する放送番組を選局するチューナ2と、チューナ2から出力されたアナログ映像信号をデジタル化するビデオA/D変換部3と、チューナ2から出力されたアナログ音声信号をデジタル化するオーディオA/D変換部4と、デジタル映像信号をMPEG−2(Moving Picture Experts Group−2)に圧縮符号化する符号化手段としてのビデオエンコーダ5と、デジタル音声信号を、例えば、リニアPCM(Linear pulse code modulation)又はドルビーデジタル(Dolby Digital)に符号化する符号化手段としてのオーディオエンコーダ6と、符号化された映像及び音声信号を1つの符号化ストリームに多重するマルチプレクサ(Multiplexer)(以下「Mux」とも記す。)7と、ビデオエンコーダ5、オーディオエンコーダ6及びMux7を制御する録画制御部8とを有している。
Embodiment 6 FIG.
FIG. 12 is a block diagram schematically showing the configuration of the video / audio recording apparatus 20 according to the sixth embodiment of the present invention. As shown in FIG. 12, the video / audio recording apparatus 20 includes a tuner 2 that selects a broadcast program to be recorded from a broadcast wave received by an antenna 1 and a video that digitizes an analog video signal output from the tuner 2. The A / D converter 3, the audio A / D converter 4 that digitizes the analog audio signal output from the tuner 2, and the digital video signal is compression-encoded to MPEG-2 (Moving Picture Experts Group-2). A video encoder 5 as an encoding means, an audio encoder 6 as an encoding means for encoding a digital audio signal into, for example, linear PCM (Linear Pulse Code Modulation) or Dolby Digital (Dolby Digital), and encoded Video and audio signals It has a multiplexer (hereinafter also referred to as “Mux”) 7 that multiplexes into one encoded stream, and a video encoder 5, audio encoder 6, and recording controller 8 that controls Mux 7.

また、映像音声記録装置20は、符号化ストリームを記録する記録手段としてのハードディスクドライブ(HDD)11と、Mux7で多重された符号化ストリームをHDD11に安定して書き込むためのストリーム制御手段としてのストリーム制御部9と、符号化ストリームを一時的に記憶するストリームバッファ17と、生成された各符号化ストリームをファイルとしてHDD11に保存するためのファイルシステム部10と、生成された符号化ストリームの番組名や生成日時に加え、特殊再生を実現するためのアドレス情報や後述するCM区間情報を生成及び管理するナビゲーション部12とを有している。   In addition, the video / audio recording apparatus 20 includes a hard disk drive (HDD) 11 as a recording unit for recording the encoded stream, and a stream as a stream control unit for stably writing the encoded stream multiplexed by Mux7 to the HDD 11. The control unit 9, the stream buffer 17 for temporarily storing the encoded stream, the file system unit 10 for saving each generated encoded stream as a file in the HDD 11, and the program name of the generated encoded stream In addition to the generation date and time, the navigation unit 12 generates and manages address information for realizing special reproduction and CM section information described later.

さらに、映像音声記録装置20は、映像の場面転換シーンを検出する映像変化点検出手段としてのシーンチェンジ検出部13と、音声の無音区間を検出する無音検出手段としての無音検出部14と、シーンチェンジと無音区間が同時に発生する変移点を検出する変移点検出手段としての変移点検出部15と、変移点を検出するためにシーンチェンジと無音区間の情報を保持する、変移点検出部15内に備えられた一時記憶手段としての変移点マッチングバッファ19と、複数の変移点からCMに固有の周期性等からCM区間を検出するCM放送区間判定手段としてのCMフィルタ16と、CMフィルタ16で解析する変移点を記憶する変移点スタックテーブル18とを有している。   Furthermore, the video / audio recording apparatus 20 includes a scene change detection unit 13 as a video change point detection unit that detects a scene change scene of video, a silence detection unit 14 as a silence detection unit that detects a silent section of audio, a scene A transition point detector 15 as a transition point detecting means for detecting a transition point at which a change and a silent section occur at the same time, and a transition point detecting section 15 that holds information on a scene change and a silent section in order to detect the transition point A transition point matching buffer 19 as a temporary storage means provided in the CM, a CM filter 16 as a CM broadcast section determination means for detecting a CM section from a plurality of transition points based on the periodicity inherent to the CM, and the CM filter 16. And a transition point stack table 18 for storing transition points to be analyzed.

図12には、記録手段としてHDD105が示されているが、記録手段は、DVDのような光ディスクや磁気テープなどの他の情報記録媒体であってもよい。また、映像音声記録装置20は、放送番組を受信及び録画する受信機又はDVD/HDDハイブリッドレコーダであってもよい。さらに、映像音声記録装置20は、家庭用のビデオレコーダに限らず、パーソナルコンピュータ、映像サーバ、又は、監視システム用の監視レコーダなどの各種用途に適用できる。   FIG. 12 shows the HDD 105 as the recording means, but the recording means may be another information recording medium such as an optical disk such as a DVD or a magnetic tape. The video / audio recording apparatus 20 may be a receiver or a DVD / HDD hybrid recorder that receives and records a broadcast program. Furthermore, the video / audio recording apparatus 20 is applicable not only to a home video recorder but also to various uses such as a personal computer, a video server, or a surveillance recorder for a surveillance system.

ファイルシステム部10は、HDD11に書き込む情報をファイル化することによって書き込み情報に対するアクセスが簡単に行えるようにするためのデータ管理を行う。ファイルシステム部10によって、ストリーム制御部9及びナビゲーション部12は、ストリームや情報をHDD11に書き込み又はHDD11から読み出しを行うときに、HDD11上の直接のアドレスを気にすることなく、ファイルを指定することによって、先頭から順に、又は、指定した位置から順に読み出し及び書き込みを行うことができる。   The file system unit 10 performs data management for making it easy to access the write information by making the information to be written in the HDD 11 into a file. The file system unit 10 allows the stream control unit 9 and the navigation unit 12 to specify a file without worrying about the direct address on the HDD 11 when a stream or information is written to or read from the HDD 11. Thus, reading and writing can be performed in order from the top or in order from the designated position.

ビデオエンコーダ5による符号化方式であるMPEG−2は、可変レートに対応しており、そのため、1秒間に発生する符号量(ビットレート)は時間によって大きく変動する。そのため、ストリーム制御部9は、HDD11へのデータ書き込み及びHDD11からのデータ読み出しによって符号化ストリームがオーバーフロー又はアンダーフローしないように、符号化ストリームをストリームバッファ17に一時的に保持させ、HDD11の状態に応じて符号化ストリームのHDD11への書き出し及びHDD11からの読み込みを行っている。ストリームバッファ17は、リングバッファで構成されており、書き込み位置ポインタと読み出し位置ポインタによって有効なデータ領域が管理されている。すなわち、データの書き込み時には、書き込み位置ポインタを先頭にデータサイズ分書き込みを行い、書き込んだデータサイズ分だけ書き込み位置ポインタを進める。一方、データの読み出し時には、読み出し位置ポインタを先頭にデータサイズ分読み出しを行い、読み出したデータサイズ分だけ読み出し位置ポインタを進める。ただし、リングバッファの終了位置に来たときは、ポインタを先頭の位置に戻す処理を行う。   MPEG-2, which is an encoding method by the video encoder 5, corresponds to a variable rate, and therefore, the amount of code (bit rate) generated per second varies greatly with time. Therefore, the stream control unit 9 temporarily stores the encoded stream in the stream buffer 17 so that the encoded stream does not overflow or underflow due to data writing to the HDD 11 and data reading from the HDD 11, and the HDD 11 is in the state of the HDD 11. Accordingly, the encoded stream is written to the HDD 11 and read from the HDD 11. The stream buffer 17 is composed of a ring buffer, and a valid data area is managed by a write position pointer and a read position pointer. That is, when data is written, writing is performed for the data size with the writing position pointer at the head, and the writing position pointer is advanced by the written data size. On the other hand, when reading data, reading is performed for the data size starting from the reading position pointer, and the reading position pointer is advanced by the read data size. However, when the end position of the ring buffer is reached, processing for returning the pointer to the head position is performed.

次に、放送番組を記録する動作について説明する。ユーザーが手動で録画開始ボタンを押した、又は、予め録画タイマーで設定しておいた録画開始時間になると、チューナ2はアンテナ1で受信した放送波から指定チャンネルを選局する。チューナ2から出力された映像及び音声のアナログ信号は、それぞれビデオA/D変換部3及びオーディオA/D変換部4に送られ、デジタル映像信号及びデジタル音声信号に変換される。録画制御部8は録画開始時にビデオエンコーダ5及びオーディオエンコーダ6に対してエンコード開始を、Mux7に対して多重処理開始を指示する。すると、ビデオA/D変換部3又はオーディオA/D変換部4から出力されたデジタル映像信号及びデジタル音声信号が順次ビデオエンコーダ5及びオーディオエンコーダ6で圧縮符号化処理が行われ、さらに、Mux7で1つのプログラムストリームに多重化が行われ、ストリーム制御部9でストリームの制御を行いながらHDD11に記録されていく。   Next, an operation for recording a broadcast program will be described. When the user manually presses the recording start button or the recording start time set in advance by the recording timer is reached, the tuner 2 selects a designated channel from the broadcast wave received by the antenna 1. The video and audio analog signals output from the tuner 2 are sent to the video A / D converter 3 and the audio A / D converter 4, respectively, and converted into digital video signals and digital audio signals. The recording control unit 8 instructs the video encoder 5 and the audio encoder 6 to start encoding and the Mux 7 to start multiprocessing when recording starts. Then, the digital video signal and the digital audio signal output from the video A / D conversion unit 3 or the audio A / D conversion unit 4 are sequentially compressed and encoded by the video encoder 5 and the audio encoder 6, and further, the mux 7 Multiplexing is performed on one program stream, and recording is performed on the HDD 11 while the stream control unit 9 controls the stream.

ビデオエンコーダ5は、エンコード単位であるGOP(Group of Pictures)の符号化が完了する毎に録画制御部8にGOP符号化完了通知を送る。ストリーム制御部9は、ビデオエンコーダ5及びオーディオエンコーダ6によって符号化されMux7で多重された符号化ストリームをストリームバッファ17の書き込み位置ポインタを先頭に順次書き込む。一方、ストリーム制御部9は、HDD11が書き込み状態になっていることを確認しながら、ストリームバッファ17の読み出し位置ポインタから符号化ストリームを読み出し、HDD11に書き込みを行う。録画が実行されている間、前記動作を繰り返し行う。録画終了時には、録画制御部8は、ビデオエンコーダ5及びオーディオエンコーダ6に対して符号化終了を指示し、符号化を停止させる。符号化停止後、ストリーム制御部9は、ストリームバッファ17に残っている符号化ストリームを全てHDD11に書き込む。   The video encoder 5 sends a GOP encoding completion notification to the recording control unit 8 every time encoding of GOP (Group of Pictures) which is an encoding unit is completed. The stream control unit 9 sequentially writes the encoded stream encoded by the video encoder 5 and the audio encoder 6 and multiplexed by Mux 7 with the write position pointer of the stream buffer 17 as the head. On the other hand, the stream control unit 9 reads the encoded stream from the read position pointer of the stream buffer 17 and writes it to the HDD 11 while confirming that the HDD 11 is in a write state. While the recording is being performed, the above operation is repeated. At the end of recording, the recording control unit 8 instructs the video encoder 5 and the audio encoder 6 to end the encoding, and stops the encoding. After the encoding is stopped, the stream control unit 9 writes all the encoded streams remaining in the stream buffer 17 to the HDD 11.

次に、シーンチェンジ検出と無音検出について説明する。録画制御部8は、GOPの符号化完了をビデオエンコーダ5から受け取る毎に、シーンチェンジ検出部13に対してシーンチェンジ検出コマンドを送る。シーンチェンジ検出部13は、エンコードが完了したGOPデータをストリーム制御部9から読み出し、映像のシーンチェンジの検出を行う。検出方法の一例としては、以下の方法がある。まず、読み出したGOP単位のデータからIピクチャの復号化を行い、ヒストグラムを作成する。そのヒストグラムと一つ前のIピクチャのヒストグラムと比較を行い、ヒストグラムの各要素値の絶対値の差の合計をシーンチェンジ差異値と定義し、そのシーンチェンジ差異値が予め設定された閾値より大きければシーンチェンジであると判定する。以下の説明においては、説明を簡単にするために、GOPを構成するピクチャ数は15枚固定であり、そのGOPの時間は0.5秒であるものとする。よって、シーンチェンジの発生した時刻は、GOPの個数で簡単に表すことが可能となる。   Next, scene change detection and silence detection will be described. The recording control unit 8 sends a scene change detection command to the scene change detection unit 13 every time GOP encoding completion is received from the video encoder 5. The scene change detection unit 13 reads the GOP data that has been encoded from the stream control unit 9 and detects a scene change of the video. As an example of the detection method, there is the following method. First, the I picture is decoded from the read GOP unit data, and a histogram is created. The histogram is compared with the histogram of the previous I picture, and the sum of the absolute value differences of each element value of the histogram is defined as the scene change difference value, and the scene change difference value is larger than a preset threshold value. If it is a scene change, it is determined. In the following description, to simplify the description, it is assumed that the number of pictures constituting a GOP is fixed to 15 and the GOP time is 0.5 seconds. Therefore, the time when the scene change occurs can be easily expressed by the number of GOPs.

オーディオA/D変換部4は、アナログ音声信号をデジタル音声信号であるリニアPCM信号に変換する。無音検出部14は、入力されたリニアPCM信号の振幅が予め設定されている閾値以下の状態が予め設定された時間以上続けば無音区間であると判定する。ここでは、入力されたリニアPCM信号の振幅が予め設定されている閾値以下の状態が、300ミリ秒以上続けば、無音区間が発生したと判定する。無音区間の条件として、ある時間以上、リニアPCM信号の振幅が低い状態が続くことを必要としている理由は、瞬間的な無音を、無音区間と判定しないようにするため、及び、無音の発生毎に後述するCM放送区間検出動作の頻度が多くなると、システムの処理負荷が大きくなってCM放送区間検出以外の動作に支障を来たすおそれがあるからである。無音区間であると判定した場合、録画開始からのサンプル数の累積番号により無音開始時刻を算出する。また、無音区間が継続されている状態でリニアPCM信号の振幅が、予め設定されている閾値より大きくなった場合、無音区間が終了したと判定し、同様にサンプル数の累積番号から無音終了時刻を算出する。   The audio A / D converter 4 converts the analog audio signal into a linear PCM signal that is a digital audio signal. The silence detection unit 14 determines that the period is a silence interval if the state where the amplitude of the input linear PCM signal is equal to or less than a preset threshold value continues for a preset time. Here, if the state in which the amplitude of the input linear PCM signal is equal to or less than a preset threshold value continues for 300 milliseconds or more, it is determined that a silent section has occurred. The reason for requiring that the state of the amplitude of the linear PCM signal be low for a certain period of time or more as a condition of the silent section is to prevent instantaneous silence from being determined as a silent section, and for each occurrence of silence. This is because if the frequency of the CM broadcast section detection operation described later increases, the processing load on the system increases, which may hinder operations other than the CM broadcast section detection. When it is determined that it is a silent section, the silent start time is calculated from the cumulative number of samples from the start of recording. Further, if the amplitude of the linear PCM signal becomes larger than a preset threshold value while the silence period is continued, it is determined that the silence period has ended, and the silence end time is similarly determined from the accumulated number of samples. Is calculated.

図13は、図12に示される映像音声記録装置20の変移点検出部15の動作を示すフローチャートである。変移点検出部15は、シーンチェンジ検出部13から送られるシーンチェンジ情報又は無音検出部14から送られる無音情報に基づいて動作を切り替える。例えば、変移点検出部15の動作が開始されて、シーンチェンジ検出部13においてシーンチェンジの検出動作を行い(ステップS101)、シーンチェンジ情報としてシーンチェンジ検出フラグ、GOP番号、及びシーンチェンジ差異値が変移点検出部15に送られたとすると、ステップS101において検出されたシーンチェンジ情報は、変移点検出部15内の変移点マッチングバッファ19に保存される(ステップS102)。   FIG. 13 is a flowchart showing the operation of the transition point detector 15 of the video / audio recording apparatus 20 shown in FIG. The transition point detection unit 15 switches the operation based on the scene change information sent from the scene change detection unit 13 or the silence information sent from the silence detection unit 14. For example, the operation of the transition point detection unit 15 is started, and the scene change detection unit 13 performs a scene change detection operation (step S101). The scene change information includes a scene change detection flag, a GOP number, and a scene change difference value. If it is sent to the transition point detection unit 15, the scene change information detected in step S101 is stored in the transition point matching buffer 19 in the transition point detection unit 15 (step S102).

一方、無音検出部14によって無音区間が検出されると(ステップS103)、無音区間情報として無音検出フラグ、無音発生時刻、及び無音終了時刻を変移点検出部15に送る。ステップS103において判定された無音区間に関する無音情報は、変移点検出部15内の変移点マッチングバッファ19に保存される(ステップS104)。無音区間が検出された場合は、さらに変移点マッチングバッファ19上で変移点検出、つまりシーンチェンジと無音が同時に発生した時間位置の検出を行う(ステップS105)。無音区間検出毎に変移点検出を行うのは、シーンチェンジ検出区間と無音区間の積情報を取るには、シーンチェンジ検出より発生頻度の低い無音区間検出の度に行うことが処理効率の面から適しているためである。変移点マッチングバッファ19には、最新のシーンチェンジ及び無音区間の情報が一時的に保持されており、双方が一致した場合は、一致した情報が次の処理であるステップS106に送られるとともに、そのシーンチェンジ情報及び無音区間情報と、それ以前のシーンチェンジ情報及び無音区間情報が破棄される。また、予め設定された一定時間が経過したときにも、シーンチェンジ情報及び無音区間情報が破棄される。このような制御によって、有限のバッファサイズであっても、リアルタイムにシーンチェンジと無音区間の一致を検出することができる。したがって、変移点マッチングバッファ19上で、無音区間の開始時刻から終了時刻までの間に発生したシーンチェンジを、シーンチェンジのGOP番号をもとに変移点を検出することができる。そして、シーンチェンジのGOP番号を変移点の時刻を表す値として利用する。このようにして選出された変移点及び一致したシーンチェンジの差異値及び無音の時間長を次のCMフィルタ16に送り(ステップS106)、CMフィルタ16内の変移点格納用の変移点スタックテーブル18に保存し、CMフィルタ16の動作を実行する(ステップS107)。   On the other hand, when a silence section is detected by the silence detector 14 (step S103), a silence detection flag, a silence occurrence time, and a silence end time are sent to the transition point detector 15 as silence section information. The silence information related to the silence section determined in step S103 is stored in the transition point matching buffer 19 in the transition point detection unit 15 (step S104). When a silent section is detected, a transition point is detected on the transition point matching buffer 19, that is, a time position where a scene change and silence occur simultaneously is detected (step S105). From the viewpoint of processing efficiency, the transition point is detected every time a silent section is detected. In order to obtain the product information of the scene change detection section and the silent section, it is necessary to detect the silent section that is less frequently generated than the scene change detection. It is because it is suitable. The transition point matching buffer 19 temporarily holds the latest scene change and silent section information. If both match, the matched information is sent to step S106, which is the next process. Scene change information and silent section information, and previous scene change information and silent section information are discarded. Also, the scene change information and the silent section information are discarded when a predetermined time has elapsed. By such control, even if the buffer size is finite, the coincidence between the scene change and the silent section can be detected in real time. Therefore, a transition point can be detected on the transition point matching buffer 19 based on the scene change GOP number for a scene change that occurs between the start time and end time of the silent section. Then, the GOP number of the scene change is used as a value representing the transition point time. The transition point selected in this way, the difference value of the matched scene change, and the silent time length are sent to the next CM filter 16 (step S106), and the transition point stack table 18 for storing transition points in the CM filter 16 is sent. And the operation of the CM filter 16 is executed (step S107).

次に、図12に示されるCMフィルタ16によってCM放送区間を検出する方法について説明する。図12に示されるように、CMフィルタ16内には、変移点に関する情報を記憶する変移点スタックテーブル18が設けられている。図14は、変移点スタックテーブル18の一例を示す図である。変移点スタックテーブル18は、録画と並行して実行されるCM放送区間検出動作時に更新されるので、リングバッファの構成をとる。よって、リードポインタからライトポインタの手前までがCM放送区間検出のための処理範囲である。変移点スタックテーブル18内には、変移点の時間位置を示す変移点GOP番号と、後続する変移点がCMとみなされた場合の最終変移点の時間位置を示す連結終了GOP番号と、後続する変移点の個数を示す変移点カウンタと、変移点における無音時間長と、変移点におけるシーンチェンジ差異値と、この変移点の有効・無効を示す有効無効フラグとが設けられている。   Next, a method for detecting a CM broadcast section by the CM filter 16 shown in FIG. 12 will be described. As shown in FIG. 12, a transition point stack table 18 for storing information about transition points is provided in the CM filter 16. FIG. 14 is a diagram illustrating an example of the transition point stack table 18. Since the transition point stack table 18 is updated during the CM broadcast section detection operation that is executed in parallel with the recording, the transition point stack table 18 has a ring buffer configuration. Therefore, the processing range for CM broadcast section detection is from the read pointer to the front of the write pointer. In the transition point stack table 18, a transition point GOP number indicating the time position of the transition point, a concatenation end GOP number indicating the time position of the last transition point when the subsequent transition point is regarded as a CM, and the like follow. A transition point counter indicating the number of transition points, a silent time length at the transition point, a scene change difference value at the transition point, and an valid / invalid flag indicating validity / invalidity of the transition point are provided.

変移点GOP番号は、シーンチェンジが検出されたGOP番号である。実施の形態6においては、シーンチェンジの検出精度を1GOPとしているため、録画開始からのGOPの累積番号で時間を表すことができる。   The transition point GOP number is the GOP number where the scene change is detected. In the sixth embodiment, since the accuracy of scene change detection is 1 GOP, time can be expressed by the cumulative number of GOPs from the start of recording.

連結終了GOP番号とは、ある変移点を基点としたCM放送区間における最終変移点のGOP番号である。図14においては、変移点GOP番号‘10’の場合、GOP番号‘10’、‘40’、‘101’においてCMが継続して検出されるので、GOP番号‘101’が連結終了GOP番号になる。変移点検出部15では、変移点33gが検出されると、GOP番号‘101’にGOP番号‘130’が連結され、変移点33bから変移点33gまでがCM放送区間と判定される。また、変移点GOP番号に後続する変移点がない場合は、連結終了GOP番号は、変移点GOP番号と同じ値になる。   The connection end GOP number is the GOP number of the last transition point in the CM broadcast section based on a certain transition point. In FIG. 14, in the case of the transition point GOP number “10”, CMs are continuously detected at the GOP numbers “10”, “40”, and “101”, so the GOP number “101” becomes the connection end GOP number. Become. When the transition point detection unit 15 detects the transition point 33g, the GOP number ‘101’ is connected to the GOP number ‘130’, and the transition point 33b to the transition point 33g is determined to be a CM broadcast section. Further, when there is no transition point subsequent to the transition point GOP number, the connection end GOP number has the same value as the transition point GOP number.

変移点カウンタは、CM放送区間においてCMが変移点で連結された場合における変移点の数を示す。   The transition point counter indicates the number of transition points when CMs are connected at transition points in the CM broadcast section.

無音時間長は、変移点における無音区間の長さをミリ秒単位で示す。   The silent time length indicates the length of the silent section at the transition point in milliseconds.

シーンチェンジ差異値は、変移点におけるシーンチェンジの変化量を0から1までの値で示す。シーンチェンジ差異値が大きいほど、映像の変化量が大きいことを意味する。   The scene change difference value indicates the change amount of the scene change at the transition point from 0 to 1. The larger the scene change difference value, the larger the amount of change in the video.

有効無効フラグは、変移点スタックテーブル内において処理対象範囲であることを示すフラグであり、変移点が登録されたときには有効‘1’が設定され、CMフィルタ16の処理において、例えば、‘40’のように、先行する変移点に連結された変移点について無効‘0’に変更される。また、ある変移点が処理対象範囲から外れた場合、例えば、‘10’、‘40’、‘101’、‘131’をCM区間として検出した場合に、‘10’以前の‘6’や、‘10’から‘131’の間の全ての変移点‘62’、‘83’を無効‘0’にすることによって、処理の高速化及び変移点スタックテーブルに必要なメモリサイズの低減を図ることができる。   The valid / invalid flag is a flag indicating that it is a processing target range in the transition point stack table, and is set to “1” when the transition point is registered. In the processing of the CM filter 16, for example, “40” is set. As described above, the transition point connected to the preceding transition point is changed to invalid '0'. Further, when a certain transition point is out of the processing target range, for example, when “10”, “40”, “101”, “131” is detected as a CM section, “6” before “10”, By disabling all transition points '62' and '83' between '10' and '131' to '0', the processing speed is increased and the memory size required for the transition point stack table is reduced. Can do.

CMフィルタ16においては、変移点スタックテーブル18の要素である変移点をそれぞれ比較し、変移点の間隔が所定の基準間隔、例えば、15秒、30秒、60秒、又は90秒相当であるものを抜き出していく。そのとき、検出誤差、CMのフレームレベルでの長さのばらつき等によりCMの長さが15秒からずれる可能性があるので、そのための許容誤差を、例えば、1GOP分設ける。よって、先の変移点の間隔として有効な間隔は、GOPの個数で表現でき、30GOP±1GOP、60GOP±1GOP、120GOP±1GOP、及び180GOP±1GOPのように、±1GOPの許容誤差を設けたGOPの数で表現することができる。CMフィルタ16においては、上記変移点の間隔が上記のように予め設定しているGOPの間隔と一致する変移点の間隔をCM候補間隔とする。さらに、CM候補間隔が連続して2個以上ある場合には、その区間をCM放送区間とする。   The CM filter 16 compares transition points that are elements of the transition point stack table 18, and the transition point interval is equivalent to a predetermined reference interval, for example, 15 seconds, 30 seconds, 60 seconds, or 90 seconds. Will be extracted. At that time, the CM length may be deviated from 15 seconds due to a detection error, a variation in the length of the CM at the frame level, and the like. For example, an allowable error is provided for 1 GOP. Therefore, an effective interval as the interval of the previous transition point can be expressed by the number of GOPs, and a GOP having a tolerance of ± 1 GOP such as 30 GOP ± 1 GOP, 60 GOP ± 1 GOP, 120 GOP ± 1 GOP, and 180 GOP ± 1 GOP. It can be expressed by the number of In the CM filter 16, the interval between transition points where the interval between the transition points coincides with the GOP interval set in advance as described above is set as the CM candidate interval. Furthermore, when there are two or more CM candidate intervals in succession, the section is set as a CM broadcast section.

図15(A)乃至(E)は、実施の形態6の映像音声記録装置20におけるCM放送区間検出動作を説明するための図である。図15(A)乃至(E)を用いてCM区放送間を特定する方法について説明する。無音検出部14によって無音区間31a,…,31mが検出された場合を説明する。一方、図15(B)に示されるように、シーンチェンジ32a,…,32oが存在するものとする。無音区間については、無音発生時刻と無音終了時刻が得られ、シーンチェンジについては、シーンチェンジの発生したGOP番号が得られる。実施の形態6においては、GOPのフレーム数を固定にしているので、GOP番号によって一意に時刻を表すことができる。無音とシーンチェンジの時刻を比較し、同一時刻に無音とシーンチェンジが発生した場合に、この点を変移点とする。ここでは、図15(C)に示されるように、変移点33a,…,33iが検出されている。さらに、各変移点33a,…,33iの間で、上記CM間隔に一致するものをCMと判定する。ここでは、変移点33bから変移点33cまでの間隔が30GOPであり、変移点33cから変移点33fまでの間隔が61GOPであり、変移点33fから変移点33gまでの間隔が29GOPであるので、それぞれの区間がCMとして検出され、さらに、CMが3個連続して続くので、変移点33b,…,33gがCM放送区間であると判定する。さらに、変移点33gから201GOP経過したところで変移点33iが検出されるが、変移点33gから変移点33iまでの間隔は、予め設定されたCM放送区間の最大値である180GOPを超えているので、CMが終了したと判断することができ、CM放送区間検出を完了したことを示している。   15A to 15E are diagrams for explaining the CM broadcast section detection operation in the video / audio recording apparatus 20 of the sixth embodiment. A method for identifying between CM broadcasts will be described with reference to FIGS. A case where the silent sections 31a,..., 31m are detected by the silent detector 14 will be described. On the other hand, it is assumed that scene changes 32a,..., 32o exist as shown in FIG. For the silent section, the silent occurrence time and silent end time are obtained, and for the scene change, the GOP number where the scene change has occurred is obtained. In the sixth embodiment, since the number of GOP frames is fixed, the time can be uniquely expressed by the GOP number. The time of silence and scene change is compared, and when silence and scene change occur at the same time, this point is taken as a transition point. Here, as shown in FIG. 15C, transition points 33a,..., 33i are detected. Further, the transition points 33a,..., 33i that match the CM interval are determined as CMs. Here, the interval from the transition point 33b to the transition point 33c is 30 GOP, the interval from the transition point 33c to the transition point 33f is 61 GOP, and the interval from the transition point 33f to the transition point 33g is 29 GOP. Are detected as CMs, and three CMs continue in succession. Therefore, it is determined that the transition points 33b, ..., 33g are CM broadcast sections. Further, the transition point 33i is detected when 201 GOP has elapsed from the transition point 33g, but the interval from the transition point 33g to the transition point 33i exceeds 180 GOP which is the maximum value of the preset CM broadcast section. It can be determined that the CM has ended, indicating that the CM broadcast section detection has been completed.

次に、図16を用いてCMフィルタ16によるCM検出処理手順について説明する。変移点検出部15においてシーンチェンジと無音区間が同時に発生する変移点が検出されると、その情報がCMフィルタ16に送られることによって、CMフィルタ16の動作が開始する(ステップS401)。検出された変移点の情報は、CMフィルタ16内の変移点スタックテーブル18の最後尾に保存される(ステップS402)。CMフィルタ16内の変移点スタックテーブル18に保存される情報は、有効無効フラグ、変移点GOP番号、連結終了GOP番号、連続するCMとして検出された変移点の個数である変移点カウンタ値、検出された変移点の無音時間長、及びシーンチェンジの変化量を示すシーンチェンジ差異値である。次に、変移点スタックテーブル18の読み出し基点を設定する(ステップS403)。図15(C)において、例えば、前回、変移点33aの処理まで完了していたとすると、今回は次の変移点33bを最初の基点とする。次に、変移点の終点側を設定する(ステップS407)。図15(C)においては、変移点33cを終点とする。もしも、変移点スタックテーブル18に終点となる変移点がなければ(ステップS408)、次の基点を取得する(ステップS404)。図15(C)においては、基点が変移点33aで終点が変移点33iの場合に、基点を変移点33bにする処理である。ここで、次の基点が見つからなければ(ステップS404)、CM検出処理を終了する(ステップS406)。基点と終点が決定した場合、基点から終点までの時間長を求める(ステップS409)。図15(C)においては、基点が変移点33b、終点が変移点33cの場合には、基点‘10’と終点‘40’との差(すなわち、変移点間隔)である30GOPが、時間長である。この時間長が、CM基準時間である30GOP±1GOP、60GOP±1GOP、120GOP±1GOP、及び180GOP±1GOPのいずれかに一致していれば(ステップS410)、基点の連結終了GOP番号を終点の連結終了GOP番号で置き換える(ステップS411)。さらに、終点の有効無効フラグを無効化し(ステップS412)、基点の変移点カウントを一つ増分する(ステップS413)。また、ステップS410においてCM基準時間長ではないと判定された場合は、次に、基点と終点間の時間長が最大CM基準時間長である180GOP±1GOPを超えているか否かを判断し(ステップS414)、超えていると判定された場合には、基点から連結終了GOP番号までをCM放送区間と判定し、CM放送区間の情報を録画制御部8に送る(ステップS415)。さらに、次回のCM放送区間検出処理の基点を今回のCM放送区間の最終変移点の次の変移点に設定すると共に、検出した最終変移点より前の変移点の有効無効フラグを無効化する(ステップS416)。   Next, the CM detection processing procedure by the CM filter 16 will be described with reference to FIG. When the transition point detection unit 15 detects a transition point where a scene change and a silent section occur simultaneously, the information is sent to the CM filter 16 to start the operation of the CM filter 16 (step S401). Information on the detected transition point is stored at the end of the transition point stack table 18 in the CM filter 16 (step S402). Information stored in the transition point stack table 18 in the CM filter 16 includes a valid / invalid flag, transition point GOP number, connection end GOP number, transition point counter value that is the number of transition points detected as consecutive CMs, and detection. This is a scene change difference value indicating the silent time length of the transition point and the change amount of the scene change. Next, the reading base point of the transition point stack table 18 is set (step S403). In FIG. 15C, if, for example, the processing of the transition point 33a has been completed last time, the next transition point 33b is set as the first base point this time. Next, the end point side of the transition point is set (step S407). In FIG. 15C, the transition point 33c is the end point. If there is no transition point as the end point in the transition point stack table 18 (step S408), the next base point is acquired (step S404). In FIG. 15C, the base point is the transition point 33b when the base point is the transition point 33a and the end point is the transition point 33i. If the next base point is not found (step S404), the CM detection process is terminated (step S406). When the base point and the end point are determined, the time length from the base point to the end point is obtained (step S409). In FIG. 15C, when the base point is the transition point 33b and the end point is the transition point 33c, the difference between the base point '10' and the end point '40' (that is, the transition point interval) is 30 GOP. It is. If this time length matches one of the CM reference times of 30 GOP ± 1 GOP, 60 GOP ± 1 GOP, 120 GOP ± 1 GOP, and 180 GOP ± 1 GOP (step S 410), the base end connection end GOP number is connected to the end point connection. Replace with the end GOP number (step S411). Further, the valid / invalid flag at the end point is invalidated (step S412), and the transition point count of the base point is incremented by one (step S413). If it is determined in step S410 that it is not the CM reference time length, it is next determined whether or not the time length between the base point and the end point exceeds the maximum CM reference time length of 180 GOP ± 1 GOP (step S410). In S414), if it is determined that the number has exceeded, it is determined as the CM broadcast section from the base point to the connection end GOP number, and information on the CM broadcast section is sent to the recording control unit 8 (Step S415). Further, the base point of the next CM broadcast section detection process is set to the transition point next to the final transition point of the current CM broadcast section, and the valid / invalid flag of the transition point before the detected final transition point is invalidated ( Step S416).

上記ステップを録画動作中継続して実行することによって、記録する放送番組のCM放送区間をリアルタイムに検出することができる。CMフィルタ16で検出したCM放送区間の時刻情報は、録画制御部8に一旦渡され、録画した番組の管理情報を扱うナビゲーション部12に伝えられ、ファイルシステム10によってファイル化され、CM放送区間情報記録手段として機能するHDD11上に記録される。   By continuously executing the above steps during the recording operation, the CM broadcast section of the broadcast program to be recorded can be detected in real time. The time information of the CM broadcast section detected by the CM filter 16 is once passed to the recording control unit 8 and transmitted to the navigation unit 12 that handles the management information of the recorded program, and is filed by the file system 10 and CM broadcast section information. It is recorded on the HDD 11 that functions as a recording means.

上記のように映像音声記録装置20を構成することによって、放送番組を録画しながらCM放送区間を検出することができる。   By configuring the video / audio recording apparatus 20 as described above, the CM broadcast section can be detected while recording the broadcast program.

また、シーンチェンジ検出機能を有しないエンコーダを用いた場合、通常、録画実行後にあらためて録画された番組を解析する必要があるが、本発明の構成においては、録画動作と並行してCM放送区間の検出が行うことができるので、エンコーダの選択の範囲が広くなり、結果コストや調達性を重視したエンコーダの選択が可能になる。   In addition, when an encoder that does not have a scene change detection function is used, it is usually necessary to analyze a recorded program after the recording is executed. However, in the configuration of the present invention, the CM broadcast section is recorded in parallel with the recording operation. Since detection can be performed, the range of encoder selection is widened, and as a result, it is possible to select an encoder with an emphasis on cost and availability.

さらに、ストリーム制御部9からシーンチェンジ検出部13及び無音検出部14にストリームを送ることによって、HDD11に録画されている番組に対して、CM放送区間検出を行うことも可能である。ただし、その場合、無音検出はシーンチェンジと同様にストリームから解析する方法を使用しなければならない。   Furthermore, it is also possible to detect a CM broadcast section for a program recorded in the HDD 11 by sending a stream from the stream control unit 9 to the scene change detection unit 13 and the silence detection unit 14. However, in that case, silence detection must use a method of analyzing from a stream in the same manner as a scene change.

また、シーンチェンジ検出結果と無音検出結果を一時的な記憶領域である変移点マッチングバッファ19に記録し、変移点マッチングバッファ19の記憶領域上で比較することによって、リアルタイムに変移点を検出することができ、よって、録画と並行してCM放送区間の検出が可能になる。また、同時に発生しているシーンチェンジと無音区間が、ある程度の時間差をもって変移点検出部15に通知されたとしても、変移点マッチングバッファ19で情報が保持されているので、片方の情報をとりこぼすことなくCM放送区間の検出を実行できる。   In addition, the scene change detection result and the silence detection result are recorded in the transition point matching buffer 19 which is a temporary storage area, and the transition point is detected in real time by comparing on the storage area of the transition point matching buffer 19. Therefore, the CM broadcast section can be detected in parallel with the recording. Even if the scene change and the silent section occurring at the same time are notified to the transition point detection unit 15 with a certain time difference, the information is held in the transition point matching buffer 19, so that one of the information is missed. It is possible to detect the CM broadcast section without any problem.

また、シーンチェンジ検出時には一時的な記憶領域である変移点マッチングバッファ19への登録のみを実行し、一方で無音が検出されたときは変移点マッチングバッファ19への登録だけでなく、変移点マッチングバッファ19上で無音と同時に発生するシーンチェンジを検出し、さらに、CM放送区間の検出処理を行う構成にすることによって、検出回数の少ない無音検出に同期して処理を行うことができるので、CPUの処理時間が少なく、かつシステム負荷の少ない状態でCM放送区間の検出を行うことができる。   When a scene change is detected, only registration in the transition point matching buffer 19 which is a temporary storage area is executed. On the other hand, when silence is detected, not only registration in the transition point matching buffer 19 but also transition point matching is performed. By detecting a scene change that occurs simultaneously with silence on the buffer 19 and further performing a detection process for the CM broadcast section, the processing can be performed in synchronization with silence detection with a small number of detections. The CM broadcast section can be detected with a short processing time and a low system load.

また、CM放送区間検出の単位をフレーム単位でなく、例えば、GOP単位とすることによって処理頻度及び処理負荷の低減を計れるだけでなく、CM毎にCMの長さが数フレーム違う場合であっても、各CMの長さの違いに影響されずに、CM放送区間の検出を行うことができる。   Further, not only can the CM broadcast section detection unit be a GOP unit, but not a frame unit, for example, the processing frequency and processing load can be reduced, and the CM length may differ by several frames for each CM. In addition, the CM broadcast section can be detected without being affected by the difference in length of each CM.

また、以上の説明においては、シーンチェンジ検出単位を1GOPとしているが、シーンチェンジ検出単位を複数のGOP単位としてもよい。また、シーンチェンジ検出単位を任意の数のフレーム毎にしてもよい。   In the above description, the scene change detection unit is 1 GOP, but the scene change detection unit may be a plurality of GOP units. Moreover, the scene change detection unit may be set to an arbitrary number of frames.

また、以上の説明においては、シーンチェンジ及び無音検出処理を行う方法としてソフトウェアによる例を示したが、ハードウェアによって実行してもよい。また、音声はオーディオA/D変換部4出力を直接解析しているが、符号化ストリームから解析して無音を検出してもよい。   In the above description, an example using software is shown as a method of performing scene change and silence detection processing, but it may be executed by hardware. In addition, the sound directly analyzes the output of the audio A / D conversion unit 4, but silence may be detected by analyzing from the encoded stream.

実施の形態7.
実施の形態7においては、CM間の境界付近に複数の変移点が存在する場合に、CM間の境界と判定する変移点を選択する方法について説明する。通常、CMの前後部分には、宣伝を行う企業名や製品名などのテロップが一時的に表示されることが多い。このため、CM間の境界付近においては、無音及びシーンチェンジが同時に起こり、変移点が複数回連続して発生する場合が多い。一方、CM放送区間の検出においては、CMの時間長さの誤差や検出遅れ及び検出ばらつきを補うため、基準とするCM長さに対して、ある程度の幅を持たせて検出を行っている。例えば、実施の形態6においては、15秒のCMを検出するために、30±1GOPの範囲内で検出を実行している。しかしながら、±1GOPの検出幅において複数回の変移点が存在することがあり、候補となる変移点から1つの変移点を選択する指針が必要であった。そこで、実施の形態7においては、候補となる変移点から1つの変移点を選択する指針となる3つの選択基準を示す。
Embodiment 7 FIG.
In the seventh embodiment, a method of selecting a transition point to be determined as a boundary between CMs when there are a plurality of transition points near the boundary between CMs will be described. Usually, a telop such as the name of a company or a product to be advertised is often temporarily displayed before and after the CM. For this reason, in the vicinity of the boundary between CMs, silence and scene changes occur at the same time, and transition points often occur continuously several times. On the other hand, in the detection of the CM broadcast section, the detection is performed with a certain width with respect to the reference CM length in order to compensate for the CM time length error, detection delay, and detection variation. For example, in the sixth embodiment, detection is performed within a range of 30 ± 1 GOP in order to detect a CM of 15 seconds. However, there may be a plurality of transition points in the detection width of ± 1 GOP, and a guideline for selecting one transition point from candidate transition points is necessary. Therefore, in the seventh embodiment, three selection criteria serving as guidelines for selecting one transition point from candidate transition points are shown.

図17(A)乃至(C)は、候補となる変移点と選択された変移点を示している。第1の方法は、図17(A)に示すように、変移点間隔が30GOP、60GOP、及び90GOPのように、基準時間から±0GOPとなるように、次の変移点を選択していく方法である。   FIGS. 17A to 17C show candidate transition points and selected transition points. In the first method, as shown in FIG. 17A, the next transition point is selected so that the transition point interval is ± 0 GOP from the reference time, such as 30 GOP, 60 GOP, and 90 GOP. It is.

第2の方法は、図17(B)のGOP番号‘30’からGOP番号‘59’までに示すように、あるCM境界検出において選択された変移点の間隔が29GOP(=30GOP−1GOP)となった場合に、図17(B)のGOP番号‘60’からGOP番号‘90’までに示すように、次のCM境界検出における選択された変移点の間隔を、31GOP(=30GOP+1GOP)を中心に選択する方法である。これは、選択された変移点が一時的に基準値からずれた場合(図17(B)におけるGOP番号‘59’に相当する。)、次の変移点は、ずれを打ち消すGOPを優先して選択するものである(図17(B)におけるGOP番号‘90’に相当する)。すなわち、予め設定された基準時間(例えば、30GOP)を中心とする所定の時間範囲内(±1GOPの範囲内)に、検出されたシーンチェンジと検出された無音区間が同時に発生する変移点が複数検出された場合には、CMフィルタ16は、直前に判定されたCMの時間長と、次に前判定されるCMの時間長との合計が、前記予め設定された基準時間(例えば、30GOP)の整数倍に近づける度合いの大きい変移点をCM放送区間を規定するための変移点と判定する。   In the second method, as shown from GOP number “30” to GOP number “59” in FIG. 17B, the interval between transition points selected in a certain CM boundary detection is 29 GOP (= 30 GOP-1GOP). In this case, as shown from GOP number “60” to GOP number “90” in FIG. 17B, the interval of the selected transition point in the next CM boundary detection is centered on 31 GOP (= 30 GOP + 1 GOP). It is a method to choose. This is because when the selected transition point is temporarily deviated from the reference value (corresponding to GOP number '59' in FIG. 17B), the next transition point is given priority to the GOP that cancels the deviation. This is to be selected (corresponding to GOP number “90” in FIG. 17B). That is, there are a plurality of transition points where a detected scene change and a detected silent section occur simultaneously within a predetermined time range (within ± 1 GOP) centered on a preset reference time (for example, 30 GOP). When detected, the CM filter 16 determines that the sum of the time length of the CM determined immediately before and the time length of the CM determined next is the reference time set in advance (for example, 30 GOP). It is determined that a transition point having a large degree close to an integral multiple of is a transition point for defining a CM broadcast section.

第3の方法は、累積した時間が、できるだけ±0GOPになるように選択する方法である。これは、図17(C)に示されるように、選択された変移点をGOP番号‘0’、‘29’、‘58’とした後に、GOP間隔が30±0GOPとなるGOP番号‘88’を選択せずに、GOP間隔が30+1GOPとなるGOP番号‘89’を選択し、さらに次の検出に際して、GOP間隔が30GOP−1GOPや30GOP±0GOPを選択せずに、GOP番号‘120‘を選択することによって、変移点のずれが全体として±0GOPになるようにするものである。すなわち、予め設定された基準時間(例えば、30GOP)を中心とする所定の時間範囲内(±1GOPの範囲内)に、検出されたシーンチェンジと検出された無音区間が同時に発生する変移点が複数検出された場合には、CMフィルタ16は、判定されるCM放送区間を、予め設定された基準時間(例えば、30GOP)の整数倍に近づける度合いの大きい変移点をCM放送区間と規定するための変移点と判定する。   The third method is a method of selecting the accumulated time so that it becomes ± 0 GOP as much as possible. As shown in FIG. 17 (C), after the selected transition point is set to GOP numbers “0”, “29”, and “58”, the GOP number “88” in which the GOP interval is 30 ± 0 GOP is obtained. GOP number '89' with GOP interval 30 + 1GOP is selected without selecting GOP, and GOP number '120' is selected without selecting GOP interval 30GOP-1GOP or 30GOP ± 0GOP at the next detection. By doing so, the shift of the transition point as a whole becomes ± 0 GOP. That is, there are a plurality of transition points where a detected scene change and a detected silent section occur simultaneously within a predetermined time range (within ± 1 GOP) centered on a preset reference time (for example, 30 GOP). When detected, the CM filter 16 defines a transition point having a large degree of approaching the determined CM broadcast section as an integral multiple of a preset reference time (for example, 30 GOP) as the CM broadcast section. Judge as a transition point.

上記第2の方法又は第3の方法を採用することによって、検出誤差等によって、一旦変移点が本来のCM間の境界位置からずれた場合であっても、補正処理が可能となり、結果としてCM放送区間検出精度を向上させることができる。   By adopting the second method or the third method, correction processing can be performed even when the transition point is once deviated from the boundary position between the original CMs due to a detection error or the like. Broadcast segment detection accuracy can be improved.

また、変移点のずれが全体として±0GOPとなる変移点を優先的に選択することによって、検出したCM放送区間が基準時間に近くなるようになり、CM放送区間の検出精度が向上する。   In addition, by preferentially selecting transition points at which transition point deviations become ± 0 GOP as a whole, the detected CM broadcast section comes close to the reference time, and the detection accuracy of the CM broadcast section is improved.

また、累積時間数又はGOP数の累積値の基準時間からのずれが、±0GOPになるように、検出した変移点に対して重み付けを行うことによって、1つのCMを検出するための誤差である±1GOPがCM放送区間を継続して実行するなかで、CMの数が増えるほど累積する、すなわち、本来のCM境界からずれる、さらには本来のCM境界からずれることによって検出すべきCMが検出できなくなるという問題を低減することができる。   Further, this is an error for detecting one CM by weighting the detected transition point so that the deviation from the reference time of the cumulative value of the cumulative time number or the GOP number becomes ± 0 GOP. While ± 1 GOP is continuously executed in the CM broadcast section, it can be accumulated as the number of CMs increases, that is, the CM to be detected can be detected by deviating from the original CM boundary or even deviating from the original CM boundary. The problem of disappearance can be reduced.

なお、実施の形態7において、上記以外の点は、上記実施の形態6の場合と同じである。   In the seventh embodiment, points other than those described above are the same as in the sixth embodiment.

実施の形態8.
実施の形態8においては、変移点における無音時間長を用いてCM放送区間の検出精度を向上させる方法を説明する。
Embodiment 8 FIG.
In the eighth embodiment, a method for improving the detection accuracy of the CM broadcast section using the silent time length at the transition point will be described.

一般に、テレビ放送番組においては、1つのCMの前後には約0.5秒程度の無音部分が存在し、CMとCMのつなぎ目である境界付近においては、双方のCMの無音部分の和で約1秒(≒0.5秒×2)の無音部分が存在する。一方、番組本編からCMに移行するとき、及び、CMから番組本編に移行するときは、番組本編側の無音部分が短い場合が多く、双方の無音部分の和で約0.6秒程度の無音部分が入るのみである。   In general, in a TV broadcast program, there is a silent part of about 0.5 seconds before and after one CM, and in the vicinity of the boundary between the CM and the CM, the sum of the silent parts of both CMs is about There is a silent part of 1 second (≈0.5 seconds × 2). On the other hand, when moving from the program main part to the CM and when moving from the CM to the main part of the program, the silent part on the main part of the program is often short, and the sum of both silent parts is about 0.6 seconds of silence. Only the part enters.

図18は、実際に放送されている任意の20番組、591本のCMを含む放送区間において、あるCMとその次のCMの間の無音部分の時間長さを測定した結果を示すグラフである。図18に示されるように、CM間の無音部分のほとんどが0.8秒から1.4秒までの間に存在している。   FIG. 18 is a graph showing a result of measuring the time length of a silent portion between a certain CM and the next CM in a broadcasting section including any 20 programs and 591 CMs actually broadcast. . As shown in FIG. 18, most of the silent part between CMs exists between 0.8 seconds and 1.4 seconds.

図19は、図18の場合と同じ任意の20番組の放送区間において、CM放送区間が終了して番組本編に移行するときの無音部分の時間長さを測定した結果を示すグラフである。図19に示されるように、CM放送区間から番組本編に移行するときは、無音部分の時間長さのほとんどが、約0.4秒から約1.2秒までの間に存在していることがわかる。すなわち、実施の形態6で示した変移点における無音時間長が0.4秒から0.8秒までの間、又は、1.4秒以上であれば、ほとんどの場合においてCMが終了し番組本編に移行したと判断することができる。   FIG. 19 is a graph showing the result of measuring the time length of the silent part when the CM broadcast section ends and the program shifts to the main part in the broadcast section of any 20 programs as in FIG. As shown in FIG. 19, when moving from the CM broadcast section to the main part of the program, most of the time length of the silent part exists between about 0.4 seconds and about 1.2 seconds. I understand. In other words, if the silent time length at the transition point shown in Embodiment 6 is between 0.4 seconds and 0.8 seconds, or 1.4 seconds or more, the CM is almost finished and the main program It can be determined that it has shifted to.

図20は、CM間の無音時間長を用いてCM放送区間を検出する方法を示すフローチャートである。図20において、図16のステップと同じステップには、同じ符号を付している。実施の形態8における基本的なCM放送区間の検出方法は、実施の形態6の場合と同じであるが、実施の形態8においては、ステップS420で変移点の無音時間長について検証を行い、CMが2つ以上検出されている状態において、先述のとおり、無音時間長が0.8秒から1.4秒まで(すなわち、第1の規定範囲)に入らなければCMが終了したと判定する工程が追加されている。また、CM放送区間が検出された場合においても、CM放送区間の各変移点の無音時間長において少なくとも1つ以上、0.8秒から1.4秒までの範囲内の時間長を持つ無音部分が存在しているかを検証し(ステップS420)、0.8秒から1.4秒までの範囲内の時間長を持つ無音部分が含まれていなければ、CM放送区間として採用しない工程が追加されている。   FIG. 20 is a flowchart showing a method for detecting a CM broadcast section using the silent time length between CMs. In FIG. 20, the same steps as those in FIG. 16 are denoted by the same reference numerals. The basic CM broadcast section detection method in the eighth embodiment is the same as that in the sixth embodiment, but in the eighth embodiment, the silent time length of the transition point is verified in step S420, and the CM In the state where two or more are detected, as described above, if the silent time length does not fall within the range from 0.8 seconds to 1.4 seconds (that is, the first specified range), it is determined that the CM has ended. Has been added. In addition, even when a CM broadcast section is detected, at least one silence period at each transition point of the CM broadcast section, and a silence portion having a time length within a range from 0.8 seconds to 1.4 seconds Is added (step S420), and if a silent part having a time length within a range from 0.8 seconds to 1.4 seconds is not included, a process not adopted as a CM broadcast section is added. ing.

上記のように構成することによって、CM放送区間の終了及び本編開始位置を検出することができ、CM放送区間の検出精度を向上させることができる。   By configuring as described above, the end of the CM broadcast section and the start position of the main part can be detected, and the detection accuracy of the CM broadcast section can be improved.

とくに、CMから番組本編に移行した後に、CM間隔と同じ間隔でシーンチェンジと無音が発生した場合、番組本編の冒頭部分をCMであると誤検出する場合があるが、無音時間長によりCM終了位置を精度良く検出でき、番組本編冒頭をCMと誤検出する事態の発生頻度を低減でき、結果として、CM放送区間の検出精度を向上させることができる。   In particular, if a scene change and silence occur at the same interval as the CM interval after moving from CM to the program main part, the beginning part of the main part of the program may be erroneously detected as a CM, but the CM ends due to the length of silence. The position can be detected with high accuracy, the occurrence frequency of a situation in which the beginning of the main part of the program is erroneously detected as CM can be reduced, and as a result, the detection accuracy of the CM broadcast section can be improved.

さらに、番組本編中においてシーンチェンジと無音区間が同時に複数発生し、その間隔がCM放送区間におけるシーンチェンジと無音区間の発生の間隔と同じであった場合に、番組本編をCM放送区間であると誤検出する場合があるが、無音時間長がCM間の無音時間長と一致していることを条件とするために、番組本編をCMと誤検出する事態の発生頻度を低減させることができる。   Furthermore, if a plurality of scene changes and silent sections occur simultaneously in the main part of the program, and the interval is the same as the occurrence interval of the scene change and silent section in the CM broadcasting section, the main part of the program is the CM broadcasting section. Although there is a case of erroneous detection, since it is a condition that the silent time length matches the silent time length between CMs, it is possible to reduce the frequency of occurrence of a situation in which the main program is erroneously detected as a CM.

なお、実施の形態8において、上記以外の点は、上記実施の形態6及び7の場合と同じである。   In the eighth embodiment, the points other than the above are the same as those in the sixth and seventh embodiments.

実施の形態9.
実施の形態9においては、シーンチェンジの変化量を示すシーンチェンジ差異値を利用して検出精度を向上させることができるCM放送区間の検出方法について説明する。
Embodiment 9 FIG.
In the ninth embodiment, a method of detecting a CM broadcast section that can improve detection accuracy using a scene change difference value indicating a change amount of a scene change will be described.

図21は、実施の形態9の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間の検出方法を示すフローチャートである。また、図22は、実施の形態9の映像音声記録装置における、シーンチェンジ差異値を利用したCM放送区間検出方法を説明するための図である。図22には、検出されたCM放送区間と、CM放送区間における各CMの境界に位置する変移点51a,…,51fが示されている。一般に、CMと番組本編の間、又は、CMとCMの間の映像的な因果関係は乏しく、よって、シーンチェンジの変化量は極めて大きいものとなる。実施の形態9においては、CMと番組本編の間、及び、CMとCMの間におけるシーンチェンジ差異値が、番組本編内におけるシーンチェンジ差異値よりもが大きいことを利用して、番組本編を誤ってCMとみなす誤検出を低減する方法について示す。   FIG. 21 is a flowchart showing a CM broadcast section detection method using the scene change difference value in the video / audio recording apparatus of the ninth embodiment. FIG. 22 is a diagram for explaining a CM broadcast section detection method using a scene change difference value in the video / audio recording apparatus according to the ninth embodiment. FIG. 22 shows the detected CM broadcast section and transition points 51a,..., 51f located at the boundary of each CM in the CM broadcast section. In general, there is little visual causal relationship between the commercial and the main program or between the commercial and the commercial, so the amount of change in the scene change is extremely large. In the ninth embodiment, the program main part is mistakenly used because the scene change difference value between the CM and the main part of the program and between the CM and the CM is larger than the scene change difference value in the main part of the program. A method for reducing false detections that are regarded as CMs will be described.

図21のフローチャートに示される動作は、実施の形態6における図16のフローチャートに示される動作を基本とし、さらに、シーンチェンジ差異値を利用した幾つかの判断と処理が追加されている。図21において、図16のステップと同じ又は対応するステップには、同じ符号を付している。   The operation shown in the flowchart of FIG. 21 is based on the operation shown in the flowchart of FIG. 16 in the sixth embodiment, and some judgments and processes using the scene change difference value are added. In FIG. 21, the same or corresponding steps as those in FIG. 16 are denoted by the same reference numerals.

まず、CMフィルタ16は、基点となる変移点から終点となる変移点までの時間長がCM基準時間長(例えば、15秒、30秒、60秒、90秒など)と同じと判定された(ステップS410)後に、その基点と終点が先頭CMであり、かつ、時間長が60秒又は90秒であるかを判定する(ステップS430)。その条件に一致した場合、基点のシーンチェンジ差異値と終点のシーンチェンジ差異値を比較し(ステップS431)、基点のシーンチェンジ差異値が大きければ基点位置からCMが開始されたと判定し、ステップS411に復帰する。図22においては、変移点51aと変移点51bのシーンチェンジ差異値を比較し、シーンチェンジ差異値が大きい方を番組本編とCMの境界と判定することを示す。   First, the CM filter 16 determines that the time length from the transition point as the base point to the transition point as the end point is the same as the CM reference time length (for example, 15 seconds, 30 seconds, 60 seconds, 90 seconds, etc.) ( After step S410), it is determined whether the base point and end point are the head CM and the time length is 60 seconds or 90 seconds (step S430). If the conditions match, the base point scene change difference value and the end point scene change difference value are compared (step S431). If the base point scene change difference value is large, it is determined that the CM is started from the base point position, and step S411 is performed. Return to. In FIG. 22, the scene change difference values at the transition point 51a and the transition point 51b are compared, and it is shown that the larger scene change difference value is determined as the boundary between the main program and the CM.

一方、ステップS431において、基点のシーンチェンジ差異値より終点のシーンチェンジ差異値のほうが大きいと判断した場合は、CMフィルタ16は、終点位置からCMが開始される、すなわち、この基点と終点の間は番組本編が継続されていると判定する。   On the other hand, if it is determined in step S431 that the scene change difference value at the end point is larger than the scene change difference value at the base point, the CM filter 16 starts CM from the end point position, that is, between this base point and the end point. Determines that the main program has been continued.

同様に、CMフィルタ16は、CM終了時にも最終CMであり、かつ、時間長が60秒又は90秒であるかを判定し(ステップS432)、条件に一致した場合、基点のシーンチェンジ差異値と終点のシーンチェンジ差異値を比較し(ステップS433)、基点のシーンチェンジ差異値より終点のシーンチェンジ差異値が大きければ終点位置から番組本編が開始されたと判定し、処理をステップS435に移す。図22においては、変移点51eのシーンチェンジ差異値と変移点51fのシーンチェンジ差異値を比較し、シーンチェンジ差異値が大きい方をCMと番組本編の境界と判定することを示す。   Similarly, the CM filter 16 determines whether the CM is the final CM at the end of the CM and whether the time length is 60 seconds or 90 seconds (step S432). And the scene change difference value at the end point are compared (step S433). If the scene change difference value at the end point is larger than the scene change difference value at the base point, it is determined that the main program has been started from the end point position, and the process proceeds to step S435. FIG. 22 shows that the scene change difference value at the transition point 51e is compared with the scene change difference value at the transition point 51f, and the larger scene change difference value is determined as the boundary between the CM and the main program.

一方、終点のシーンチェンジ差異値より基点のシーンチェンジ差異値のほうが大きいと判断した場合は、CMフィルタ16は、基点位置から番組本編が開始された、すなわち、この基点と終点の間はすでに番組本編に入っていると判定する。このように、CM開始時又は本編開始時において60秒又は90秒などの長く、かつ、放送される頻度の少ないCMの場合、その区間の前後のどちらがより映像の変化量が大きいかによって番組本編とCMの境界を判断する。番組本編の冒頭や最後は、ひとまとまりのエピソードや1コーナーなど編集された単位になっている場合があり、その場合に、CMと誤検出する可能性があるが、実施の形態9のCM放送区間検出方法においては、より映像変化の大きいCM境界を見つけることによって、正確にCMと番組本編の境界を検出することができる。   On the other hand, if it is determined that the base scene change difference value is larger than the end point scene change difference value, the CM filter 16 has started the main program from the base point position. Judged to be in the main story. In this way, in the case of a CM that is long such as 60 seconds or 90 seconds at the start of the CM or at the start of the main part and is broadcasted less frequently, the main part of the program depends on which of the video change amount is greater before or after the section. And the boundary of CM. The beginning and end of the main part of the program may be edited units such as a group of episodes and one corner. In this case, there is a possibility of being erroneously detected as a CM. In the section detection method, the boundary between the CM and the main part of the program can be accurately detected by finding the CM boundary having a larger video change.

また、ステップS435においては、全変移点のシーンチェンジ差異値をチェックし、シーンチェンジの判定に用いた閾値より大きな、第2の閾値と比較し、CM放送区間の少なくとも一つの変移点のシーンチェンジ差異値が第2の閾値を越えていれば、CM放送区間として扱うステップS415に移り、反対に、超えていなければこのCM放送区間を無効化する(ステップS436)。図14で説明すると、シーンチェンジ差異値の閾値が0.9であったとすると、変移点33b,33c,33f,33gのうち変移点33b及び33gのシーンチェンジ差異値が閾値0.9を超えているため、変移点33bから変移点33gまでの期間をCM放送区間と判定する。   In step S435, the scene change difference value of all transition points is checked and compared with a second threshold value that is larger than the threshold value used for the scene change determination, and the scene change value of at least one transition point in the CM broadcast section is compared. If the difference value exceeds the second threshold value, the process proceeds to step S415 where it is handled as a CM broadcast section. On the other hand, if the difference value does not exceed the second threshold, the CM broadcast section is invalidated (step S436). Referring to FIG. 14, if the threshold value of the scene change difference value is 0.9, the scene change difference values at the transition points 33b and 33g out of the transition points 33b, 33c, 33f, and 33g exceed the threshold value 0.9. Therefore, the period from the transition point 33b to the transition point 33g is determined as the CM broadcast section.

上記のように番組本編とCMとの境界のCMにおいてシーンチェンジ差異値を番組本編とCMの境界選択に利用することによって、番組本編とCMとの境界を判定することができ、番組本編の冒頭又は最後をCMとして誤検出する事態の発生頻度を低減させることができる。   As described above, the boundary between the program main part and the CM can be determined by using the scene change difference value for selecting the boundary between the program main part and the CM in the CM at the boundary between the program main part and the CM. Alternatively, it is possible to reduce the occurrence frequency of a situation in which the last is erroneously detected as a CM.

また、検出したCM放送区間内においてシーンチェンジ差異値の少なくとも一つが、ある閾値を超えない場合、CMでないと判定することによって、CMに比べて映像の変化量の少ない番組本編をCMであると誤検出する事態の発生頻度を低減させることができる。   In addition, if at least one of the scene change difference values does not exceed a certain threshold within the detected CM broadcast section, it is determined that the program is not a CM so that the main program having a smaller video change amount than the CM is a CM. The frequency of occurrence of erroneous detection can be reduced.

なお、実施の形態9において、上記以外の点は、上記実施の形態6乃至8の場合と同じである。   In the ninth embodiment, points other than those described above are the same as those in the sixth to eighth embodiments.

実施の形態10.
実施の形態10においては、記録されたストリームの先頭に数秒のCMがあり、そのCMに続いて本編が記録されているような場合に、その数秒の断片化されたCMを検出する方法について示す。通常、映像音声記録装置20は、記録を開始すると判断してから、実際の記録が開始されるまでに一定の時間が必要とされており、そのために予め設定されていた記録開始時刻から数秒遡って記録を開始するように構成されているものが多い。また、映像音声記録装置の内部に持っている時計は、常に正確な時刻を指し示している保障はない。そのため、例えば、放送番組がPM9:00に開始予定であり、かつ、PM9:00ちょうどの本編が開始されたとしても、記録されたストリームの先頭に記録されてしまうことがあった。実施の形態10では、記録されたストリームの先頭に記録された断片化されたCMを抽出する方法を示す。
Embodiment 10 FIG.
In the tenth embodiment, when there is a CM of several seconds at the beginning of a recorded stream and the main part is recorded subsequent to the CM, a method of detecting the fragmented CM of the several seconds is shown. . Usually, the video / audio recording apparatus 20 requires a certain period of time from the start of recording to the start of actual recording, and for this reason, the recording start time set in advance several seconds back. Are often configured to start recording. Further, there is no guarantee that the clock held in the video / audio recording apparatus always indicates the correct time. Therefore, for example, even if a broadcast program is scheduled to start at PM 9:00 and the main part at PM 9:00 is started, the program may be recorded at the beginning of the recorded stream. Embodiment 10 shows a method for extracting a fragmented CM recorded at the beginning of a recorded stream.

図23を用いて実施の形態10を説明する。シーンチェンジと無音が同時に発生した点である変移点が、記録されているストリームから検出されたとする。その変移点が、図23の強制CM化区間61内の最終に発生した変移点60cをCMと本編の境界と判断し、記録開始位置62から60cの間をCMとみなす。強制CM化区間は、映像音声記録装置の仕様によって決定され、例えば、記録予定時刻より5秒前から記録が開始されるのであれば、強制CM化区間は5秒とすればよい。また、映像音声記録装置の内部時計の誤差分、例えば、2秒を勘案し、7秒に設定してもよい。ここで、強制CM化区間の最終変移点60cをCMと本編の境界として採用しているのは、強制CM化区間の時間幅が実際の記録開始時刻と記録予定時刻の差にほぼ等しいように設定していることと、CM内の変移点発生頻度は本編中の変移点発生頻度に比べて、かなり高いことによる。   The tenth embodiment will be described with reference to FIG. It is assumed that a transition point, which is a point at which scene change and silence occur simultaneously, is detected from a recorded stream. The transition point 60c finally generated in the forced CM conversion section 61 in FIG. 23 is determined as the boundary between the CM and the main part, and the portion between the recording start position 62 and 60c is regarded as the CM. The compulsory CM conversion section is determined according to the specifications of the video / audio recording apparatus. For example, if recording is started from 5 seconds before the scheduled recording time, the compulsory CM conversion section may be set to 5 seconds. Further, an error of the internal clock of the video / audio recording apparatus, for example, 2 seconds may be taken into consideration, and may be set to 7 seconds. Here, the final transition point 60c of the forced CM section is adopted as the boundary between the CM and the main part so that the time width of the forced CM section is substantially equal to the difference between the actual recording start time and the scheduled recording time. This is because the transition point occurrence frequency in the CM is considerably higher than the transition point occurrence frequency in the main part.

以上より、予め設定された記録予定時刻ちょうどから記録を開始しないために、本編前の不要なCMから記録を開始するような映像音声記録装置であっても、本編より前の不要なCMを検出することができる。   As described above, even if the video / audio recording apparatus starts recording from an unnecessary CM before the main part in order not to start recording at a preset scheduled recording time, an unnecessary CM before the main part is detected. can do.

また、映像音声記録装置の内部時計が正確な時刻を刻んでいなくても、本編より前の不要なCMを検出することができる。   Even if the internal clock of the video / audio recording apparatus does not keep accurate time, it is possible to detect unnecessary CMs before the main part.

また、実施の形態10では、強制CM化区間における最終変移点をCMと本編の境界として採用する方法を取ったが、強制CM化区間の代わりに、強制CM化時刻として記録開始時刻から、例えば、5秒経過した時刻を用い、その強制CM化時刻に最も近い変移点をCMと本編の境界として採用するよう構成してもよい。図23では、60dとCMを本編の境界として採用する方法である。   In the tenth embodiment, the final transition point in the compulsory CM conversion section is adopted as the boundary between the CM and the main part. Instead of the compulsory CM conversion section, for example, from the recording start time as the forced CM conversion time, for example, It is also possible to use a time point when 5 seconds have passed and adopt the transition point closest to the forced CM time as the boundary between the CM and the main part. In FIG. 23, 60d and CM are used as the boundaries of the main part.

また、実施の形態6乃至10の各構成を選択的に組み合わせて、CM放送区間の検出を行うこともできる。   Further, the CM broadcast section can be detected by selectively combining the configurations of Embodiments 6 to 10.

100 映像記録装置、 101 符号化部、 102 録画制御部、 103 ストリーム制御部、 104 ストリームバッファ、 105 HDD、 110 シーンチェンジ抽出部、 111 復号化部、 112 ヒストグラム生成器、 113 第1のヒストグラムバッファ、 114 第2のヒストグラムバッファ、 115 差分抽出器、 116 シーンチェンジ判定器、 120 シーンチェンジコマンド制御部、 121 API部、 122 コマンドバッファ、 123 シーンチェンジ抽出結果バッファ、 124 状態制御部、 301 画素サイズ検出部、 302 次数決定部、 303 DCT係数抽出部、 304 IDCT部、 305 画像整形部、 306 使用スライス決定部、 307 ヘッダ検出部、 308 逆量子化部、 1 アンテナ、 2 チューナ、 3 ビデオA/D変換部、 4 オーディオA/D変換部、 5 ビデオエンコーダ、 6 オーディオエンコーダ、 7 マルチプレクサ(Mux)、 8 録画制御部、 9 ストリーム制御部、 10 ファイルシステム部、 11 HDD、 12 ナビゲーション部、 13 シーンチェンジ検出部、 14 無音検出部、 15 変移点検出部、 16 CMフィルタ、 17 ストリームバッファ、 18 変移点スタックテーブル、 19 変移点マッチングバッファ、 20 映像音声記録装置、 31a,…,31m 無音区間、 32a,…,32o シーンチェンジ、 33a,…,33i 変移点、 34a,…,34c 検出されたCM、 35 検出されたCM放送区間、 51a 番組本編からCM放送区間に移行する時点における変移点、 51b,…,51e CM間の変移点、 51f CM放送区間から番組本編に移行する時点における変移点。
DESCRIPTION OF SYMBOLS 100 Video recording device, 101 Coding part, 102 Recording control part, 103 Stream control part, 104 Stream buffer, 105 HDD, 110 Scene change extraction part, 111 Decoding part, 112 Histogram generator, 113 1st histogram buffer, 114 second histogram buffer, 115 difference extractor, 116 scene change determiner, 120 scene change command control unit, 121 API unit, 122 command buffer, 123 scene change extraction result buffer, 124 state control unit, 301 pixel size detection unit , 302 degree determination unit, 303 DCT coefficient extraction unit, 304 IDCT unit, 305 image shaping unit, 306 used slice determination unit, 307 header detection unit, 308 inverse quantization unit, 1 antenna, 2 tuner, 3 B A / D conversion unit, 4 audio A / D conversion unit, 5 video encoder, 6 audio encoder, 7 multiplexer (Mux), 8 recording control unit, 9 stream control unit, 10 file system unit, 11 HDD, 12 navigation unit , 13 Scene change detection unit, 14 Silence detection unit, 15 Transition point detection unit, 16 CM filter, 17 Stream buffer, 18 Transition point stack table, 19 Transition point matching buffer, 20 Video / audio recording device, 31a, ..., 31m Silence Section, 32a, ..., 32o Scene change, 33a, ..., 33i Transition point, 34a, ..., 34c Detected CM, 35 Detected CM broadcast section, 51a Transition point at time of transition from main program to CM broadcast section 51b, ..., 51e Transition point between CMs, Transition point at the time to migrate to the main program from 1f CM broadcast section.

Claims (19)

映像データを符号化して符号化ストリームを出力する符号化手段と、
符号化ストリームを記録する記録手段と、
前記記録手段に対する符号化ストリームの転送を制御するストリーム制御手段と、
前記ストリーム制御手段が制御する符号化ストリームに対して、該符号化ストリームの符号化単位毎に映像データのシーンチェンジを抽出する映像変化点抽出手段と、
前記符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに前記映像変化点抽出手段に対するシーンチェンジ抽出指示を出力する録画制御手段と
を有し、
前記映像変化点抽出手段は、符号化ストリームを復号化する復号化手段を有する
ことを特徴とする映像記録装置。
Encoding means for encoding video data and outputting an encoded stream;
Recording means for recording the encoded stream;
Stream control means for controlling transfer of the encoded stream to the recording means;
Video change point extraction means for extracting a scene change of video data for each encoding unit of the encoded stream with respect to the encoded stream controlled by the stream control means;
A recording control unit that obtains an encoding completion notification from the encoding unit for each encoding unit of an encoded stream, and outputs a scene change extraction instruction to the video change point extracting unit when the encoding completion notification is acquired; Have
The video recording device, wherein the video change point extraction means includes decoding means for decoding an encoded stream.
前記映像変化点抽出手段は、
前記復号化された映像データのヒストグラムを生成するヒストグラム生成手段と、
前記生成されたヒストグラムを所定の画素数毎に交互に保持する第1のヒストグラムバッファ及び第2のヒストグラムバッファと、
前記第1のヒストグラムバッファに保持されたヒストグラムと前記第2のヒストグラムバッファに保持されたヒストグラムの差異値を求める差分抽出手段と、
前記差分抽出手段で求めた差異値と予め定められた閾値とを比較するシーンチェンジ判定手段と
を有することを特徴とする請求項1に記載の映像記録装置。
The video change point extraction means includes:
Histogram generating means for generating a histogram of the decoded video data;
A first histogram buffer and a second histogram buffer for alternately holding the generated histogram for each predetermined number of pixels;
Difference extraction means for obtaining a difference value between the histogram held in the first histogram buffer and the histogram held in the second histogram buffer;
The video recording apparatus according to claim 1, further comprising: a scene change determination unit that compares the difference value obtained by the difference extraction unit with a predetermined threshold value.
符号化ストリームを記録する記録手段と、
前記記録手段に対する符号化ストリームの転送を制御するストリーム制御手段と、
前記ストリーム制御手段が制御する符号化ストリームに対して、該符号化ストリームの符号化単位毎に映像データのシーンチェンジを抽出する映像変化点抽出手段と、
前記記録手段よりもデータの書込み速度及びデータの読出し速度が早く、前記ストリーム制御手段に入力された符号化ストリームを一時的に記憶する一時記憶手段と
を有し、
前記映像変化点抽出手段によるシーンチェンジの抽出は、前記一時記憶手段から読み出された符号化ストリームに対して実行される
ことを特徴とする映像記録装置。
Recording means for recording the encoded stream;
Stream control means for controlling transfer of the encoded stream to the recording means;
Video change point extraction means for extracting a scene change of video data for each encoding unit of the encoded stream with respect to the encoded stream controlled by the stream control means;
Temporary storage means for temporarily storing the encoded stream input to the stream control means, the data writing speed and the data reading speed being faster than the recording means,
The scene change extraction by the video change point extraction unit is executed on the encoded stream read from the temporary storage unit.
符号化ストリームを記録手段に記録するステップと、
ストリーム制御手段が、前記記録手段に対する符号化ストリームの転送を制御するステップと、
前記映像変化点抽出手段が、前記ストリーム制御手段が制御する符号化ストリームの符号化単位毎に映像データのシーンチェンジを抽出するステップと
を有し、
前記シーンチェンジを抽出するステップは、
復号化手段が、符号化ストリームを復号化するステップと、
録画制御手段が、映像データを符号化して符号化ストリームを出力する符号化手段から符号化ストリームの符号化単位毎に符号化完了通知を取得し、該符号化完了通知を取得したときに前記映像変化点抽出手段に対するシーンチェンジ抽出指示を出力するステップと
を有する
ことを特徴とする映像記録方法。
Recording the encoded stream in a recording means;
A stream control means for controlling transfer of an encoded stream to the recording means;
The video change point extracting means includes a step of extracting a scene change of the video data for each encoding unit of the encoded stream controlled by the stream control means;
The step of extracting the scene change includes:
Decoding means for decoding the encoded stream;
When the recording control means obtains an encoding completion notification for each encoding unit of the encoded stream from the encoding means for encoding the video data and outputs the encoded stream, the video when the encoding completion notice is acquired Outputting a scene change extraction instruction to the change point extraction means.
前記シーンチェンジを抽出するステップは、
ヒストグラム生成手段が、前記復号化された映像データのヒストグラムを生成するステップと、
前記生成されたヒストグラムを所定の画素数毎に交互に第1のヒストグラムバッファ及び第2のヒストグラムバッファに保持するステップと、
差分抽出手段が、前記第1のヒストグラムバッファに保持されたヒストグラムと前記第2のヒストグラムバッファに保持されたヒストグラムの差異値を求めるステップと、
シーンチェンジ判定手段が、前記差分抽出手段で求めた差異値と予め定められた閾値とを比較するステップと
を有することを特徴とする請求項4に記載の映像記録方法。
The step of extracting the scene change includes:
A histogram generating means generating a histogram of the decoded video data;
Holding the generated histogram alternately in a first histogram buffer and a second histogram buffer for each predetermined number of pixels;
A step of obtaining a difference value between the histogram held in the first histogram buffer and the histogram held in the second histogram buffer;
5. The video recording method according to claim 4, wherein the scene change determination unit includes a step of comparing the difference value obtained by the difference extraction unit with a predetermined threshold value.
符号化ストリームを記録手段に記録するステップと、
ストリーム制御手段が、前記記録手段に対する符号化ストリームの転送を制御するステップと、
前記映像変化点抽出手段が、前記ストリーム制御手段が制御する符号化ストリームの符号化単位毎に映像データのシーンチェンジを抽出するステップと
を有し、
前記シーンチェンジを抽出するステップは、
前記記録手段よりもデータの書込み速度及びデータの読出し速度が早い一時記憶手段に、前記ストリーム制御手段に入力された符号化ストリームを一時的に記憶するステップを有し、
前記映像変化点抽出手段によるシーンチェンジの抽出は、前記一時記憶手段から読み出された符号化ストリームに対して実行される
ことを特徴とする映像記録方法。
Recording the encoded stream in a recording means;
A stream control means for controlling transfer of an encoded stream to the recording means;
The video change point extracting means includes a step of extracting a scene change of the video data for each encoding unit of the encoded stream controlled by the stream control means;
The step of extracting the scene change includes:
Temporarily storing the encoded stream input to the stream control means in a temporary storage means having a data writing speed and a data reading speed faster than the recording means;
The video recording method, wherein extraction of a scene change by the video change point extraction unit is executed on an encoded stream read from the temporary storage unit.
映像及び音声の符号化ストリームを記録する記録手段と、
前記記録手段に符号化ストリームを記録する前に、符号化ストリームを一時的に保持するストリーム保持手段と、
前記ストリーム保持手段に保持されている符号化ストリームの映像データからシーンチェンジを検出する映像変化点検出手段と、
音声信号から無音を検出する無音検出手段と、
前記映像変化点検出手段によって検出されたシーンチェンジ情報と前記無音検出手段によって検出された無音情報を一時的に保持する一時記憶手段と、
前記一時記憶手段に保持されたシーンチェンジ情報と無音情報から、シーンチェンジと無音が同時に発生する変移点を検出する変移点検出手段と、
前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段と
を有することを特徴とする映像音声記録装置。
Recording means for recording an encoded video and audio stream;
A stream holding unit for temporarily holding the encoded stream before recording the encoded stream in the recording unit;
Video change point detection means for detecting a scene change from the video data of the encoded stream held in the stream holding means;
Silence detecting means for detecting silence from the audio signal;
Temporary storage means for temporarily holding the scene change information detected by the video change point detection means and the silence information detected by the silence detection means;
From the scene change information and silence information held in the temporary storage means, a transition point detection means for detecting a transition point where a scene change and silence occur simultaneously;
A section in which two or more combinations of transition points in which a transition point interval detected by the transition point detecting means is within a predetermined time range centered on a preset reference time continues continuously is a CM broadcast section. CM broadcast section determination means for determining,
A video / audio recording apparatus comprising: CM broadcast section information recording means for recording time information of a CM broadcast section determined by the CM broadcast section determination means.
映像及び音声の符号化ストリームを記録する記録手段と、
前記記録手段に符号化ストリームを記録する前に、符号化ストリームを一時的に保持するストリーム保持手段と、
前記ストリーム保持手段に保持されている符号化ストリームの音声データから無音を検出する無音検出手段と、
前記無音検出手段によって検出された無音情報を変移点として一時的に保持する一時記憶手段と、
前記一時記憶手段に保持された無音情報の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段と
を有することを特徴とする映像音声記録装置。
Recording means for recording an encoded video and audio stream;
A stream holding unit for temporarily holding the encoded stream before recording the encoded stream in the recording unit;
Silence detecting means for detecting silence from the audio data of the encoded stream held in the stream holding means;
Temporary storage means for temporarily holding the silence information detected by the silence detection means as a transition point;
A section in which two or more transition point combinations in which the interval of silent information held in the temporary storage means falls within a predetermined time range centered on a preset reference time continues is determined as a CM broadcast section. CM broadcast section determination means to perform,
A video / audio recording apparatus comprising: CM broadcast section information recording means for recording time information of a CM broadcast section determined by the CM broadcast section determination means.
映像及び音声の符号化ストリームを記録する記録手段と、
前記記録手段に符号化ストリームを記録する前に、符号化ストリームを一時的に保持するストリーム保持手段と、
前記ストリーム保持手段に保持されている符号化ストリームの映像データから映像のシーンチェンジを検出する映像変化点検出手段と、
前記映像変化点検出手段によって検出されたシーンチェンジ情報を一時的に保持する一時記憶手段と、
前記一時記憶手段に保持されたシーンチェンジ情報の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するCM放送区間判定手段と、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報を記録するCM放送区間情報記録手段と
を有することを特徴とする映像音声記録装置。
Recording means for recording an encoded video and audio stream;
A stream holding unit for temporarily holding the encoded stream before recording the encoded stream in the recording unit;
Video change point detection means for detecting a scene change of the video from the video data of the encoded stream held in the stream holding means;
Temporary storage means for temporarily holding scene change information detected by the video change point detection means;
A section in which two or more transition point combinations in which the interval of scene change information held in the temporary storage means falls within a predetermined time range centered on a preset reference time continues continuously is a CM broadcast section. CM broadcast section determination means for determining,
A video / audio recording apparatus comprising: CM broadcast section information recording means for recording time information of a CM broadcast section determined by the CM broadcast section determination means.
前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合には、
前記CM放送区間判定手段は、
前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第1の値だけ長い場合には、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第1の値だけ短くする変移点を、CM放送区間を規定するための変移点として優先的に選択し、
前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第2の値だけ短い場合には、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第2の値だけ長くする変移点を、CM放送区間を規定するための変移点として優先的に選択する
ことを特徴とする請求項7に記載の映像音声記録装置。
When a plurality of transition points are detected within a predetermined time range centered on the reference time used by the CM broadcast section determination means,
The CM broadcast section determining means is:
If the transition point interval determined immediately before by the CM broadcast section determination means is longer than the reference time by a first value, the transition point interval determined by the CM broadcast section determination means is then set as the reference time. The transition point to be shortened by the first value is preferentially selected as the transition point for defining the CM broadcast section,
When the transition point interval determined immediately before by the CM broadcast section determination means is shorter than the reference time by a second value, the transition point interval determined by the CM broadcast section determination means is then set as the reference time. The video / audio recording apparatus according to claim 7, wherein a transition point that is longer than the second value is preferentially selected as a transition point for defining a CM broadcast section.
前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合には、
前記CM放送区間判定手段は、前記CM放送区間の先頭の変移点から前記検出された各変移点までの時間間隔が、前記基準時間の整数倍に最も近くなる変移点を、前記CM放送区間を規定するための変移点と判定する
ことを特徴とする請求項7に記載の映像音声記録装置。
When a plurality of transition points are detected within a predetermined time range centered on the reference time used by the CM broadcast section determination means,
The CM broadcast section determining means determines a transition point at which a time interval from the first transition point of the CM broadcast section to each detected transition point is closest to an integer multiple of the reference time. The video / audio recording apparatus according to claim 7, wherein the video / audio recording apparatus is determined to be a transition point for defining.
映像及び音声の符号化ストリームを記録手段に記録するステップと、
前記記録手段に符号化ストリームを記録するステップの前に、符号化ストリームをストリーム保持手段に一時的に保持するステップと、
映像変化点検出手段が、前記ストリーム保持手段に保持されている符号化ストリームの映像データからシーンチェンジを検出するステップと、
無音検出手段が、音声信号から無音を検出するステップと、
前記映像変化点検出手段によって検出されたシーンチェンジ情報と前記無音検出手段によって検出された無音情報を一時記憶手段に一時的に保持するステップと、
変移点検出手段が、前記一時記憶手段に保持されたシーンチェンジ情報と無音情報から、シーンチェンジと無音が同時に発生する変移点を検出するステップと、
CM放送区間判定手段が、前記変移点検出手段によって検出された変移点の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するステップと、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報をCM放送区間情報記録手段に記録するステップと
を有することを特徴とする映像音声記録方法。
Recording a video and audio encoded stream in a recording means;
Before the step of recording the encoded stream in the recording means, temporarily holding the encoded stream in the stream holding means;
A step of detecting a scene change from video data of an encoded stream held in the stream holding unit;
A step in which silence detecting means detects silence from the audio signal;
Temporarily storing the scene change information detected by the video change point detection means and the silence information detected by the silence detection means in a temporary storage means;
A transition point detecting means for detecting a transition point where a scene change and silence occur simultaneously from the scene change information and silence information held in the temporary storage means;
The CM broadcast section determination means continues two or more combinations of transition points where the interval of transition points detected by the transition point detection means falls within a predetermined time range centered on a preset reference time. Determining a section to be a CM broadcast section;
Recording the time information of the CM broadcast section determined by the CM broadcast section determination means in the CM broadcast section information recording means.
映像及び音声の符号化ストリームを記録手段に記録するステップと、
前記記録手段に符号化ストリームを記録するステップの前に、符号化ストリームをストリーム保持手段に一時的に保持するステップと、
無音検出手段が、前記ストリーム保持手段に保持されている符号化ストリームの音声データから無音を検出するステップと、
前記無音検出手段によって検出された無音情報を変移点として一時記憶手段に一時的に保持するステップと、
CM放送区間判定手段が、前記一時記憶手段に保持された無音情報の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するステップと、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報をCM放送区間情報記録手段に記録するステップと
を有することを特徴とする映像音声記録方法。
Recording a video and audio encoded stream in a recording means;
Before the step of recording the encoded stream in the recording means, temporarily holding the encoded stream in the stream holding means;
Silence detecting means for detecting silence from the audio data of the encoded stream held in the stream holding means;
Temporarily holding the silence information detected by the silence detection means in the temporary storage means as a transition point;
The CM broadcast section determination means continues two or more combinations of transition points where the interval of the silence information held in the temporary storage means falls within a predetermined time range centered on a preset reference time. Determining a section as a CM broadcast section;
Recording the time information of the CM broadcast section determined by the CM broadcast section determination means in the CM broadcast section information recording means.
映像及び音声の符号化ストリームを記録手段に記録するステップと、
前記記録手段に符号化ストリームを記録するステップの前に、符号化ストリームをストリーム保持手段に一時的に保持するステップと、
映像変化点検出手段が、前記ストリーム保持手段に保持されている符号化ストリームの映像データから映像のシーンチェンジを検出するステップと、
前記映像変化点検出手段によって検出されたシーンチェンジ情報を一時記憶手段に一時的に保持するステップと、
CM放送区間判定手段が、前記一時記憶手段に保持されたシーンチェンジ情報の間隔が予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが連続して2つ以上継続する区間をCM放送区間と判定するステップと、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報をCM放送区間情報記録手段に記録するステップと
を有することを特徴とする映像音声記録方法。
Recording a video and audio encoded stream in a recording means;
Before the step of recording the encoded stream in the recording means, temporarily holding the encoded stream in the stream holding means;
A step of detecting a video scene change from video data of an encoded stream held in the stream holding unit;
Temporarily holding scene change information detected by the video change point detection means in a temporary storage means;
The CM broadcast section determination means continues two or more combinations of transition points where the interval of the scene change information held in the temporary storage means falls within a predetermined time range centered on a preset reference time. Determining a section to be a CM broadcast section;
Recording the time information of the CM broadcast section determined by the CM broadcast section determination means in the CM broadcast section information recording means.
前記CM放送区間を判定するステップは、
前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合であって、前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第1の値だけ長い場合には、前記CM放送区間判定手段が、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第1の値だけ短くする変移点を、CM放送区間を規定するための変移点として優先的に選択し、
前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合であって、前記CM放送区間判定手段により直前に判定された変移点間隔が前記基準時間よりも第2の値だけ短い場合には、前記CM放送区間判定手段が、次に前記CM放送区間判定手段により判定される変移点間隔を前記基準時間よりも第2の値だけ長くする変移点を、CM放送区間を規定するための変移点として優先的に選択する
ステップを有することを特徴とする請求項12に記載の映像音声記録方法。
The step of determining the CM broadcast section includes:
The transition point interval determined immediately before by the CM broadcast segment determination unit when a plurality of the transition points are detected within a predetermined time range centered on the reference time used by the CM broadcast segment determination unit. Is longer than the reference time by the first value, the CM broadcast section determination means sets the transition point interval determined by the CM broadcast section determination means next to the reference time by the first value. Select the transition point to be shortened preferentially as the transition point for defining the CM broadcast section,
A transition point interval determined immediately before by the CM broadcast section determination means when a plurality of the transition points are detected within a predetermined time range centered on the reference time used by the CM broadcast section determination means. Is shorter than the reference time by the second value, the CM broadcast section determination means sets the transition point interval determined by the CM broadcast section determination means next to the reference time by the second value. 13. The video / audio recording method according to claim 12, further comprising a step of preferentially selecting a transition point to be lengthened as a transition point for defining a CM broadcast section.
前記CM放送区間を判定するステップは、前記CM放送区間判定手段が用いる前記基準時間を中心とする所定の時間範囲内に、前記変移点が複数検出された場合に、前記CM放送区間判定手段が、前記CM放送区間の先頭の変移点から前記検出された各変移点までの時間間隔が、前記基準時間の整数倍に最も近くなる変移点を、前記CM放送区間を規定するための変移点と判定するステップを有する
ことを特徴とする請求項12に記載の映像音声記録方法。
The step of determining the CM broadcast section includes the step of determining the CM broadcast section when a plurality of transition points are detected within a predetermined time range centered on the reference time used by the CM broadcast section determination means. The transition point at which the time interval from the first transition point of the CM broadcast section to each detected transition point is the closest to an integral multiple of the reference time is the transition point for defining the CM broadcast section. The video / audio recording method according to claim 12, further comprising a determining step.
映像及び音声の符号化ストリームを記録手段に記録するステップと、
前記記録手段に符号化ストリームを記録するステップの前に、符号化ストリームをストリーム保持手段に一時的に保持するステップと、
無音検出手段が、前記ストリーム保持手段に保持されている符号化ストリームの音声データから無音の発生時刻及び無音時間長を検出し、無音時間長が規定時間継続した場合に無音が検出されたと判定するステップと、
検出された前記無音情報を変移点として一時記憶手段に一時的に保持するステップと、
CM放送区間判定手段が、前記一時記憶手段に保持された無音情報を含む変移点の間隔が、予め設定された基準時間を中心とする所定の時間範囲内になる変移点の組み合わせが、連続して2つ以上継続する区間をCM放送区間と判定するとともに、第3番目以降の変移点の無音時間長が第2の規定範囲内であればCMが継続していると判定するステップと、
前記CM放送区間判定手段によって判定されたCM放送区間の時刻情報をCM放送区間情報記録手段に記録するステップと
を有することを特徴とする映像音声記録方法。
Recording a video and audio encoded stream in a recording means;
Before the step of recording the encoded stream in the recording means, temporarily holding the encoded stream in the stream holding means;
The silence detection means detects the silence occurrence time and the silence time length from the encoded stream audio data held in the stream holding means, and determines that silence has been detected when the silence time length continues for a specified time. Steps,
Temporarily storing the detected silence information as a transition point in a temporary storage means;
A combination of transition points in which the interval between transition points including silence information held in the temporary storage means is within a predetermined time range centered on a preset reference time is continuous. Determining a CM broadcast section as a CM broadcast section and determining that the CM continues if the silent time length of the third and subsequent transition points is within the second specified range;
Recording the time information of the CM broadcast section determined by the CM broadcast section determination means in the CM broadcast section information recording means.
前記CM放送区間判定手段によって判定されたCM放送区間の変移点の中に、無音時間長が第3の規定範囲内に有る変移点が存在しない場合、前記CM放送区間の時刻情報をCM放送区間情報記録手段に記録するステップにおいて、前記CM放送区間を前記CM放送区間情報記録手段に記録しないことを特徴とする請求項17に記載の映像音声記録方法。   If there is no transition point whose silent time length is within the third specified range among the transition points of the CM broadcast section determined by the CM broadcast section determination means, the time information of the CM broadcast section is displayed as the CM broadcast section. 18. The video / audio recording method according to claim 17, wherein in the step of recording in the information recording means, the CM broadcast section is not recorded in the CM broadcast section information recording means. 前記CM放送区間を判定するステップにおいて、検出された前記変移点のうち、ストリームが記録開始されてから規定時間内において、最後尾に発生した変移点までをCM放送区間と判定することを特徴とする請求項12乃至18のいずれか1項に記載の映像音声記録方法。   In the step of determining the CM broadcast section, the detected transition point is determined as a CM broadcast section from the start of recording a stream to a transition point that occurs at the end within a specified time. The video / audio recording method according to any one of claims 12 to 18.
JP2011006173A 2011-01-14 2011-01-14 Video recording apparatus, video recording method, video / audio recording apparatus, and video / audio recording method Expired - Fee Related JP5036882B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011006173A JP5036882B2 (en) 2011-01-14 2011-01-14 Video recording apparatus, video recording method, video / audio recording apparatus, and video / audio recording method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011006173A JP5036882B2 (en) 2011-01-14 2011-01-14 Video recording apparatus, video recording method, video / audio recording apparatus, and video / audio recording method

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007529457A Division JP4707713B2 (en) 2005-08-11 2006-03-17 Video recording apparatus and scene change extraction method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2012130317A Division JP5425972B2 (en) 2012-06-08 2012-06-08 Video / audio recording apparatus and video / audio recording method

Publications (2)

Publication Number Publication Date
JP2011091859A true JP2011091859A (en) 2011-05-06
JP5036882B2 JP5036882B2 (en) 2012-09-26

Family

ID=44109598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011006173A Expired - Fee Related JP5036882B2 (en) 2011-01-14 2011-01-14 Video recording apparatus, video recording method, video / audio recording apparatus, and video / audio recording method

Country Status (1)

Country Link
JP (1) JP5036882B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013157679A (en) * 2012-01-26 2013-08-15 Canon Inc Video processing device, video processing method, and program
US8991605B2 (en) 2008-09-12 2015-03-31 Boehringer Ingelheim International Gmbh Packaging unit
CN117172989A (en) * 2023-11-02 2023-12-05 武汉朱雀闻天科技有限公司 Intelligent campus management method and system based on big data

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH089327A (en) * 1994-06-24 1996-01-12 Mitsubishi Electric Corp Optical disk and its reproduction method
WO1998041978A1 (en) * 1997-03-19 1998-09-24 Hitachi, Ltd. Method and device for detecting starting and ending points of sound section in video
JP2000165796A (en) * 1998-11-30 2000-06-16 Sony Corp Information processor and information processing method and providing medium
JP2000286715A (en) * 1999-03-31 2000-10-13 Toshiba Corp Method and device for recording/reproducing information
JP2002010254A (en) * 2000-06-20 2002-01-11 Sony Corp Feature point detection method and record reproduction device
JP2002084497A (en) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd Digital video recording device and method therefor
JP2004120497A (en) * 2002-09-27 2004-04-15 Ricoh Co Ltd Device and method for detecting scene change, image processor, program and recording medium
JP2005175710A (en) * 2003-12-09 2005-06-30 Sony Corp Digital recording and reproducing apparatus and digital recording and reproducing method
JP3827705B1 (en) * 2005-08-11 2006-09-27 三菱電機株式会社 Video recording apparatus and scene change extraction method
JP3894940B2 (en) * 2005-08-11 2007-03-22 三菱電機株式会社 Video / audio recording device

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH089327A (en) * 1994-06-24 1996-01-12 Mitsubishi Electric Corp Optical disk and its reproduction method
WO1998041978A1 (en) * 1997-03-19 1998-09-24 Hitachi, Ltd. Method and device for detecting starting and ending points of sound section in video
JP2000165796A (en) * 1998-11-30 2000-06-16 Sony Corp Information processor and information processing method and providing medium
JP2000286715A (en) * 1999-03-31 2000-10-13 Toshiba Corp Method and device for recording/reproducing information
JP2002010254A (en) * 2000-06-20 2002-01-11 Sony Corp Feature point detection method and record reproduction device
JP2002084497A (en) * 2000-06-26 2002-03-22 Matsushita Electric Ind Co Ltd Digital video recording device and method therefor
JP2004120497A (en) * 2002-09-27 2004-04-15 Ricoh Co Ltd Device and method for detecting scene change, image processor, program and recording medium
JP2005175710A (en) * 2003-12-09 2005-06-30 Sony Corp Digital recording and reproducing apparatus and digital recording and reproducing method
JP3827705B1 (en) * 2005-08-11 2006-09-27 三菱電機株式会社 Video recording apparatus and scene change extraction method
JP3894940B2 (en) * 2005-08-11 2007-03-22 三菱電機株式会社 Video / audio recording device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8991605B2 (en) 2008-09-12 2015-03-31 Boehringer Ingelheim International Gmbh Packaging unit
JP2013157679A (en) * 2012-01-26 2013-08-15 Canon Inc Video processing device, video processing method, and program
CN117172989A (en) * 2023-11-02 2023-12-05 武汉朱雀闻天科技有限公司 Intelligent campus management method and system based on big data
CN117172989B (en) * 2023-11-02 2024-02-02 武汉朱雀闻天科技有限公司 Intelligent campus management method and system based on big data

Also Published As

Publication number Publication date
JP5036882B2 (en) 2012-09-26

Similar Documents

Publication Publication Date Title
JP4707713B2 (en) Video recording apparatus and scene change extraction method
JP3894940B2 (en) Video / audio recording device
US8457478B2 (en) Method and apparatus for receiving, storing, and presenting multimedia programming without indexing prior to storage
US8249167B2 (en) PVR-support video decoding system
JP4613867B2 (en) Content processing apparatus, content processing method, and computer program
US6798839B2 (en) Image processing device, television receiver and image reproducing device
JP2009124298A (en) Device and method for reproducing coded video image
JP4215681B2 (en) Moving image processing apparatus and method
JP3827705B1 (en) Video recording apparatus and scene change extraction method
JP5036882B2 (en) Video recording apparatus, video recording method, video / audio recording apparatus, and video / audio recording method
JP4432823B2 (en) Specific condition section detection device and specific condition section detection method
JP5425972B2 (en) Video / audio recording apparatus and video / audio recording method
US20050053353A1 (en) Personal video recorder and method for controlling the same
JP5682167B2 (en) Video / audio recording / reproducing apparatus and video / audio recording / reproducing method
JP2011199525A (en) Chapter information creation apparatus and control method therefor
JP5476179B2 (en) Tuner switching device, tuner switching system, and method for controlling tuner switching device
JP5350037B2 (en) Display control apparatus, control method thereof, and program
JP2009117923A (en) Image processor, image processing method and program
JP2006303868A (en) Signal attribute judgment apparatus and method, information signal recording apparatus and method, information signal reproducing apparatus and method, information signal recording and reproducing apparatus and method, and recording medium
JP2019212348A (en) Video recording/playback device and video recording/playback method
JP2006121415A (en) Moving image encoding device

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120410

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120703

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5036882

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees