JP4239496B2 - Information signal processing apparatus and information signal processing method - Google Patents

Information signal processing apparatus and information signal processing method Download PDF

Info

Publication number
JP4239496B2
JP4239496B2 JP2002197311A JP2002197311A JP4239496B2 JP 4239496 B2 JP4239496 B2 JP 4239496B2 JP 2002197311 A JP2002197311 A JP 2002197311A JP 2002197311 A JP2002197311 A JP 2002197311A JP 4239496 B2 JP4239496 B2 JP 4239496B2
Authority
JP
Japan
Prior art keywords
image
playback
processing
recording medium
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002197311A
Other languages
Japanese (ja)
Other versions
JP2004040629A (en
Inventor
昇 村林
裕成 岡本
金男 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002197311A priority Critical patent/JP4239496B2/en
Publication of JP2004040629A publication Critical patent/JP2004040629A/en
Application granted granted Critical
Publication of JP4239496B2 publication Critical patent/JP4239496B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はDVDソフトなど画像音声信号が記録されている記録媒体を所定の装置に装着して再生を行なう場合に、その記録媒体の内容をできるだけ効率良くダイジェスト再生を行なうための信号処理技術、並びに映像信号、音声信号などの情報信号を光磁気ディスク、ハードディスク、半導体メモリーなどの記録媒体に記録する記録装置において、例えば、放送番組を記録して再生時にその番組内の指定した任意のシーンに類似したシーンを選択的に再生してスキミング動作を行い効率的に短時間で所望の内容を把握できる情報信号処理装置、情報信号処理方法に関するものである。
【0002】
【従来の技術】
従来技術において、初めてのソフトなどを再生する場合に、そのソフトの内容の概要を知りたいと思っても、数倍速再生でダイジェスト再生して、面白そうな又は所望の再生場面にきたならば通常再生するなどの手法しかなく、効果的な内容の効果的な確認手段が無い。
【0003】
また、再生しようとする画像音声のダイジェスト再生用IDが既に生成されていることを表示する信号処理装置及び信号処理方法も存在しない。
【0004】
又、例えば、音声信号、映像信号からビデオ構造を解析し、ダイジェスト再生のような特殊再生を行う公知技術として、特表平10−507555「デジタル・オーディオとビデオ・データを走り読みするための方法とそのシステム」、特開平11−239322「ビデオブラウジング/ビューイングシステム」、特開2000−50233「放送型配信方法,その方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体およびビデオコンテンツを記録したコンピュータ読み取り可能な記録媒体」などがある。
【0005】
【発明が解決しようとする課題】
しかしながら、上記説明した従来技術では、例えば、記録時に放送番組などをリアルタイムに画像シーンを分類処理し、所定のシーンIDを分類した画像に割り当てる、といった有効な技術がないという問題がある。
【0006】
又、そのシーンIDを記録した記録媒体から特殊再生に利用し、ダイジェスト再生動作を行うこともできないという問題がある。
【0007】
従って、上記のような観点からソフト再生を行なう場合に、効率良くダイジェスト再生を行なう信号処理技術に解決しなければならない課題を有する。
【0008】
【課題を解決するための手段】
上記課題を解決するために、本願発明に係る情報信号処理装置、情報信号処理方法は、次に示す構成にすることである。
【0009】
(1)情報信号処理装置は、画像音声信号が記録されている第1の記録媒体を再生する再生手段と、前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録する記録手段と、を備え、前記画像音声の特徴の抽出は、通常の再生する区間Hに対して、それよりも少ないイントロの部分を含む区間aの通常再生時間内で特徴を抽出するようにすることである
(2)情報信号処理装置は、画像音声信号が記録されている第1の記録媒体を再生する再生手段と、前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録する記録手段と、を備え、前記画像音声の特徴の抽出は、再生区間H1、H2、H3が長いものであるとき、再生区間H1に対しては、それよりも極めて短い再生区間b1の通常再生時間内で特徴を抽出し、次の再生区間H2に対しては、それよりも極めて短い再生区間b2の通常再生時間内で特徴を抽出し、次の再生区間H3に対しては、それよりも極めて短い再生区間b3の通常再生時間内で特徴を抽出することである
【0010】
(3)情報信号処理方法は、画像音声信号が記録されている第1の記録媒体を再生し、前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録し、前記画像音声の特徴の抽出は、通常の再生する区間Hに対して、それよりも少ないイントロの部分を含む区間aの通常再生時間内で特徴を抽出することである。
(4)情報信号処理方法は、画像音声信号が記録されている第1の記録媒体を再生し、前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録し、前記画像音声の特徴の抽出は、再生区間H1、H2、H3が長いものであるとき、再生区間H1に対しては、それよりも極めて短い再生区間b1の通常再生時間内で特徴を抽出し、次の再生区間H2に対しては、それよりも極めて短い再生区間b2の通常再生時間内で特徴を抽出し、次の再生区間H3に対しては、それよりも極めて短い再生区間b3の通常再生時間内で特徴を抽出することである
【0015】
【発明の実施の形態】
次に、本願発明に係る情報信号処理装置、情報信号処理方法の実施形態について、図面を参照して説明する。
【0016】
先ず、本願発明の第1の実施例の情報信号処理装置の概要について説明すると、レンタルソフト(DVDなど)など予め画像音声信号が記録されている記録媒体又は装置に設置されているハードディスクなどの記録媒体に記録された所定の画像音声情報データを、その装置で初めて再生する場合に、そのことを自動検出し、画像音声の特徴抽出を再生と同時に行いながら要約再生用IDを生成しその装置における所定の記録媒体に記憶する。
即ち、再生区間全ての通常再生時間で特徴を抽出するのではなく、例えば、図1(A)に示すように、通常の再生する区間Hに対して、それよりも少ないイントロの部分も含む区間aの通常再生時間内で特徴を抽出するようにする。図1(B)は、再生区間H1、H2、H3が長いものであるときの特徴を抽出する手法を示したもので、再生区間H1に対しては、それよりも極めて短い再生区間b1の通常再生時間内により特徴を抽出し、次の再生区間H2に対しては、それよりも極めて短い再生区間b2の通常再生時間内で特徴を抽出し、次の再生区間H3に対しては、それよりも極めて短い再生区間b3の通常再生時間内で特徴を抽出するというものである。このように、再生区間が長い場合には、再生区間を区切り、その区切ったなかの一部分の再生区間で特徴を抽出するようにする。
図2(A)、(B)、(C)は、上記図1(A)(実施例1)、または図1(B)(実施例2)におけるH1、H2、H3の処理過程を示すもので、処理の最初の状態は、図2(A)に示すように、通常再生位置と特徴抽出位置は開始位置が同じで、図2(B)のように通常再生時間がt(sec)経過し再生が進むに従って特徴抽出処理の位置も所定の特徴抽出区間の終わりの方に進み、図2(C)のように、斜線部区間の所定の通常再生区間を通常再生した時点で、所定の特徴抽出区間の特徴抽出処理が終了する。
このように、特徴抽出データを用いたダイジェスト再生を行う場合に、所定区間の特徴抽出処理が終了するまでの間、通常再生を行う。
上記のような信号処理により、特徴抽出データを用いたダイジェスト再生モード開始時に、特徴抽出データが予め処理されていない場合でも、特徴抽出処理が終了するまで、所定のダイジェスト再生動作が行えずに画像音声が出力されることがないということを防ぐことができ、更に、本発明による特徴抽出処理の時間は短時間で終了するので、ユーザーは特徴抽出処理中における通常再生動作でもあたかも、すぐに所定の特徴抽出データを用いた所定のダイジェスト再生動作が始まっていると感じることが出来、効率的、効果的な動作を行うことができる。
【0017】
また図2を用いて説明する別の方法で、再生区間が長い場合に時刻経過により特徴を抽出するようにしたものがあり、処理開始時点から数秒間の間で特徴を抽出するようにし(図2(A))、処理開始後t秒後に再度特徴を抽出するようにすることを繰返し(図2(B))、最後に所定区間終了間近かにおいて特徴を抽出する(図2(C))ようにする。このように再生時間の解らないものに対しては、所定の再生時間の経過毎に特徴を抽出するようにしても良い。
上記の図1および図2の説明では特徴抽出処理期間中に通常再生を同時に行った場合の処理であるが、これに限らず、所定区間の特徴抽出処理が終了した時点で、処理した特徴抽出データを用いた所定のダイジェスト再生動作を始めるようにしても良い。このような処理の場合には所定の特徴抽出処理が終了するまで所定のダイジェスト動作は開始しないので、ユーザーに対して特徴抽出中であることを示す表示を行うようにしても良い。
【0018】
そして、再度当該ソフトを再生する場合には、そのソフトであることを判定し、要約再生モードにした場合には、そのIDを読み出すことで、効果的な要約再生など特殊再生を行う処理に素早く移行できる。
【0019】
既に、ID処理がなされている場合は、処理を行わず、IDがあることを所定の表示手段に表示する。
【0020】
又、上記IDを装置内の所定の記録媒体に記憶する代わりに、その記録媒体自体の所定の記憶部(ケース、記録媒体の所定記録領域など)に記憶し、再生時の特殊再生モード動作は、上記と同様の処理を行う。
【0021】
ID処理が既になされている場合は上記の特徴抽出処理は行わず、すでにIDがあることを所定の表示手段に表示する。
【0022】
所定の画像音声が記録されている記録媒体を、装置に装着した場合に、ダイジェスト用ID処理がなされていない場合は、高速再生により自動的にID処理を行なう。
【0023】
以下、本発明の第1の実施例について図面を用いて以下の順序で説明する。
【0024】
[1]動作原理
[2]全体ブロック構成例
[3]動作フローチャート
【0025】
[1]動作原理
(1.1)特性信号の検出方法
ここでは、簡単のため特性信号は、画像音声信号がMPEGで圧縮処理されており、そのMPEGストリームから所定の特性信号を検出するものとする。
【0026】
例えば、図3に示すように、画像系列からIピクチャーを検出し、このIピクチャー毎のDCT(Discrete Cosine Transform;離散コサイン変換)のDC係数から分割し特性ベクトルを生成し、その特性べクトルの距離を演算することで、又、Pピクチャーにおける動きベクトルを検出し類似画像検出とカット点検出を行なうことができる。
即ち、図3のようにフレームを例えば25の領域に分割し、その領域毎に輝度信号y、色差信号cb、crのDC係数の平均値を算出し、その算出値を成分とする輝度信号yの特性ベクトルVy、色差信号cb、crの特性ベクトルVcb、Vcrを演算し、所定時点の特性ベクトルを基準ベクトルとし、ベクトル距離を演算するものである。ここで、フレームの分割領域数は25でなくとも、例えば、36領域のようにやや多くしても、16領域のようにやや少なくしても良く、極端に多い領域または極端に少ない領域数ではないようにし、処理時間、処理精度などに応じて分割数の設定をしても良い。
【0027】
(1.2)所定記録媒体の検出方法
上記のように検出した特性信号(特性ベクトル)は所定の記録媒体のものであると判別できるように、ラベルのある場合はラベルと共に装置内の記録媒体に記憶する。
【0028】
記録媒体にラベルがない場合、またはラベルが重複している場合も想定できるので、その記録媒体のイントロの部分のデータを装置内の記録媒体に記憶しておけば、その記録媒体が装置に装着された場合にそのイントロの部分のデータのマッチングを取ることで記録媒体の判定ができる。
【0029】
場合によっては、すでにその装置で処理した記録媒体のリストをラベルやタイトルがある場合は、それと共に、後で示すブロック図の表示系13で表示しても良い。
【0030】
[2]全体ブロック構成例
情報信号処理装置は、図4に示すように、記録媒体系1と、この記録媒体系1に記録されている情報を再生する再生処理系2と、再生したデータを分離する再生データ分離処理系3と、分離したデータのうち映像データをデコードする映像デコード処理系4と、このデコードした映像信号をアナログ信号に変換して映像信号を出力する映像D/A処理系5と、記録媒体系1に記録されたことを検出する記録媒体検出系6と、記録媒体系1の再生を制御する再生制御系7と、再生データ分離処理系3で分離されたデータのうち識別信号を検出する識別信号検出系8と、再生データ分離処理系3で分離されたデータのうち音声信号をデコードする音声デコード処理系9と、デコードされた音声信号をアナログ値に変換して音声信号として出力する音声D/A処理系10と、映像デコード処理系4並びに音声デコード処理系9から特徴を抽出する特徴抽出系11と、記録媒体検出系6、再生制御系7,識別信号検出系8、特徴抽出系11、表示系13を制御するシステムコントローラー12と、システムコントローラー12の制御により表示する表示系13と、ユーザーがコマンド等を入力するユーザー入力I/F系14と、メモリー系15とからなる。
【0031】
このような構成において、記録媒体検出系6で所定の記録媒体が設置されたことを検出し、イントロの部分の再生を始め、その記録媒体の、所定プログラムがID処理されているか、メモリー系15に記憶されているデータと比較処理して判定する。
又、記録媒体系1を装置に設置されたハードディスクなどの記録媒体の場合は、ユーザーが所望する記録されている所定のプログラムなどを再生動作状態とし、イントロの部分、または所定情報が記録されたTOC(Table of contents)部分の再生を始め、所定プログラムがID処理されているか、メモリー系15に記憶されているデータと比較処理して判定する。
【0032】
ID処理されていない場合は、通常再生と同時に行うか、高速再生でID処理を行なうかする。
【0033】
記録媒体から再生された画像音声データはデコードの後に特徴抽出系11で抽出し、システムコントローラー12を介して、メモリー系15に記憶される。
又、記録媒体系1を例えば、ユーザーが記録可能なDVDやCD(CD−RW)(CD Rewritable)などのような記録媒体の場合、または装置に設置されたハードディスクなどの記録媒体の場合には、画像音声情報が記録されている所定の記録領域とは別の、データの記録が許可された所定の記録領域を設けて、メモリー系15で記録する代わりに所定のデータを記録することもできる。
【0034】
ユーザーのコマンド入力により、特殊再生モードでは、適宜、特性データはこのメモリー系15から呼び出されて、システムコントローラー12により再生制御系7が制御され所定のダイジェスト再生を行なう。
【0035】
[3]動作フローチャート
以下、上記構成からなる情報信号処理装置の動作について、図5〜図7に示すフローチャートを参照して説明する。
【0036】
先ず、記録媒体が検出されると、メモリー系15からデータを読み出す(ステップST11、ST12)。
【0037】
そして、イントロの部分の再生が開始し、比較処理再生回数の判定が行われる(ステップST13、ST14)。
【0038】
もし、初めての場合には、初めてであることを表示し、モード0(Mode=0)に設定して回数メモリーに書き込む(ステップST15、ST16、ST17、ST18)。
【0039】
ステップST15において、初めてでない場合には、2回目以上であることの回数の表示を行う(ステップST19)。
【0040】
そして、モード1(Mode=1)に設定して回数メモリーに書き込む(ステップST20、ST21)。
【0041】
そして、再生モード入力待ちの状態にしておき、入力がなく停止の場合には、停止する(ステップST22、ST23、ST24、ST25)。
【0042】
ステップST23において、入力有りの場合には、次にダイジェスト再生であるか否かを判別し、ダイジェスト再生の場合であって、モード1(Mode=1)の場合にはメモリー系15のID読み込みを行う(ステップST26、ST27、ST33)。
【0043】
ステップST27において、モード0(Mode=0)の場合には、次に高速再生処理を行い、特性検出処理を行い、ID処理を行い、メモリー系15に書き込む(ステップST28、ST29、ST30、ST31)。
【0044】
次に、上記ステップST28〜ST31の処理が終了していない場合にはステップST28に行き、上記処理を行い、処理が終了した場合には、メモリー系にIDを読み込む(ステップST32、ST33)。
【0045】
次に、図7に行き、フレームNO.の検出処理を行い、メモリー系読み出し処理を行う(ステップST41、ST42)。
【0046】
次に、ダイジェストIDフレームの比較処理を行う(ステップST43)。そして、ダイジェストフレームでない場合には再生処理を行い、ダイジェストフレームである場合にはスキップ処理を行う(ステップST44、ST45、ST46)。
【0047】
次に、図6に示す、ステップST37に行き、通常再生モード処理を行う
【0048】
図5に示す、ステップST26において、ダイジェスト再生でない場合には、図6に示すステップST34に行き、メモリー系15からIDを読み込んだ後に、ダイジェスト再生処理を行い、停止の場合には停止し、停止でない場合にはモードの変更があるかを判別する(ステップST34、ST35、ST36)。
【0049】
ステップST36でモードの変更がない場合には、ステップST34に行き再びダイジェスト再生の処理を行い、モードの変更がある場合には通常の再生モードを処理する(ステップST37)。
【0050】
通常の再生モードの処理をした後に、停止の場合には停止し、停止でない場合にはモード変更がない場合には、ステップST37の通常再生モードの処理を行う(ステップST38、ST39)。
【0051】
ステップST39において、モードの変更がある場合には、モード0(Mode=0)の場合には、図5に示すステップST28に行き高速再生処理を行い、モード1(Mode=1)の場合には、図5に示すステップST33に行きメモリー系15にIDの読み込みを行う(ステップST40、ST33)。
【0052】
次に、図7に行き、フレームNO.を検出する処理を行う(ステップST41)。
メモリー系15から読み出し処理を行い、ダイジェストIDフレームの比較処理を行う(ステップST42、ST43)。
【0053】
そして、ダイジェストフレームがない場合には再生処理し、ダイジェストフレームがある場合にはスキップ処理をし、図6に示すステップST37の通常再生モード処理をする(ステップST44、ST45、ST46)。
【0054】
[4]装置表示例
図8は装置の表示例であり、記録媒体の再生回数、ダイジェストID処理がなされたか、などの表示がなされる。
【0055】
このような表示は、再生画像を表示するディスプレイなどでも良いし、装置本体に備えられた、液晶ディスプレイなどの表示系でも良い。
【0056】
図8(1)はチェンジャーなどの複数のディスクが装置内に装着して再生できる場合であり、ディスク毎にID処理がなされているか表示できる。図において、ディスクNo.1の再生回数は1、タイトルは「映画」で、ダイジェストID処理がなされている表示がなされている。ディスクNo.2の再生回数は0、タイトルは「音楽」で、ダイジェストID処理がなされていない表示がなされている。ディスクNo.3の再生回数は2、タイトルは「スポーツ」で、ダイジェストID処理がなされていない表示がなされている。
【0057】
この場合には、ディスクを指定して、図8(2)に示す、単一ディスク再生装置のように、そのディスクのプログラム毎にID処理がなされているかを表示しても良い。
【0058】
図8(2)は単一ディスク再生装置の場合で、プログラム毎にID処理がなされているかを表示する。例えば、ディスクNo.1の再生回数は1、タイトルは「映画」で、ダイジェストID処理がなされている表示がなされている。ディスクNo.2の再生回数は0、タイトルは「音楽」で、ダイジェストID処理がなされていない表示がなされている。ディスクNo.3の再生回数は2、タイトルは「スポーツ」で、ダイジェストID処理がなされていない表示がなされている。
【0059】
次に、第2の実施形態の情報信号処理装置及び情報信号処理方法について、図面を参照して説明する。
【0060】
先ず、第2の実施形態の情報信号処理装置及び情報信号処理方法の概要について説明する。
時系列的に画像シーンにおける特性データを入力し、すでに記憶されている特性データとこの入力特性データとの間で、所定の演算処理を行い、その結果と、動きベクトル情報で所定のシーンIDをその画像シーンに割り当てる。一つの処理が終了毎に、入力データ領域を逐次シフトさせていくというものである。
【0061】
以下、本発明の第2の実施例について、図面を用いて以下の順序で説明する。
[1]動作原理
[2]ブロック構成例
[3]動作フローチャート
【0062】
[1]動作原理
図9(1)は特性データを記憶するデータメモリー系で、初期データとして、Daがすべての記録領域にメモリーされている様子を示したものであり、この場合は、最初の入力データD0としても良い。
【0063】
図9(2)は、IDメモリー系で、初期データとして、Aaが全ての記録領域にメモリーされている様子を示したものであり、この場合は、初期データとして0でも構わない。
上記、図9(1)のデータメモリー系のアドレスとこの図9(2)IDメモリー系のアドレスとは、一対一に対応しており、下記で説明するように所定の演算処理により、データメモリー系のアドレスに対応するIDメモリー系のアドレスに記憶されているIDデータが読み出され、特性データを入力して演算処理を行った画像フレームにこのIDデータが割り当てられるようになっている。
【0064】
ここでは、簡単のため、MPEGの画像データから特性データを生成するとし、Iピクチャー毎にデータメモリー系に入力するものとする。
【0065】
図9(1)(a1)のように、最初のIピクチャーが検出されると、特性データD0が最初のメモリーエリアに記憶される。
【0066】
D0を基準データとして、図に示すように、他のメモリーエリアのデータと逐次、所定のベクトル距離演算を行う。
【0067】
所定の演算の後、演算結果が最小となる値Vdと所定のしきい値、Thとを比較し、
Vd<Th 式(1.1)
の場合は、その最小となったエリアに対応する、IDメモリーエリアのIDデータをD0に割り当て、D0のメモリーエリアに対応する、IDメモリー系のメモリーエリアにそのIDデータを記憶する。
【0068】
この図の場合は、まだ、D0が最初のエリアなので、初期IDとし0を設定した場合は、0がIDデータとして割り当てられる。
【0069】
Vd>=Th 式(1.2)
の場合は、IDメモリー系に記憶されているデータ値の最大値IDmaxに、1を加えたデータをIDとする。
【0070】
しかし、上記の場合はまだ、入力データはIDメモリー系の全ての領域になるまで、入力していないので、式(1.2) になることはない。
【0071】
次のIピクチャーが検出された場合は、図9(1)(a2)、(a3)のようにメモリー領域を一つずらして、上記と同様な処理を行っていく。
【0072】
そして、図9(1)(a4)のように、メモリー領域すべてに記憶された場合は、次のIピクチャー検出では、図9(1)(a5)のように、最初のメモリーエリアに戻る。
【0073】
IDメモリー系も同様で、このようにして演算処理、およびIDを割り当てていく。
【0074】
図10は記録した画像系列で、区間a〜b、区間b〜c、区間c〜d、及び区間d〜、においてカメラパンがあるものとし、時点a、b、c、dはカット点で、シーンチェンジが生じたとする。
【0075】
ある人物や物体を基準に、画像の分類を考えた場合に、例えば、人物や物体が動いていたり、カメラパンなどがあった場合に、その画像は類似画像と判定するか、或いは、別画像とするかの絶対的な判定基準はなく、ユーザー自身の好みによって相違する。
【0076】
ここで、上記で説明したID処理をこのような画像系列で行うと、カメラパン区間a〜bでは、画像シーンが動くので異なったIDが割り当てられる場合がある。
【0077】
見方を変えれば、画像が動いているだけで、分類上は同じIDを割り当てる方が良い場合も考えられる。
【0078】
そこで、動きベクトルを用いて、ある時点においてIDが前の時点と相違しても、所定の動きベクトルの平均スカラー値Mdが、所定しきい値Mthよりも小さい場合は、前のIピクチャーのIDと同一のIDを割り当てるようにする。
【0079】
このように処理することで、カット点の区間を境に、画像シーンが多少動いても類似した画像フレームには同一の所定のIDが割り当てられ、ユーザーの好みに応じて、IDを利用して類似画像の検索、画像の整理、類似画像のダイジェスト再生などに応用することも出来る。
【0080】
図11は分類処理系及びID生成系のブロック構成例であり、システムコントローラーにより演算処理を行う。
その構成は、画像データを入力して特性データを検出する特性データ検出系30と、特性データを記憶する特性データメモリー系31と、特性データメモリー系31から読み出した特性データと特性データ検出系30で検出した特性データとの比較演算する演算処理系32と、識別情報データを生成する識別情報データ生成系33と、識別情報データを記憶する識別情報データメモリー系34と、これらの系を制御するシステムコントローラー35とからなる。
【0081】
特性データ検出系30における特性データの検出は、図12に示すように、分割してデータ生成を行う。
ここで、特性データは前記した本発明の第1の実施例[1]動作原理(1.1)で説明したようにフレームを複数の領域に分割し、その分割領域毎にDCTのDC係数の平均値を成分とするベクトルを考えて、ベクトルの成分を特性データとすることができるが、別の方法として、画像フレームをウェーブレット変換し、輝度信号、色差信号を多重解像度解析し、図12に示すように多重解像度解析したHH領域を例えば36分割し、その領域毎にウェーブレット係数の平均値を算出し、その算出値を成分とするベクトルを想定することができ、上記、DCTのDC係数の場合と同じように考えて、ベクトルの成分を特性データとすることができる。すなわち、分割領域毎のDCTのDC係数の平均値やウェーブレット係数の平均値を特性データとする。
ここで、図12で示す領域分割数は36に限ることはなく、前記した、本発明の第1の実施例[1]動作原理(1.1)で述べたように、場合に応じて、25分割や16分割としても良く、分割領域数と特性データの次数は同じなので、分割領域数に応じて特性データ次数も25次、16次としても良い。
【0082】
識別情報データ生成系33における識別情報データの生成は、図13に示すように、IDデータの折り返り処理でIDが所定値まで行った場合は、折り返し処理を行う。
すなわち、IDデータの初期値をmin(0000H)とし、上記で説明したような所定の演算処理により、類似画像が続いて検出されない場合は、IDは所定の演算毎に1づつ増加して行き、設定した所定の最大値max(FFFFH)になった場合は、初期値であるminにリセットする。
ここで、上記のようにIDがリセットされ、ID処理を継続していくと、以前にID処理したあるフレーム画像と同一のIDが割り当てられることが考えられるが、図13のように例えば最大値maxをFFFFHのように設定しておけば、同じIDが割り当てられる時間間隔は長いので、以前の画像とは類似画像ではないのに、同一IDが割り当てられてもあまり問題ではない。
画像のフレームレートを例えば、30フレーム/秒、MPEGの1GOP(Group of Picture)を15フレームと仮定すると、ID処理単位のIピクチャーは15フレーム毎の0.5秒毎に検出され、処理されるIピクチャー毎に異なったIDが割り当てられたとしても、FFFFH=65535であるので、
65535×0.5(秒)= 32767.5(秒)、すなわち、約9時間となる。
このように類似画像ではないのに同一のIDが割り当てられる時間間隔は長いので、類似画像ではないのに同一IDであるとユーザーが気づいたとしても、この実施例のような記録再生装置ではほとんど問題ではない。
【0083】
[2]ブロック構成例
本発明を適用した情報信号処理装置の構成は、図14に示すように、音声信号を入力してAD変換して出力する音声A/D変換処理系101と、デジタル値に変換された音声信号をエンコードする音声エンコーダー処理系102と、音声信号及び映像信号、音声信号からの特徴抽出信号及び画像信号からの特徴抽出信号を多重化する多重化処理系103と、多重化した信号を記録するための処理を行う記録処理系104と、多重化した信号を記録する記録媒体系105と、映像信号を入力してAD変換して出力する映像A/D変換処理系106と、デジタル値に変換された映像信号をエンコードする映像エンコーダー処理系107と、記録媒体系105に記録されているデータに対して再生処理を行う再生制御系108と、音声エンコーダー処理系102でエンコードされた音声信号から特徴となる信号を抽出する音声信号特徴抽出系109と、映像エンコーダー処理系7でエンコードされた映像信号から特徴となる信号を抽出する画像信号特徴抽出系110と、記録媒体系105に記録されているデータの再生処理をする再生処理系111と、再生された信号を音声信号、映像信号、識別信号に分離する再生データ分離処理系112と、再生データ分離処理系112で分離された音声信号をデコードする音声デコード処理系113と、音声デコード処理系113での信号をアナログ値にする音声D/A処理系114と、再生データ分離処理系112で分離した映像信号をデコードする映像デコード処理系115と、映像デコード処理系115での信号をアナログ値に変換する映像D/A処理系116と、音声信号特徴抽出系109、画像信号特徴抽出系110、多重化処理系103、再生制御系108を制御するシステムコントローラー118と、ユーザーからの信号を入力するユーザー入力I/F系119と、再生モード表示系120とからなる。
【0084】
このような構成からなる情報信号処理装置において、先ず、音声信号は音声A/D変換処理系101で所定のAD変換された後、音声エンコーダー処理系102で所定のエンコーダー処理がなされ、このAD変換処理された信号、または、エンコード処理された信号は、音声信号特徴抽出系109に入力し、所定の特徴抽出を行う。
【0085】
映像信号も同様で、映像AD変換処理系106で所定のAD変換された後、映像エンコーダー処理系107で所定のエンコーダー処理がなされ、このAD変換処理された信号、又は、エンコード処理された信号は、画像信号特徴抽出系110に入力し、所定の特徴抽出を行う。
【0086】
ユーザー入力I/F系119を介して、前記[1]動作原理で説明ように所定の区間で、予め音声信号特徴抽出系109、画像信号特徴抽出系110により、その特徴データを、システムコントローラー系118内における所定のメモリーに記憶する。
【0087】
その後、逐次、特徴データは検出され、システムコントローラー118内において、所定の相関演算、或いは、上記で述べた各特徴抽出データを成分としたベクトルとした場合には、所定のベクトル距離演算が行われる。
【0088】
所定の放送番組などの画像音声データは、所定の多重化処理系103、記録処理系104などを経て、記録媒体系105に記録される。
【0089】
特殊再生モードでは、システムコントローラー118は、再生制御系108を介して、前記[1]動作原理で説明したような記録媒体系105からの再生データの制御を行う。
【0090】
[3]動作フローチャート
上記システムコントローラー118において、動きベクトルを利用した演算手法について、図15〜図17に示すフローチャートを参照して以下説明する。
【0091】
先ず、図15(A)に示すように、カウンタn=0に設定して、初期設定処理をする(ステップST101、ST102)。
この初期設定処理は、図15(B)に示すように、動きベクトルを処理するもので、フレーム数m=0、算出値V=0に設定する(ステップST113)。
【0092】
次に、図15(A)におけるステップST103において、ストリームの検出を行い、Iピクチャでない場合には、動きベクトルフレーム内検出処理がなされる(ステップST103、ST104、ST105)。
この動きベクトルフレーム内検出処理は、図15(C)に示すように、先ずPピクチャであるかを判別し、Pピクチャでない場合には停止でないことを確認して次のステップに行く(ステップST114、ST115)。
ステップST114において、Pピクチャである場合には、動きベクトルを検出し、フレーム内平均(Vf)を算出する(ステップST114、ST117、ST118)。
そして、算出値V=V+Vfの計算をして平均値を算出する(ステップST119)。
次に、フレーム数mをインクリメントする(m=m+1)(ステップST120)。
そして、図15(A)におけるステップST103に行き、ストリームの検出を行う(ステップST103)。
【0093】
上記ステップST104において、Iピクチャである場合には、動きベクトルの平均(Vav)を、Vav=V/mにより算出する(ステップST106)。
【0094】
次にID判定処理を行う(ステップST107)。
このID判定処理は、図16に示すように、先ず、特性データ(Dt)を生成する(ステップST121)。
そして、カウンタn=0のときは、初期値設定処理を行う(ステップST122、ST123)。
初期値設定処理は、データバッファ初期設定Dt(0)の入力、IDバッファ初期設定id=0の入力、データ入力位置inplace=0の入力を行う。
【0095】
ステップST122において、カウンタn=0でない場合には、ベクトル距離配列をリセットし、ベクトル距離演算の初期設定をする(ステップST124、ST125)。
【0096】
そして、距離Vp、位置pにおけるベクトル距離最小値演算を行う(ステップST126)。
【0097】
そして、閾値Vpの判定を行い、閾値以外であればIDオーバーフロー判定の処理を行う(ステップST129)。
このIDオーバーフロー判定処理は、図17(A)に示すように、先ず、IDバッフアidにプラス1インクリメントした値がIDバッファ最大値idmaxより大きいかを判定する(ステップST140)。大きくない場合には、IDバッファidを1つインクリメントし、大きい倍にはIDバッファidは0に設定し、IDバッファid=IDnにする(ステップST142、ST141、ST143)。
【0098】
図16に戻り、ステップST127において、閾値内であれば、IDバッファデータID(p)を読み出して、IDnに入力し、データ入力位置inplaceを1つインクリメントする(ステップST128、ST130)。
【0099】
位置判定でオーバーしている場合には、データ入力位置inplaceを0にし、位置がメモリ位置内であればそのままにし、データ入力位置inplaceのデータバッファDtを記憶する(ステップST131、ST132、ST133)。
【0100】
又、IDバッファ内にデータ入力位置inplaceにID(p)を記憶する(ステップST134)。
【0101】
そして、動きベクトル(Vav)の判定、閾値Vpの再判定を行う(ステップST135)。
【0102】
閾値Vp以外であれば、前処理ID割当て、IDnv=IDpreとし、閾値以内であればシーンID(動きベクトル対応)割り当て、IDnv=ID(p)とし、IDnメモリにIDpre=IDnとする(ステップST136、ST137、ST138、ST139)。
【0103】
このようにして、ID判定処理を行った後に、図15に示すステップST108において、動きベクトルフレーム内検出後処理を行う(ステップST108)。
この動きベクトルフレーム内検出後処理は、図17(B)に示すように、動きベクトルの処理であって、フレーム数m=0、算出値V=0にする(ステップST144)。
【0104】
図15におけるステップST108の動きベクトルフレーム内検出後処理をした後に、動きベクトルIDnvに対応したシーンID記録処理を行う(ステップST109)。
【0105】
そして、カウンタnをインクリメントし、停止でないことを確認して。ステップST103の次のストリームの検出に行く(ステップST110、ST111、ST112)。
【0106】
【発明の効果】
以上説明したように、本発明においては、初めての再生用媒体を鑑賞する場合に、短時間でその概要を把握することができるので、通常の再生時間で見る場合の参考にすることができるという効果がある。
又、ダイジェスト再生用の特徴抽出処理を行っている間に、通常再生を行うので、特徴抽出処理期間中でもダイジェスト再生動作中の画像音声が途切れることがなく、効果的な動作が行える。
【0107】
更に、再生用媒体の内容の概要が別の記録媒体に自動的に記録されるので、色々な再生用媒体を捜して再び、当該再生用媒体を見ようとするときに、その概要が解るため、再度の操作を省略することができるという効果もある。
【0108】
また、記録媒体を挿入したら、自動的にダイジェスト再生用ID処理を高速に行なうので、操作の通常手間が省け、通常再生を行なう場合の参考になる。
【0109】
また、放送番組などを記録する際に、リアルタイムで、分類処理を行うことができると共に、タイマー記録などで、記録終了後にすぐ、その分類結果を知ることができ、処理の待ち時間が殆ど無くすことができるという効果がある。
【0110】
さらに、分類処理されたシーンIDを利用して、画像の分類整理、編集、ダイジェスト再生などを行うことができるという効果もある。
【図面の簡単な説明】
【図1】本願発明に係る第1の実施形態の動作原理を示す説明図である。
【図2】本願発明に係る第1の実施形態の動作原理を示す説明図である。
【図3】本願発明に係る第1の実施形態の動作原理を示す説明図である。
【図4】本願発明に係る第1の実施形態の情報信号処理装置の構成を示すブロック図である。
【図5】同動作を示すフローチャートである。
【図6】同動作を示すフローチャートである。
【図7】同動作を示すフローチャートである。
【図8】同装置の表示例を示す説明図である。
【図9】本願発明に係る第2の実施形態の動作原理を示す説明図である。
【図10】本願発明に係る第2の実施形態の動作原理を示す説明図である。
【図11】本願発明に係る第2の実施形態の画像分離処理系のブロック図である。
【図12】同多重解像度解析面の分割領域を選択するときの説明図である。
【図13】同識別情報データ折り返し処理の説明図である。
【図14】本願発明に係る第2の実施形態の情報信号処理装置の構成を示すブロック図である。
【図15】同動作を示すフローチャートである。
【図16】同動作を示すフローチャートである。
【図17】同動作を示すフローチャートである。
装置表示例
【符号の説明】
1;記録媒体系、2;再生処理系、3;再生データ分離処理系、4;映像デコード処理系、5;映像D/A処理系、6;記録媒体検出系、7;再生制御系、8;識別信号検出系、9;音声デコード処理系、10;音声D/A処理系 、11;特徴抽出系、12;システムコントローラー、13;再生モード表示系、14;ユーザー入力I/F系、15;メモリー系、30;特性データ検出系、31;特性データメモリー系、32;演算処理系、33;識別情報データ生成系、34;識別情報データメモリー系、35;システムコントローラー、101;音声A/D変換処理系 、102;音声エンコーダー処理系、103;多重化処理系、104;記録処理系、105;記録媒体系、106;映像A/D変換処理系、107;映像エンコーダー処理系、108;再生制御系、109;音声信号特徴抽出系、110;画像信号特徴抽出系、111;再生処理系、112;再生データ分離処理系、113;音声デコード処理系、114;音声D/A処理系、115;映像デコード処理系、116;映像D/A処理系、117;識別信号検出系、118;システムコントローラー、119;ユーザー入力I/F系、120;再生モード表示系。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a signal processing technique for performing digest reproduction of the contents of a recording medium as efficiently as possible when a recording medium on which an image / audio signal is recorded, such as DVD software, is mounted on a predetermined apparatus. In a recording device that records information signals such as video signals and audio signals on a recording medium such as a magneto-optical disk, hard disk, semiconductor memory, etc., for example, when a broadcast program is recorded and played back, it is similar to any specified scene in the program Information signal processing device that can selectively reproduce a scene and perform a skimming operation to efficiently grasp a desired content in a short time, Information signal processing method Is.
[0002]
[Prior art]
When playing back software for the first time in the prior art, even if you want to get an overview of the contents of the software, it is normal if you come back to a fun or desired playback scene by digest playback at several times speed playback. There is only a technique such as reproduction, and there is no effective confirmation means of effective contents.
[0003]
In addition, there is no signal processing apparatus and signal processing method for displaying that a digest reproduction ID for video and audio to be reproduced has already been generated.
[0004]
Further, for example, as a known technique for analyzing a video structure from an audio signal and a video signal and performing special reproduction such as digest reproduction, Japanese Patent Laid-Open No. 10-507555 “Method for running and reading digital audio and video data” And its system ", Japanese Patent Laid-Open No. 11-239322," Video Browsing / Viewing System ", Japanese Patent Application Laid-Open No. 2000-50233" Broadcast-type distribution method, computer-readable recording medium having recorded thereon a program for causing the computer to execute the method, and And a computer-readable recording medium on which video content is recorded.
[0005]
[Problems to be solved by the invention]
However, the above-described conventional technique has a problem that there is no effective technique for classifying image scenes in real time at the time of recording, for example, and assigning a predetermined scene ID to the classified images.
[0006]
In addition, there is a problem that the digest reproduction operation cannot be performed by using the scene ID for recording from the recording medium on which the scene ID is recorded.
[0007]
Therefore, when soft reproduction is performed from the above viewpoint, there is a problem that must be solved by a signal processing technique that efficiently performs digest reproduction.
[0008]
[Means for Solving the Problems]
In order to solve the above problems, an information signal processing apparatus according to the present invention, Information signal processing method The configuration is as follows.
[0009]
(1) The information signal processing device extracts a feature of the image and sound from the reproduction unit that reproduces the first recording medium on which the image and audio signal is recorded, the image and audio signal reproduced by the reproduction unit, and the feature Recording means for creating a digest reproduction ID based on the extracted image sound and recording it on the second recording medium, and extracting the feature of the image sound, A feature is to be extracted within a normal playback time of a section a including a smaller intro portion than a normal playback section H. .
(2) The information signal processing apparatus reproduces the first recording medium on which the image / sound signal is recorded, and extracts the feature of the image / sound from the image / sound signal reproduced by the reproducing unit, Recording means for creating a digest reproduction ID based on the extracted image sound and recording it on the second recording medium, and extracting the feature of the image sound, When the playback sections H1, H2, and H3 are long, features are extracted within the normal playback time of the playback section b1 that is much shorter than the playback section H1, and for the next playback section H2, The feature is extracted within the normal playback time of the playback section b2 that is much shorter than that, and the feature is extracted within the normal playback time of the playback section b3 that is much shorter than the next playback section H3. .
[0010]
(3) In the information signal processing method, the first recording medium on which the image / audio signal is recorded is reproduced, the image / audio feature is extracted from the image / audio signal reproduced by the reproducing means, and the feature is extracted. Based on the image and sound, a digest playback ID is created and recorded on the second recording medium. A feature is extracted within a normal playback time of a section a including a smaller intro portion than a normal playback section H. That is.
(4) In the information signal processing method, the first recording medium on which the image / audio signal is recorded is reproduced, the image / audio feature is extracted from the image / audio signal reproduced by the reproducing means, and the feature is extracted. Based on the image and sound, a digest playback ID is created and recorded on the second recording medium. When the playback sections H1, H2, and H3 are long, features are extracted within the normal playback time of the playback section b1 that is much shorter than the playback section H1, and for the next playback section H2, The feature is extracted within the normal playback time of the playback section b2 that is much shorter than that, and the feature is extracted within the normal playback time of the playback section b3 that is much shorter than the next playback section H3. .
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Next, an information signal processing apparatus according to the present invention, Embodiment of information signal processing method Will be described with reference to the drawings.
[0016]
First, the outline of the information signal processing apparatus according to the first embodiment of the present invention will be described. Recording such as rental software (DVD or the like) such as a recording medium on which an image / audio signal is recorded in advance or a hard disk or the like installed in the apparatus. When the predetermined image / audio information data recorded on the medium is reproduced for the first time by the device, this is automatically detected, and the summary reproduction ID is generated while performing the feature extraction of the image / audio at the same time as the reproduction. Store in a predetermined recording medium.
That is, the feature is not extracted at the normal playback time of all playback sections, but, for example, as shown in FIG. 1A, a section including a smaller intro portion than the normal playback section H Features are extracted within the normal playback time of a. FIG. 1B shows a technique for extracting features when the playback sections H1, H2, and H3 are long. For the playback section H1, normal playback of a playback section b1 that is much shorter than that is shown. The feature is extracted within the time, the feature is extracted within the normal playback time of the playback section b2 that is extremely shorter than the next playback section H2, and the next playback section H3 is more than that. The feature is extracted within the normal playback time of the extremely short playback section b3. As described above, when the playback section is long, the playback section is divided, and the features are extracted in a part of the playback section.
FIGS. 2A, 2B, and 2C show the processing steps of H1, H2, and H3 in FIG. 1A (Embodiment 1) or FIG. 1B (Embodiment 2). In the initial state of processing, as shown in FIG. 2 (A), the normal playback position and the feature extraction position have the same start position, and the normal playback time elapses as shown in FIG. 2 (B). As the playback proceeds, the position of the feature extraction processing advances toward the end of the predetermined feature extraction section, and when a predetermined normal playback section in the hatched section is normally played back as shown in FIG. The feature extraction process for the feature extraction section ends.
In this way, when performing digest playback using feature extraction data, normal playback is performed until the feature extraction processing for a predetermined section is completed.
When the digest playback mode using the feature extraction data is started by the signal processing as described above, even if the feature extraction data is not processed in advance, the predetermined digest playback operation cannot be performed until the feature extraction processing is completed. It is possible to prevent the sound from being output, and furthermore, since the time of the feature extraction process according to the present invention is completed in a short time, the user can immediately perform the normal reproduction operation during the feature extraction process. Thus, it can be felt that a predetermined digest reproduction operation using the feature extraction data has started, and an efficient and effective operation can be performed.
[0017]
In another method described with reference to FIG. 2, when a playback section is long, a feature is extracted as time elapses, and the feature is extracted within a few seconds from the start of processing (see FIG. 2). 2 (A)), repeating the feature extraction again t seconds after the start of processing (FIG. 2B), and finally extracting the feature near the end of the predetermined section (FIG. 2C). Like that. In this way, for those whose reproduction time is not known, features may be extracted every time a predetermined reproduction time elapses.
In the description of FIG. 1 and FIG. 2 described above, the normal reproduction is performed simultaneously during the feature extraction processing period. However, the present invention is not limited to this, and the feature extraction processed when the feature extraction processing for a predetermined section is completed. A predetermined digest reproduction operation using data may be started. In such a process, since the predetermined digest operation does not start until the predetermined feature extraction process is completed, a display indicating that the feature is being extracted may be displayed to the user.
[0018]
When the software is played again, it is determined that the software is selected. When the summary playback mode is set, the ID is read to quickly perform special playback such as effective summary playback. Can be migrated.
[0019]
If ID processing has already been performed, the processing is not performed and the presence of ID is displayed on a predetermined display means.
[0020]
Further, instead of storing the ID in a predetermined recording medium in the apparatus, the ID is stored in a predetermined storage unit (a case, a predetermined recording area of the recording medium, etc.) of the recording medium itself, and the special reproduction mode operation at the time of reproduction is The same processing as described above is performed.
[0021]
If the ID process has already been performed, the above feature extraction process is not performed, and the fact that there is an ID is displayed on a predetermined display means.
[0022]
When a recording medium on which a predetermined image and sound is recorded is mounted on the apparatus, if the digest ID processing is not performed, the ID processing is automatically performed by high-speed playback.
[0023]
Hereinafter, a first embodiment of the present invention will be described in the following order with reference to the drawings.
[0024]
[1] Operating principle
[2] Whole block configuration example
[3] Operation flowchart
[0025]
[1] Operating principle
(1.1) Characteristic signal detection method
Here, for the sake of simplicity, it is assumed that the characteristic signal is a video / audio signal compressed by MPEG and a predetermined characteristic signal is detected from the MPEG stream.
[0026]
For example, as shown in FIG. 3, an I picture is detected from an image sequence, a characteristic vector is generated by dividing the DC coefficient of a DCT (Discrete Cosine Transform) for each I picture, and the characteristic vector of the characteristic vector is generated. By calculating the distance, it is also possible to detect a motion vector in a P picture and perform similar image detection and cut point detection.
That is, as shown in FIG. 3, the frame is divided into, for example, 25 areas, the average value of the DC coefficient of the luminance signal y and the color difference signals cb and cr is calculated for each area, and the luminance signal y using the calculated value as a component. Characteristic vector Vy and color difference signals cb, cr characteristic vectors Vcb, Vcr are calculated, and a vector distance is calculated using a characteristic vector at a predetermined time as a reference vector. Here, even if the number of divided areas of the frame is not 25, for example, it may be slightly increased as 36 areas or slightly decreased as 16 areas. The number of divisions may be set according to processing time, processing accuracy, and the like.
[0027]
(1.2) Method for detecting a predetermined recording medium
If there is a label, the characteristic signal (characteristic vector) detected as described above is stored in a recording medium in the apparatus together with the label so that it can be determined that the characteristic signal belongs to a predetermined recording medium.
[0028]
If there is no label on the recording medium, or if the label is duplicated, it can be assumed that if the data of the intro part of the recording medium is stored in the recording medium in the device, the recording medium is attached to the device. In this case, the recording medium can be determined by matching the data of the intro portion.
[0029]
In some cases, a list of recording media already processed by the apparatus may be displayed on the display system 13 of a block diagram shown later together with a label or title, if there is a label or title.
[0030]
[2] Whole block configuration example
As shown in FIG. 4, the information signal processing apparatus includes a recording medium system 1, a reproduction processing system 2 that reproduces information recorded in the recording medium system 1, and a reproduction data separation processing system that separates reproduced data. 3, a video decoding processing system 4 that decodes video data out of the separated data, a video D / A processing system 5 that converts the decoded video signal into an analog signal and outputs the video signal, and a recording medium system 1 A recording medium detection system 6 for detecting the recording on the recording medium, a reproduction control system 7 for controlling the reproduction of the recording medium system 1, and an identification signal for detecting an identification signal among the data separated by the reproduction data separation processing system 3 The detection system 8, the audio decoding processing system 9 that decodes the audio signal among the data separated by the reproduction data separation processing system 3, and the decoded audio signal are converted into analog values and output as an audio signal. Feature extraction system 11 for extracting features from voice D / A processing system 10, video decoding processing system 4 and audio decoding processing system 9, recording medium detection system 6, reproduction control system 7, identification signal detection system 8, feature extraction The system 11 includes a system controller 12 that controls the system 11 and the display system 13, a display system 13 that is displayed under the control of the system controller 12, a user input I / F system 14 through which a user inputs a command and the like, and a memory system 15.
[0031]
In such a configuration, the recording medium detection system 6 detects that a predetermined recording medium is installed, starts reproduction of the intro part, and whether the predetermined program of the recording medium is subjected to ID processing, or the memory system 15 It is determined by comparing with the data stored in
In the case where the recording medium system 1 is a recording medium such as a hard disk installed in the apparatus, a predetermined program recorded by the user is set in a reproduction operation state, and an intro part or predetermined information is recorded. The reproduction of the TOC (Table of contents) portion is started, and it is determined whether the predetermined program has been subjected to ID processing by comparing it with data stored in the memory system 15.
[0032]
When the ID process is not performed, the ID process is performed simultaneously with the normal reproduction or the high-speed reproduction.
[0033]
The audio / video data reproduced from the recording medium is extracted by the feature extraction system 11 after being decoded and stored in the memory system 15 via the system controller 12.
In the case where the recording medium system 1 is a recording medium such as a DVD or CD (CD-RW) (CD Rewritable) that can be recorded by the user, or a recording medium such as a hard disk installed in the apparatus. Instead of the predetermined recording area in which the image / audio information is recorded, a predetermined recording area in which data recording is permitted can be provided, and the predetermined data can be recorded instead of recording in the memory system 15. .
[0034]
In the special reproduction mode, the characteristic data is appropriately called from the memory system 15 by the user command input, and the reproduction control system 7 is controlled by the system controller 12 to perform a predetermined digest reproduction.
[0035]
[3] Operation flowchart
The operation of the information signal processing apparatus having the above configuration will be described below with reference to the flowcharts shown in FIGS.
[0036]
First, when a recording medium is detected, data is read from the memory system 15 (steps ST11 and ST12).
[0037]
Then, the reproduction of the intro part starts, and the comparison process reproduction count is determined (steps ST13 and ST14).
[0038]
If it is the first time, the fact that it is the first time is displayed, mode 0 (Mode = 0) is set and the number of times is written to the memory (steps ST15, ST16, ST17, ST18).
[0039]
If it is not the first time in step ST15, the number of times of being the second or more is displayed (step ST19).
[0040]
Then, mode 1 (Mode = 1) is set and the number of times is written in the memory (steps ST20 and ST21).
[0041]
Then, the reproduction mode input is waited for, and when there is no input and the operation is stopped, the reproduction mode is stopped (steps ST22, ST23, ST24, ST25).
[0042]
In step ST23, if there is an input, it is determined whether or not digest playback is to be performed next. If the mode is digest playback and mode 1 (Mode = 1), ID reading of the memory system 15 is read. Performed (steps ST26, ST27, ST33).
[0043]
In step ST27, in the case of mode 0 (Mode = 0), next, high-speed playback processing is performed, characteristic detection processing is performed, ID processing is performed, and data is written in the memory system 15 (steps ST28, ST29, ST30, ST31). .
[0044]
Next, when the processes of steps ST28 to ST31 are not completed, the process goes to step ST28, and when the processes are completed, the ID is read into the memory system (steps ST32 and ST33).
[0045]
Next, referring to FIG. 7, a frame number detection process is performed, and a memory read process is performed (steps ST41 and ST42).
[0046]
Next, digest ID frame comparison processing is performed (step ST43). If it is not a digest frame, playback processing is performed. If it is a digest frame, skip processing is performed (steps ST44, ST45, ST46).
[0047]
Next, the process goes to step ST37 shown in FIG. 6 to perform normal playback mode processing.
[0048]
In step ST26 shown in FIG. 5, if the digest reproduction is not performed, the process goes to step ST34 shown in FIG. 6, and after the ID is read from the memory system 15, the digest reproduction process is performed. If not, it is determined whether there is a mode change (steps ST34, ST35, ST36).
[0049]
If there is no mode change in step ST36, the process goes to step ST34 to perform digest playback again, and if there is a mode change, the normal playback mode is processed (step ST37).
[0050]
After the normal playback mode processing, the process stops in the case of stop, and in the case of no stop, the normal playback mode process of step ST37 is performed (steps ST38 and ST39).
[0051]
In step ST39, if there is a mode change, if mode 0 (Mode = 0), go to step ST28 shown in FIG. 5 to perform high-speed playback processing, and if mode 1 (Mode = 1). Then, the process goes to step ST33 shown in FIG. 5 to read the ID into the memory system 15 (steps ST40 and ST33).
[0052]
Next, referring to FIG. 7, a process for detecting the frame number is performed (step ST41).
A reading process is performed from the memory system 15, and a digest ID frame comparison process is performed (steps ST42 and ST43).
[0053]
If there is no digest frame, playback processing is performed. If there is a digest frame, skip processing is performed, and normal playback mode processing in step ST37 shown in FIG. 6 is performed (steps ST44, ST45, ST46).
[0054]
[4] Device display example
FIG. 8 shows a display example of the apparatus, which displays the number of reproductions of the recording medium, whether digest ID processing has been performed, and the like.
[0055]
Such a display may be a display for displaying a reproduced image or a display system such as a liquid crystal display provided in the apparatus main body.
[0056]
FIG. 8A shows a case where a plurality of discs such as a changer can be mounted and reproduced in the apparatus, and it can be displayed whether ID processing is performed for each disc. In FIG. The number of reproductions of 1 is 1, the title is “movie”, and a display in which digest ID processing is performed is made. Disc No. The number of playbacks of 2 is 0, the title is “music”, and the display without digest ID processing is made. Disc No. The number of reproductions of 3 is 2, the title is “sports”, and the display without digest ID processing is made.
[0057]
In this case, a disk may be designated to display whether ID processing is performed for each program of the disk, as in the single disk playback device shown in FIG.
[0058]
FIG. 8 (2) shows the case of the single disk playback apparatus, and displays whether ID processing is performed for each program. For example, the disc No. The number of reproductions of 1 is 1, the title is “movie”, and a display in which digest ID processing is performed is made. Disc No. The number of playbacks of 2 is 0, the title is “music”, and the display without digest ID processing is made. Disc No. The number of reproductions of 3 is 2, the title is “sports”, and the display without digest ID processing is made.
[0059]
Next, an information signal processing device and an information signal processing method according to a second embodiment will be described with reference to the drawings.
[0060]
First, an outline of the information signal processing apparatus and the information signal processing method of the second embodiment will be described.
Characteristic data in an image scene is input in time series, and predetermined calculation processing is performed between the already stored characteristic data and this input characteristic data, and a predetermined scene ID is obtained from the result and motion vector information. Assign to the image scene. Each time one process is completed, the input data area is sequentially shifted.
[0061]
Hereinafter, a second embodiment of the present invention will be described in the following order with reference to the drawings.
[1] Operating principle
[2] Block configuration example
[3] Operation flowchart
[0062]
[1] Operating principle
FIG. 9 (1) shows a data memory system for storing characteristic data, in which Da is stored in all recording areas as initial data. In this case, the first input data D0 is also stored. good.
[0063]
FIG. 9B shows a state in which Aa is stored in all recording areas as initial data in the ID memory system. In this case, 0 may be used as the initial data.
The address of the data memory system shown in FIG. 9 (1) and the address of the ID memory system shown in FIG. 9 (2) have a one-to-one correspondence. The ID data stored in the address of the ID memory system corresponding to the system address is read out, and this ID data is assigned to the image frame on which the characteristic data is input and the arithmetic processing is performed.
[0064]
Here, for the sake of simplicity, it is assumed that characteristic data is generated from MPEG image data and is input to the data memory system for each I picture.
[0065]
As shown in FIGS. 9A and 9A, when the first I picture is detected, the characteristic data D0 is stored in the first memory area.
[0066]
Using D0 as reference data, a predetermined vector distance calculation is sequentially performed with data in other memory areas as shown in the figure.
[0067]
After a predetermined calculation, the value Vd that minimizes the calculation result is compared with a predetermined threshold value Th,
Vd <Th Formula (1.1)
In this case, ID data in the ID memory area corresponding to the smallest area is assigned to D0, and the ID data is stored in the memory area of the ID memory system corresponding to the memory area of D0.
[0068]
In this case, since D0 is still the first area, when 0 is set as the initial ID, 0 is assigned as ID data.
[0069]
Vd> = Th Formula (1.2)
In this case, data obtained by adding 1 to the maximum value IDmax of data values stored in the ID memory system is used as the ID.
[0070]
However, in the above case, the input data is not yet input until the entire area of the ID memory system is entered, and therefore, the expression (1.2) does not occur.
[0071]
When the next I picture is detected, the memory area is shifted by one as shown in FIGS. 9 (1), (a2), and (a3), and processing similar to the above is performed.
[0072]
If the data is stored in the entire memory area as shown in FIGS. 9 (1) and (a4), the next I picture detection returns to the first memory area as shown in FIGS. 9 (1) and (a5).
[0073]
The same applies to the ID memory system, and calculation processing and IDs are assigned in this way.
[0074]
FIG. 10 shows a recorded image series, where there is a camera pan in the sections a to b, the sections b to c, the sections c to d, and the sections d to, and the time points a, b, c, and d are cut points. Suppose a scene change occurs.
[0075]
When considering image classification based on a person or object, for example, when a person or object is moving or there is a camera pan, the image is determined to be a similar image, or another image There is no absolute criteria for whether or not, and it depends on the user's own preference.
[0076]
Here, when the ID processing described above is performed in such an image series, a different ID may be assigned because the image scene moves in the camera pan sections a and b.
[0077]
In other words, it may be better to assign the same ID for classification only by moving the image.
[0078]
Therefore, if the average scalar value Md of the predetermined motion vector is smaller than the predetermined threshold Mth even if the ID is different from the previous time at a certain time using the motion vector, the ID of the previous I picture The same ID is assigned.
[0079]
By processing in this way, the same predetermined ID is assigned to similar image frames even if the image scene moves slightly across the section of the cut point, and the ID is used according to the user's preference. It can also be applied to retrieval of similar images, image organization, digest reproduction of similar images, and the like.
[0080]
FIG. 11 is a block configuration example of the classification processing system and the ID generation system, and the arithmetic processing is performed by the system controller.
The configuration includes a characteristic data detection system 30 for inputting image data and detecting characteristic data, a characteristic data memory system 31 for storing characteristic data, and characteristic data and characteristic data detection system 30 read from the characteristic data memory system 31. An arithmetic processing system 32 that performs a comparison operation with the characteristic data detected in step 1, an identification information data generation system 33 that generates identification information data, an identification information data memory system 34 that stores identification information data, and these systems. And a system controller 35.
[0081]
In the characteristic data detection system 30, the characteristic data is detected by dividing the data as shown in FIG.
Here, the characteristic data is obtained by dividing the frame into a plurality of areas as described in the first embodiment [1] principle of operation (1.1) of the present invention, and the DC coefficient of the DCT for each divided area. Considering a vector having an average value as a component, the component of the vector can be used as characteristic data. However, as another method, the image frame is wavelet transformed, and the luminance signal and the color difference signal are subjected to multi-resolution analysis. As shown in the figure, the HH region subjected to the multi-resolution analysis is divided into, for example, 36, an average value of wavelet coefficients is calculated for each region, and a vector having the calculated value as a component can be assumed. Thinking in the same way as the case, vector components can be used as characteristic data. That is, the average value of DC coefficients of DCT and the average value of wavelet coefficients for each divided region are used as characteristic data.
Here, the number of area divisions shown in FIG. 12 is not limited to 36, and as described in the first embodiment [1] operating principle (1.1) of the present invention, depending on the case, Since the number of divided areas and the order of characteristic data are the same, the order of characteristic data may be 25th and 16th according to the number of divided areas.
[0082]
The generation of the identification information data in the identification information data generation system 33 is performed as shown in FIG. 13 when the ID is returned to a predetermined value in the ID data return processing.
That is, if the initial value of the ID data is set to min (0000H) and a similar image is not subsequently detected by a predetermined calculation process as described above, the ID increases by 1 for each predetermined calculation, When the set maximum value max (FFFFH) is reached, the initial value is reset to min.
Here, when the ID is reset as described above and the ID processing is continued, it is considered that the same ID as a certain frame image subjected to the ID processing before is assigned. If max is set to FFFFH, the time interval for assigning the same ID is long, so it is not a problem even if the same ID is assigned even though it is not a similar image to the previous image.
Assuming that the frame rate of the image is, for example, 30 frames / second and MPEG 1 GOP (Group of Pictures) is 15 frames, an I picture of ID processing unit is detected and processed every 0.5 seconds every 15 frames. Even if a different ID is assigned to each I picture, FFFFH = 65535,
65535 × 0.5 (seconds) = 32767.5 (seconds), that is, about 9 hours.
As described above, since the time interval in which the same ID is assigned even though it is not a similar image is long, even if the user notices that it is not a similar image but the same ID, the recording / reproducing apparatus as in this embodiment hardly is not a problem.
[0083]
[2] Block configuration example
As shown in FIG. 14, the configuration of the information signal processing apparatus to which the present invention is applied includes an audio A / D conversion processing system 101 that inputs an audio signal, performs AD conversion, and outputs an audio signal converted into a digital value. An audio encoder processing system 102 that encodes the audio signal, a video signal, a feature extraction signal from the audio signal, and a feature extraction signal from the image signal, and a multiplexed signal for recording the multiplexed signal. A recording processing system 104 that performs the above-described processing, a recording medium system 105 that records the multiplexed signal, a video A / D conversion processing system 106 that inputs a video signal, performs AD conversion, and outputs it, and a digital value. A video encoder processing system 107 that encodes the recorded video signal, a playback control system 108 that performs playback processing on the data recorded in the recording medium system 105, and an audio encoder An audio signal feature extraction system 109 for extracting a characteristic signal from the audio signal encoded by the science system 102; and an image signal feature extraction system 110 for extracting a characteristic signal from the video signal encoded by the video encoder processing system 7. A reproduction processing system 111 that performs reproduction processing of data recorded in the recording medium system 105, a reproduction data separation processing system 112 that separates the reproduced signal into an audio signal, a video signal, and an identification signal, and reproduction data separation processing. Audio decoding processing system 113 for decoding the audio signal separated by the system 112, audio D / A processing system 114 for converting the signal in the audio decoding processing system 113 to an analog value, and video separated by the reproduction data separation processing system 112 Video decoding processing system 115 that decodes the signal, and video that converts the signal in the video decoding processing system 115 into an analog value / A processing system 116, audio signal feature extraction system 109, image signal feature extraction system 110, multiplexing processing system 103, system controller 118 for controlling reproduction control system 108, and user input I / O for inputting a signal from a user An F system 119 and a reproduction mode display system 120 are included.
[0084]
In the information signal processing apparatus having such a configuration, the audio signal is first subjected to predetermined AD conversion by the audio A / D conversion processing system 101, and then subjected to predetermined encoder processing by the audio encoder processing system 102. The processed signal or the encoded signal is input to the audio signal feature extraction system 109 to perform predetermined feature extraction.
[0085]
The same applies to the video signal. After the predetermined AD conversion is performed by the video AD conversion processing system 106, the predetermined encoder processing is performed by the video encoder processing system 107, and this AD converted signal or the encoded signal is Then, it is input to the image signal feature extraction system 110 to perform predetermined feature extraction.
[0086]
Via the user input I / F system 119, the characteristic data is preliminarily obtained by the audio signal feature extraction system 109 and the image signal feature extraction system 110 in a predetermined section as described in the above [1] operation principle. The data is stored in a predetermined memory in 118.
[0087]
After that, feature data is sequentially detected, and a predetermined vector distance calculation is performed in the system controller 118 when a predetermined correlation calculation or a vector having each feature extraction data described above as a component is used. .
[0088]
Image / audio data such as a predetermined broadcast program is recorded in the recording medium system 105 through a predetermined multiplexing processing system 103, a recording processing system 104, and the like.
[0089]
In the special reproduction mode, the system controller 118 controls the reproduction data from the recording medium system 105 as described in the above [1] operation principle via the reproduction control system 108.
[0090]
[3] Operation flowchart
A calculation method using a motion vector in the system controller 118 will be described below with reference to flowcharts shown in FIGS.
[0091]
First, as shown in FIG. 15A, the counter n = 0 is set and initial setting processing is performed (steps ST101 and ST102).
In this initial setting process, as shown in FIG. 15B, the motion vector is processed, and the frame number m = 0 and the calculated value V = 0 are set (step ST113).
[0092]
Next, in step ST103 in FIG. 15A, a stream is detected. If it is not an I picture, intra-motion vector frame detection processing is performed (steps ST103, ST104, ST105).
In this motion vector frame detection process, as shown in FIG. 15C, first, it is determined whether or not it is a P picture, and if it is not a P picture, it is confirmed that it is not a stop and the process proceeds to the next step (step ST114). , ST115).
In step ST114, if it is a P picture, a motion vector is detected, and an intraframe average (Vf) is calculated (steps ST114, ST117, ST118).
Then, the average value is calculated by calculating the calculated value V = V + Vf (step ST119).
Next, the frame number m is incremented (m = m + 1) (step ST120).
Then, the process goes to step ST103 in FIG. 15A to detect a stream (step ST103).
[0093]
In step ST104, in the case of an I picture, the average (Vav) of motion vectors is calculated by Vav = V / m (step ST106).
[0094]
Next, ID determination processing is performed (step ST107).
In this ID determination process, as shown in FIG. 16, first, characteristic data (Dt) is generated (step ST121).
When the counter n = 0, initial value setting processing is performed (steps ST122 and ST123).
In the initial value setting process, data buffer initial setting Dt (0) is input, ID buffer initial setting id = 0 is input, and data input position inplace = 0 is input.
[0095]
In step ST122, when the counter n is not 0, the vector distance array is reset and the vector distance calculation is initialized (steps ST124 and ST125).
[0096]
Then, the vector distance minimum value calculation at the distance Vp and the position p is performed (step ST126).
[0097]
Then, the threshold value Vp is determined, and if it is not the threshold value, ID overflow determination processing is performed (step ST129).
In this ID overflow determination process, as shown in FIG. 17A, first, it is determined whether or not the value obtained by adding 1 to the ID buffer id is larger than the ID buffer maximum value idmax (step ST140). If not, the ID buffer id is incremented by 1, and the ID buffer id is set to 0 for a larger multiple, and ID buffer id = IDn is set (steps ST142, ST141, ST143).
[0098]
Returning to FIG. 16, if it is within the threshold value in step ST127, the ID buffer data ID (p) is read out and input to IDn, and the data input position "inplace" is incremented by one (steps ST128 and ST130).
[0099]
If it is over in the position determination, the data input position inplace is set to 0, and if the position is within the memory position, it is left as it is, and the data buffer Dt of the data input position inplace is stored (steps ST131, ST132, ST133).
[0100]
Further, ID (p) is stored in the data input position inplace in the ID buffer (step ST134).
[0101]
Then, the motion vector (Vav) is determined and the threshold value Vp is determined again (step ST135).
[0102]
If it is other than the threshold Vp, pre-process ID assignment, IDnv = IDpre is set, and if it is within the threshold, scene ID (motion vector correspondence) is assigned, IDnv = ID (p), and IDpre = IDn is set in the IDn memory (step ST136). , ST137, ST138, ST139).
[0103]
After performing the ID determination processing in this way, in step ST108 shown in FIG. 15, post-motion vector frame detection post-processing is performed (step ST108).
This post-detection process within the motion vector frame is a motion vector process as shown in FIG. 17B, in which the number of frames m = 0 and the calculated value V = 0 are set (step ST144).
[0104]
After the post-detection process in the motion vector frame of step ST108 in FIG. 15, the scene ID recording process corresponding to the motion vector IDnv is performed (step ST109).
[0105]
Then, increment the counter n and confirm that it is not stopped. Going to detection of the next stream of step ST103 (steps ST110, ST111, ST112).
[0106]
【The invention's effect】
As described above, in the present invention, when the first playback medium is viewed, the outline can be grasped in a short time, so that it can be used as a reference when viewing in the normal playback time. effective.
In addition, since normal reproduction is performed while performing feature extraction processing for digest reproduction, the image and sound during the digest reproduction operation are not interrupted even during the feature extraction processing period, and an effective operation can be performed.
[0107]
Furthermore, since the outline of the content of the reproduction medium is automatically recorded on another recording medium, when searching for various reproduction media and trying to view the reproduction medium again, the outline is understood. There is also an effect that the re-operation can be omitted.
[0108]
Also, when the recording medium is inserted, the digest reproduction ID processing is automatically performed at a high speed, so that the normal operation is saved and it becomes a reference for normal reproduction.
[0109]
In addition, when recording broadcast programs, etc., classification processing can be performed in real time, and timer recording can be used to know the classification result immediately after the recording is completed, thereby eliminating the waiting time for processing. There is an effect that can be.
[0110]
Furthermore, there is also an effect that image classification and rearrangement, editing, digest reproduction, and the like can be performed using the scene ID subjected to classification processing.
[Brief description of the drawings]
FIG. 1 is an explanatory diagram showing an operation principle of a first embodiment according to the present invention.
FIG. 2 is an explanatory diagram showing an operation principle of the first embodiment according to the present invention.
FIG. 3 is an explanatory diagram showing an operation principle of the first embodiment according to the present invention.
FIG. 4 is a block diagram showing the configuration of the information signal processing apparatus according to the first embodiment of the present invention.
FIG. 5 is a flowchart showing the operation.
FIG. 6 is a flowchart showing the operation.
FIG. 7 is a flowchart showing the operation.
FIG. 8 is an explanatory diagram showing a display example of the same device.
FIG. 9 is an explanatory diagram showing an operation principle of a second embodiment according to the present invention.
FIG. 10 is an explanatory diagram showing an operation principle of a second embodiment according to the present invention.
FIG. 11 is a block diagram of an image separation processing system according to a second embodiment of the present invention.
FIG. 12 is an explanatory diagram when selecting a divided region on the same multi-resolution analysis plane;
FIG. 13 is an explanatory diagram of the identification information data return processing;
FIG. 14 is a block diagram showing a configuration of an information signal processing apparatus according to a second embodiment of the present invention.
FIG. 15 is a flowchart showing the operation.
FIG. 16 is a flowchart showing the operation.
FIG. 17 is a flowchart showing the operation.
Device display example
[Explanation of symbols]
1; recording medium system, 2; reproduction processing system, 3; reproduction data separation processing system, 4; video decoding processing system, 5; video D / A processing system, 6; recording medium detection system, 7; Identification signal detection system, 9; audio decoding processing system, 10; audio D / A processing system, 11; feature extraction system, 12; system controller, 13; reproduction mode display system, 14; user input I / F system, 15 Memory system, 30; characteristic data detection system, 31; characteristic data memory system, 32; arithmetic processing system, 33; identification information data generation system, 34; identification information data memory system, 35; system controller, 101; D conversion processing system 102: Audio encoder processing system 103: Multiplexing processing system 104: Recording processing system 105: Recording medium system 106: Video A / D conversion processing system 107: Video encoder Science system 108; Playback control system 109; Audio signal feature extraction system 110; Image signal feature extraction system 111; Playback processing system 112; Playback data separation processing system 113; Audio decoding processing system 114; Audio D / A processing system, 115; video decoding processing system, 116; video D / A processing system, 117; identification signal detection system, 118; system controller, 119; user input I / F system, 120;

Claims (4)

画像音声信号が記録されている第1の記録媒体を再生する再生手段と、
前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録する記録手段と、を備え、
前記画像音声の特徴の抽出は、通常の再生する区間Hに対して、それよりも少ないイントロの部分を含む区間aの通常再生時間内で特徴を抽出するようにすることを特徴とする情報信号処理装置。
Reproducing means for reproducing the first recording medium on which the image / audio signal is recorded;
Recording means for extracting features of the image and sound from the image and sound signal reproduced by the reproducing means, creating a digest reproduction ID based on the extracted image and sound, and recording the digest reproduction ID on a second recording medium; With
In the extraction of the feature of the image and sound, the information signal is characterized in that the feature is extracted within the normal reproduction time of the section a including the intro part smaller than the section H to be reproduced normally. Processing equipment.
画像音声信号が記録されている第1の記録媒体を再生する再生手段と、
前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録する記録手段と、を備え、
前記画像音声の特徴の抽出は、再生区間H1、H2、H3が長いものであるとき、再生区間H1に対しては、それよりも極めて短い再生区間b1の通常再生時間内で特徴を抽出し、次の再生区間H2に対しては、それよりも極めて短い再生区間b2の通常再生時間内で特徴を抽出し、次の再生区間H3に対しては、それよりも極めて短い再生区間b3の通常再生時間内で特徴を抽出することを特徴とする情報信号処理装置。
Reproducing means for reproducing the first recording medium on which the image / audio signal is recorded;
Recording means for extracting features of the image and sound from the image and sound signal reproduced by the reproducing means, creating a digest reproduction ID based on the extracted image and sound, and recording the digest reproduction ID on a second recording medium; With
When the playback sections H1, H2, and H3 are long , the feature extraction of the video and audio is performed for the playback section H1 within the normal playback time of the playback section b1, which is much shorter than the playback section H1, For the next playback section H2, features are extracted within the normal playback time of the playback section b2 that is much shorter than that, and for the next playback section H3, the normal playback time of the playback section b3 that is much shorter than that is extracted. An information signal processing device characterized by extracting features within the information signal processing device.
画像音声信号が記録されている第1の記録媒体を再生し、
前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録し、
前記画像音声の特徴の抽出は、通常の再生する区間Hに対して、それよりも少ないイントロの部分を含む区間aの通常再生時間内で特徴を抽出することを特徴とする情報信号処理方法。
Playing back the first recording medium on which the image / audio signal is recorded,
Extracting the feature of the image and sound from the image and sound signal reproduced by the reproduction means, creating a digest reproduction ID based on the image and sound from which the feature is extracted, and recording it on the second recording medium,
The information audio processing method is characterized in that the feature extraction of the image and sound is performed within a normal playback time of a section a including a smaller intro portion than a section H for normal playback .
画像音声信号が記録されている第1の記録媒体を再生し、
前記再生手段により再生された画像音声信号から画像音声の特徴を抽出し、該特徴を抽出した画像音声に基づいてダイジェスト再生用IDを作成して、第2の記録媒体に記録し、
前記画像音声の特徴の抽出は、再生区間H1、H2、H3が長いものであるとき、再生区間H1に対しては、それよりも極めて短い再生区間b1の通常再生時間内で特徴を抽出し、次の再生区間H2に対しては、それよりも極めて短い再生区間b2の通常再生時間内で特徴を抽出し、次の再生区間H3に対しては、それよりも極めて短い再生区間b3の通常再生時間内で特徴を抽出することを特徴とする情報信号処理方法。
Playing back the first recording medium on which the image / audio signal is recorded,
Extracting the feature of the image and sound from the image and sound signal reproduced by the reproduction means, creating a digest reproduction ID based on the image and sound from which the feature is extracted, and recording it on the second recording medium,
When the playback sections H1, H2, and H3 are long , the feature extraction of the video and audio is performed for the playback section H1 within the normal playback time of the playback section b1, which is much shorter than the playback section H1, For the next playback section H2, features are extracted within the normal playback time of the playback section b2 that is much shorter than that, and for the next playback section H3, the normal playback time of the playback section b3 that is much shorter than that is extracted. An information signal processing method characterized in that features are extracted from within .
JP2002197311A 2002-07-05 2002-07-05 Information signal processing apparatus and information signal processing method Expired - Fee Related JP4239496B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002197311A JP4239496B2 (en) 2002-07-05 2002-07-05 Information signal processing apparatus and information signal processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002197311A JP4239496B2 (en) 2002-07-05 2002-07-05 Information signal processing apparatus and information signal processing method

Publications (2)

Publication Number Publication Date
JP2004040629A JP2004040629A (en) 2004-02-05
JP4239496B2 true JP4239496B2 (en) 2009-03-18

Family

ID=31705117

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002197311A Expired - Fee Related JP4239496B2 (en) 2002-07-05 2002-07-05 Information signal processing apparatus and information signal processing method

Country Status (1)

Country Link
JP (1) JP4239496B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4600236B2 (en) * 2005-09-30 2010-12-15 ソニー株式会社 REPRODUCTION DEVICE, RECORDING / REPRODUCTION DEVICE, DATA PROCESSING METHOD, AND PROGRAM THEREOF
WO2011013288A1 (en) * 2009-07-27 2011-02-03 パナソニック株式会社 Video file playback method, video file playback device, and related technology thereof

Also Published As

Publication number Publication date
JP2004040629A (en) 2004-02-05

Similar Documents

Publication Publication Date Title
JP4569055B2 (en) Signal processing apparatus and signal processing method
US7463776B2 (en) Method and device for condensed image recording and reproduction
JP3701051B2 (en) Information recording apparatus and information reproducing apparatus
JP2004048730A (en) Method of displaying video stream
JP3340905B2 (en) Moving image processing method
JP2001506111A (en) Encoded video signal format
JP4239496B2 (en) Information signal processing apparatus and information signal processing method
JP3861362B2 (en) Digital signal reproduction method and apparatus
JPH08279273A (en) Recording and reproducing device for data, and method thereof
JP2003515290A (en) Reverse playback of MPEG video stream
JPH0877755A (en) Reproducing device for compressed image information
JP3281742B2 (en) Disc player
US7031595B2 (en) Disk reproducing apparatus
JP3110376B2 (en) Optical disc reproducing method and optical disc reproducing apparatus
JP3279186B2 (en) Playback control method for moving image data
JP3890655B2 (en) Digital signal reproduction method and apparatus
JPH11203051A (en) Information processing device and method, and supply medium
JP2004040628A (en) Information signal processing apparatus and information signal processing method
JP4030328B2 (en) Digest video file creation method and video recording / playback apparatus
JPH08205044A (en) Information service controller and information service control method
JPH09282797A (en) Recording method and recording and reproducing device
JP3291392B2 (en) Method and apparatus for reproducing compressed image data
JP4196475B2 (en) Reproduction apparatus and method, and recording and / or reproduction apparatus and method
JP2002044573A (en) Information signal processor and information signal processing method
JP3249897B2 (en) Disc player

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080731

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081003

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081030

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081215

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120109

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130109

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees