JP4334898B2 - Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device - Google Patents

Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device Download PDF

Info

Publication number
JP4334898B2
JP4334898B2 JP2003084906A JP2003084906A JP4334898B2 JP 4334898 B2 JP4334898 B2 JP 4334898B2 JP 2003084906 A JP2003084906 A JP 2003084906A JP 2003084906 A JP2003084906 A JP 2003084906A JP 4334898 B2 JP4334898 B2 JP 4334898B2
Authority
JP
Japan
Prior art keywords
image data
search
information
person
recording medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003084906A
Other languages
Japanese (ja)
Other versions
JP2004297305A (en
Inventor
功治 南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003084906A priority Critical patent/JP4334898B2/en
Publication of JP2004297305A publication Critical patent/JP2004297305A/en
Application granted granted Critical
Publication of JP4334898B2 publication Critical patent/JP4334898B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Image Analysis (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、記録媒体に記録された動画像データから特定のシーンの検索を容易に行えるようにする技術にかかり、データベース構築装置、データベース構築プログラム、画像検索装置、画像検索プログラム、及び画像記録再生装置に関する。
【0002】
【従来の技術】
まず、ここで、本明細書で用いる言葉について定義する。動画像は静止画像の列で構成され、動画像全体の一部を構成する任意の静止画像の列をシーンとする。そして、シーン情報とは、シーンを構成する静止画像の画像データそのものとは区別され、個々のシーンに付与され、シーンを特定し得る情報である。また、動画像の画像データを動画像データ、静止画像の画像データを静止画像データとし、動画像データ、静止画像データと区別する必要がない場合は、単に画像データと称する。
【0003】
今日、記録媒体への動画像の記録が簡単にできるようになり、記録した動画像の編集を効率よく行い得る技術の開発が望まれている。しかしながら、動画像を再生して、ユーザ自らが画面を見つめながら動画像に含まれている特定の対象物や事象を含んだシーンを探し当てるのは冗長であり、かつ目的のシーンを短時間で探し当てることは困難である。
【0004】
そこで、従来から、動画像を構成する各シーンに対して、シーンに関する情報(以下、シーン情報)を与え、これをデータベース化しておき、シーン情報を用いて動画像データを検索することが行われている。
【0005】
シーン情報として、例えば特許文献1には、動画像中での位置(例えば開始・終了フレーム番号、タイム・コード)、シーンの意味内容(例えばキーワード、属性、代表フレーム)、シーン相互の関係(例えば親または子のシーンの識別子)、シーン変化の情報(例えば変化点の動画像中での位置、変化のタイプ、確からしさ)等の情報が挙げられている。
【0006】
図8に、該文献に記載されている、シーン情報の入力システムの構成図を示す。これにおいて、シーン情報エディタ112は、複数のシーンについて、それを代表する静止画像データを代表フレームファイル122から取り出し、静止画像を時間軸とともに、かつその時間軸に沿って時間順に、ディスプレイ114の画面に表示する。そして、入力装置115を通してユーザからの指示を受けると、指示されたところの時間軸の一部に対応する期間について、動画像データをLD116から取り出し、TVモニター118に表示する。
【0007】
また、シーン情報エディタ112は、それらのシーンに与えられた情報であるシーン情報をシーン情報ファイル121から取り出し、ディスプレイ114の画面に同時に図形的に表示する。そして、ユーザが入力装置115を通じて編集コマンドを入力したときには、それを実行し、シーン情報ファイル121を編集する。
【0008】
図9に、該文献に記載されているシーン情報を構築していくための手順を示す。これは、時間的に連続するフレーム列で構成される動画像を、部分フレーム列であるところのシーンに分割し、シーンへの分割を確認・修正し、シーン情報を入力し、入力した情報を動画像データベースに登録するまでの処理の流れを示している。
【0009】
シーン変化点を検出するステップa)、検出されたシーン変化点に基づいてシーン情報を生成し、シーン情報ファイルに格納するステップb)、シーン情報をディスプレイに図形的に表示するステップc)、入力手段を使ってユーザより指示された編集コマンドを実行して、シーン情報ファイルを編集するステップd)、およびシーン情報ファイルのシーン情報をデータベース手段に登録するステップe)よりなる。
【0010】
【特許文献1】
特開平5−334374号公報(1993年12月17日)
【0011】
【発明が解決しようとする課題】
動画像を検索するにおいて、シーン情報のデータベース化は有意な中核技術であるが、上記した文献に記載されている技術は、ユーザ自らがシーン情報を入力してデータベースを構築するものであるため、やはりユーザにとって困難な作業と言わざるを得ない。
【0012】
そこで、シーン情報を自動で入力できるシステムが求められるが、自動によるシーン情報の完全な情報としての入力は非常に難しいものとなる。それは、シーン情報の内容が、人物、そこに存在する物全ての名称、構成要素それぞれの配置場所、構成要素それぞれの明るさなど非常に多岐にわたり、これら全てが入力対象になるからである。
【0013】
上記した文献の技術は、シーン情報のデータベースを構築する助けとなる発明ではあるが、シーン情報として、画像データの内容に関する全ての情報を扱う必要があるという点では、その文献の従来技術と同じであり、自動化は難しい。
【0014】
また、上記した文献の技術では、シーンの変化をとらえてシーンを分けるようにようになっている。しかしながら、変化が小さい映像では変化の判断が難しく、また、局所的(画面の一部)に変化が起こった場合なども、変化の発生箇所の探索まで含めると、非常に難しい変化の判断機能が要求される。
【0015】
このような理由で、上記した文献のシステムで構築されたデータベース(動画像データベース)は、シーン情報の内容が緻密である一方で、どんな種類の画像に対しても有効なデータベースとはなり得ない。
【0016】
例えば、人物主体の動画像で、スナップ写真的に動画像から静止画像を切り出したい要望が生じたときなど、シーンの変化が局所的であったり、小さかったりした複数のシーンは、シーン情報検索に使うキーワードの選択によっては、同時に検索されてしまうことになる。
【0017】
本発明は、上記課題に鑑みなされたもので、動画像データを構成する静止画像データをさらに細分化し、静止画像に含まれる人物、或いは人物とその付加情報の組み合わせとしてシーン情報を取得することで、人物画像主体の動画像データに対しては、シーン情報を人物を含む画像情報としてユーザの手を煩わせることなく自動に取得できるようにして、シーン情報のデータベース化を容易にするとともに、局所的なシーン変化なども容易に判別でき、人物の動きに沿った画像検索等も可能にする、データベース構築装置、データベース構築プログラム、画像検索装置、画像検索プログラム、及び画像記録再生装置を提供することを目的としている。
【0018】
【課題を解決するための手段】
本発明のデータベース構築装置は、上記課題を解決するために、第1のドライブにて再生された第1の記録媒体の動画像データから静止画像データを取得する静止画像データ取得手段と、上記静止画像データ取得手段にて取得された静止画像データを蓄積していく蓄積手段と、該蓄積手段が蓄積した静止画像データに含まれる人物を探索し、人物が含まれている場合は人物を含む所定領域を部分画像データとして抽出する探索抽出手段と、該探索抽出手段にて部分画像データが抽出されると、抽出された部分画像データを抽出元である静止画像データの上記第1の記録媒体上のアドレス情報と対応付けて第2のドライブを用いて第2の記録媒体に記録させる記録手段とを有することを特徴としている。
【0019】
これによれば、静止画像データ取得手段が、第1のドライブにて再生された第1の記録媒体の動画像データから静止画像データを取得する。取得された静止画像データは、蓄積手段に蓄積されていき、探索抽出手段が、該蓄積手段が蓄積した静止画像データに含まれる人物を探索して、人物が含まれている場合は人物を含む所定領域を部分画像データとして抽出する。探索抽出手段にて抽出された部分画像データは、記録手段にて、抽出された部分画像データを抽出元である静止画像データの上記第1の記録媒体上のアドレス情報と対応付けて第2のドライブを用いて第2の記録媒体に記録されることとなる。
【0020】
第2の記録媒体に記録される部分画像データには、その人物の行為など、そこには既にこれを抽出した静止画像データ、つまりその静止画像データを構成要素とする動画像のあるシーンを特徴付ける情報が含まれているので、部分画像データを表示させることで、部分画像データ自体がシーン情報となる。また、その部分画像データから複数の人物情報が得られる場合も、その複数人の人物構成などが重要なシーン情報となる。つまり、これらの部分画像データは、そのままでもユーザにとってはシーン変化を検出するために得られる情報と相当のシーン情報となる。
【0021】
そして、このようなシーン情報は、人物を含む領域を切り出した部分画像データであるので、既存の技術にてユーザの手を煩わせることなく自動にて取得して、データベースを構築することができる。
【0022】
これにより、人物画像主体の動画像データに適した、シーン情報をユーザの手を煩わせることなく自動に取得可能な、シーン情報のデータベース構築装置を提供することができる。
【0023】
そして、このようなデータベース構築装置を画像記録再生装置に搭載させることで、局所的なシーン変化なども容易に判別でき、人物の動きに沿った画像検索等も可能な、人物を主体とした動画像データの内容編集等を容易に行うことのできる画像記録再生装置を提供することができる。
【0024】
また、本発明のデータベース構築装置においては、さらに、上記探索抽出手段は、部分画像データを抽出する際に、当該部分画像データ内に含まれる人物の数を表す数情報を含む付加情報を併せて取得し、上記記録手段は、部分画像データと共に対応する付加情報を、部分画像データに連なるツリー構造で関係付け得るように上記第2の記録媒体に記録することを特徴とすることもできる。
【0025】
これによれば、部分画像データ内に含まれる人物の数を表す数情報を含む付加情報が取得され、部分画像データと共に対応する付加情報が、部分画像データに連なるツリー構造で関係付け得るように第2の記録媒体に記録されるので、たとえ、人物を含む部分画像データの切り出しが、人物が二人重なっている画像として取得した場合でも、第2の記録媒体に記録されたデータ側では、二人の人物に分離して管理することができる。
【0026】
また、上記付加情報には、さらに、各人物の色的特徴を表す色情報、及び/又は、各人物の形状的特徴を表す形状情報を含めておくこともできる。
【0027】
色情報を利用すれば、例えば動画像全体の中で特定の人物が着ている衣装をキーに、特定のシーンを検索することが可能となる。また、別の例で、形状情報を利用すれば、その形状変化を捉えて、特定の人物の行動をキーに、特定のシーンを検索することが可能である。
【0028】
したがって、人物を含み領域を抜き出した部分画像データをシーン情報とし、これをもとに動画像データの検索を行う場合、検索のキーとなる項目が増え、より効果な検索を行いえるデータベースを構築することができる。
【0029】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、静止画像データに含まれる全ての人物が何れかの部分画像データに含まれるように部分画像データの抽出を行うことが好ましい。
【0030】
これによれば、静止画像データに含まれる全人物が、独立して或いはほかの人物と共に、部分画像データとして取得されるので、シーン情報の内容としてより確度の高い情報となる。
【0031】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、人物を探索する際の探索領域を適宜変更しながら行うことを特徴とすることができる。
【0032】
これによれば、人物を探索する際の探索領域を適宜変更しながら行うので、探索時に、人物情報の静止画像データに占める割合が任意に変化する動画像データなどに対しても、探索領域を画面最大範囲から段階的に縮小していくなど、探索領域を常に適切に定めていくことができ、探索をより効率良く行うことができる。また、最初の探索で複数の人物を含む領域として探索した際にも、より情報確度を上げるため、探索領域を変えて再度探索を行うといったことも容易に行える。
【0033】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、静止画像データを予め複数の領域に分割し、分割した領域を探索領域として探索することを特徴とすることもできる。
【0034】
これによれば、静止画像データを予め複数の領域に分割してから分割した各領域を探索領域として探索するので、切り出した静止画像データに予め多数の人物が記録されていると予想される動画像データの場合、一回の探索で見つけて切り出すところの人物が含まれる領域に存在する人物数を適宜少なくでき、個別人物情報の数を少なくできる。また、分割した各領域にて独立して探索処理を行うようにすれば、静止画像データからの人物の抽出をより短時間で行うことができる。
【0035】
また、このよう予め静止画像データを分割する場合、静止画像データに含まれる人物の数の状態を判定し、判定に基づいて静止画像データの分割数を決定する分割数決定手段を備え、上記探索抽出手段は、該分割数決定手段にて決定された分割数にて画像データを分割する構成とすることがより好ましい。
【0036】
これにより、静止画像データの分割が、静止画像データに含まれる人物の数の状態に応じて行われるので、静止画像データの分割数が静止画像データに含まれる人物の数の状態にあったものとなり、分割数が固定されている構成よりも、個別人物情報の数をより的確にできる。
【0037】
また、本発明のデータベース構築装置では、上記第1のドライブにおける上記第1の記録媒体の動画像データの再生が初めてか否かを判定し、初めてである場合は、上記静止画像データ取得手段による静止画像データの取得を開始させる開始指示手段を備えている構成とすることもできる。
【0038】
これによれば、第1のドライブにおける上記第1の記録媒体の動画像データの再生が初めてである場合、開始指示手段にて、静止画像データ取得手段による静止画像データの取得が開始されるので、ユーザは第1のドライブで第1の記録媒体を再生させるだけで特別な指示を行うことなく、シーン情報のデータベースを取得することができる。
【0039】
本発明の画像記録再生装置は、上記課題を解決するために、第1の記録媒体に記録されている情報を再生する第1のドライブと、第2の記録媒体に情報を記録・再生する第2のドライブとを備えた画像記録再生装置において、上記請求項1〜9に記載のデータベース構築装置を備えたことを特徴としている。
【0040】
既にデータベース構築装置として説明したように、本発明のデータベース構築装置は、人物画像主体の動画像データに適した、シーン情報をユーザの手を煩わせることなく自動に取得し得るシーン情報のデータベース構築装置である。
【0041】
したがって、このようなデータベース構築装置を搭載してなる本発明の画像記録再生装置は、局所的なシーン変化なども容易に判別でき、人物の動きに沿った画像検索等も可能な、人物を主体とした動画像データの内容編集等を容易に行うことのが可能な優れた画像記録再生装置となる。
【0042】
本発明の画像検索方法は、本発明の画像記録再生装置の画像検索方法であって、上記第2の記録媒体に記録されている部分画像データをシーン情報として用いて、上記第1の記録媒体に記録されている動画像データにおける任意のシーンの検索を行うことを特徴としている。
【0043】
上述したように、第2の記録媒体に記録される部分画像データには、その人物の行為など、そこには既にこれを抽出した静止画像データ、つまりその静止画像データを構成要素とする動画像のあるシーンを特徴付ける情報が含まれているので、部分画像データを表示させることで、部分画像データ自体がシーン情報となる。また、その部分画像データから複数の人物情報が得られる場合も、その複数人の人物構成などが重要なシーン情報となる。つまり、これらの部分画像データは、そのままでもユーザにとってはシーン変化を検出するために得られる情報と相当のシーン情報となる。
【0044】
したがって、画像に含まれる人物の動作まで含めた細かいレベルでのシーン情報を用いて検索するので、人物が中心の動画データ再生時の検索においてなど、より効率の良い画像検索が可能になる。
【0045】
また、本発明の画像検索装置は、上記画像記録再生装置に備えられる画像検索装置であって、上記第2ドライブを用いて上記第2の記録媒体に記録されている部分画像データ群を再生し、表示手段に表示させる部分画像データ表示手段と、
ユーザからの表示されている部分画像データに対する選択を受けつける入力手段と、上記入力手段にて選択された部分画像データをもとに、第1の記録媒体に記録されている動画像データに対して、該部分画像データの抽出元となる静止画像データの検索を行う検索手段とからなることを特徴としている。
【0046】
これによれば、部分画像データ再生表示手段が、像上記第2ドライブを用いて上記第2の記録媒体に記録されている部分画像データ群を再生し、表示手段に表示させる。ユーザが表示されている部分画像データの1つを入力手段を用いて選択すると、検索手段が、上記入力手段にて選択された部分画像データの抽出元となる静止画像データを動画像データより検索する。
【0047】
したがって、第2の記録媒体に記録されている人物の動作、表情などを直接に見て必要な画像データの検索(シーン検索)を行うことができるので、例えば動画像検索を、静止画像全体を表示して行う場合よりもきめ細かい検索が可能になる。例えば、元の静止画像内で人物が記録された領域の占める割合が全体の中で小さい場合にも、人物情報をキーにした画像検索ができる。つまり、画面内を絞って表示するので、ユーザにとってはより見やすく、かつ情報確度の高い検索が可能になる。
【0048】
本発明の画像検索装置では、さらに、部分画像データ再生表示手段は、上記第1の記録媒体に記録されている動画像データの再生が指示された場合、動画像データの再生前に部分画像データの一部を表示することを特徴とすることもできる。
【0049】
これによれば、第1の記録媒体の動画像データの部分画像データ群が第2の記録媒体にある場合は、動画像データの再生を前にして部分画像データの一部が自動的に再生されるので、例えばユーザはその部分画像データをみて、見たいシーンのみ選択的に再生させるといった使い方が可能となる。
【0050】
また、本発明のデータベース構築プログラム及び記録媒体は、上記した本発明のデータベース構築装置における各手段としてコンピュータを機能させるプログラム及びそれを記録した記録媒体である。
【0051】
また、本発明の画像検索プログラム及び記録媒体は、上記した本発明の画像検索装置における各手段としてコンピュータを機能させるプログラム及びそれを記録した記録媒体である。
【0052】
これにより、上記したデータベース構築プログラム、或いは画像検索プログラムをコンピュータによって実行させれば、特定の特定のデータベース構築装置、画像検索装置、画像記録再生装置ではなく、不特定の画像記録再生装置に対しても本発明のデータベース構築装置、画像検索装置、画像記録再生装置を実現させることが可能となる。
【0053】
そしてまた、本発明は、以下のように表現することもできる。つまり、本発明の画像記録再生装置は、第1の記録媒体を記録再生可能な第1のドライブと、第2の記録媒体を記録再生可能な第2のドライブと、第1のドライブから再生された画像データを一時的に格納するためのバッファメモリと、画像処理のためのプログラムを記憶するメモリと、第1ドライブで再生されたデータ、および第2ドライブで再生されたデータの少なくとも一方を表示する表示装置とからなり、第1の記録媒体、第2の記録媒体を同時に少なくとも記録、再生の一方が可能な再生装置において、第1の記録媒体からの再生画像データを少なくとも一つのバッファメモリに蓄積し、前記バッファメモリに蓄積された画像データから人物が含まれる領域を探索し、かつ、人物が含まれる領域が少なくとも一つ以上探索できた場合に、前記領域を少なくとも一つ以上の部分画像データとして抜き出し、前記部分画像データを、前記部分画像データを抜き出した元画像データの第1の記録媒体におけるアドレス情報と結び付け、第2の記録媒体に記録することを特徴としている。
【0054】
また、ここで、前記第1の記録媒体から人物が含まれる領域を探索して得られた前記部分画像データに対し、前記探索時に得られた、人数情報、色情報、形状情報の三つの情報を少なくとも含む、前記第1の記録媒体の画像データに関する複数の情報を、前記個々の部分画像データに連なるツリー構造で関係付けられるように、前記第2の記録媒体に記録することが好ましい。
【0055】
また、第1の記録媒体からの再生画像データを少なくとも一つのバッファメモリに蓄積する動作と、前記バッファメモリに蓄積された画像データから人物が含まれる領域を探索し、かつ、人物が含まれる領域が少なくとも一つ以上探索できた場合に、前記領域を少なくとも一つ以上の部分画像データとして抜き出し、前記部分画像データを、前記部分画像データを抜き出した元画像データの第1の記録媒体におけるアドレス情報と結び付け、第2の記録媒体に記録する動作とを独立して実行可能な上記画像記録再生装置であって、かつ、人物が含まれる領域の探索を画像データ内の探索領域を順次変えていくことで行うことを特徴とすることもできる。
【0056】
また、第1の記録媒体からの再生画像データを少なくとも一つのバッファメモリに蓄積する動作と、前記バッファメモリに蓄積された画像データから人物が含まれる領域を探索し、かつ、人物が含まれる領域が少なくとも一つ以上探索できた場合に、前記領域を少なくとも一つ以上の部分画像データとして抜き出し、前記部分画像データを、前記部分画像データを抜き出した元画像データの第1の記録媒体におけるアドレス情報と結び付け、第2の記録媒体に記録する動作とを独立して実行可能な請求項1記載の画像記録再生装置であって、かつ、第1の記録媒体から再生した画像データを予め複数の探索領域に分けてから、人物が含まれる領域の探索を行うことを特徴とすることもできる。
【0057】
また、本発明の画像記録再生装置における画像検索システムは、前記第2記録媒体に記録した人物を含む部分画像データを、前記第1の記録媒体の画像データのシーン情報として用いることを特徴としている。
【0058】
また、本発明の画像記録再生装置における画像検索システムは、前記第1の記録媒体の画像データを再生することで、第2の記録媒体に自動記録された部分画像データ群の一部を、第2の記録媒体も再生して前記第1の記録媒体の2回目以降の再生前に表示し、前記部分画像データを選択することで、部分画像データを第1の記録媒体記録された画像データの検索キーとすることを特徴としている。
【0059】
【発明の実施の形態】
〔実施の形態1〕
本発明の実施の一形態について図1ないし図5に基づいて説明すれば、以下の通りである。
【0060】
図1は、本発明のデータベース構築装置並びに画像検索装置を具備する本実施の形態の画像記録再生装置の構成図である。
【0061】
本画像記録再生装置は、第1及び第2の2つのドライブ11・12と、バッファメモリ3と、表示装置5と、CPU6と、メモリ4とを少なくとも備えている。
【0062】
第1のドライブ11は、第1の記録媒体1を記録再生可能な装置であり、第2のドライブ12は、第2の記録媒体2を記録再生可能な装置である。
【0063】
バッファメモリ(蓄積手段)3は、第1のドライブ11から再生された動画像データ(静止画像データの列からなる)より、所定のタイミングで取得された静止画像データを一時的に格納するものである。サンプリングされた静止画像データは、必要に応じて、後述のようにさらに細分化されて第2のドライブ12へ転送される。
【0064】
表示装置(表示手段)5は、第1のドライブ11で再生された画像データ、及び第2のドライブ12で再生された画像データを表示するものである。再生された画像データの表示は独立して行われ、表示装置5は、第1及び第2のドライブ11・12で再生された何れか一方の画像データを表示する。
【0065】
メモリ4は、ハードディスク等からなり、画像処理のためのプログラムを始め、各種のアプリケーションプログラムを格納している。
【0066】
CPU6は、図示しないRAMを作業領域として備えており、上記した第1及び第2のドライブ11・12、バッファメモリ3、表示装置5の各種動作を制御する制御中枢である。また、上記メモリ4よりアプリケーションプログラムを読み出して実行するものであり、本発明のデータベース構築装置並びに画像検索装置を具現化するものでもある。つまり、CPU6とメモリ4にて、静止画像データ取得手段、探索抽出手段、記録手段、開始指示手段、部分画像データ表示手段、検索手段等の機能を有している。
【0067】
また、上記した第1のドライブ11と第2のドライブ12とは、対応する記録媒体である記録媒体1或いは第2の記録媒体2に対して、同時に少なくとも記録、再生の一方が可能となっている。
【0068】
上記第1及び第2の記録媒体として、特に大きな制約はないが、本実施の形態では、一例として、第1の記録媒体1にはDVRディスク(大容量の相変化光ディスク)を、第2の記録媒体2にはDVD−RWをそれぞれ用いている。
【0069】
そして、本画像記録再生装置では、第1のドライブ11にて第1の記録媒体1の動画像データを再生する際に、動画像データの構成要素である静止画像データを所定のタイミングでサンプリングし、静止画像データのさらに一部である部分画像データを抽出して第2のドライブ12にて第2の記録媒体2に記録するようになっている。
【0070】
そしてさらに、本画像記録再生装置では、例えば、第1の記録媒体1に記録されている動画像データの内容編集等の目的で、動画像データに含まれる特定のシーン或いは画像を検索する必要が生じた場合は、第2の記録媒体2に記録されている上記した部分画像データ群を、画像検索のための情報として用いるようになっている。
【0071】
動画像データのシーンを検索するために用いる情報は、シーン情報と称される。本発明では、動画像データを構成する静止画像データの一部である部分画像データをシーン情報とする。より詳細には、静止画像データにおける人物とその周辺の画像とからなる部分画像データをシーン情報とする。
【0072】
前述した従来の構成では、シーン情報を、動画像中での位置、シーンの意味内容、シーン相互の関係、シーン変化の情報等の情報からなる構成としていた。そのため、シーン情報を自動にて完全な情報として取得することは難しかった。しかしながら、動画像データを構成する静止画像データにおける人物とその周辺画像とからなるシーン情報であれば、既存の技術にて自動的に取得していくことが可能となる。
【0073】
また、シーン情報を、人物とその周辺画像とに絞ることで、人物主体の動画像データにおける検索情報を、その人物の動作も含めてより具体的なものにすることができる。
【0074】
つまり、図2(a)(b)に、人物情報をそのある程度周囲の周辺画像と共に抜き出す。人物情報を抜き出す際、人物情報そのものだけを抜き出すのではなく、破線にて示すように、人物をある程度周囲にある周辺画像とともに抜き出す。
【0075】
また、シーン情報の内容としてより確度の高い情報とするために、その静止画像データに含まれる人物全てが何れかの部分画像データに含まれるように、部分画像データは複数であることが望ましい。つまり、その静止画像データから取得した部分画像データ全体で、その静止画像データに登場する全ての人物を網羅していることが望ましい。
【0076】
そこで、図2(a)に示すように、画像に人物の重なりがない場合は、部分画像データの取得は比較的容易である。例えば、大きな探索領域から出発して、その探索領域内に一人の人物が入り、人物探索が上手くいくことも増える。一方、図2(b)に示すように、画像に人物の重なりがある場合は、探索領域の形状と大きさを変えていき、例えば探索領域が大きい場合では重なった人物二人の部分画像データを重なった二人の人物双方情報として抜き出して取得する。また、探索領域が小さい場合では、一人の人物を含む部分画像データとして抜き出して取得することもできる。
【0077】
静止画像データ内に含まれる複数の画像の中で、画像が人物か否かの判定は、例えば以下のように、人物情報を基本フレームの組み合わせとして捉えることで行うことができる。
【0078】
ここで言う、基本フレームとは、顔フレーム、身体パーツフレーム(手、胴体、足など)から構成される。顔フレームについては、顔が観測方向によって平面的形態が変わることを応用して、その形態の変化に応じた判定基準情報として複数パターンの顔フレームを、メモリ4に記憶させておく。顔フレームのパターンを判定基準情報としていくつ用意するか、つまりその個数Nは、システムの条件によって変わるが、顔フレームの個数としては、所望の観測方向の角度分解能を(△φ,△θ: △φはあおり、△θは回転)とした場合はN=(180/△φ)×(360/△θ)となる。また、顔フレームの情報形態は、その構成要素(目や鼻、口等)を複数の線情報に置き換えたものである。
【0079】
人物かどうかの判定にあたり、まず、画像処理が行われ、静止画像データの輪郭画像(画像をいくつかの複数の線情報に加工した画像、既存技術で形成される)を形成する。そして、その輪郭画像に含まれるいくつかの輪郭群の中のいずれかと、その判定基準となるN個の顔フレームを形成するための輪郭モデルとの間で、顔フレームの各構成要素の配置を比較することで行う。N個の顔フレームの中に近い輪郭があるかどうかをチェックする。これが、人物であるかどうかの第1段階の判定となる。
【0080】
次に、第1段階の判定結果を受けて、顔フレームの近傍に身体パーツフレームがあるかどうかで、最終判断を行う。判断用の身体パーツフレームは、腕フレーム、胴フレームなどがある。例えば判定用に複数の腕フレームを用いた場合、腕フレームの輪郭モデルが、顔フレームと所定の距離の範囲にあるかどうかを判断し、この距離的な条件が満たされた場合、その顔フレームの判定で得られた画像情報が人物と判断するというような判断方法がある。このようなほぼ二段階の判定方法で人物かどうかの判定を行うことができる。
【0081】
なお、このような人物判定の方法については、例えば、『Labeled Graph Matchingを用いた動画像に対する人物頭部及び表情変化を伴う部位の抽出』電子情報通信学会論文誌 Vol.J85-D-II No.11 pp.1656-1663 2002年11月等に記載されている。
【0082】
また、これらの部分画像データを、人物を含む画像データ情報として抜き出す際に、部分画像データに関する付加情報として、少なくとも人数情報を含む情報を取得することが好ましい。人数情報は、部分画像データに含まれる人物の数を表す情報である。また、より好ましくは、付加情報に、各人物の色を特徴付ける色情報或いは各人物の形状を特徴付ける形状情報の一方或いは両方(より好い)を含めておくことである。
【0083】
このように付加情報を部分画像データと共に取得させておくことで、画像に人物の重なりがあり、抜き出した1つの部分画像データに複数の人物が含まれていても、得られた部分画像データに含まれる個別人物情報を、図3に示すようなツリー構造で情報管理される付加データ(付加情報)を同時に取得することで、部分画像データの中に含まれる複数の人物情報を取得でき、シーン情報として活用することができるようになる。
【0084】
色情報及び形状情報は、より詳細に言えば、部分画像データを取り込んで、取り込んだ画像の中で、人物毎に、後述する顔フレームや身体パーツフレームなど、顔フレーム群、身体フレーム群におけるどのパターンかを判別した後で、さらにこれらを特徴付けるために用いる情報である。例えば、色情報は、画像を取り込んで判断用に適合させたフレーム(顔フレームや身体パーツフレームなど)全体の色調を表現する情報のことで、形状情報は、判断用に適合させたフレームのまさにその形状を現す情報のことである。
【0085】
また、付加情報に、動きの情報を含めてもよい。動きの情報とは、判断用に適合させたフレーム(顔フレームや、身体パーツフレームなど)が、次の静止画像データの取り込み操作で、同フレーム群の先とは異なるフレーム群の別のフレームに適合するようになったことを示す情報である。さらに、顔フレームの中の構成要素(目や鼻、口等)を別のフレーム群化することで、表情変化などにも対応した処理が可能になる。
【0086】
人物が複数重なった画像では、人物かどうか判定するための顔フレームや身体パーツフレームが、不完全な形でしかも、近接した形で複数存在するので、判定の基準になる。顔フレームや身体パーツフレーム、それぞれの色情報、形状情報は人物固有であるから、この各フレームの色、及び形状情報で、複数人それぞれの情報を得ることができる。そして、さらにその部分画像データを特徴づけるための情報量として、<人数情報>×<人物判断用フレームの数>×<形状情報+色情報>という情報量として、部分画像に関する情報を管理できるので、画像情報を特徴づけしやすい。また、ツリー構造で管理することで、検索の際にも検索が容易になる。
【0087】
このような色情報、形状情報は、人物かどうかを判断するのに用いた、顔フレームや身体フレームに近いと判断した輪郭モデルを、輪郭モデル専用の一時記憶装置(図示せず)が情報として取り込み、輪郭モデルのもとになっている人物かどうかの判定のために取り込んだ画像データと参照して、その輪郭モデルの位置に相当する部分で、もとの画像での色や形状といった情報を、色情報専用の一時記憶装置(図示せず)、形状情報専用の一時記憶装置(図示せず)が情報として取り込むことで取得できる。
【0088】
また、人数情報は、抜き出した部分画像データの中に、人物と判断された人物情報がいくつあったかの情報であるから、これも人数情報専用の一時記憶装置(図示せず)が、同一の部分画像データの中で何度輪郭モデルを取得したかを、カウントしてこれを記憶することで取得できる。
【0089】
また、静止画像データより人物を含む領域を探索する際、探索の単位となる探索領域を、静止画像データの最大サイズ以下の範囲で適宜変更することが好ましい。探索領域を変更するとはつまり、探索領域の形状(通常は矩形)と大きさとを変更することである。探索領域を適宜切り換えることで、探索領域を人物画像に合った適切な形とでき、人物に関する確度の高い情報を短時間で取得することができる。
【0090】
探索領域の設定の仕方としては、例えば顔フレームを利用する方法がある。次のタイミングで取得した静止画像データと前のタイミングで取得した静止画像データとで、同じ人物の大きさが変化する場合は、顔フレームの大きさの変化を検出して、その変化率に合わせて探索領域を小さくする。この場合は、顔フレームの大きさの変化率が元の70%になったなら、探索領域も元の70%にするといった具合である。
【0091】
また、複数の人物を含む領域が探索された場合については、顔フレームが例えば5つあった場合は、その顔フレームの数が3つになるように、領域を設定直すことで、探索領域に含まれる個々の人物情報は多くなり、確度が上がることになる。
【0092】
そして、このように、顔フレームを基準に探索領域を小さくする場合には、顔フレームの存在する場所を探索領域の対角要素の基点にする方法が有効である。
【0093】
具体的には、図4に示すように、顔フレームのサイズx1×y1とx2×y2と顔フレーム間の距離X,Y、さらにはその探索部分を十分に確保するためのマージンとして設けた、元の顔フレームのサイズを基準に予め定めた(m1,m2,n1,n2は任意の数)範囲を組み合わせて探索領域サイズは、{(m1+1)・x1+X+(m2+1)・x2}×{(n1+1)・y1+Y+(n2+1)・y2}で与えられる。
【0094】
以上に示した、人物を含む部分画像データによるシーン情報の取得により、シーンの変化様々な情報を考慮して異なるシーンであると判別して、その変化を階層構造で管理するなどの概念はなくなり、それらの人物が何をするか等にも着目した情報が管理できることになる。
【0095】
次に、図5のフローチャートを用いて、人物を含む部分画像データを抜き出す操作を説明する。
【0096】
図5では、静止画像データ内の人物を含む領域を部分画像データとして抜き出す際に、人物を探索する探索領域を適宜変更しながら行う場合の部分画像データの取得までの流れを示す。
【0097】
第1のドライブ11で、第1の記録媒体1の動画像再生中に開始信号が検出されると、第1のドライブ11で再生される動画像データの一コマを取得するタイミング情報を発生させ、静止画像データの取得を開始する(S1)。
【0098】
動画像データを取得するタイミング情報が与えられると、それに同期して、バッファメモリ3に、動画像データの一コマである静止画像データを、そのアドレスデータ(第1の記録媒体1上のアドレス)と共に蓄積する(S2、S3)。
【0099】
次に、開始直後であるか否かを判断し(S4)、開始直後以外は、続けて画像データ転送要求のトリガが検出されたか否かを確認する(S5)。開始直後以外で、画像データ転送要求のトリガが検出されなければ、S1〜S5を繰り返して、画像蓄積を続けていく。
【0100】
一方、開始直後である場合、及び、画像データ転送要求のトリガが検出された場合は、バッファメモリ3に取り込んだ静止画像データを、人物情報検出系に送る(S7)。ここまでの処理は、静止画像データを蓄積する画像蓄積系の処理である。
【0101】
以下に人物情報検出系について説明する。転送された静止画像データに対し、まず、画像処理を行って、上述した輪郭画像を形成する(S8)。次に、探索領域の見直しを行いながら、人物を含む領域を探索していく(S9)。
【0102】
S9では、静止画像データから得られた輪郭画像に対して、探索領域を所定の画素ずつ(輪郭画像の分解能に合わせて決める)水平方向にずらしていき、その探索で読み込まれる線分をベクトルと見ての方向と長さの情報を検出する。そして、方向と長さ情報を取得しながら探索を進める。また、1水平方向の探索走査が終了したら、垂直方向に所定の画素だけずらして、再度水平方向に探索走査を開始する。この探索を輪郭画像データ全体に対して、人物と判断できる情報が得られるところまで続け、線分の有無の情報と、線分が有る場合は、その方向と長さの情報とが輪郭画像情報として、一時記憶装置に格納されていく。
【0103】
この探索で、輪郭画像内の線分の情報が定量的に得られるので、顔フレームや、身体パーツフレームといった、人物かどうか判断するための各フレームの輪郭モデルとの間で、その類似性を数値的に比較し、上記各フレームの輪郭モデルと一致した際には、人物が含まれると判断する(S10)。
【0104】
人物が含まれると判断すると、その一致部分を含む一定の範囲を、人物を含む部分画像データとして切り出す(S12)。また、この際、切り出した部分画像データが静止画像データのどこにあったかもわかるようにフィールド情報を併せて取得する(S11)。フィールド情報とは、静止画像内のどの位置に人物画像が存在するかを示す情報である。
【0105】
切り出した部分画像データとフィールド情報とは、当該部分画像データが含まれていた静止画像データの第1の記録媒体1上の位置を示すアドレス情報と対応付けて、第2のドライブ12を用いて第2の記録媒体2に記録する(S13)。
【0106】
次に、輪郭画像全体の探索を完了していない段階では、未探索部分への探索を続行し、探索領域の見直しを行いながら、人物画像の探索を続ける(S14、S15)。S16にて人物情報が他にないことを確認するまで、S12〜S15の処理を繰り返す。
【0107】
また、より望ましくは、一度得られた部分画像データの範囲内をさらにそれより小さい探索領域にて探索することである。これにより、顔の表情といった、よりそのシーンを特徴付けられる確度の高い情報を短時間で得ることができる。
【0108】
一方、S10にて、静止画像データの全体を探索しても人物が含まれると判断しなかった場合、及びS16にて人物情報が他にないことを確認すると、人物情報検出系の処理が終了する。
【0109】
この人物情報の検出系の処理が終わった時点で、次の静止画像データを人物情報検出系に送るための画像データ転送要求のトリガを発生させ(S17)、そのトリガデータを、静止画像データを蓄積しているバッファメモリ3に送る。これにて、画像蓄積系より人物情報検出系へ、次の静止画像データの転送処理がなされる(S7)。
【0110】
この探索の際には、人物を含む領域を探索する人物情報検出系と、画像データを蓄積する画像蓄積系とは別の動きをしている。したがって、動画像データの再生が終了して後しばらくしてから、人物を含む領域を探索する処理が終了することになる。探索の終了に際しては、第1のドライブ11で再生される動画像データのエンド情報が転送されたことをもとに終了動作に入る(S6)。
【0111】
なお、上記したS1における、再生された動画像データを構成する静止画像データをサンプリングし、バッファメモリ3に蓄積していく時間間隔(サンプリングのタイミング)は、人物を含む領域の探索と記録に要する時間を考慮して設定するのが好ましい。
【0112】
また、ユーザがサンプリングのタイミングを自由に設定できるようにしてもよい。第1の記録媒体1の動画像データを再生して、シーン情報となる部分画像データを取得しているときに、ユーザは表示装置5に映し出される動画像をもとに、その内容を把握することができるので、その内容に合わせて静止画像データを取得するタイミングを適宜設定すれば、動画像の内容に応じたサンプリングが可能となる。
【0113】
次に、本画像記録再生装置における動画像データの画像検索について説明する。
【0114】
上記のようにして取得した部分画像データは、その人物の行為など、そこには既にこれを抽出した静止画像データ、つまりその静止画像データを構成要素とする動画像のあるシーンを特徴付ける情報が含まれているので、部分画像データ自体を表示装置5に表示させることで、部分画像データ自体がシーン情報となる。
【0115】
また、その部分画像データから複数の人物情報が得られる場合も、その複数人の人物構成などが重要なシーン情報となる。つまり、これらの部分画像データは、そのままでもユーザにとってはシーン変化を検出するために得られる情報と相当のシーン情報を提供することになる。
【0116】
そこで、上述したように、本画像記録再生装置では、第1の記録媒体1に記録された動画像データの数あるシーンの中から、ある特定のシーン(画像)を検索したい場合、本動画像データより取得され、既に第2の記録媒体2に記録されている部分画像データ群を、画像検索のための情報として用いるようになっている。
【0117】
画像検索において、表示装置5には、部分画像データ群より部分画像データが、動画像データの時間軸に沿った順番等で表示される。このとき、部分画像データをサムネイル表示してもよい。また、全ての部分画像データを表示する必要はなく、その一部を時間的に間引いて表示することもできる。
【0118】
そして、このように部分画像データを表示している状態で、図示しない入力装置を介して、ユーザからの表示されている部分画像データに対する選択を受けつけ、選択された部分画像データをもとに、第1の記録媒体1に記録されている動画像データに対して、該部分画像データの抽出元となる静止画像データの検索を行い、選択された部分画像データの抽出元の静止画像データから(その前後を含む)、動画像データの再生を開始する。
【0119】
また、本画像記録再生装置では、第1の記録媒体1の動画像データを初めて本装置で再生する際に、人物情報とその周辺情報に人物を含む部分画像データを自動的に取得しておくようになっている。そしてまた、本画像記録再生装置では、第1の記録媒体1に記録された動画像データの2回目以降の再生が指示されたとき、動画像データの再生前に、取得した部分画像データの一部を、図1の枠20に示すように、表示装置5の画面にサムネイル表示するようになっている。
【0120】
部分画像データの表示は、動画像データの時間軸方向に、単純に取得した部分画像データ(静止画)を所定数(図1,6では8個)ずつ所定時間表示しても、部分画像データの中のいくつかだけを選択してから表示してもよい。さらに、その選択表示方法には、元の動画像全体の中の一定時間ごとに表示用部分画像を選択しておいて、その選択した部分画像データを表示するなどの方法がある。
【0121】
このような部分画像データは、既に、人物の動作、表情などに絞られているので、通常の静止画像全体のサムネイル表示よりも、ユーザにとってはより見やすくなる。そして、このような既に絞り込まれた部分画像データをもとにした検索は、通常の静止画像全体のサムネイル表示に秘して、情報確度が高く、かつ、よりきめ細かい画像検索(シーン検索)が可能になる。
【0122】
例えば、元の静止画像内で人物が記録された領域の占める割合が全体の中で小さい場合、静止画像像全体のサムネイル表示では、人物の特定さえ難しくなっていたが、本画像記録再生装置の場合は、人物画像がクローズアップされて表示されるので、人物情報をキーにした画像検索が可能となる。
【0123】
また、部分画像は人物情報が基本に管理されるので、例えば、身体パーツフレームに関する色情報を利用すれば、例えば動画像全体の中で特定の人物が着ている衣装をキーに、部分画像データ群よりその衣装を含む部分画像データのみを選択的に表示させるといったことも可能となり、より効果的なシーン検索が可能となる。
【0124】
また、別の例で、身体パーツフレームに関する形状情報を利用すれば、足の形状の情報を動きの情報と複合したり、腕の形状の情報を動きの情報と複合したりして、特定の人物の行動をキーに、シーンを検索することが可能である。また、フィールド情報を利用すれば、特定の人物が移動しているシーンを、それが歩いているか、走っているかを区別して検索することができる。
【0125】
〔実施の形態2〕
本発明の実施の他の形態について図6、図7に基づいて説明すれば、以下の通りである。なお、説明の便宜上、実施の形態1で用いた部材と同じ機能を有する部材には同じ符号を付して説明を省略する。
【0126】
本実施の形態の画像記録再生装置は、図6に示すように、独立して書込み読出しが可能なバッファメモリ群30を備えている点が、実施の形態1の画像記録再生装置(図1)と大きく異なる点である。実施の形態1の画像記録再生装置では、CPU6は、1つのバッファメモリ3を用いて、静止画像データ内で探索領域を移動しながら静止画像データ全体に対して探索を行っていたが、ここでは、複数のバッファメモリからなるバッファメモリ群30を用いて、静止画像データを予め複数の領域に分割し、各分割領域内で独自に人物の探索を行い、部分画像データの抽出を行うようになっている。つまり、探索領域の移動を行わない。
【0127】
図7のフローチャートを用いて、人物を含む部分画像データを抜き出す操作を説明する。
【0128】
図7では、静止画像データ内の人物を含む領域を部分画像データとして抜き出す際に、人物を探索する探索領域を予め分割しておいて探索を行い、部分画像データを取得するまでの流れを示す。
【0129】
第1のドライブ11で、第1の記録媒体1の動画再生中に開始信号が検出されれると、第1のドライブ11で再生される動画像データの一コマを取得するタイミング情報を発生させ、静止画像データの取得を開始する(S21)。
【0130】
この取得後に、静止画像データの分割数Nを決定する(S22)。例えば、画面上に多数の人物が存在するかという情報を、静止画像データの輪郭画像データのレベルで粗く探索して画像全体の人物数の状態を分析し、分析結果をもとに分割数を決定する。判定には、図7には示していないが、メモリ4に格納してある簡易な画像分析プログラムをCPU6が起動して、自動判定作業をするという機能が含まれる。尚、分割数Nは最大、バッファメモリ群30を構成するバッファメモリ数となる。
【0131】
N個に分割された静止画像データは、分割と同時に、N個の独立して書込み及び読出し動作が可能な、バッファメモリ群30の1〜Nに、静止画像データをN分割したN個の画像データ群として、画像分割前の第1の記録媒体1でのアドレスデータと共に一括蓄積される(S23、S24)。
【0132】
次に、開始直後であるかを判断し(S25)、開始直後以外は、続けて画像データ転送要求のトリガが検出されたか否かを確認する(S26)。開始直後以外で、画像データ転送要求のトリガが検出されなければ、S21〜S26を繰り返して、分割された静止画像データ(以下、分割画像データと称する)のバッファメモリ群30への画像蓄積を続けていく。
【0133】
一方、開始直後である場合、及び、画像データ転送要求のトリガが検出された場合は、バッファメモリ群30に取り込んだ分割画像データを人物情報検出系に一括して送る(S27)。ここまでの処理は、分割画像データを蓄積する画像蓄積系の処理である。
【0134】
ここで、静止画像データはN個に分割され、1〜Nまでのバッファメモリに蓄積されているので、人物情報検出系はN個存在することとなる。N個の各人物情報検出系ではそれぞれ、転送された分割画像データに対し、まず、画像処理を行って、上述した輪郭画像を形成する(S28)。次に、人物を含む領域を探索する(S29)。但し、ここでは、探索領域の見直しを行うことなく探索する。
【0135】
そして、実施の形態1で説明したと同様の判定して、S30で人物が含まれると判断すると、その一致部分を含む一定の範囲を、人物を含む部分画像データとして切り出す(S32)。また、この際も、切り出した部分画像データが静止画像データのどこにあったかもわかるようにフィールド情報を併せて取得する(S31)。
【0136】
切り出された部分画像データとフィールド情報とは、当該部分画像データが含まれていた静止画像データの第1の記録媒体1上の位置を示すアドレス情報と対応付けて、第2のドライブ12を用いて第2の記録媒体2に記録される(S36)。
【0137】
但し、ここでは、N個の人物情報検出系が独立し、並行して処理を行っているので、S34及びS35の処理を経て、CPU6との間で通信しながら、第2のドライブ12への記録要求に関する許可を待って行われる。N個の人物情報検出系は、個々に図6には示さないが、一時記憶機能を有している。
【0138】
S30にて分割画像データには人物が含まれないと判断し探索抽出手段場合、及び、S36にて第2の記録媒体2への記録が完了すると、次の人物情報検出系のS35に進み。
【0139】
上述したように、この実施の形態では、探索領域を変えての再探索は行わない。たとえ、複数の人物が重なる人物情報が仮に取得されても、個別の人物情報については付加情報として別途記録する方法で補うことができる。
【0140】
最終の人物情報検出系で、第2の記録媒体2への分割画像データの記録が完了する、或いはS30にて人物が含まれていないと判断すると、N個の人物情報検出系の処理が終了する。
【0141】
N個の人物情報検出系の処理が終わった時点で、次の分割画像データを各人物情報検出系に送るための画像データ転送要求のトリガを発生させ(S37)、そのトリガデータを、分割画像データを蓄積しているN個のバッファメモリに送る。これにて、画像蓄積系より人物情報検出系へ、次の分割画像データが一括して転送処理がなされる(S27)。
【0142】
この探索の際においても、人物を含む領域を探索する人物情報検出系と、画像データを蓄積する画像蓄積系とは別の動きをしている。したがって、動画像データの再生が終了して後しばらくしてから、人物を含む領域を探索する処理が終了することになる。また、探索の終了に際しては、第1のドライブ11で再生される元の動画像データのエンド情報が転送されたことをもとに終了動作に入る(S38)。
【0143】
なお、上記したS21における、再生された動画像データを構成する静止画像データをサンプリングし、分割してバッファメモリ群30に蓄積していく時間間隔(サンプリングのタイミング)は、人物を含む領域の探索と記録に要する時間を考慮して設定するのが好ましく、また、ユーザがサンプリングのタイミングを自由に設定できるようにしてもよい。
【0144】
このように、本実施の形態の画像記録再生装置は、実施の形態1の画像記録再生装置と比べて、探索領域を移動させることもなく、また、探索領域を変化させることもない。したがって、繰り返し探索などの動作がない分、静止画像データが多数の人物が含まれるような動画像データの場合は、このような静止画像データを予めN個に分割して人物情報を検出する処理の方が、効率良い探索が可能になる。
【0145】
なお、本画像記録再生装置においても、第2の記録媒体2に部分画像データ群を用いた画像検索は実施の形態1の画像記録再生装置と同じであるので、説明は省略する。
【0146】
以上説明した、実施の形態1,2の画像記録再生装置は、コンピュータ読み取り可能な記録媒体にプログラムとして記録することも可能である。例えば、コンピュータを、静止画像データ取得手段、探索抽出手段、記録手段、開始指示手段、部分画像データ表示手段、検索手段として機能させるデータベース構築プログラム、画像検索プログラムが記録された記録媒体が考えられる。
【0147】
本発明の目的は、このような手段をコンピュータに実現させるソフトウエアであるデータベース構築プログラム、画像検索プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)を、コンピュータが読み取り得るように記録媒体に記録させ、該記録媒体を、画像記録再生装置に供給し、そのコンピュータが記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。この場合、記録媒体から読み出されたプログラムコード自体が上述した手順を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
【0148】
ここで、上記プログラムメディアとしての記録媒体は、本体と分離可能に構成される記録媒体であり、磁気テープやカセットテープ等のテープ系、フレキシブルディスクやハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD等の光ディスクのディスク系、ICカード(メモリカードを含む)/光カード等のカード系、あるいはマスクROM、EPROM、EEPROM、フラッシュROM等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。
【0149】
なお、本発明は、上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的手段に含まれる。
【0150】
【発明の効果】
本発明のデータベース構築装置は、以上のように、第1のドライブにて再生された第1の記録媒体の動画像データから静止画像データを取得する静止画像データ取得手段と、上記静止画像データ取得手段にて取得された静止画像データを蓄積していく蓄積手段と、該蓄積手段が蓄積した静止画像データに含まれる人物を探索し、人物が含まれている場合は人物を含む所定領域を部分画像データとして抽出する探索抽出手段と、該探索抽出手段にて部分画像データが抽出されると、抽出された部分画像データを抽出元である静止画像データの上記第1の記録媒体上のアドレス情報と対応付けて第2のドライブを用いて第2の記録媒体に記録させる記録手段とを有することを特徴としている。
【0151】
これによれば、第2の記録媒体には、人物を含む領域を抽出してなる部分画像データが記録されデータベース化される。このような部分画像データは、それ自身を表示させることで、部分画像データ自体がシーン情報となる。また、その部分画像データから複数の人物情報が得られる場合も、その複数人の人物構成などが重要なシーン情報となる。つまり、これらの部分画像データは、そのままでもユーザにとってはシーン変化を検出するために得られる情報と相当のシーン情報となる。
【0152】
しかも、このようなシーン情報は、人物を含む領域を切り出した部分画像データであるので、既存の技術にてユーザの手を煩わせることなく自動にて取得して、データベースを構築することができる。
【0153】
したがって、これにより、人物画像主体の動画像データに適した、シーン情報をユーザの手を煩わせることなく自動に取得可能な、シーン情報のデータベース構築装置を提供することができるという効果を奏する。
【0154】
そしてまた、このようなデータベース構築装置を画像記録再生装置に搭載させることで、局所的なシーン変化なども容易に判別でき、人物の動きに沿った画像検索等も可能な、人物を主体とした動画像データの内容編集等を容易に行うことのできる画像記録再生装置を提供することができるという効果を奏する。
【0155】
また、本発明のデータベース構築装置においては、さらに、上記探索抽出手段は、部分画像データを抽出する際に、当該部分画像データ内に含まれる人物の数を表す数情報を含む付加情報を併せて取得し、上記記録手段は、部分画像データと共に対応する付加情報を、部分画像データに連なるツリー構造で関係付け得るように上記第2の記録媒体に記録することを特徴とすることもできる。
【0156】
これによれば、部分画像データ内に含まれる人物の数を表す数情報を含む付加情報が取得され、部分画像データと共に対応する付加情報が、部分画像データに連なるツリー構造で関係付け得るように第2の記録媒体に記録されるので、たとえ、人物を含む部分画像データの切り出しが、人物が二人重なっている画像として取得した場合でも、第2の記録媒体に記録されたデータ側では、二人の人物に分離して管理することができるという効果を併せて奏する。
【0157】
また、上記付加情報には、さらに、各人物の色的特徴を表す色情報、及び/又は、各人物の形状的特徴を表す形状情報を含めておくこともできる。
【0158】
色情報を利用すれば、例えば動画像全体の中で特定の人物が着ている衣装をキーに、特定のシーンを検索することが可能となる。また、別の例で、形状情報を利用すれば、その形状変化を捉えて、特定の人物の行動をキーに、特定のシーンを検索することが可能である。
【0159】
したがって、人物を含み領域を抜き出した部分画像データをシーン情報とし、これをもとに動画像データの検索を行う場合、検索のキーとなる項目が増え、より効果な検索を行いえるデータベースを構築することができるという効果を併せて奏する。
【0160】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、静止画像データに含まれる全ての人物が何れかの部分画像データに含まれるように部分画像データの抽出を行うことが好ましい。
【0161】
これによれば、静止画像データに含まれる全人物が、独立して或いはほかの人物と共に、部分画像データとして取得されるので、シーン情報の内容としてより確度の高い情報となるという効果を併せて奏する。
【0162】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、人物を探索する際の探索領域を適宜変更しながら行うことを特徴とすることができる。
【0163】
これによれば、人物を探索する際の探索領域を適宜変更しながら行うので、探索時に、人物情報の静止画像データに占める割合が任意に変化する動画像データなどに対しても、探索領域を画面最大範囲から段階的に縮小していくなど、探索領域を常に適切に定めていくことができ、探索をより効率良く行うことができる。また、最初の探索で複数の人物を含む領域として探索した際にも、より情報確度を上げるため、探索領域を変えて再度探索を行うといったことも容易に行えるという効果を併せて奏する。
【0164】
また、本発明のデータベース構築装置においては、上記探索抽出手段は、静止画像データを予め複数の領域に分割し、分割した領域を探索領域として探索することを特徴とすることもできる。
【0165】
これによれば、静止画像データを予め複数の領域に分割してから分割した各領域を探索領域として探索するので、切り出した静止画像データに予め多数の人物が記録されていると予想される動画像データの場合、一回の探索で見つけて切り出すところの人物が含まれる領域に存在する人物数を適宜少なくでき、個別人物情報の数を少なくできる。また、分割した各領域にて独立して探索処理を行うようにすれば、静止画像データからの人物の抽出をより短時間で行うことができるという効果を併せて奏する。
【0166】
また、このよう予め静止画像データを分割する場合、静止画像データに含まれる人物の数の状態を判定し、判定に基づいて静止画像データの分割数を決定する分割数決定手段を備え、上記探索抽出手段は、該分割数決定手段にて決定された分割数にて画像データを分割する構成とすることがより好ましい。
【0167】
これにより、静止画像データの分割が、静止画像データに含まれる人物の数の状態に応じて行われるので、静止画像データの分割数が静止画像データに含まれる人物の数の状態にあったものとなり、分割数が固定されている構成よりも、個別人物情報の数をより的確にできるという効果を併せて奏する。
【0168】
また、本発明のデータベース構築装置では、上記第1のドライブにおける上記第1の記録媒体の動画像データの再生が初めてか否かを判定し、初めてである場合は、上記静止画像データ取得手段による静止画像データの取得を開始させる開始指示手段を備えている構成とすることもできる。
【0169】
これによれば、第1のドライブにおける上記第1の記録媒体の動画像データの再生が初めてである場合、開始指示手段にて、静止画像データ取得手段による静止画像データの取得が開始されるので、ユーザは第1のドライブで第1の記録媒体を再生させるだけで特別な指示を行うことなく、シーン情報のデータベースを取得することができるという効果を併せて奏する。
【0170】
本発明の画像記録再生装置は、上記課題を解決するために、第1の記録媒体に記録されている情報を再生する第1のドライブと、第2の記録媒体に情報を記録・再生する第2のドライブとを備えた画像記録再生装置において、上記請求項1〜9に記載のデータベース構築装置を備えたことを特徴としている。
【0171】
既にデータベース構築装置として説明したように、本発明のデータベース構築装置は、人物画像主体の動画像データに適した、シーン情報をユーザの手を煩わせることなく自動に取得し得るシーン情報のデータベース構築装置である。
【0172】
したがって、このようなデータベース構築装置を搭載してなる本発明の画像記録再生装置は、局所的なシーン変化なども容易に判別でき、人物の動きに沿った画像検索等も可能な、人物を主体とした動画像データの内容編集等を容易に行うことのが可能な優れた画像記録再生装置となるという効果を奏する。
【0173】
本発明の画像検索方法は、本発明の画像記録再生装置の画像検索方法であって、上記第2の記録媒体に記録されている部分画像データをシーン情報として用いて、上記第1の記録媒体に記録されている動画像データにおける任意のシーンの検索を行うことを特徴としている。
【0174】
上述したように、第2の記録媒体に記録される部分画像データには、その人物の行為など、そこには既にこれを抽出した静止画像データ、つまりその静止画像データを構成要素とする動画像のあるシーンを特徴付ける情報が含まれているので、部分画像データを表示させることで、部分画像データ自体がシーン情報となる。また、その部分画像データから複数の人物情報が得られる場合も、その複数人の人物構成などが重要なシーン情報となる。つまり、これらの部分画像データは、そのままでもユーザにとってはシーン変化を検出するために得られる情報と相当のシーン情報となる。
【0175】
したがって、画像に含まれる人物の動作まで含めた細かいレベルでのシーン情報を用いて検索するので、人物が中心の動画データ再生時の検索においてなど、より効率の良い画像検索が可能になるという効果を併せて奏する。
【0176】
また、本発明の画像検索装置は、上記画像記録再生装置に備えられる画像検索装置であって、上記第2ドライブを用いて上記第2の記録媒体に記録されている部分画像データ群を再生し、表示手段に表示させる部分画像データ表示手段と、ユーザからの表示されている部分画像データに対する選択を受けつける入力手段と、上記入力手段にて選択された部分画像データをもとに、第1の記録媒体に記録されている動画像データに対して、該部分画像データの抽出元となる静止画像データの検索を行う検索手段とからなることを特徴としている。
【0177】
これによれば、部分画像データ再生表示手段が、像上記第2ドライブを用いて上記第2の記録媒体に記録されている部分画像データ群を再生し、表示手段に表示させる。ユーザが表示されている部分画像データの1つを入力手段を用いて選択すると、検索手段が、上記入力手段にて選択された部分画像データの抽出元となる静止画像データを動画像データより検索する。
【0178】
したがって、第2の記録媒体に記録されている人物の動作、表情などを直接に見て必要な画像データの検索(シーン検索)を行うことができるので、例えば動画像検索を、静止画像全体を表示して行う場合よりもきめ細かい検索が可能になる。例えば、元の静止画像内で人物が記録された領域の占める割合が全体の中で小さい場合にも、人物情報をキーにした画像検索ができる。つまり、画面内を絞って表示するので、ユーザにとってはより見やすく、かつ情報確度の高い検索が可能になるという効果を奏する。
【0179】
本発明の画像検索装置では、さらに、部分画像データ再生表示手段は、上記第1の記録媒体に記録されている動画像データの再生が指示された場合、動画像データの再生前に部分画像データの一部を表示することを特徴とすることもできる。
【0180】
これによれば、第1の記録媒体の動画像データの部分画像データ群が第2の記録媒体にある場合は、動画像データの再生を前にして部分画像データの一部が自動的に再生されるので、例えばユーザはその部分画像データをみて、見たいシーンのみ選択的に再生させるといった使い方が可能となるという効果を併せて奏する。
【0181】
また、本発明のデータベース構築プログラム及び記録媒体は、上記した本発明のデータベース構築装置における各手段としてコンピュータを機能させるプログラム及びそれを記録した記録媒体である。
【0182】
また、本発明の画像検索プログラム及び記録媒体は、上記した本発明の画像検索装置における各手段としてコンピュータを機能させるプログラム及びそれを記録した記録媒体である。
【0183】
これにより、上記したデータベース構築プログラム、或いは画像検索プログラムをコンピュータによって実行させれば、特定のデータベース構築装置、画像検索装置、画像記録再生装置ではなく、不特定の画像記録再生装置に対しても本発明のデータベース構築装置、画像検索装置、画像記録再生装置を実現させることが可能となるという効果を併せて奏する。
【図面の簡単な説明】
【図1】本発明の実施の一形態の画像記録再生装置の構成を示すブロック図である。
【図2】図2(a)(b)は、上記画像記録再生装置におけるシーン情報の取得例を示す説明図である。
【図3】上記画像記録再生装置における人物情報検索における情報付加構造を示す説明図である。
【図4】上記画像記録再生装置における人物探索の際の探索領域の変更方法を示す説明図である。
【図5】上記画像記録再生装置における人物情報自動取得の手順を示すフローチャートである。
【図6】本発明の実施の他の形態の画像記録再生装置の構成を示すブロック図である。
【図7】上記画像記録再生装置における人物情報自動取得の手順を示すフローチャートである。
【図8】従来公報に開示された発明のシーン情報入力システムを示す図である。
【図9】上記従公報に開示された発明のシーン情報入力の手順を示す流れ図である。
【符号の説明】
1 第1の記録媒体
2 第2の記録媒体
3 バッファメモリ(蓄積手段)
4 メモリ(静止画像データ取得手段、探索抽出手段、記録手段、開始指示手段、部分画像データ表示手段、検索手段)
5 表示手段
6 CPU(静止画像データ取得手段、探索抽出手段、記録手段、開始指示手段、部分画像データ表示手段、検索手段)
11 第1のドライブ
12 第2のドライブ
30 バッファメモリ群(蓄積手段)
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a technique for easily searching for a specific scene from moving image data recorded on a recording medium, a database construction device, a database construction program, an image retrieval device, an image retrieval program, and an image recording / reproduction. Relates to the device.
[0002]
[Prior art]
First, terms used in this specification will be defined. A moving image is composed of a sequence of still images, and an arbitrary sequence of still images constituting a part of the entire moving image is a scene. The scene information is information that is distinguished from the image data itself of the still images that constitute the scene, is given to each scene, and can identify the scene. If the image data of the moving image is moving image data, the image data of the still image is still image data, and it is not necessary to distinguish between the moving image data and the still image data, they are simply referred to as image data.
[0003]
Nowadays, it is possible to easily record a moving image on a recording medium, and it is desired to develop a technique that can efficiently edit the recorded moving image. However, it is redundant to find a scene that includes a specific object or event included in the moving image while the user is watching the screen while playing the moving image, and finds the target scene in a short time. It is difficult.
[0004]
Therefore, conventionally, information relating to a scene (hereinafter referred to as scene information) is given to each scene constituting a moving image, this is stored in a database, and moving image data is searched using the scene information. ing.
[0005]
As scene information, for example, Patent Document 1 discloses a position in a moving image (for example, start / end frame number, time code), meaning of a scene (for example, keyword, attribute, representative frame), and a relationship between scenes (for example, Information such as the identifier of the parent or child scene), information on the scene change (for example, the position of the change point in the moving image, the type of change, the probability).
[0006]
FIG. 8 shows a configuration diagram of a scene information input system described in the document. In this case, the scene information editor 112 takes out still image data representing a plurality of scenes from the representative frame file 122, and displays the still images along with the time axis in the time order along the time axis. To display. When an instruction from the user is received through the input device 115, moving image data is taken out from the LD 116 and displayed on the TV monitor 118 for a period corresponding to a part of the designated time axis.
[0007]
Also, the scene information editor 112 takes out scene information, which is information given to those scenes, from the scene information file 121 and displays it graphically on the screen of the display 114 at the same time. When the user inputs an editing command through the input device 115, the editing command is executed and the scene information file 121 is edited.
[0008]
FIG. 9 shows a procedure for constructing the scene information described in the document. This involves dividing a moving image composed of temporally continuous frame sequences into scenes that are partial frame sequences, confirming and correcting the division into scenes, inputting scene information, and inputting the input information. The flow of processing until registration in a moving image database is shown.
[0009]
Step a) for detecting a scene change point, step b) for generating scene information based on the detected scene change point and storing it in a scene information file, step c) for displaying the scene information graphically on a display, and input Step d) for editing the scene information file by executing an editing command instructed by the user using the means, and step e) for registering the scene information of the scene information file in the database means.
[0010]
[Patent Document 1]
JP-A-5-334374 (December 17, 1993)
[0011]
[Problems to be solved by the invention]
In searching for moving images, the creation of a database of scene information is a significant core technology, but the technology described in the above-mentioned literature is to construct a database by the user himself / herself entering scene information. It must be said that this is a difficult task for the user.
[0012]
Therefore, a system capable of automatically inputting scene information is required, but it is very difficult to automatically input complete scene information. This is because the contents of the scene information are very diverse, such as a person, the names of all the objects existing there, the location of each component, and the brightness of each component, all of which are input targets.
[0013]
The technique of the above document is an invention that helps to construct a database of scene information, but it is the same as the prior art of that document in that it needs to handle all information related to the contents of image data as scene information. And automation is difficult.
[0014]
Further, in the technique of the above-described literature, scenes are divided by capturing scene changes. However, it is difficult to judge changes in video with small changes, and even when changes occur locally (part of the screen), including the search for the location of the change, it is very difficult to judge changes. Required.
[0015]
For this reason, the database (moving image database) constructed by the above-described document system cannot be an effective database for any kind of image while the content of the scene information is precise. .
[0016]
For example, when there is a request to extract a still image from a moving image like a snapshot in a moving image mainly of a person, a plurality of scenes whose scene changes are local or small are used for scene information retrieval. Depending on the selection of keywords to be used, it will be searched at the same time.
[0017]
The present invention has been made in view of the above problems, and further subdivides still image data constituting moving image data, and acquires scene information as a person included in a still image or a combination of a person and its additional information. For moving image data mainly composed of person images, scene information can be automatically acquired as image information including a person without bothering the user, thereby facilitating the creation of a database of scene information and local PROBLEM TO BE SOLVED: To provide a database construction device, a database construction program, an image retrieval device, an image retrieval program, and an image recording / reproducing device that can easily discriminate a scene change etc. It is an object.
[0018]
[Means for Solving the Problems]
In order to solve the above problems, the database construction apparatus of the present invention includes still image data acquisition means for acquiring still image data from moving image data of a first recording medium reproduced by a first drive, and the still image data A storage unit for storing still image data acquired by the image data acquisition unit, and a person included in the still image data stored by the storage unit are searched. Search extraction means for extracting a region as partial image data; and when the partial image data is extracted by the search extraction means, the extracted partial image data is stored on the first recording medium of still image data from which the extraction is performed. And recording means for recording on a second recording medium using a second drive in association with the address information.
[0019]
According to this, the still image data acquisition means acquires still image data from the moving image data of the first recording medium reproduced by the first drive. The acquired still image data is accumulated in the accumulating unit, and the search and extracting unit searches for a person included in the still image data accumulated by the accumulating unit, and includes a person when the person is included. A predetermined area is extracted as partial image data. The partial image data extracted by the search extraction means is associated with the second partial image data associated with the address information on the first recording medium of the still image data that is the extraction source by the recording means. Recording is performed on the second recording medium using the drive.
[0020]
The partial image data recorded on the second recording medium is characterized by the action of the person, such as still image data that has already been extracted, that is, a scene with a moving image having the still image data as a component. Since information is included, the partial image data itself becomes scene information by displaying the partial image data. In addition, when a plurality of pieces of person information are obtained from the partial image data, the person configuration of the plurality of persons is important scene information. That is, even if these partial image data are used as they are, they become information obtained for detecting a scene change and corresponding scene information.
[0021]
Since such scene information is partial image data obtained by cutting out an area including a person, the database can be constructed by automatically acquiring the existing technology without bothering the user. .
[0022]
Accordingly, it is possible to provide a scene information database construction device that can automatically acquire scene information suitable for moving image data mainly composed of human images without bothering the user.
[0023]
By installing such a database construction device in an image recording / playback device, it is possible to easily identify local scene changes and the like, and it is possible to search for images according to the movement of a person, etc. It is possible to provide an image recording / reproducing apparatus capable of easily editing the contents of image data.
[0024]
Further, in the database construction device of the present invention, the search and extraction means further extracts additional information including number information representing the number of persons included in the partial image data when extracting the partial image data. Acquiring and recording, the recording means records the additional information corresponding to the partial image data on the second recording medium so as to be related in a tree structure connected to the partial image data.
[0025]
According to this, the additional information including the number information indicating the number of persons included in the partial image data is acquired, and the corresponding additional information together with the partial image data can be related in a tree structure connected to the partial image data. Since it is recorded on the second recording medium, even if the partial image data including the person is obtained as an image in which two persons overlap, on the data side recorded on the second recording medium, It can be managed separately in two persons.
[0026]
The additional information may further include color information representing the color characteristics of each person and / or shape information representing the shape characteristics of each person.
[0027]
If the color information is used, for example, it is possible to search for a specific scene using a costume worn by a specific person as a key in the entire moving image. In another example, if shape information is used, it is possible to search for a specific scene by capturing the change in shape and using the action of a specific person as a key.
[0028]
Therefore, when searching for moving image data based on the partial image data extracted from the region including people as the scene information, the number of search key items increases and a database that can perform more effective search is constructed. can do.
[0029]
In the database construction device of the present invention, it is preferable that the search and extraction means extract partial image data so that all persons included in still image data are included in any partial image data.
[0030]
According to this, since all the persons included in the still image data are acquired as partial image data independently or together with other persons, the information of the scene information is more accurate.
[0031]
Further, in the database construction device of the present invention, the search extraction means can be characterized in that it is performed while appropriately changing the search area when searching for a person.
[0032]
According to this, since the search area at the time of searching for a person is changed as appropriate, the search area can be set even for moving image data or the like in which the ratio of the person information to the still image data changes arbitrarily during the search. The search area can always be appropriately determined by reducing the maximum range of the screen step by step, and the search can be performed more efficiently. In addition, when searching for an area including a plurality of persons in the initial search, it is possible to easily perform a search again by changing the search area in order to further improve information accuracy.
[0033]
In the database construction device of the present invention, the search and extraction means may divide still image data into a plurality of areas in advance, and search the divided areas as search areas.
[0034]
According to this, since still image data is divided into a plurality of regions in advance and each divided region is searched as a search region, a moving image that is expected to have a large number of people recorded in the cut out still image data in advance. In the case of image data, it is possible to appropriately reduce the number of persons existing in an area including a person to be found and extracted by a single search, and to reduce the number of individual person information. Further, if the search process is performed independently in each divided area, it is possible to extract a person from still image data in a shorter time.
[0035]
In addition, when dividing still image data in advance, the above search is provided with a division number determining means for determining the state of the number of persons included in the still image data and determining the number of divisions of the still image data based on the determination. More preferably, the extracting means divides the image data by the division number determined by the division number determining means.
[0036]
Thereby, since the division of the still image data is performed according to the number of persons included in the still image data, the number of divisions of the still image data was in the state of the number of persons included in the still image data. Thus, the number of pieces of individual person information can be made more accurate than the configuration in which the number of divisions is fixed.
[0037]
In the database construction device of the present invention, it is determined whether or not the moving image data of the first recording medium is reproduced for the first time in the first drive. It can also be configured to include a start instruction means for starting acquisition of still image data.
[0038]
According to this, when the reproduction of the moving image data of the first recording medium in the first drive is the first time, the acquisition of the still image data by the still image data acquisition unit is started by the start instruction unit. The user can acquire a database of scene information by only reproducing the first recording medium with the first drive without giving a special instruction.
[0039]
In order to solve the above problems, an image recording / reproducing apparatus of the present invention includes a first drive for reproducing information recorded on a first recording medium, and a first drive for recording / reproducing information on a second recording medium. An image recording / reproducing apparatus including two drives includes the database construction apparatus according to any one of the first to ninth aspects.
[0040]
As already described as a database construction apparatus, the database construction apparatus of the present invention is a database construction of scene information suitable for moving image data mainly of human images and capable of automatically obtaining scene information without bothering the user. Device.
[0041]
Therefore, the image recording / reproducing apparatus of the present invention equipped with such a database construction apparatus is capable of easily discriminating local scene changes and the like, and can search for images according to the movement of the person. Thus, an excellent image recording / reproducing apparatus capable of easily editing the contents of the moving image data is provided.
[0042]
The image search method of the present invention is the image search method of the image recording / reproducing apparatus of the present invention, wherein the partial image data recorded on the second recording medium is used as scene information, and the first recording medium is used. An arbitrary scene is searched in the moving image data recorded in the video.
[0043]
As described above, the partial image data recorded on the second recording medium includes, for example, the action of the person, still image data that has already been extracted, that is, a moving image having the still image data as a component. Therefore, by displaying partial image data, the partial image data itself becomes scene information. In addition, when a plurality of pieces of person information are obtained from the partial image data, the person configuration of the plurality of persons is important scene information. That is, even if these partial image data are used as they are, they become information obtained for detecting a scene change and corresponding scene information.
[0044]
Therefore, since the search is performed using scene information at a fine level including the motion of the person included in the image, a more efficient image search can be performed, for example, in a search when reproducing moving image data centered on a person.
[0045]
The image search apparatus of the present invention is an image search apparatus provided in the image recording / reproducing apparatus, and reproduces a partial image data group recorded on the second recording medium using the second drive. Partial image data display means to be displayed on the display means;
An input unit that accepts selection of the displayed partial image data from the user, and a moving image data recorded on the first recording medium based on the partial image data selected by the input unit And retrieval means for retrieving still image data from which the partial image data is extracted.
[0046]
According to this, the partial image data reproduction display means reproduces the partial image data group recorded on the second recording medium using the image second drive, and causes the display means to display it. When the user selects one of the displayed partial image data using the input means, the search means searches the moving image data for still image data from which the partial image data selected by the input means is extracted. To do.
[0047]
Accordingly, it is possible to search for necessary image data (scene search) by directly looking at the movement, facial expression, etc. of the person recorded on the second recording medium. Finer search is possible than when displayed. For example, even when the ratio of the area where the person is recorded in the original still image is small in the whole, the image search using the person information as a key can be performed. In other words, since the screen is narrowed and displayed, a search that is easier for the user to see and has high information accuracy becomes possible.
[0048]
In the image search device according to the present invention, the partial image data reproduction / display means may further execute partial image data before reproduction of the moving image data when the reproduction of the moving image data recorded on the first recording medium is instructed. It is also possible to display a part of the screen.
[0049]
According to this, when the partial image data group of the moving image data on the first recording medium is on the second recording medium, a part of the partial image data is automatically reproduced before the moving image data is reproduced. Therefore, for example, the user can use the partial image data by selectively reproducing only the desired scene.
[0050]
The database construction program and recording medium of the present invention are a program for causing a computer to function as each means in the above-described database construction apparatus of the present invention, and a recording medium recording the program.
[0051]
The image search program and recording medium of the present invention are a program for causing a computer to function as each means in the above-described image search apparatus of the present invention and a recording medium on which the program is recorded.
[0052]
Thus, if the above-described database construction program or image retrieval program is executed by a computer, it is not intended for a specific specific database construction device, image retrieval device, or image recording / reproduction device, but for an unspecified image recording / reproduction device. In addition, the database construction device, image search device, and image recording / playback device of the present invention can be realized.
[0053]
The present invention can also be expressed as follows. That is, the image recording / reproducing apparatus of the present invention reproduces data from the first drive capable of recording / reproducing the first recording medium, the second drive capable of recording / reproducing the second recording medium, and the first drive. Displays at least one of a buffer memory for temporarily storing the image data, a memory for storing a program for image processing, data reproduced by the first drive, and data reproduced by the second drive In a playback device capable of simultaneously recording and playing back at least one of the first recording medium and the second recording medium, the playback image data from the first recording medium is stored in at least one buffer memory. When an area including a person is searched from the stored image data stored in the buffer memory, and at least one area including a person can be searched. In addition, the region is extracted as at least one partial image data, the partial image data is combined with address information in the first recording medium of the original image data from which the partial image data is extracted, and the second recording medium It is characterized by recording.
[0054]
Further, here, for the partial image data obtained by searching an area including a person from the first recording medium, three pieces of information obtained at the time of searching, number information, color information, and shape information. It is preferable that a plurality of pieces of information relating to image data of the first recording medium including at least are recorded on the second recording medium so as to be related in a tree structure connected to the individual partial image data.
[0055]
Also, an operation for accumulating reproduced image data from the first recording medium in at least one buffer memory, an area including a person is searched from the image data stored in the buffer memory, and an area including a person is included. When at least one or more of them can be searched, the area is extracted as at least one partial image data, and the partial image data is address information in the first recording medium of the original image data from which the partial image data is extracted. The image recording / reproducing apparatus is capable of independently executing the operation of recording on the second recording medium, and sequentially searches the area including the person by changing the search area in the image data. It can also be characterized by performing.
[0056]
Also, an operation for accumulating reproduced image data from the first recording medium in at least one buffer memory, an area including a person is searched from the image data stored in the buffer memory, and an area including a person is included. When at least one or more of them can be searched, the area is extracted as at least one partial image data, and the partial image data is address information in the first recording medium of the original image data from which the partial image data is extracted. The image recording / reproducing apparatus according to claim 1, wherein the image recording / reproducing apparatus is capable of independently executing an operation of recording on the second recording medium, and a plurality of searches for image data reproduced from the first recording medium in advance. It is also possible to search for an area including a person after dividing the area.
[0057]
The image search system in the image recording / playback apparatus of the present invention is characterized in that partial image data including a person recorded on the second recording medium is used as scene information of the image data on the first recording medium. .
[0058]
Further, the image search system in the image recording / reproducing apparatus of the present invention reproduces the image data of the first recording medium, thereby reconstructing a part of the partial image data group automatically recorded on the second recording medium. The second recording medium is also reproduced and displayed before the second reproduction of the first recording medium, and the partial image data is selected, whereby the partial image data is recorded on the first recording medium. It is a search key.
[0059]
DETAILED DESCRIPTION OF THE INVENTION
[Embodiment 1]
One embodiment of the present invention will be described with reference to FIGS. 1 to 5 as follows.
[0060]
FIG. 1 is a configuration diagram of an image recording / playback apparatus according to the present embodiment, which includes a database construction apparatus and an image search apparatus according to the present invention.
[0061]
The image recording / reproducing apparatus includes at least first and second drives 11 and 12, a buffer memory 3, a display device 5, a CPU 6, and a memory 4.
[0062]
The first drive 11 is a device capable of recording / reproducing the first recording medium 1, and the second drive 12 is a device capable of recording / reproducing the second recording medium 2.
[0063]
The buffer memory (storage means) 3 temporarily stores still image data acquired at a predetermined timing from moving image data (consisting of a sequence of still image data) reproduced from the first drive 11. is there. The sampled still image data is further subdivided as described below and transferred to the second drive 12 as necessary.
[0064]
The display device (display unit) 5 displays the image data reproduced by the first drive 11 and the image data reproduced by the second drive 12. The reproduced image data is displayed independently, and the display device 5 displays either one of the image data reproduced by the first and second drives 11 and 12.
[0065]
The memory 4 is composed of a hard disk or the like, and stores various application programs including a program for image processing.
[0066]
The CPU 6 includes a RAM (not shown) as a work area, and is a control center that controls various operations of the first and second drives 11 and 12, the buffer memory 3, and the display device 5. Further, the application program is read from the memory 4 and executed, and the database construction apparatus and the image search apparatus according to the present invention are also embodied. That is, the CPU 6 and the memory 4 have functions such as still image data acquisition means, search extraction means, recording means, start instruction means, partial image data display means, and search means.
[0067]
Further, the first drive 11 and the second drive 12 described above can simultaneously perform at least one of recording and reproduction with respect to the recording medium 1 or the second recording medium 2 which is a corresponding recording medium. Yes.
[0068]
The first and second recording media are not particularly limited, but in the present embodiment, as an example, the first recording medium 1 is a DVR disc (large-capacity phase change optical disc), the second The recording medium 2 uses a DVD-RW.
[0069]
In the image recording / reproducing apparatus, when the first drive 11 reproduces the moving image data of the first recording medium 1, the still image data which is a component of the moving image data is sampled at a predetermined timing. The partial image data, which is a part of still image data, is extracted and recorded on the second recording medium 2 by the second drive 12.
[0070]
Further, in this image recording / reproducing apparatus, for example, for the purpose of editing the contents of the moving image data recorded on the first recording medium 1, it is necessary to search for a specific scene or image included in the moving image data. When it occurs, the partial image data group recorded on the second recording medium 2 is used as information for image retrieval.
[0071]
Information used to search a scene of moving image data is referred to as scene information. In the present invention, partial image data that is a part of still image data constituting moving image data is used as scene information. More specifically, the partial image data composed of a person in the still image data and surrounding images is used as scene information.
[0072]
In the above-described conventional configuration, the scene information is configured from information such as the position in the moving image, the meaning of the scene, the relationship between the scenes, and information on the scene change. For this reason, it is difficult to automatically obtain scene information as complete information. However, if the scene information is composed of a person in the still image data constituting the moving image data and the surrounding image, it can be automatically acquired by the existing technology.
[0073]
Further, by narrowing down the scene information to the person and the surrounding image, the search information in the moving image data mainly of the person can be made more specific including the action of the person.
[0074]
That is, in FIG. 2 (a) and FIG. 2 (b), the person information is extracted together with the surrounding image to some extent. When extracting the person information, not only the person information itself is extracted, but the person is extracted together with surrounding images around to some extent as indicated by a broken line.
[0075]
Further, in order to obtain more accurate information as the contents of the scene information, it is desirable that the partial image data is plural so that all the persons included in the still image data are included in any partial image data. That is, it is desirable that the entire partial image data acquired from the still image data covers all persons appearing in the still image data.
[0076]
Therefore, as shown in FIG. 2A, when there are no overlapping persons in the image, it is relatively easy to acquire partial image data. For example, starting from a large search area, one person enters the search area, and the person search increases. On the other hand, as shown in FIG. 2B, when there are overlapping persons in the image, the shape and size of the search area are changed. For example, when the search area is large, partial image data of two overlapping persons Is extracted and acquired as information on both of the two people who overlap. Further, when the search area is small, it can be extracted and acquired as partial image data including one person.
[0077]
The determination as to whether or not the image is a person among the plurality of images included in the still image data can be performed by capturing the person information as a combination of basic frames as follows, for example.
[0078]
Here, the basic frame is composed of a face frame and a body part frame (hand, torso, legs, etc.). As for the face frame, by applying the fact that the shape of the face changes depending on the observation direction, a plurality of patterns of face frames are stored in the memory 4 as determination reference information corresponding to the change of the shape. The number of face frame patterns to be prepared as judgment reference information, that is, the number N varies depending on the system conditions, but the number of face frames can be determined by setting the angle resolution in the desired observation direction (Δφ, Δθ: Δ When φ is tilted and Δθ is rotation, N = (180 / Δφ) × (360 / Δθ). The information format of the face frame is obtained by replacing the constituent elements (eyes, nose, mouth, etc.) with a plurality of line information.
[0079]
In determining whether or not a person is present, first, image processing is performed to form a contour image of still image data (an image obtained by processing an image into a plurality of pieces of line information, which is formed by existing technology). Then, the arrangement of each component of the face frame is made between any one of several contour groups included in the contour image and the contour model for forming the N face frames as the determination criteria. Do by comparing. Check if there are close contours in the N face frames. This is the first stage determination as to whether or not the person is a person.
[0080]
Next, in response to the determination result of the first stage, a final determination is made based on whether there is a body part frame in the vicinity of the face frame. The body part frame for judgment includes an arm frame and a torso frame. For example, when a plurality of arm frames are used for determination, it is determined whether the contour model of the arm frame is within a predetermined distance range from the face frame, and if this distance condition is satisfied, the face frame There is a determination method in which the image information obtained in this determination is determined as a person. Whether or not a person is a person can be determined by such a two-stage determination method.
[0081]
As for such a person determination method, for example, “Extraction of a human head and a part with a change in facial expression from a moving image using Labeled Graph Matching”, IEICE Transactions Vol.J85-D-II No. .11 pp.1656-1663 It is described in November 2002.
[0082]
In addition, when extracting these partial image data as image data information including a person, it is preferable to acquire information including at least the number information as additional information regarding the partial image data. The number information is information indicating the number of persons included in the partial image data. More preferably, the additional information includes one or both (more preferable) of color information that characterizes the color of each person or shape information that characterizes the shape of each person.
[0083]
By acquiring the additional information together with the partial image data in this way, even if there are overlapping persons in the image and the extracted partial image data includes a plurality of persons, the obtained partial image data A plurality of pieces of personal information included in the partial image data can be acquired by simultaneously acquiring additional data (additional information) whose information is managed in a tree structure as shown in FIG. It can be used as information.
[0084]
More specifically, color information and shape information are obtained by capturing partial image data, and in the captured image, for each person, which face frame group or body frame frame, such as a face frame or body part frame described later, This information is used to further characterize the pattern after it is determined. For example, color information is information that expresses the overall color tone of a frame (such as a face frame or body part frame) that has been captured and adapted for judgment, and shape information is exactly what the frame adapted for judgment is. It is information that shows its shape.
[0085]
Further, movement information may be included in the additional information. Motion information refers to a frame (face frame, body part frame, etc.) adapted for judgment being transferred to another frame in a different frame group from the frame group in the next still image data capture operation. It is information indicating that it has become compatible. Furthermore, by processing the constituent elements (eyes, nose, mouth, etc.) in the face frame into another frame group, processing corresponding to facial expression changes and the like can be performed.
[0086]
In an image in which a plurality of persons are overlapped, there are a plurality of face frames and body part frames for determining whether or not a person is in an incomplete shape and close to each other. Since the face frame and body part frame, each color information, and shape information are unique to a person, the information of each of a plurality of persons can be obtained from the color and shape information of each frame. Further, as information amount for characterizing the partial image data, information on the partial image can be managed as information amount of <number information> × <number of person determination frames> × <shape information + color information>. Easy to characterize image information. In addition, by managing with a tree structure, the search can be easily performed.
[0087]
Such color information and shape information is obtained by using a contour model dedicated temporary storage device (not shown) as the information used to determine whether the person is a person or the face frame or body frame. Information such as color and shape in the original image in the part corresponding to the position of the contour model, with reference to the image data captured for the determination of whether or not the person is the basis of the contour model Are acquired as information by a temporary storage device (not shown) dedicated to color information and a temporary storage device (not shown) dedicated to shape information.
[0088]
In addition, since the number information is information on how many pieces of person information determined to be persons in the extracted partial image data, a temporary storage device (not shown) dedicated to the number information also has the same part. It can be acquired by counting and storing how many times the contour model is acquired in the image data.
[0089]
Further, when searching for a region including a person from still image data, it is preferable to appropriately change the search region as a unit of search within a range not exceeding the maximum size of still image data. In other words, changing the search area means changing the shape (usually rectangular) and size of the search area. By appropriately switching the search area, the search area can have an appropriate shape that matches the person image, and highly accurate information about the person can be acquired in a short time.
[0090]
As a method of setting the search area, for example, there is a method using a face frame. If the size of the same person changes between the still image data acquired at the next timing and the still image data acquired at the previous timing, the change in the size of the face frame is detected and matched to the rate of change. To reduce the search area. In this case, if the change rate of the size of the face frame becomes 70%, the search area is also changed to 70%.
[0091]
In addition, when an area including a plurality of persons is searched, if there are five face frames, for example, the area is reset so that the number of the face frames is three. Individual person information included increases, and the accuracy increases.
[0092]
Thus, in the case where the search area is made smaller based on the face frame, a method of using the place where the face frame exists as the base point of the diagonal element of the search area is effective.
[0093]
Specifically, as shown in FIG. 4, the face frame sizes x1 × y1 and x2 × y2 and the distances X and Y between the face frames, and further provided as a margin for sufficiently securing the search portion, The search area size is {(m1 + 1) · x1 + X + (m2 + 1) · x2} × {(n1 + 1) by combining predetermined ranges (m1, m2, n1, and n2 are arbitrary numbers) based on the size of the original face frame. ) · Y1 + Y + (n2 + 1) · y2}.
[0094]
By acquiring scene information from partial image data that includes people as described above, there is no concept of determining changes in scenes considering various information and managing the changes in a hierarchical structure. Information that pays attention to what those persons do, etc. can be managed.
[0095]
Next, an operation of extracting partial image data including a person will be described using the flowchart of FIG.
[0096]
FIG. 5 shows a flow up to acquisition of partial image data in the case where a region including a person in still image data is extracted as partial image data while changing a search area for searching for a person as appropriate.
[0097]
When the first drive 11 detects a start signal during moving image reproduction on the first recording medium 1, timing information for acquiring one frame of moving image data reproduced by the first drive 11 is generated. Then, acquisition of still image data is started (S1).
[0098]
When timing information for acquiring moving image data is given, in synchronization with this, still image data, which is one frame of moving image data, is stored in the buffer memory 3 with its address data (address on the first recording medium 1). It accumulates with (S2, S3).
[0099]
Next, it is determined whether or not it is immediately after the start (S4), and it is subsequently confirmed whether or not a trigger for the image data transfer request is detected except for immediately after the start (S5). If an image data transfer request trigger is not detected except immediately after the start, S1 to S5 are repeated and image accumulation is continued.
[0100]
On the other hand, when it is immediately after the start and when the trigger for the image data transfer request is detected, the still image data captured in the buffer memory 3 is sent to the person information detection system (S7). The processing so far is processing of an image storage system that stores still image data.
[0101]
The person information detection system will be described below. First, image processing is performed on the transferred still image data to form the above-described contour image (S8). Next, an area including a person is searched while reviewing the search area (S9).
[0102]
In S9, with respect to the contour image obtained from the still image data, the search area is shifted in the horizontal direction by a predetermined pixel (determined according to the resolution of the contour image), and the line segment read in the search is defined as a vector. Detect direction and length information. Then, the search is advanced while obtaining the direction and length information. When the search scan in one horizontal direction is completed, the search scan is started again in the horizontal direction after shifting by a predetermined pixel in the vertical direction. This search is continued until the information that can be determined as a person is obtained for the entire contour image data, and the presence / absence information of the line segment and, if there is a line segment, the direction and length information thereof are the contour image information. Are stored in the temporary storage device.
[0103]
This search provides quantitative information about the line segments in the contour image, so the similarity between the contour model of each frame to determine whether it is a person, such as a face frame or body part frame, can be determined. When numerical comparison is made and it matches the contour model of each frame, it is determined that a person is included (S10).
[0104]
If it is determined that a person is included, a certain range including the matching portion is cut out as partial image data including the person (S12). At this time, the field information is also acquired so that the extracted partial image data can be seen in the still image data (S11). The field information is information indicating in which position in the still image the person image exists.
[0105]
The extracted partial image data and field information are associated with address information indicating the position on the first recording medium 1 of the still image data in which the partial image data was included, and the second drive 12 is used. Recording is performed on the second recording medium 2 (S13).
[0106]
Next, at the stage where the search for the entire contour image has not been completed, the search for the unsearched portion is continued, and the search for the person image is continued while the search area is reviewed (S14, S15). The processes in S12 to S15 are repeated until it is confirmed in S16 that there is no other person information.
[0107]
Further, it is more preferable to search within the range of the partial image data obtained once in a search area smaller than that. This makes it possible to obtain information such as facial expressions with high accuracy that can characterize the scene in a short time.
[0108]
On the other hand, if it is not determined in S10 that a person is included even if the entire still image data is searched, and if it is confirmed in S16 that there is no other person information, the process of the person information detection system is completed. To do.
[0109]
When the processing of the person information detection system is completed, an image data transfer request trigger for sending the next still image data to the person information detection system is generated (S17), and the trigger data is converted into still image data. The data is sent to the accumulated buffer memory 3. Thus, the next still image data is transferred from the image storage system to the person information detection system (S7).
[0110]
At the time of this search, the person information detection system that searches for an area including a person and the image storage system that stores image data perform different movements. Therefore, after a while after the reproduction of the moving image data is finished, the process of searching for an area including a person is finished. At the end of the search, the end operation is started based on the transfer of the end information of the moving image data reproduced by the first drive 11 (S6).
[0111]
Note that the time interval (sampling timing) at which the still image data constituting the reproduced moving image data is sampled and stored in the buffer memory 3 in S1 described above is required for searching and recording the area including the person. It is preferable to set in consideration of time.
[0112]
Further, the user may be able to freely set the sampling timing. When the moving image data of the first recording medium 1 is reproduced and partial image data serving as scene information is acquired, the user grasps the content based on the moving image displayed on the display device 5. Therefore, if the timing for acquiring still image data is appropriately set according to the content, sampling according to the content of the moving image can be performed.
[0113]
Next, image retrieval of moving image data in the image recording / reproducing apparatus will be described.
[0114]
The partial image data acquired as described above includes, for example, the actions of the person, still image data that has already been extracted, that is, information that characterizes a scene with a moving image having the still image data as a component. Therefore, by displaying the partial image data itself on the display device 5, the partial image data itself becomes scene information.
[0115]
In addition, when a plurality of pieces of person information are obtained from the partial image data, the person configuration of the plurality of persons is important scene information. That is, even if these partial image data are used as they are, they provide information obtained for detecting a scene change and corresponding scene information.
[0116]
Therefore, as described above, in the present image recording / reproducing apparatus, when it is desired to search for a specific scene (image) from a number of scenes of moving image data recorded in the first recording medium 1, the main moving image A partial image data group acquired from the data and already recorded on the second recording medium 2 is used as information for image retrieval.
[0117]
In the image search, the display device 5 displays the partial image data from the partial image data group in the order along the time axis of the moving image data. At this time, the partial image data may be displayed as a thumbnail. Further, it is not necessary to display all the partial image data, and a part of the partial image data can be displayed by being thinned in time.
[0118]
And in the state where the partial image data is displayed in this way, the selection for the displayed partial image data is received from the user via an input device (not shown), and based on the selected partial image data, The moving image data recorded on the first recording medium 1 is searched for still image data from which the partial image data is extracted, and from the still image data from which the selected partial image data is extracted ( (Including before and after that), playback of moving image data is started.
[0119]
Further, in the present image recording / reproducing apparatus, when moving image data of the first recording medium 1 is reproduced for the first time by this apparatus, partial image data including a person in person information and its peripheral information is automatically acquired. It is like that. Further, in the present image recording / reproducing apparatus, when the second or subsequent reproduction of the moving image data recorded on the first recording medium 1 is instructed, one of the acquired partial image data is reproduced before the moving image data is reproduced. Are displayed as thumbnails on the screen of the display device 5 as shown by a frame 20 in FIG.
[0120]
Partial image data can be displayed even if partial image data (still images) obtained simply in the time axis direction of the moving image data is displayed for a predetermined number of times (eight in FIGS. 1 and 6) for a predetermined time. Only some of them may be selected and displayed. Further, as the selection display method, there is a method in which a partial image for display is selected at regular time intervals in the entire original moving image, and the selected partial image data is displayed.
[0121]
Since such partial image data has already been narrowed down to human actions, facial expressions, etc., it is easier for the user to view than a normal thumbnail display of the entire still image. Such a search based on already narrowed partial image data is hidden in the normal thumbnail display of the entire still image, and the information accuracy is high and finer image search (scene search) is possible. become.
[0122]
For example, if the ratio of the area in which the person is recorded in the original still image is small in the whole, it is difficult to specify the person in the thumbnail display of the entire still image. In this case, since the person image is displayed in close-up, an image search using person information as a key is possible.
[0123]
In addition, since partial information is basically managed in the partial image, for example, if color information about the body part frame is used, the partial image data is used, for example, with a costume worn by a specific person in the entire moving image as a key. It is also possible to selectively display only partial image data including the costume from the group, thereby enabling more effective scene search.
[0124]
In another example, if the shape information about the body part frame is used, the information on the shape of the foot is combined with the information on the movement, or the information on the shape of the arm is combined with the information on the movement. It is possible to search for a scene by using a person's action as a key. Further, by using field information, it is possible to search for a scene in which a specific person is moving by distinguishing whether it is walking or running.
[0125]
[Embodiment 2]
The following will describe another embodiment of the present invention with reference to FIGS. For convenience of explanation, members having the same functions as those used in the first embodiment are denoted by the same reference numerals and description thereof is omitted.
[0126]
As shown in FIG. 6, the image recording / reproducing apparatus of the present embodiment is provided with a buffer memory group 30 that can be written and read independently, as the image recording / reproducing apparatus of the first embodiment (FIG. 1). This is a very different point. In the image recording / reproducing apparatus of the first embodiment, the CPU 6 uses one buffer memory 3 to search the entire still image data while moving the search area in the still image data. Using the buffer memory group 30 composed of a plurality of buffer memories, still image data is divided into a plurality of areas in advance, a person is searched independently in each divided area, and partial image data is extracted. ing. That is, the search area is not moved.
[0127]
The operation of extracting partial image data including a person will be described using the flowchart of FIG.
[0128]
FIG. 7 shows a flow from when a region including a person in still image data is extracted as partial image data until a search region for searching for a person is divided in advance and a partial image data is acquired. .
[0129]
When the first drive 11 detects a start signal during moving image reproduction of the first recording medium 1, it generates timing information for acquiring one frame of moving image data reproduced by the first drive 11, Acquisition of still image data is started (S21).
[0130]
After this acquisition, the number N of still image data divisions is determined (S22). For example, information on whether there are a large number of people on the screen is roughly searched at the contour image data level of still image data, the state of the number of people in the entire image is analyzed, and the number of divisions is calculated based on the analysis result. decide. Although not shown in FIG. 7, the determination includes a function in which the CPU 6 starts a simple image analysis program stored in the memory 4 and performs automatic determination work. The division number N is the maximum number of buffer memories constituting the buffer memory group 30.
[0131]
The still image data divided into N pieces is divided into N pieces of N pieces of image data obtained by dividing the still image data into N pieces of 1 to N of the buffer memory group 30 capable of performing N pieces of independent writing and reading operations simultaneously with the division. As a data group, it is accumulated together with the address data in the first recording medium 1 before image division (S23, S24).
[0132]
Next, it is determined whether or not it is immediately after the start (S25), and it is confirmed whether or not an image data transfer request trigger has been detected except for immediately after the start (S26). If a trigger for an image data transfer request is not detected except immediately after the start, S21 to S26 are repeated, and image storage in the buffer memory group 30 of the divided still image data (hereinafter referred to as divided image data) is continued. To go.
[0133]
On the other hand, when it is immediately after the start and when the trigger for the image data transfer request is detected, the divided image data fetched into the buffer memory group 30 is sent to the person information detection system all at once (S27). The processing so far is the processing of the image storage system that stores the divided image data.
[0134]
Here, since the still image data is divided into N pieces and stored in the buffer memories 1 to N, there are N person information detection systems. In each of the N person information detection systems, first, image processing is performed on the transferred divided image data to form the above-described contour image (S28). Next, an area including a person is searched (S29). However, here, the search is performed without reviewing the search area.
[0135]
If it is determined in the same manner as described in the first embodiment and it is determined in S30 that a person is included, a certain range including the matching portion is cut out as partial image data including the person (S32). Also in this case, field information is also acquired so that the extracted partial image data can be seen where in the still image data (S31).
[0136]
The extracted partial image data and field information are associated with address information indicating the position on the first recording medium 1 of the still image data including the partial image data, and the second drive 12 is used. Is recorded on the second recording medium 2 (S36).
[0137]
However, since the N person information detection systems are independent and perform processing in parallel here, the processing to S2 and S35 is performed through the processing of S34 and S35, and the second drive 12 is connected to the second drive 12. This is done after permission for the recording request. Although not shown in FIG. 6 individually, the N person information detection systems have a temporary storage function.
[0138]
If it is determined in S30 that the divided image data does not include a person and search extraction means is used, and if recording on the second recording medium 2 is completed in S36, the process proceeds to S35 of the next person information detection system.
[0139]
As described above, in this embodiment, the re-search is not performed by changing the search area. For example, even if personal information obtained by overlapping a plurality of persons is acquired, individual personal information can be supplemented by a method of separately recording additional information.
[0140]
When the recording of the divided image data on the second recording medium 2 is completed in the final person information detection system, or when it is determined that no person is included in S30, the processing of the N person information detection systems ends. To do.
[0141]
When the processing of the N person information detection systems is completed, an image data transfer request trigger for sending the next divided image data to each person information detection system is generated (S37). Send data to N buffer memories that store data. Thus, the next divided image data is collectively transferred from the image storage system to the person information detection system (S27).
[0142]
Also in this search, the person information detection system that searches for an area including a person and the image storage system that stores image data perform different movements. Therefore, after a while after the reproduction of the moving image data is finished, the process of searching for an area including a person is finished. At the end of the search, the end operation is started based on the transfer of the end information of the original moving image data reproduced by the first drive 11 (S38).
[0143]
Note that the time interval (sampling timing) at which the still image data constituting the reproduced moving image data is sampled, divided and stored in the buffer memory group 30 in S21 described above is a search for an area including a person. It is preferable to set in consideration of the time required for recording, and the user may be able to freely set the sampling timing.
[0144]
As described above, the image recording / reproducing apparatus according to the present embodiment does not move the search area and does not change the search area as compared with the image recording / reproducing apparatus according to the first embodiment. Therefore, in the case of moving image data in which the still image data includes a large number of people because there is no operation such as repeated search, a process of detecting the person information by dividing such still image data into N pieces in advance. More efficient search is possible.
[0145]
In the present image recording / reproducing apparatus, the image search using the partial image data group for the second recording medium 2 is the same as that of the image recording / reproducing apparatus of the first embodiment, and the description thereof will be omitted.
[0146]
The image recording / reproducing apparatus according to the first and second embodiments described above can also be recorded as a program on a computer-readable recording medium. For example, a database construction program for causing a computer to function as still image data acquisition means, search extraction means, recording means, start instruction means, partial image data display means, search means, and a recording medium on which an image search program is recorded can be considered.
[0147]
An object of the present invention is to record a database construction program, which is software for realizing such means on a computer, and a program code (execution format program, intermediate code program, source program) of an image search program so that the computer can read it. This can also be achieved by recording on a medium, supplying the recording medium to an image recording / reproducing apparatus, and reading and executing the program code recorded on the recording medium by the computer. In this case, the program code itself read from the recording medium realizes the above-described procedure, and the recording medium recording the program code constitutes the present invention.
[0148]
Here, the recording medium as the program medium is a recording medium configured to be separable from the main body, such as a tape system such as a magnetic tape or a cassette tape, a magnetic disk such as a flexible disk or a hard disk, or a CD-ROM / MO /. It carries a fixed program including disk systems for optical disks such as MD / DVD, card systems such as IC cards (including memory cards) / optical cards, or semiconductor memories such as mask ROM, EPROM, EEPROM, flash ROM, etc. It may be a medium.
[0149]
The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the claims, and the technical means disclosed in different embodiments can be appropriately combined. Embodiments to be described are also included in the technical means of the present invention.
[0150]
【The invention's effect】
As described above, the database construction apparatus of the present invention includes still image data acquisition means for acquiring still image data from moving image data of the first recording medium reproduced by the first drive, and the still image data acquisition described above. The storage means for storing still image data acquired by the means, and a person included in the still image data stored by the storage means are searched, and if a person is included, a predetermined area including the person is partially Search extraction means for extracting as image data, and when partial image data is extracted by the search extraction means, address information on the first recording medium of still image data from which the extracted partial image data is extracted And a recording means for recording on a second recording medium using a second drive.
[0151]
According to this, partial image data obtained by extracting an area including a person is recorded on the second recording medium and is made into a database. Such partial image data is displayed by itself, and the partial image data itself becomes scene information. In addition, when a plurality of pieces of person information are obtained from the partial image data, the person configuration of the plurality of persons is important scene information. That is, even if these partial image data are used as they are, they become information obtained for detecting a scene change and corresponding scene information.
[0152]
Moreover, since such scene information is partial image data obtained by cutting out an area including a person, the database can be constructed by automatically acquiring the existing technology without bothering the user. .
[0153]
Therefore, it is possible to provide an apparatus for constructing a database of scene information that can automatically acquire scene information suitable for moving image data mainly composed of human images without bothering the user.
[0154]
In addition, by installing such a database construction device in an image recording / playback device, local scene changes can be easily identified, and image search in accordance with a person's movement is possible. There is an effect that it is possible to provide an image recording / reproducing apparatus capable of easily editing the contents of moving image data.
[0155]
Further, in the database construction device of the present invention, the search and extraction means further extracts additional information including number information representing the number of persons included in the partial image data when extracting the partial image data. Acquiring and recording, the recording means records the additional information corresponding to the partial image data on the second recording medium so as to be related in a tree structure connected to the partial image data.
[0156]
According to this, the additional information including the number information indicating the number of persons included in the partial image data is acquired, and the corresponding additional information together with the partial image data can be related in a tree structure connected to the partial image data. Since it is recorded on the second recording medium, even if the partial image data including the person is obtained as an image in which two persons overlap, on the data side recorded on the second recording medium, It also has the effect of being able to be managed separately by two persons.
[0157]
The additional information may further include color information representing the color characteristics of each person and / or shape information representing the shape characteristics of each person.
[0158]
If the color information is used, for example, it is possible to search for a specific scene using a costume worn by a specific person as a key in the entire moving image. In another example, if shape information is used, it is possible to search for a specific scene by capturing the change in shape and using the action of a specific person as a key.
[0159]
Therefore, when searching for moving image data based on the partial image data extracted from the region including people as the scene information, the number of search key items increases and a database that can perform more effective search is constructed. It also has the effect of being able to.
[0160]
In the database construction device of the present invention, it is preferable that the search and extraction means extract partial image data so that all persons included in still image data are included in any partial image data.
[0161]
According to this, since all the persons included in the still image data are acquired as partial image data independently or together with other persons, the effect that the information of the scene information becomes more accurate can be obtained. Play.
[0162]
Further, in the database construction device of the present invention, the search extraction means can be characterized in that it is performed while appropriately changing the search area when searching for a person.
[0163]
According to this, since the search area at the time of searching for a person is changed as appropriate, the search area can be set even for moving image data or the like in which the ratio of the person information to the still image data changes arbitrarily during the search. The search area can always be appropriately determined by reducing the maximum range of the screen step by step, and the search can be performed more efficiently. In addition, when searching for an area including a plurality of persons in the initial search, there is an effect that it is possible to easily perform a search again by changing the search area in order to further improve the information accuracy.
[0164]
In the database construction device of the present invention, the search and extraction means may divide still image data into a plurality of areas in advance, and search the divided areas as search areas.
[0165]
According to this, since still image data is divided into a plurality of regions in advance and each divided region is searched as a search region, a moving image that is expected to have a large number of people recorded in the cut out still image data in advance. In the case of image data, it is possible to appropriately reduce the number of persons existing in an area including a person to be found and extracted by a single search, and to reduce the number of individual person information. In addition, if the search processing is performed independently in each divided area, there is also an effect that a person can be extracted from still image data in a shorter time.
[0166]
In addition, when dividing still image data in advance, the above search is provided with a division number determining means for determining the state of the number of persons included in the still image data and determining the number of divisions of the still image data based on the determination. More preferably, the extracting means divides the image data by the division number determined by the division number determining means.
[0167]
Thereby, since the division of the still image data is performed according to the number of persons included in the still image data, the number of divisions of the still image data was in the state of the number of persons included in the still image data. Thus, there is an effect that the number of pieces of individual person information can be made more accurate than the configuration in which the number of divisions is fixed.
[0168]
In the database construction device of the present invention, it is determined whether or not the moving image data of the first recording medium is reproduced for the first time in the first drive. It can also be configured to include a start instruction means for starting acquisition of still image data.
[0169]
According to this, when the reproduction of the moving image data of the first recording medium in the first drive is the first time, the acquisition of the still image data by the still image data acquisition unit is started by the start instruction unit. The user can also obtain the scene information database by reproducing the first recording medium with the first drive without giving a special instruction.
[0170]
In order to solve the above problems, an image recording / reproducing apparatus of the present invention includes a first drive for reproducing information recorded on a first recording medium, and a first drive for recording / reproducing information on a second recording medium. An image recording / reproducing apparatus including two drives includes the database construction apparatus according to any one of the first to ninth aspects.
[0171]
As already described as a database construction apparatus, the database construction apparatus of the present invention is a database construction of scene information suitable for moving image data mainly of human images and capable of automatically obtaining scene information without bothering the user. Device.
[0172]
Therefore, the image recording / reproducing apparatus of the present invention equipped with such a database construction apparatus is capable of easily discriminating local scene changes and the like, and can search for images according to the movement of the person. As a result, it is possible to provide an excellent image recording / reproducing apparatus capable of easily editing the contents of the moving image data.
[0173]
The image search method of the present invention is the image search method of the image recording / reproducing apparatus of the present invention, wherein the partial image data recorded on the second recording medium is used as scene information, and the first recording medium is used. An arbitrary scene is searched in the moving image data recorded in the video.
[0174]
As described above, the partial image data recorded on the second recording medium includes, for example, the action of the person, still image data that has already been extracted, that is, a moving image having the still image data as a component. Therefore, by displaying partial image data, the partial image data itself becomes scene information. In addition, when a plurality of pieces of person information are obtained from the partial image data, the person configuration of the plurality of persons is important scene information. That is, even if these partial image data are used as they are, they become information obtained for detecting a scene change and corresponding scene information.
[0175]
Accordingly, since the search is performed using scene information at a fine level including the motion of the person included in the image, it is possible to perform a more efficient image search such as a search when reproducing moving image data centered on a person. Play together.
[0176]
The image search apparatus of the present invention is an image search apparatus provided in the image recording / reproducing apparatus, and reproduces a partial image data group recorded on the second recording medium using the second drive. A first image based on the partial image data displayed on the display means, an input means for receiving selection of the displayed partial image data from the user, and the partial image data selected by the input means; It is characterized by comprising search means for searching still image data from which the partial image data is extracted from moving image data recorded on a recording medium.
[0177]
According to this, the partial image data reproduction display means reproduces the partial image data group recorded on the second recording medium using the image second drive, and causes the display means to display it. When the user selects one of the displayed partial image data using the input means, the search means searches the moving image data for still image data from which the partial image data selected by the input means is extracted. To do.
[0178]
Accordingly, it is possible to search for necessary image data (scene search) by directly looking at the movement, facial expression, etc. of the person recorded on the second recording medium. Finer search is possible than when displayed. For example, even when the ratio of the area where the person is recorded in the original still image is small in the whole, the image search using the person information as a key can be performed. In other words, since the display is narrowed down, it is possible to perform a search that is easier for the user to see and has high information accuracy.
[0179]
In the image search device according to the present invention, the partial image data reproduction / display means may further execute partial image data before reproduction of the moving image data when the reproduction of the moving image data recorded on the first recording medium is instructed. It is also possible to display a part of the screen.
[0180]
According to this, when the partial image data group of the moving image data on the first recording medium is on the second recording medium, a part of the partial image data is automatically reproduced before the moving image data is reproduced. Therefore, for example, the user sees the partial image data, and also has an effect that it is possible to selectively reproduce only the scene to be viewed.
[0181]
The database construction program and recording medium of the present invention are a program for causing a computer to function as each means in the above-described database construction apparatus of the present invention, and a recording medium recording the program.
[0182]
The image search program and recording medium of the present invention are a program for causing a computer to function as each means in the above-described image search apparatus of the present invention and a recording medium on which the program is recorded.
[0183]
Thus, if the above-described database construction program or image retrieval program is executed by a computer, the present invention can be applied not only to a specific database construction device, image retrieval device, and image recording / reproduction device but also to an unspecified image recording / reproduction device. This also brings about the effect that the database construction device, the image search device, and the image recording / reproducing device of the invention can be realized.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an image recording / reproducing apparatus according to an embodiment of the present invention.
FIGS. 2A and 2B are explanatory diagrams illustrating an example of scene information acquisition in the image recording / playback apparatus.
FIG. 3 is an explanatory diagram showing an information addition structure in person information search in the image recording / reproducing apparatus.
FIG. 4 is an explanatory diagram showing a search area changing method when searching for a person in the image recording / reproducing apparatus.
FIG. 5 is a flowchart showing a procedure for automatically obtaining personal information in the image recording / reproducing apparatus.
FIG. 6 is a block diagram showing a configuration of an image recording / reproducing apparatus according to another embodiment of the present invention.
FIG. 7 is a flowchart showing a procedure for automatically obtaining personal information in the image recording / reproducing apparatus.
FIG. 8 is a diagram showing a scene information input system of the invention disclosed in the conventional publication.
FIG. 9 is a flowchart showing a procedure of scene information input according to the invention disclosed in the above-mentioned publication.
[Explanation of symbols]
1 First recording medium
2 Second recording medium
3 Buffer memory (storage means)
4 memory (still image data acquisition means, search extraction means, recording means, start instruction means, partial image data display means, search means)
5 display means
6 CPU (still image data acquisition means, search extraction means, recording means, start instruction means, partial image data display means, search means)
11 First drive
12 Second drive
30 buffer memory group (storage means)

Claims (17)

第1のドライブにて再生された第1の記録媒体の動画像データから静止画像データを取得する静止画像データ取得手段と、
上記静止画像データ取得手段にて取得された静止画像データを蓄積していく蓄積手段と、
該蓄積手段が蓄積した静止画像データに含まれる人物を、当該静止画像データを複数の線情報に加工した輪郭画像と、人物を判断するための顔フレーム及び身体フレームとを比較することによって探索し、当該静止画像データに含まれる全ての人物のそれぞれについて、人物を含む所定領域を部分画像データとして抽出する探索抽出手段と、
該探索抽出手段にて部分画像データが抽出されると、抽出された部分画像データを抽出元である静止画像データの上記第1の記録媒体上のアドレス情報と対応付けて第2のドライブを用いて第2の記録媒体に記録すると共に、上記探索抽出手段が顔フレーム及び身体フレームに類似性が高いと判断した輪郭を示す輪郭モデルを記録する記録手段とを有することを特徴とするデータベース構築装置。
Still image data acquisition means for acquiring still image data from moving image data of the first recording medium reproduced by the first drive;
Storage means for storing still image data acquired by the still image data acquisition means;
A person included in the still image data stored by the storage means is searched by comparing a contour image obtained by processing the still image data into a plurality of line information, and a face frame and a body frame for determining the person. Search and extraction means for extracting a predetermined area including a person as partial image data for each of all persons included in the still image data;
When the partial image data is extracted by the search extraction means, the extracted partial image data is associated with the address information on the first recording medium of the still image data as the extraction source, and the second drive is used. And a recording unit for recording a contour model indicating a contour determined by the search and extraction unit to be highly similar to the face frame and the body frame. .
上記探索抽出手段は、部分画像データを抽出する際に、上記記録手段が上記輪郭モデルを記録した回数を、当該部分画像データ内に含まれる人物の数としてカウントし、この数を表す数情報を含む付加情報を併せて取得し、
上記記録手段は、部分画像データと共に対応する付加情報を、部分画像データに連なるツリー構造で関係付け得るように上記第2の記録媒体に記録することを特徴とする請求項1に記載のデータベース構築装置。
The search extraction means, when extracting the partial image data, the number of times said recording means has recorded the contour model, counted as the number of persons included in the partial image data, the number information indicating the number Acquire additional information including
2. The database construction according to claim 1, wherein the recording means records the additional information corresponding to the partial image data on the second recording medium so as to be related in a tree structure connected to the partial image data. apparatus.
上記付加情報、各人物の色的特徴を表す色情報として、上記探索抽出手段が部分画像データを抽出した静止画像データにおける、上記輪郭モデルの位置に相当する部分の色を示す情報をことを特徴とする請求項2に記載のデータベース構築装置。The additional information as the color information representing the color characteristics of each person, in the still image data the search extracting means has extracted partial image data, information including indicating the color of a portion corresponding to the position of the contour model The database construction device according to claim 2 characterized by things. 上記付加情報、各人物の形状的特徴を表す形状情報として、上記探索抽出手段が部分画像データを抽出した静止画像データにおける、上記輪郭モデルの位置に相当する部分の形状を示す情報をことを特徴とする請求項2又は3に記載のデータベース構築装置。The additional information, the shape information representing the shape characteristics of each person, in the still image data the search extracting means has extracted partial image data, the contour model including information indicating the shape of a portion corresponding to the position The database construction device according to claim 2 or 3 characterized by things. 上記探索抽出手段は、静止画像データに含まれる全ての人物が何れかの部分画像データに含まれるように部分画像データの抽出を行うことを特徴とする請求項1〜4の何れかに記載のデータベース構築装置。  The said search extraction means extracts partial image data so that all the persons included in still image data may be included in any partial image data, The any one of Claims 1-4 characterized by the above-mentioned. Database construction device. 上記探索抽出手段は、人物を探索する際の探索領域を適宜変更しながら行うことを特徴とする請求項1〜4の何れかに記載のデータベース構築装置。  The database construction device according to claim 1, wherein the search extraction unit performs the search while appropriately changing a search area when searching for a person. 上記探索抽出手段は、静止画像データを予め複数の領域に分割し、分割した領域を探索領域として探索することを特徴とする請求項1〜4の何れかに記載のデータベース構築装置。  The database construction apparatus according to claim 1, wherein the search extraction unit divides still image data into a plurality of areas in advance, and searches the divided areas as search areas. 上記静止画像データに含まれる人物の数の状態を判定し、判定に基づいて静止画像データの分割数を決定する分割数決定手段を有しており、
上記探索抽出手段は、該分割数決定手段にて決定された分割数にて画像データを分割することを特徴とする請求項7に記載のデータベース構築装置。
Determining the number of persons included in the still image data, and having a division number determining means for determining the number of divisions of the still image data based on the determination;
8. The database construction apparatus according to claim 7, wherein the search extraction unit divides the image data by the number of divisions determined by the division number determination unit.
上記第1のドライブにおける上記第1の記録媒体の動画像データの再生が初めてか否かを判定し、初めてである場合は、上記静止画像データ取得手段による静止画像データの取得を開始させる開始指示手段を備えていることを特徴とする請求項1に記載のデータベース構築装置。  It is determined whether or not the moving image data of the first recording medium is reproduced for the first time in the first drive, and if it is the first time, a start instruction for starting the acquisition of still image data by the still image data acquisition unit The database construction device according to claim 1, further comprising means. 第1の記録媒体に記録されている情報を再生する第1のドライブと、
第2の記録媒体に情報を記録・再生する第2のドライブとを備えた画像記録再生装置において、
上記請求項1〜9に記載のデータベース構築装置を備えたことを特徴とする画像記録再生装置。
A first drive for reproducing information recorded on the first recording medium;
In an image recording / reproducing apparatus comprising a second drive for recording / reproducing information on a second recording medium,
An image recording / reproducing apparatus comprising the database construction apparatus according to claim 1.
上記請求項10に記載の画像記録再生装置の画像検索方法であって、
上記第2の記録媒体に記録されている部分画像データをシーン情報として用いて、上記第1の記録媒体に記録されている動画像データにおける任意のシーンの検索を行うことを特徴とする画像検索方法。
An image search method for an image recording / reproducing apparatus according to claim 10,
An image search comprising: searching for an arbitrary scene in the moving image data recorded on the first recording medium using the partial image data recorded on the second recording medium as scene information. Method.
上記請求項10に記載の画像記録再生装置に備えられる画像検索装置であって、
上記第2ドライブを用いて上記第2の記録媒体に記録されている部分画像データ群を再生し、表示手段に表示させる部分画像データ表示手段と、
ユーザからの表示されている部分画像データに対する選択を受けつける入力手段と、
上記入力手段にて選択された部分画像データをもとに、第1の記録媒体に記録されている動画像データに対して、該部分画像データの抽出元となる静止画像データの検索を行う検索手段とからなる画像検索装置。
An image search apparatus provided in the image recording / reproducing apparatus according to claim 10,
Partial image data display means for reproducing the partial image data group recorded on the second recording medium using the second drive and displaying the reproduced data on the display means;
An input means for receiving a selection for the displayed partial image data from the user;
Search for searching for still image data from which partial image data is extracted from moving image data recorded on the first recording medium based on the partial image data selected by the input means. An image search device comprising means.
上記部分画像データ表示手段は、上記第1の記録媒体に記録されている動画像データの再生が指示された場合に、動画像データの再生前に部分画像データの一部を表示することを特徴とする請求項12に記載の画像検索装置。  The partial image data display means displays a part of the partial image data before reproducing the moving image data when an instruction to reproduce the moving image data recorded on the first recording medium is given. The image search device according to claim 12. 上記請求項1〜9の何れかに記載のデータベース構築装置における各手段としてコンピュータを機能させるデータベース構築プログラム。  A database construction program for causing a computer to function as each means in the database construction device according to claim 1. 請求項14に記載のデータベース構築プログラムを記録したコンピュータ読み取り可能な記録媒体。  The computer-readable recording medium which recorded the database construction program of Claim 14. 上記請求項12又は13に記載の画像検索装置における各手段としてコンピュータを機能させる画像検索プログラム。  14. An image search program for causing a computer to function as each means in the image search device according to claim 12 or 13. 請求項16に記載の画像検索プログラムを記録したコンピュータ読み取り可能な記録媒体。  The computer-readable recording medium which recorded the image search program of Claim 16.
JP2003084906A 2003-03-26 2003-03-26 Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device Expired - Fee Related JP4334898B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003084906A JP4334898B2 (en) 2003-03-26 2003-03-26 Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003084906A JP4334898B2 (en) 2003-03-26 2003-03-26 Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device

Publications (2)

Publication Number Publication Date
JP2004297305A JP2004297305A (en) 2004-10-21
JP4334898B2 true JP4334898B2 (en) 2009-09-30

Family

ID=33399959

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003084906A Expired - Fee Related JP4334898B2 (en) 2003-03-26 2003-03-26 Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device

Country Status (1)

Country Link
JP (1) JP4334898B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4532320B2 (en) * 2005-03-29 2010-08-25 株式会社日立国際電気 Image display device
JP2006309661A (en) * 2005-05-02 2006-11-09 Fuji Photo Film Co Ltd Image reproducing apparatus and image reproducing program
JP4553134B2 (en) * 2005-07-19 2010-09-29 カシオ計算機株式会社 Image generating apparatus and program thereof
JP4597803B2 (en) * 2005-07-26 2010-12-15 パナソニック株式会社 Video scene information generator
JP4254802B2 (en) * 2006-05-11 2009-04-15 ソニー株式会社 Image processing apparatus and method, program, and recording medium
JP5667773B2 (en) * 2010-03-18 2015-02-12 キヤノン株式会社 Information creating apparatus and control method thereof
JP5837484B2 (en) * 2010-05-26 2015-12-24 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America Image information processing device
CN111931567B (en) * 2020-07-01 2024-05-28 珠海大横琴科技发展有限公司 Human body identification method and device, electronic equipment and storage medium

Also Published As

Publication number Publication date
JP2004297305A (en) 2004-10-21

Similar Documents

Publication Publication Date Title
JP3615657B2 (en) Video search method and apparatus, and recording medium
JP2994177B2 (en) System and method for locating boundaries between video segments
US7873258B2 (en) Method and apparatus for reviewing video
JPH08249348A (en) Method and device for video retrieval
JP4765732B2 (en) Movie editing device
US8644683B2 (en) Moving image data processing apparatus and method
US7110592B2 (en) Image recording apparatus, image reproducing apparatus and methods therefor
JP4996404B2 (en) Human behavior search device
JP2010518673A (en) Method and system for video indexing and video synopsis
JP2007280325A (en) Video display apparatus
JP4536940B2 (en) Image processing apparatus, image processing method, storage medium, and computer program
JP2011090476A (en) System and method for retrieving similar image
JP4334898B2 (en) Database construction device, database construction program, image retrieval device, image retrieval program, and image recording / reproducing device
JP6203188B2 (en) Similar image search device
JP2006079457A (en) Electronic album display system, electronic album display method, electronic album display program, image classification device, image classification method and image classification program
JP2013179498A (en) Image processing method and image processing device
JP3372096B2 (en) Image information access device
JP2006081021A (en) Electronic album display system, electronic album display method, electronic album display program, image classification device, image classification method and image classification program
JP6214762B2 (en) Image search system, search screen display method
JP5826513B2 (en) Similar image search system
JP2002262233A (en) Behavior measurement system
JP6210634B2 (en) Image search system
JP5012644B2 (en) Presentation recording apparatus, presentation playback apparatus, and program
JP2020119368A (en) Video information management system and video information management method
JP2004110096A (en) User operation log visualizing method, user operation log visualizing device, program and its recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070903

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071030

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071228

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090623

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090624

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120703

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees