JP4053251B2 - Image search system and image storage method - Google Patents
Image search system and image storage method Download PDFInfo
- Publication number
- JP4053251B2 JP4053251B2 JP2001086271A JP2001086271A JP4053251B2 JP 4053251 B2 JP4053251 B2 JP 4053251B2 JP 2001086271 A JP2001086271 A JP 2001086271A JP 2001086271 A JP2001086271 A JP 2001086271A JP 4053251 B2 JP4053251 B2 JP 4053251B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- data
- pattern
- multimedia data
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、画像データ及び音声データを含めたマルチメディアデータを圧縮符号化して蓄積し、蓄積されたマルチメディアデータをクライアントの要求に応じて配送する画像検索システムに関するものである。
【0002】
【従来の技術】
従来、マルチメディアデータの画像検索システムでは、画像要素情報から画像の特徴を利用して、画像そのものを検索している。近年、登録時に画像解析プログラムを併用して、エッジ情報、色情報等から一連の画像情報の中を静止画像と同様に画像を検索するシステムや、画像に現れる個々のコンテントに着目して検索することにより、画面上の個々の物体に対しても検索するシステムが実現されている。この従来技術は、特開平11−338876号公報に記載されている。また、検索するための情報量の増大を抑制するために、代表フレームとその前後の音声データとを含むインデックスファイルを作成することでインデックスデータに登録された音声データ、画像データ、情報の復号情報にて画像を検索するシステムが特開平11−331779号公報に記載されている。さらに、音声・画像を含むマルチメディアデータの蓄積装置にて、圧縮符号化されているデータを直接検索する方式が特開平2000−29881号公報に記載されている。
【0003】
【発明が解決しようとする課題】
しかし、これらの検索システムでは、映像・音声・インデックスデータの登録時にユーザが検索キーワードを割り当てるか、検索時に検索画像・音声データを別途用意して比較することにより検索するなど、検索キーワードを入力する手段が、ユーザ側にて別途必要となる問題がある。また、検索データを管理するインデックスファイルは、別装置にて作成されたマルチメディアデータをコピーした場合にインデックスファイル内のキーワード情報が更新されずに、手動にて登録しなければならず手間がかかるという問題がある。
【0004】
本発明は、上記課題を解決するために、マルチメディアデータを蓄積するときに、検索のときに利用するキーとなる情報をより簡単に登録することができる蓄積画像検索システムを提供することを目的とする。
【0005】
【課題を解決するための手段】
画像検索システムは、画像データ及び音声データを含めたマルチメディアデータを圧縮符号化する符号化手段と、当該圧縮符号化されたマルチメディアデータを蓄積する蓄積手段とを有する。
【0006】
記憶手段には、検索のときに利用するためのキーとなるあらかじめ定めた音声パターンと画像パターンとをあらかじめ記憶しておく。比較手段は、前記符号化手段で前記マルチメディアデータを圧縮符号化するときに、当該マルチメディアデータの音声データと、前記記憶手段に記憶する音声パターンとを比較し、当該マルチメディアデータの画像データと、前記記憶手段に記憶する画像パターンとを比較する。作成手段は、前記比較手段で比較した結果、一致した前記マルチメディアデータと前記音声パターンおよび/または画像パターンの識別情報とを関連づけるインデックス情報を作成する。
【0007】
【発明の実施の形態】
以下図面を参照して、本発明の実施の形態を示す。
【0008】
図1に本発明の実施形態のシステム構成図を示す。図1において、蓄積画像検索システムは、サーバ装置1、ビデオポンプ装置2、コンテンツ作成端末3、クライアント装置8とを備え、これらは各々パーソナルコンピュータで構成され、各装置はLANなどの通信手段7を介して通信を行う。クライアント装置8では所望するマルチメディアデータを選択し、配信要求を出すことにより、サーバ装置1はビデオポンプ装置2に対して、該当クライアント装置8の要求データを送信する。ビデオポンプ装置2はディスクドライブユニット5を備え、コンテンツ作成端末3で作成されたマルチメディアデータを蓄積することを可能とする。ユーザは、クライアント装置8の入力装置9のキーボードからキーワードを入力する。入力されたキーワードはサーバ装置1内の検索部4にて、一致するキーワードが存在するか判別し、合致した場合にマルチメディアデータをクライアント装置8に配信する。コンテンツ作成端末3のコンテンツ作成部6は、入力されたマルチメディアデータを圧縮符号化してファイル化する時にキーワード情報を予め登録したパターン情報と比較することにより、合致したキーワードを入力したコンテンツデータを作成する。作成されたマルチメディアデータのファイルはビデオポンプ装置2に蓄積され、検索キーワード情報とファイル名をリンクした情報はサーバ装置1の検索部4内の検索情報管理テーブルに記録される。
【0009】
次に、コンテンツデータ作成方法について説明する。図2に、本実施の形態におけるコンテンツ作成端末3の内部に備えるコンテンツ作成部6のブロック図を示し、図3にコンテンツ作成部6のエンコーダ部30及びパターン比較部60のブロック図を示す。
【0010】
図2に示すように、制御部80は各ブロックの制御を行う。通信制御部100は、外部通信手段とのインタフェース制御を行う。システムバス20は、各制御データ及び画像データ、音声データのデータラインを含んでいる。映像・音声からなるマルチメディアデータとして、カメラからの画像データとマイクからの音声データとがそれぞれ入力部10に入力される。入力された画像データ及び音声データは、A/D部20にてアナログ信号をディジタル信号に変換される。ディジタル信号化された画像データ及び音声データは圧縮符号化するためにエンコーダ部30にて選択された符号化方式に従い符号化処理を行う。
【0011】
音声データは、オーディオエンコーダ部310を介してオーディオメモリ部340に記録される。入力された画像データは図3に示すビデオエンコーダ部310にて、一時、ビデオメモリ部320に記録され、輝度と色差を持つ画素単位に分割して、複数の画素を1つのブロック(マクロブロック)として符号化される。符号化処理を行う上で、マクロブロック単位に動きベクトルを算出して、フレーム当たりの動き量を算出する動き量検出部600にて動き量を算出する。算出された動き量の変化が閾値αより大きい場合に、制御部80は音声のパターン比較を開始するために、パターン比較部60に対して比較処理の開始指示を送る。比較処理が開始すると、制御部80は、オーディオメモリ部340に記録された音声データを音声データ抽出部610で音声波形をフーリエ変換しスペクトル成分に変換させる。変換されたスペクトルの慨形をスペクトル包絡と称し、スペクトルからスペクトル包絡と音源情報を表す音声スペクトルの微細構造情報である残差信号と称する残差成分とに分解される。分解された各成分は、スペクトルパターンと音源パターンとしてマルチメディアメモリ部40に記録される。同時に画像データは、ビデオメモリ部320に記録された画像データを画像データ抽出部640でフレーム毎にマクロブロック単位に分解して、画像構成情報を伴いマルチメディアメモリ部40に記録される。マルチメディアメモリ部40に記録された画像・音声データは、比較処理完了するまで記録される。さらに、ビデオエンコーダ部310は、符号化処理にて符号化されたデータの時刻管理情報値をマルチメディアメモリ部40に記録する。時刻管理情報値は、画像データ、音声データをいつ復号再生するかの情報を示す情報値である。これは画像データと音声データがそれぞれ符号化する際に生じる遅延により、復号化の再生映像と再生音声ずれるような違和感をなくすための処理である。符号化されたマルチメディアデータは、この情報を元に画像データ及び音声データは復号化される。マルチメディアメモリ部40に画像データ及び音声データを記録した後、記録した音声データと音声パターン記録部630に予め記録した音声パターンを音声パターン比較部620で比較する。
【0012】
音声パターン記憶部630には、図12に示すような音声パターンに対応するキーワードをあらかじめ記憶させておく。パターン記憶部630には、受付部635で音声パターンとキーワードとを受付けて登録することができる。音声パターンは、個別のキーワードに対応するパターンのほかに、複数のキーワードに対応するような音声パターンをあらかじめ登録しておくことができる。比較した結果、合致したパターンのキーワードをキーワード抽出部670に記録する。キーワードは複数あった場合でも全て、キーワード抽出部670に記録する。制御部80は、キーワード抽出部670に記録されたキーワードから、画像パターン記録部660より画像パターンを選択する。画像パターン記録部660には、画像パターンに対応するキーワードがあらかじめ登録されている。画像パターンとしては、キーワードに対応する画像のエッジ処理を施した画像を登録しておく。1つのキーワードに複数の画像パターンが存在することもあり得るため、制御部80は、前回検出したキーワードの画像パターンから類似頻度の高い画像パターンを選択する指示を出すようにしてもよい。画像パターン比較部650では、制御部80より選択された画像パターンから順次マルチメディアメモリ部40に記録された画像データを比較する。比較した結果、合致したパターンがある場合に、該当キーワードをキーワード検出部680に記録する。制御部80はキーワードを検出したことを認識し、インデックスデータとしてキーワードと該当映像・音声部の時刻管理情報値とをマルチメディアメモリ部40から抽出し、インデックスデータ生成部700に記録させる。記録されたインデックスデータはキーワード毎に、各時刻管理情報値が記録される。算出された動き量の変化が閾値αより小さい場合には、制御部80はパターン比較指示を出すことはなく、動き量の変化が閾値αより大きくなるまで、音声データ及び画像データの抽出を行わない。制御部80は、音声パターン比較部620にて比較した結果、合致するキーワードが無い場合は、「音声パターン合致無し」というキーワードをキーワード検出部680に記録し、マルチメディアメモリ部40に記録した時刻管理情報値と共に、インデックスデータ生成部700に記録する。制御部80は、画像パターン比較部にて合致したキーワードが無い場合は、「画像パターン合致無し」というキーワードをキーワード検出部680に記録し、マルチメディアメモリ部40に記録した時刻管理情報値と共に、インデックスデータ生成部700に記録する。
【0013】
また、符号化された音声データと画像データは多重化部50にて多重化される。多重化のフォーマット例を図4に示す。図4において、画像データ及び音声データをそれぞれパケットと称する48バイトのストリームに分割する。これに5バイトのヘッダ部160に画像データあるいはオーディオデータの属性情報を含み、53バイトのパケットを構成する。ここで、画像データを含むパケットをビデオパケット、音声データを含むパケットをオーディオパケットと称する。多重化部50では、ビデオとオーディオのパケットを切り換えて時分割多重化を行う。マルチメディアデータの多重化完了時に、ファイル作成部710は、インデックスデータ生成部700のインデックスデータの時刻管理情報を、検索後の所望映像の再生開始位置を示す情報値(タイムスタンプ値)としてキーワードとともに、多重化されたマルチメディアデータのデータの先頭部に記録する。
【0014】
図5にデータフォーマット例を示す。図5に示すように、インデックスデータ、画像データおよび音声データは、それぞれパケットと称する48バイトのストリームに分割される。これに5バイトのヘッダ部150にインデックスデータあるいは画像データ、オーディオデータの属性情報を含み、53バイトのパケットを構成する。ここで、インデックスデータを含むパケットをインデックスパケット、画像データを含むパケットをビデオパケット、音声データを含むパケットをオーディオパケットと称する。インデックスパケットには、同一ファイル内のマルチメディアデータ全てのキーワードと、キーワードに対応したタイムスタンプ値を格納する。インデックスパケット、ビデオパケット、オーディオパケットはそれぞれ、ファイル作成部710にて、多重化されたマルチメディアデータの先頭部をインデックスパケットとするマルチメディアファイルが作成される。マルチメディアデータを再生する場合は、インデックスパケットのヘッダ部の情報を読みとり、パケットが再生すべきデータではないことを認識するため、ビデオパケットもしくはオーディオパケットのみを再生対象とする。
【0015】
図6にマルチメディアデータ作成処理のフローチャートを示す。
【0016】
図6において、マルチメディアデータを入力し、マルチメディアデータのファイル作成処理を開始する(ステップ400)。動き量取得処理により画像データから動き量を取得する(ステップ4100)。図7に動き量検出処理の概要を示す。図7において、図3に示すエンコーダ部310からの画像データを予測メモリ1(4710)または予測メモリ2(4720)に交互に蓄積する。予測メモリ1または予測メモリ2内の画像データ、または、予測メモリ1および予測メモリ2の平均値の画像データと、現在の画像データとのフレーム間の差分を差分検出部4730にて採取し、水平及び垂直方向にずらして、差分が小さくなる位置を動きベクトルとしてベクトル値を算出する。算出したベクトル値を動き量として変換し、フレーム単位で、動き量を決定する。取得された動き量と閾値αをステップ4200により比較する。ステップ4200により閾値αより動き量が大きい場合は、パターン比較処理を開始する(ステップ4300)。パターン比較処理は、図3に示す音声データ比較部620と画像データ比較部650とで行い、一致するキーワードをキーワード検出部680に記録する(ステップ4300)。パターン比較処理により比較抽出されたキーワードからインデックス作成処理にてインデックスを作成する(ステップ4400)。図8にインデックス作成処理の例を示す。図3に示すキーワード検出部680に記録したキーワードと図2に示すマルチメディアメモリ部40に記録した時刻管理情報値とを合わせてインデックスデータ700として記録する。図3に示すキーワード検出部680では、検出したキーワード数を記録部の最初に記録する。動き量の変化が閾値より大きくならない限り、パターン比較・時刻管理情報値の更新を行わないため、キーワード検出部に記録するキーワードは、1つの時刻管理情報値で管理する。動き量が閾値を越え、新たなパターン比較処理を始めるまでに、図3に示すインデックスデータ生成部700において、キーワード数、キーワードおよび時刻管理情報を記録する。新たなパターン比較の結果で生じるキーワードは、さらに次のパターン比較処理が始める前に、前回の時刻管理情報値の後に続けて記録する。記録を行う上で、前回と同一のキーワードが存在する場合は、そのキーワードを削除し、キーワード数を減らす処理を行うようにしてもよい。
【0017】
インデックス作成処理後、ステップ4500のマルチメディアデータの作成終了判別処理にて、マルチメディアデータの作成終了を判別する。また、ステップ4200により閾値αより動き量が小さい場合は、比較対象画像の変化が無いと判断し、マルチメディアデータの作成終了判別処理にて(ステップ4500)、マルチメディアデータの作成終了を判別する。終了時にはファイル作成処理にて、マルチメディアデータのファイルを作成する(ステップ4600)。マルチメディア作成処理では、最終的なデータ量をインデックスデータの先頭に入れる処理を行い、図5に示すインデックスパケット151として48バイト毎に区切る処理を行い、ビデオデータ・オーディオデータと合わせてマルチメディアデータを作成する。継続時には、ステップ4100の動き量取得処理に戻る。
【0018】
次に、複数のマルチメディアデータファイルを登録(検索情報登録)する場合の処理を、図9を参照して説明する。図9に検索情報登録処理のフローチャートを示す。
【0019】
図9において、検索情報登録処理を開始すると、コンテンツ作成端末3にてファイル登録処理を行う(ステップ5100)。ファイル登録処理は、コンテンツ作成端末3にて作成されたマルチメディアデータファイルにファイル名とタイトルを登録する処理である。これは、ユーザがキーボードから入力装置により、ファイル名称、タイトルを登録する。ファイル名称及びタイトルの登録が完了すると、コンテンツ作成端末3は、通信手段7により、ファイルデータをビデオポンプ装置2のディスクユニット部5に送信する。ビデオポンプ装置2へのファイル送信が完了すると、コンテンツ作成端末3は、ステップ5200のインデックスデータ取得処理を開始する。インデックスデータ処理は、マルチメディアファイル内のインデックスデータを読みとり、サーバ装置1の検索部4に対して、インデックスデータを送信する。検索情報管理テーブル登録処理(ステップ5300)にて、サーバ装置1の検索部4の検索情報管理テーブルにインデックスデータが登録される。検索情報管理テーブルは、図10に示すように、インデックスデータに登録されたキーワードを示すキーワード名250と、キーワードの対象マルチメディアファイルのファイル名を示すファイル名称251と、該当キーワードに対応するマルチメディアデータの再生位置を示す時刻管理情報に対応するタイムスタンプ値252と、登録時に別途入力するマルチメディアファイルのタイトル名253とで構成される。
【0020】
検索時には、検索情報管理テーブルを参照することにより、クライアント装置8の入力装置9からの入力されたキーワードを含むファイル名称を選択し、ファイルの再生位置をタイムスタンプ値から読みとることにより、所望する画像を検索することが可能となる。検索情報管理テーブルには、画像の作成年月などの検索情報を記録することも可能とする。
【0021】
図11に、第2の実施の形態におけるマルチメディアデータの検索情報登録処理のブロック図を示す。第2の実施の形態においては、すでに作成されたマルチメディアデータを受付けて、キーワードの登録を行う場合の構成を示す。
【0022】
本システム以外にて作成されたマルチメディアデータは、マルチメディア分離部350にて画像データと音声データとに分離される。画像データは、ビデオデコーダ部360にて復号化され、復号化時の動き量を動き量検出部600にて検出される。動き量が閾値αより大きい場合は、前述のマルチメディアデータを作成する場合と同様に、制御部80がパターン比較処理を開始する。音声データは、オーディオデコーダ部380にて復号化される。制御部80が比較処理を開始すると、オーディオ抽出部にて音声データを抽出し、予め記録してある音声パターンとの比較を行う。同様に、画像パターンとの比較も行い、キーワードと時刻管理情報を検出する。検出されたキーワードと時刻管理情報とはインデックスデータ作成部700に記録される。マルチメディアデータの復号化処理終了時に、ファイル作成部710は、本システム以外で作成されたマルチメディアデータをマルチメディアデータ記録部400から引き出し、インデックスデータ生成部700のインデックスデータの時刻管理情報を、再生開始位置の情報値(タイムスタンプ値)としてキーワードとともに、引き出されたマルチメディアデータの先頭部に記録し、新規ファイルを作成する。このとき、新規ファイルの作成により、同一内容のマルチメディアファイルが2種類存在することになる。新規ファイルの作成を拒否した場合に於いても、ファイル生成部710は、ファイル名称とインデックスデータ情報を記録したインデックスファイルを作成し、ファイル登録時には、検索情報管理テーブルに記録することを可能とする。このことにより、別途システムで作成されたマルチメディアデータも自動的にキーワードを挿入することを可能とする。
【0023】
【発明の効果】
本発明の画像検索システムを利用すれば、マルチメディアデータを検索する場合のキーワードや特徴データの登録を行わず、マルチメディア作成時にキーワードを自動的に登録することが可能となる。さらに、音声データと動き量によりキーワードを選択することにより、余剰な検索データを挿入することなく登録を可能とする。
【図面の簡単な説明】
【図1】画像検索システムのシステム構成図
【図2】コンテンツ作成部のブロック図
【図3】パターン比較部のブロック図
【図4】マルチメディアデータ多重化フォーマット例を示す説明図
【図5】マルチメディアファイルデータフォーマット例を示す説明図
【図6】ファイル作成処理フロー図
【図7】動き量検出処理ブロック図
【図8】インデックスデータ作成例を示す説明図
【図9】検索情報登録処理フロー図
【図10】検索情報管理テーブル例を示す説明図
【図11】本システム以外で作成されたファイルのパターン比較ブロック図。
【図12】音声パターンと画像パターンとの説明図
【符号の説明】
1 サーバ装置
2 ビデオポンプ装置
3 コンテンツ作成端末
4 検索部
5 ディスクユニット部
6 コンテンツ作成部
7 通信手段
8 クライアント装置
9 入力装置
10 入力部
20 A/D部
30 エンコーダ部
40 マルチメディアメモリ部
50 マルチメディア多重化部
60 パターン比較部
70 ファイル作成部
80 制御部
90 メモリ部
100 通信制御部
110 デコーダ部
150 ヘッダ部
151 インデックスデータ
152 ビデオデータ
153 オーディオデータ
160 ヘッダ部
250 キーワード名
251 ファイル名称
252 タイムスタンプ値
253 タイトル名
300 エンコーダ入力部
310 ビデオエンコーダ部
320 ビデオメモリ部
330 オーディオエンコーダ部
340 ビデオメモリ部
350 マルチメディア分離部
360 ビデオデコーダ部
370 ビデオメモリ部
380 オーディオデコーダ部
390 オーディオメモリ部
400 マルチメディア記録部
600 動き量検出部
610 音声データ抽出部
620 音声パターン比較部
630 音声パターン記録部
640 画像データ抽出部
650 画像パターン比較部
660 画像パターン記録部
670 キーワード抽出部
680 キーワード検出部
700 インデックスデータ生成部
710 ファイル生成部
4000 ファイル作成処理
4100 動き量取得処理
4200 閾値判別
4300 パターン比較処理
4400 インデックス作成処理
4500 終了判別
4600 マルチメディアデータ作成処理
4710 予測メモリ1
4720 予測メモリ2
4730 差分検出部
5000 検索情報登録処理
5100 ファイル登録処理
5200 インデックスデータ取得処理
5300 検索情報管理テーブル登録処理。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image search system for compressing and storing multimedia data including image data and audio data and storing the multimedia data in response to a client request.
[0002]
[Prior art]
Conventionally, in an image search system for multimedia data, an image itself is searched using image features from image element information. In recent years, using an image analysis program at the time of registration, a system for searching for images in a series of image information from edge information, color information, etc., as well as still images, and searching by focusing on individual content appearing in images Thus, a system for searching for individual objects on the screen is realized. This prior art is described in JP-A-11-338876. In addition, in order to suppress an increase in the amount of information to be searched, decoding information of audio data, image data, and information registered in the index data by creating an index file including a representative frame and audio data before and after the representative frame JP-A-11-331779 discloses a system for searching for images. Further, Japanese Patent Laid-Open No. 2000-29881 discloses a method for directly retrieving compressed and encoded data in a storage device for multimedia data including audio and images.
[0003]
[Problems to be solved by the invention]
However, in these search systems, the user inputs a search keyword such as assigning a search keyword when registering video / audio / index data, or searching by separately preparing and comparing search image / audio data during search. There is a problem that means is separately required on the user side. In addition, the index file that manages the search data must be manually registered without updating the keyword information in the index file when multimedia data created by another device is copied. There is a problem.
[0004]
In order to solve the above-described problems, an object of the present invention is to provide an accumulated image retrieval system capable of more easily registering information serving as a key used for retrieval when accumulating multimedia data. And
[0005]
[Means for Solving the Problems]
The image search system includes an encoding unit that compresses and encodes multimedia data including image data and audio data, and a storage unit that stores the compressed and encoded multimedia data.
[0006]
The storage means stores in advance a predetermined voice pattern and image pattern that are keys for use in the search. The comparing means compares the audio data of the multimedia data with the audio pattern stored in the storage means when the encoding means compresses and encodes the multimedia data, and the image data of the multimedia data And the image pattern stored in the storage means. The creation means creates index information that associates the multimedia data that matches the result of the comparison by the comparison means with the identification information of the audio pattern and / or image pattern.
[0007]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings.
[0008]
FIG. 1 shows a system configuration diagram of an embodiment of the present invention. In FIG. 1, the stored image retrieval system includes a
[0009]
Next, a content data creation method will be described. FIG. 2 shows a block diagram of the
[0010]
As shown in FIG. 2, the
[0011]
The audio data is recorded in the
[0012]
The voice
[0013]
The encoded audio data and image data are multiplexed by the multiplexing
[0014]
FIG. 5 shows a data format example. As shown in FIG. 5, index data, image data, and audio data are each divided into 48-byte streams called packets. This includes the 5-
[0015]
FIG. 6 shows a flowchart of the multimedia data creation process.
[0016]
In FIG. 6, multimedia data is input, and multimedia data file creation processing is started (step 400). A motion amount is acquired from the image data by a motion amount acquisition process (step 4100). FIG. 7 shows an outline of the motion amount detection process. In FIG. 7, the image data from the
[0017]
After the index creation process, the completion of multimedia data creation is determined in the multimedia data creation end judgment process in
[0018]
Next, a process for registering a plurality of multimedia data files (search information registration) will be described with reference to FIG. FIG. 9 shows a flowchart of the search information registration process.
[0019]
In FIG. 9, when the search information registration process is started, a file registration process is performed in the content creation terminal 3 (step 5100). The file registration process is a process of registering the file name and title in the multimedia data file created by the
[0020]
At the time of retrieval, a desired image can be obtained by referring to the retrieval information management table to select a file name including the keyword input from the
[0021]
FIG. 11 is a block diagram of multimedia data search information registration processing according to the second embodiment. In the second embodiment, a configuration in which already created multimedia data is received and a keyword is registered is shown.
[0022]
Multimedia data created by other than this system is separated into image data and audio data by a
[0023]
【The invention's effect】
By using the image search system of the present invention, it is possible to automatically register keywords when creating multimedia without registering keywords and feature data when searching for multimedia data. Furthermore, by selecting a keyword based on voice data and the amount of movement, registration is possible without inserting excessive search data.
[Brief description of the drawings]
FIG. 1 is a system configuration diagram of an image search system. FIG. 2 is a block diagram of a content creation unit. FIG. 3 is a block diagram of a pattern comparison unit. FIG. 4 is an explanatory diagram showing an example of a multimedia data multiplexing format. Explanatory diagram showing an example of multimedia file data format [FIG. 6] File creation processing flow diagram [FIG. 7] Motion amount detection processing block diagram [FIG. 8] Explanatory diagram showing an example of index data creation [FIG. 9] Search information registration processing flow FIG. 10 is an explanatory diagram showing an example of a search information management table. FIG. 11 is a pattern comparison block diagram of files created by other than this system.
FIG. 12 is an explanatory diagram of an audio pattern and an image pattern.
DESCRIPTION OF
4720
4730
Claims (5)
検索のときに利用するためのキーとなるあらかじめ定めた音声パターンと画像パターンとを記憶する記憶手段と、前記符号化手段で前記マルチメディアデータを圧縮符号化するときに、当該マルチメディアデータの音声データと、前記記憶手段に記憶する音声パターンとを比較し、当該マルチメディアデータの画像データと、前記記憶手段に記憶する画像パターンとを比較する比較手段と、前記比較手段で比較した結果、一致した前記マルチメディアデータと前記音声パターンおよび前記画像パターンとを関連づけるインデックス情報を作成する作成手段とを有し、
前記記憶手段は、前記音声パターンおよび前記画像パターンに対して1または2以上のキーワード情報をあらかじめ記憶し、
前記比較手段は、当該マルチメディアデータの音声データと、前記記憶手段に記憶する音声パターンとを比較し、一致した音声パターンに対応するキーワード情報を検出し、当該キーワード情報に対応する画像パターンと、前記マルチメディアデータの画像データとを比較し、
前記作成手段は、前記比較手段で一致した画像パターンのキーワード情報を含む前記インデックス情報を作成する、
ことを特徴とする画像検索システム。In an image search system comprising: encoding means for compressing and encoding multimedia data including image data and audio data; and storage means for storing the compressed and encoded multimedia data.
Storage means for storing a predetermined sound pattern and image pattern that are keys for use in the search, and sound of the multimedia data when the encoding means compresses and encodes the multimedia data As a result of comparing the data with the sound pattern stored in the storage means, comparing the image data of the multimedia data with the image pattern stored in the storage means, and the comparison means. Creating means for creating index information that associates the multimedia data with the audio pattern and the image pattern;
The storage means stores in advance one or more keyword information for the voice pattern and the image pattern,
The comparison unit compares the audio data of the multimedia data with the audio pattern stored in the storage unit, detects keyword information corresponding to the matched audio pattern, and an image pattern corresponding to the keyword information; Compare the image data of the multimedia data,
The creating means creates the index information including keyword information of the image pattern matched by the comparing means;
An image search system characterized by that.
前記端末は、検索のときに利用するためのキーとなるあらかじめ定めた音声パターンと、画像パターンと、前記音声パターンおよび前記画像パターンに対して1または2以上のキーワード情報とをあらかじめ記憶しておく記憶部と、制御部と、を備え、
前記制御部が、前記マルチメディアデータの音声データと、前記音声パターンとを比較し、一致した音声パターンに対応するキーワード情報を検出し、当該キーワード情報に対応する画像パターンと、前記マルチメディアデータの画像データとを比較し、一致した画像パターンのキーワード情報を当該マルチメディアデータと関連付けるインデックス情報を作成する、ことを特徴とする画像蓄積方法。An image storage method in a terminal for compressing and storing multimedia data including image data and audio data,
The terminal stores in advance a predetermined voice pattern, which is a key to be used for search, an image pattern, and one or more keyword information for the voice pattern and the image pattern. A storage unit, a control unit,
The control unit compares the audio data of the multimedia data with the audio pattern, detects keyword information corresponding to the matched audio pattern, detects an image pattern corresponding to the keyword information, and the multimedia data An image storage method comprising comparing image data and creating index information that associates keyword information of a matched image pattern with the multimedia data.
前記制御部が、前記マルチメディアデータを圧縮符号化するときに、当該マルチメディアデータの画像の動き量があらかじめ定めた動き量以上であることを検出し、
前記制御部が、前記検出が行われたときに当該マルチメディアデータのインデックス情報を作成する、ことを特徴とする画像蓄積方法。The image storage method according to claim 4,
When the control unit compresses and encodes the multimedia data, the controller detects that the amount of motion of the image of the multimedia data is equal to or greater than a predetermined amount of motion,
The image storage method, wherein the control unit creates index information of the multimedia data when the detection is performed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001086271A JP4053251B2 (en) | 2001-03-23 | 2001-03-23 | Image search system and image storage method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001086271A JP4053251B2 (en) | 2001-03-23 | 2001-03-23 | Image search system and image storage method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002288185A JP2002288185A (en) | 2002-10-04 |
JP4053251B2 true JP4053251B2 (en) | 2008-02-27 |
Family
ID=18941678
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001086271A Expired - Lifetime JP4053251B2 (en) | 2001-03-23 | 2001-03-23 | Image search system and image storage method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4053251B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4621607B2 (en) * | 2005-03-30 | 2011-01-26 | 株式会社東芝 | Information processing apparatus and method |
JP5124238B2 (en) * | 2007-11-09 | 2013-01-23 | 株式会社日立製作所 | Backup execution determination system |
CN105157742B (en) * | 2014-04-29 | 2021-03-23 | 杭州美盛红外光电技术有限公司 | Identification device and identification method |
JP6530357B2 (en) * | 2016-09-06 | 2019-06-12 | 株式会社日立ビルシステム | Maintenance work management system and maintenance work management device |
-
2001
- 2001-03-23 JP JP2001086271A patent/JP4053251B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002288185A (en) | 2002-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1357542B1 (en) | A video retrieval data generation apparatus and a video retrieval apparatus | |
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
US7248782B2 (en) | Image retrieving apparatus, image retrieving method and recording medium for recording program to implement the image retrieving method | |
EP1081960A1 (en) | Signal processing method and video/voice processing device | |
US20020051081A1 (en) | Special reproduction control information describing method, special reproduction control information creating apparatus and method therefor, and video reproduction apparatus and method therefor | |
KR100782286B1 (en) | Information retrieving/processing method, retrieving/processing device, storing method and storing device | |
JP2000516434A (en) | Visible indexing system | |
JP2000516435A (en) | Key Scene Detection and Frame Filtering for Visible Indexing System | |
KR101812103B1 (en) | Method and program for setting thumbnail image | |
JP2010068434A (en) | Metadata editing device and method for generating metadata | |
KR20100015666A (en) | Method to transmit video data in a data stream and associated metadata | |
JP2868981B2 (en) | Apparatus and method for generating compressed signal and apparatus and method for reproducing | |
US20040076399A1 (en) | Motion picture recording/reproduction apparatus | |
CN1378178A (en) | Picture searching equipment | |
JP4053251B2 (en) | Image search system and image storage method | |
JP6168453B2 (en) | Signal recording apparatus, camera recorder, and signal processing apparatus | |
JP2009225116A (en) | Video recording device with network transmission function | |
US20030163480A1 (en) | Meta data creation apparatus and meta data creation method | |
US7050700B2 (en) | Picture compression managing apparatus and picture compression managing method used therefor | |
KR100713501B1 (en) | Method of moving picture indexing in mobile phone | |
JP2003289495A (en) | Moving picture processing apparatus | |
CN1728824B (en) | Data processing method, and its system | |
JP3166572B2 (en) | Video / audio compression device | |
KR100239120B1 (en) | Device and method for reproducing image record of digital camera | |
JP2002175304A (en) | Image-retrieving device and its method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040810 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070302 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071005 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071205 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4053251 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101214 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111214 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121214 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131214 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |