JPH08335223A - Image retrieval system - Google Patents
Image retrieval systemInfo
- Publication number
- JPH08335223A JPH08335223A JP7141592A JP14159295A JPH08335223A JP H08335223 A JPH08335223 A JP H08335223A JP 7141592 A JP7141592 A JP 7141592A JP 14159295 A JP14159295 A JP 14159295A JP H08335223 A JPH08335223 A JP H08335223A
- Authority
- JP
- Japan
- Prior art keywords
- image
- search
- data
- area
- composition data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は、メモリーに蓄積されて
いる画像データを電子計算機を用いて画像検索を可能と
する方法及び装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and apparatus for enabling image retrieval of image data stored in a memory using an electronic computer.
【0002】[0002]
【従来の技術】一般に、画像データを検索する場合にお
いて、従来の画像検索方法には以下が挙げられる。検索
したい画像自体を検索キーとして、それが被検索画像中
に含まれているかをマッチングによって判定して検索し
画像を取りだす方法と、キーワードを検索キーとしてあ
らかじめ画像に付加されたキーワードを検索して画像を
取りだす方法である。2. Description of the Related Art Generally, in the case of retrieving image data, the conventional image retrieval method is as follows. Using the image itself that you want to search as a search key, determine whether it is included in the searched image by matching and retrieve it to retrieve the image, and search the keyword added in advance to the image using the keyword as the search key. This is a method of extracting an image.
【0003】前者は、検索したい画像が手元に用意され
ている場合には使用できるが、それがない場合には検索
自体が不可能になってしまう。後者は、検索したい画像
が手元になくても検索できるが、画像に付加されたキー
ワードに完全または部分的に一致しない限り検索したい
画像の候補すら得ることができない。また、もっと意味
上の上位概念を表わしたキーワードが付加されていると
画像候補が非常に多くなってしまいやはり画像検索が破
綻してしまう。The former can be used when an image to be searched is prepared at hand, but if it is not available, the search itself becomes impossible. The latter can search even if the image to be searched is not at hand, but even if it does not match the keyword added to the image completely or partially, it is not possible to obtain even the candidate of the image to be searched. Further, if a keyword representing a more semantically higher concept is added, the number of image candidates becomes so large that the image search also fails.
【0004】問題を整理すると、手元に検索したい画像
がない場合においては、キーワードによって検索する手
段が有効であるが、しかし欲しい画像を指定するには画
像の自由度を適切に表わし切れないことが原因で画像検
索が破綻してしまうということである。In order to sort out the problem, when there is no image to be searched at hand, a means for searching by keyword is effective, but the degree of freedom of the image cannot be adequately expressed in order to specify the desired image. This means that the image search will fail due to the cause.
【0005】[0005]
【発明が解決しようとする課題】例えば、カタログ作成
や公告イメージやCM作成など画像をアレンジして新た
な画像を作りあげる分野の作業においては、作成者のイ
メージに合った画像サンプルが容易に検索できる方法が
必要不可欠となる。この場合、検索キーとなるものは本
人の画像イメージしかないため、画像のマッチングによ
る検索は使用できない。すると必然的に、キーワードな
どで検索するか、検索キーを作成してそれを使用するこ
とによって検索する方法が必要となる。For example, in work in the field of creating new images by arranging images, such as cataloging, publicity images, and CM creation, it is possible to easily retrieve image samples that match the image of the creator. Method becomes essential. In this case, since the only search key is the image of the person himself / herself, the search by image matching cannot be used. Then, inevitably, a method of searching by using a keyword or creating a search key and using it is necessary.
【0006】本発明は、このような状況において、メモ
リーに蓄積されている画像データを電子計算機を用いて
画像検索を可能とする方法及び装置を提供しようとする
ものである。The present invention is intended to provide a method and apparatus for enabling image retrieval of image data stored in a memory by using an electronic computer in such a situation.
【0007】[0007]
【課題を解決するための手段】本発明では、前述したキ
ーワードに代えて、画像の構図を利用しようとするもの
である。画像にキーワードを付すことは、その時の付与
の考え方を正しく理解しないと適切なキーワードが選べ
ないが、画像の構図という概念で見ると、検索したい人
が持つ構図の概念と、画像に付加されるべき構図の概念
は、図を構成する要素と配置の組合せを意味する「構
図」という点で共通するから、被検索画像に構図データ
を付加しておけば、検索したい画像の構図を表現するデ
ータを作成し、それを検索キーとして使用することによ
って画像の検索が可能となる。The present invention intends to utilize the composition of an image instead of the above-mentioned keyword. To attach a keyword to an image, you cannot select an appropriate keyword unless you properly understand the concept of attachment at that time, but when you look at the concept of image composition, it is added to the image and the concept of the composition that the person who wants to search has. Since the concept of power composition is common in that it is a composition that means a combination of elements and arrangements that make up the drawing, if composition data is added to the image to be searched, data representing the composition of the image to be searched will be displayed. It is possible to search for an image by creating and using it as a search key.
【0008】この場合、被検索画像がどのような構図で
あると理解するか、あるいはそれを表現する表現の仕方
は人によって違ってくる可能性はあるが、画像自体をキ
ーワード出表現する場合、あるいは画像自体の意味的な
表現のようには異ならないから、だれが被検索画像に構
図データを付加したかは本質的な問題となることはな
い。In this case, there is a possibility that the composition of the searched image is understood, or the way of expressing it is different depending on the person. Or, since it does not differ from the semantic representation of the image itself, it does not matter who added the composition data to the searched image.
【0009】[0009]
【作用】データベースに格納された、画像に付加された
構図データと、検索者が付与する構図を表現する検索キ
ーとのマッチングによって画像の検索が行われる。画像
に付加された構図データと検索者が付与する検索キーと
しての構図データが一致したと判定したときに求める画
像候補であるとして検索結果が出力される。検索キーに
画像を直接使用しないため、検索キーの指定が容易であ
ること、または手元に検索キーにできる画像が存在しな
い場合にも検索が可能となることが特徴である。The image is searched by matching the composition data added to the image, which is stored in the database, with the search key representing the composition given by the searcher. When it is determined that the composition data added to the image matches the composition data as the search key given by the searcher, the search result is output as the image candidate to be obtained. Since the image is not directly used as the search key, it is easy to specify the search key, or it is possible to perform the search even when there is no image that can be used as the search key.
【0010】[0010]
【実施例】以下に本発明の実施例を説明する。Embodiments of the present invention will be described below.
【0011】図1はデータベースに格納されている2次
元静止画像データの検索を行う場合の、検索キーである
構図データ入力例を説明した図である。検索者はスクリ
ーン上の画像描画領域の限界枠101内で、多角形の辺を
表わした直線102によって閉領域106を形作る。103は同
じく多角形の頂点であり、104はその閉領域に当てがう
キーワードを入力するためのフィールド、105はそのキ
ーワードである。FIG. 1 is a view for explaining an example of composition data input as a search key when searching for two-dimensional still image data stored in a database. The searcher forms a closed region 106 by a straight line 102 representing the side of a polygon within the limit frame 101 of the image drawing region on the screen. Reference numeral 103 is also a vertex of a polygon, 104 is a field for inputting a keyword applicable to the closed region, and 105 is the keyword.
【0012】この例では、キーワードとして、「山」と
いう一般名称と属性として「暗い」というその山の様子
が入力されている。この領域とキーワードのセットが、
検索者が与える構図データの一つを構成しており、これ
らの組合せを、以降、構図データセットと呼ぶ。この例
の構図データは、画像の中央部からやや左よりの領域に
かけて山が描かれており、その山は暗いイメージである
ことを意味する。データベースに格納されている2次元
静止画像データの領域とキーワードがこれと一致したと
判定されたときに、検索者が指定した構図データセット
で要求された画像が検索されたものとしてその2次元静
止画像データを出力するものとする。In this example, the general name "mountain" is input as the keyword and the appearance of the mountain "dark" is input as the attribute. This area and set of keywords
It constitutes one of the composition data given by the searcher, and a combination of these is hereinafter referred to as a composition data set. In the composition data of this example, mountains are drawn from the central part of the image to the region slightly to the left, which means that the mountains are dark images. When it is determined that the area of the two-dimensional still image data stored in the database and the keyword match, it is assumed that the image requested by the composition data set specified by the searcher has been retrieved and the two-dimensional still image is retrieved. Image data shall be output.
【0013】この例では、さらに「街」をキーワードと
した領域も示されているように、検索者は、複数の構図
データによる構図データセットを指定して検索すること
もできる。In this example, the area where "town" is used as a keyword is also shown, and the searcher can also search by designating a composition data set composed of a plurality of composition data.
【0014】図2は、検索結果の出力の表示の様子の一
例を説明している。201は縮小した検索結果の画像であ
る。202は、その画像の名称や属性などの説明が表示さ
れるフィールドである。この例に示すように、複数個の
検索結果が得られることになり、この数は、検索の一致
の程度をどのように制御するかにより、変化するが、こ
の点は後述する。得られた縮小画像201は、この画像自
体がスクリーン上のスイッチとなっており、ポインター
にてその部分をクリックすると、その画像について、縮
小前の画像を表示することができる。こうして、検索者
は、より詳細に検索結果の画像を観ることができる。FIG. 2 illustrates an example of how the search result output is displayed. 201 is a reduced image of the search result. 202 is a field in which a description such as the name and attribute of the image is displayed. As shown in this example, a plurality of search results are obtained, and this number changes depending on how to control the degree of matching of the search, which will be described later. In the obtained reduced image 201, this image itself is a switch on the screen, and when the portion is clicked with the pointer, the image before reduction can be displayed. In this way, the searcher can view the image of the search result in more detail.
【0015】図3は、検索結果の詳細表示の一例を説明
している。301は検索画像が表示される表示領域の限界
枠、302は画像の名称や属性または画像が示している場
所や意味など画像に関する説明が表示されるフィールド
の枠、303は検索によって得られた画像、304は、302の
フィールド内部、305はスクリーン上の描画領域の限界
枠である。図2の縮小画像201をポインターでクリック
することによって表示される画像の様子である。検索結
果が1つだけの時は、図2の縮小画像表示は省略して、
いきなりこの図3の検索結果詳細表示を行うという設定
も可能である。FIG. 3 illustrates an example of detailed display of search results. 301 is the limit frame of the display area in which the search image is displayed, 302 is the frame of the field in which the description of the image such as the name and attributes of the image or the place and meaning of the image are displayed, and 303 is the image obtained by the search , 304 are inside the field of 302, and 305 is the limit frame of the drawing area on the screen. It is a state of an image displayed by clicking the reduced image 201 of FIG. 2 with a pointer. When there is only one search result, the reduced image display of FIG. 2 is omitted,
It is also possible to make a setting that the search result details display of FIG. 3 is suddenly performed.
【0016】図4は、検索のための構図データ入力の別
の実施例である。401は描画領域の限界枠、402は領域を
示す長方形、403はその長方形によって指定された閉領
域、404はその閉領域に当てがわれるキーワードの入力
フィールド、405はそのキーワードである。図1との違
いは、閉領域の指定が任意の多角形ではなくて、長方形
となっていることである。画像上の2点を指定すること
によって、それを対角の頂点とする長方形を指定でき
る。領域を記述する方法が2点の座標で済むため非常に
記憶容量が少なくて扱い易く、かつ領域の指定する手間
が楽である。ただし、閉領域の形の自由度が限られてし
まうため、検索キーとしての構図データが画一的となる
ため、検索に対する一致の許容度をゆるめることが必要
となり、結果として、選択される出力が増えることにな
り、検索結果から所望の画像を選んでいく作業の負担が
増加する可能性がある。FIG. 4 shows another embodiment of composition data input for retrieval. 401 is a limit frame of the drawing area, 402 is a rectangle indicating the area, 403 is a closed area specified by the rectangle, 404 is an input field of a keyword applied to the closed area, and 405 is the keyword. The difference from FIG. 1 is that the specification of the closed region is not an arbitrary polygon but a rectangle. By designating two points on the image, it is possible to designate a rectangle having diagonal vertices. Since the method of describing the area is only the coordinates of two points, the storage capacity is very small, it is easy to handle, and the time and effort for specifying the area are easy. However, since the degree of freedom of the shape of the closed region is limited, the composition data as the search key is uniform, so it is necessary to loosen the matching tolerance for the search, and as a result, the selected output Therefore, the load of the work of selecting a desired image from the search results may increase.
【0017】図5は、被検索画像の構図データの作成方
法の一実施例を説明している。検索の対象となる画像
を、描画領域の限界枠501に表示する。この表示された
被検索画像から、構図データとして適切と思われる画像
の部分の配置を示す閉領域502を設定し、この閉領域の
データをフィールド511に保存する。また、その領域に
当てられたキーワードをフィールド512に保存する。505
は閉領域と閉領域データ保存フィールドとの対応関係を
示した線である。FIG. 5 illustrates an embodiment of a method of creating composition data of a searched image. The image to be searched is displayed in the limit frame 501 of the drawing area. From the displayed search target image, a closed area 502 indicating the arrangement of the portion of the image considered to be appropriate as composition data is set, and the data of this closed area is stored in the field 511. Also, the keyword assigned to the area is stored in the field 512. 505
Is a line showing the correspondence between the closed region and the closed region data storage field.
【0018】すなわち、図1との対応で説明すると、被
検索画像の領域502には暗いやまが描かれているので、
領域502の指定と、これに対するキーワード「山、暗い」
を付与するのである。これを領域503及び504に対しても
行うのである。この領域データを保存するフィールド51
1とキーワードを保存するフィールド512のデータの組合
せが、被検索画像に付された閉領域(構図の要素)の数だ
け存在しており、複数並んでテーブル化され、構図デー
タセットが構成される。That is, to explain in correspondence with FIG. 1, since a dark mountain is drawn in the area 502 of the searched image,
Specifying the area 502 and the keyword "mountain, dark" for this
Is given. This is also done for regions 503 and 504. Field 51 for storing this area data
There are as many combinations of 1 and data in the field 512 for storing keywords as there are closed areas (elements of composition) attached to the image to be searched, and a plurality of them are tabulated side by side to form a composition dataset. .
【0019】検索の際、被検索者が付与する検索キー
は、実際の画像ではなくてこの被検索画像の構図データ
セットを走査することによって高速に検索することが可
能となる。検索のひとつの方法は、キーワードのフィー
ルド504を走査してマッチングによって一致するものを
探し、その後、キーワードの一致するものの中から領域
が一致すると判定されるかものがあるかどうかをフィー
ルド503をチェックして検出する方法である。At the time of search, the search key given by the search target person can be searched at high speed by scanning the composition data set of the search target image rather than the actual image. One method of searching is to scan the field 504 of the keyword to find a match by matching and then check field 503 to see if the region may be determined to match from the keyword matches. It is a method of detecting.
【0020】図6は、検索者が与える検索キーのデータ
構造の一実施例を説明している。検索キーは、検索キー
の全体の長さ、構図データの数、構図データのミスマッ
チング数許容割合、そして1つまたは複数の構図データ
で構成されている。構図データは、キーワードと多角形
の各頂点の座標データである領域データおよび領域のマ
ッチング時における位置ずれと面積ずれの許容範囲を示
すデータで構成されている。これらのずれの許容範囲を
示すデータは、あらかじめ値を設定しておき検索時に自
動的に付与されて使用される。FIG. 6 illustrates an embodiment of the data structure of the search key provided by the searcher. The search key is made up of the entire length of the search key, the number of composition data, the permissible mismatching ratio of composition data, and one or more composition data. The composition data is composed of area data, which is the coordinate data of each vertex of the polygon and the keyword, and data indicating the allowable range of the positional deviation and the area deviation when matching the areas. Data indicating the allowable range of these deviations is set in advance and automatically given and used at the time of search.
【0021】全ての構図データについてマッチングが実
行されて、実際にその許容範囲内に納まらなかったデー
タ数と構図データセットの数との割合がミスマッチング
数許容割合以下になってなっていると、構図データが一
致したと判定する。別の実施例としては、検索実行時に
あまりにもマッチングするデータが少ない場合に、動的
に許容範囲を変化させてマッチングデータを増加させる
方法がある。If matching is executed for all composition data, and the ratio of the number of data that does not actually fall within the permissible range and the number of composition data sets is less than or equal to the permissible mismatch matching number, It is determined that the composition data match. As another embodiment, there is a method of dynamically changing the allowable range and increasing the matching data when the matching data is too small when the search is executed.
【0022】本発明による画像検索システムはキーボー
ドやマウスなどによって画像入力が出来るソフトを備え
る一般の計算機によって実現できるので、その例は後述
することとし、まず、具体的な処理フローの例を説明す
る。Since the image retrieval system according to the present invention can be realized by a general computer equipped with software capable of inputting an image with a keyboard, a mouse, etc., an example thereof will be described later. First, an example of a concrete processing flow will be explained. .
【0023】図7は、構図データ検索装置の一実施例の
フローチャートである。801はひとつの構図データの入
力を示している。構図データの入力は図1で説明したよ
うに、領域を指定し、その領域にキーワードを指定した
ものを構図データとする。これを、検索者が、検索した
い画像を特定するために必要と思うだけ入力することが
必要であり、802は全ての構図データを入力したかどう
かの問合せである。この問合せ802に代え、通常は、一
つの構図データの入力では、まだ構図データが全て入力
されていないと見なして閉領域の入力待ちになるが、キ
ーボード上の終了キーを押したり、スクリーン上の終了
アイコンをポインターでクリックしたりすることによっ
て次の画像検索へと移るように実装することもできる。
803は構図データによる画像検索とその結果表示であ
る。804にて画像検索を終了するかどうかを聞いてく
る。終了でなければ最初に戻る。FIG. 7 is a flow chart of an embodiment of the composition data search device. Reference numeral 801 indicates the input of one composition data. As described in FIG. 1, the composition data is input by designating an area and designating a keyword in the area. It is necessary for the searcher to input as many as necessary to specify the image to be searched, and 802 is an inquiry as to whether or not all composition data has been input. Instead of this inquiry 802, normally, when one composition data is input, it is considered that all the composition data has not been input yet, and the system waits for the input of the closed area. However, pressing the end key on the keyboard or on the screen It is also possible to implement to move to the next image search by clicking the end icon with the pointer.
Reference numeral 803 is an image search by composition data and display of the result. At 804, you will be asked if you want to end the image search. If not finished, return to the beginning.
【0024】フローチャートでは、803の画像検索及び
結果表示がサブルーチンの記号で描かれているが、ここ
でのフローチャートは実装方法までは指定しない。従っ
て、それはサブルーチンという形で実装されてもいい
し、インライン展開という形で実装されてもいい。以下
のフローチャートを説明する図においても同様である。In the flow chart, the image search and result display of 803 are drawn by the symbol of the subroutine, but the flow chart here does not specify the mounting method. Therefore, it may be implemented in the form of a subroutine or inline expansion. The same applies to the drawings for explaining the following flowcharts.
【0025】図8は2次元静止画像の場合の画像検索と
結果表示の方法の一実施例を示したフローチャートであ
り、図7における処理803の一例である。901は構図デー
タによる画像マッチングのために画像を適当数用意する
処理であり、図5のテーブルに示すような、画像に付与
された構図データをデータベースから用意することであ
る。902は画像に付与された構図データと、検索キーと
しての構図データとの比較により、画像マッチングを実
行するブロックである。903は画像がマッチングしたか
否かを判定する。904はマッチングした場合に、その検
索した画像を保存しておくブロックである。905は検索
結果の表示を行うブロックである。以下、同じ構図デー
タを用いて検索を続ける限り最初から繰り返す。906に
よる検索停止の条件は、マッチングした画像が設定枚数
までたまった場合や時間制限に達した場合、または検索
者による検索の停止の指示があった場合などである。FIG. 8 is a flow chart showing an embodiment of a method of image retrieval and result display in the case of a two-dimensional still image, which is an example of the process 803 in FIG. Reference numeral 901 denotes a process of preparing an appropriate number of images for image matching based on the composition data, and preparing composition data attached to the images from the database as shown in the table of FIG. A block 902 executes image matching by comparing the composition data attached to the image with the composition data as a search key. 903 determines whether the images match. A block 904 stores the searched image when matching is performed. Reference numeral 905 is a block for displaying the search result. Hereinafter, as long as the search is continued using the same composition data, the process is repeated from the beginning. The condition for stopping the search by 906 is, for example, when the number of matched images has reached the set number, when the time limit is reached, or when the searcher gives an instruction to stop the search.
【0026】図9は2次元静止画像の場合の構図データ
による画像マッチングの方法の一実施例を示したフロー
チャートであり、図8における処理902の一例であ
る。1001は図6に示す検索キーの複数の構図データの中
からひとつの構図データを取りだす部分である。1002は
キーワードが一致する部分が存在するかどうかの判定で
ある。もし一致した部分が存在しているならその領域に
ついて1003へ進む。1003は、検索キーの全ての閉領
域と実際の画像の大きさを一致させるものである。10
04は、検索キーの1つの構図データの閉領域重心と被
検索画像に付与された構図データの閉領域の重心との位
置ずれを計算していて、その位置ずれがあらかじめ設定
しておいた許容範囲内であれば位置が一致していると判
定する。1005は、同じく双方の領域の面積について大き
な面積を小さな面積で割ったその面積比が、あらかじめ
設定しておいた許容範囲内であったなら面積が一致して
いると判定する。1006は、構図データセットの一致カウ
ンターである。複数の構図データのうち、何個の構図デ
ータがマッチングしたかを計数するためのカウンターで
ある。1007は、検索キーに含まれる全ての構図データに
ついてマッチングを実行したか否かを判定する。それは
構図データの数をカウントしていくことによって実現で
きる。1008は、1006で計数したマッチングのカウンター
数を検索キー内の構図データ数で割った割合が、あらか
じめ設定しておいた許容範囲内に納まっていれば、構図
が一致したとみなして一致判定を返す。そうでなければ
不一致判定を返す。あらかじめ設定していた許容範囲と
は、例えば図6のミスマッチ数許容範囲を使用するなら
1からその値を引いたものが使用できる。FIG. 9 is a flowchart showing an embodiment of an image matching method using composition data in the case of a two-dimensional still image, which is an example of the process 902 in FIG. Reference numeral 1001 is a portion for extracting one composition data from a plurality of composition data of the search key shown in FIG. 1002 is a determination as to whether or not there is a portion where the keywords match. If there is a match, proceed to 1003 for that area. Reference numeral 1003 is for matching all the closed areas of the search key with the actual image size. 10
Reference numeral 04 calculates the positional deviation between the closed area centroid of the composition data of one of the search keys and the closed area centroid of the composition data attached to the searched image, and the positional deviation is set in advance. If it is within the range, it is determined that the positions match. Similarly, if the area ratios obtained by dividing a large area by a small area for the areas of both areas are within a preset allowable range, 1005 determines that the areas match. 1006 is a composition data set coincidence counter. It is a counter for counting how many pieces of composition data among a plurality of composition data are matched. 1007 determines whether matching has been performed for all composition data included in the search key. This can be realized by counting the number of composition data. If the ratio of the number of matching counters counted in 1006 divided by the number of composition data in the search key is within the preset allowable range, the 1008 considers the composition to be a match and judges the match. return. Otherwise, a non-matching judgment is returned. As the allowable range set in advance, for example, if the mismatch number allowable range of FIG. 6 is used, one obtained by subtracting the value can be used.
【0027】図10は2次元静止画像の場合の構図デー
タによる画像マッチングの方法の別の一実施例を示した
フローチャートである。1101〜1103はそれぞれ1001〜10
03と同様である。1104は、領域の面積比の離れ具合と位
置の離れ具合とのそれぞれの評価基準を求める部分であ
る。ここでは、検索キーの構図データの領域面積をS1,
被検索画面に付与された構図データの領域をS2とする
と、A=max(S1/S2,S2/S1)に選ぶことができる。また、S
1、S2の領域の重心座標を G1(G1x,G1y), G2(G2x,G2y)と
おくと、B=sqrt((G1x-G2x)**2+(G1y-G2y)**2)で定義す
ることができる。ここで、sqrt、**はそれぞれ平方根と
羃乗を表わしている。1105は、エネルギー関数Eを、予
め重みWa,Wbを与えておいて E=Wa*A + Wb*Bのように定
義しそれが予め設定しておいた値よりも小さくなった場
合に、その構図データセットが一致したと判定する。11
06〜1108については、1006〜1008とそれぞれ同様であ
る。FIG. 10 is a flow chart showing another embodiment of the image matching method using composition data in the case of a two-dimensional still image. 1101 to 1103 are 1001 to 10 respectively
Same as 03. Reference numeral 1104 is a part for obtaining evaluation criteria for the degree of separation of the area ratio of the regions and the degree of separation of the positions. Here, the area size of the composition data of the search key is S1,
If the area of the composition data added to the searched screen is S2, A = max (S1 / S2, S2 / S1) can be selected. Also, S
If the barycentric coordinates of the area of 1 and S2 are G1 (G1x, G1y), G2 (G2x, G2y), B = sqrt ((G1x-G2x) ** 2+ (G1y-G2y) ** 2) can do. Here, sqrt and ** represent square root and power, respectively. 1105 defines the energy function E by giving weights Wa and Wb in advance and defining it as E = Wa * A + Wb * B, and when it becomes smaller than a preset value, the It is determined that the composition datasets match. 11
06 to 1108 are the same as 1006 to 1008, respectively.
【0028】図11は、構図による画像検索システムの
一実施例の外観図の模式図である。1201は表示装置、12
02、1207は表示装置によって表示された構図入力画面、
検索結果表示画面、1203は構図データ付き画像データベ
ースの格納と、検索結果として得られた画像を保存する
のに使用される記憶装置である。これにはデータベース
を格納しているハードディスクと、検索画像を保存する
フロッピーディスクまたは光磁気ディスクなどの着脱可
能な記憶装置が付いている。1204はキーワードなどを入
力する際に使用するキーボード、1205は領域指定の際に
使用する座標入力装置のマウスである。1206は、検索画
像や検索条件などを出力するプリンターである。FIG. 11 is a schematic diagram of an external view of an embodiment of the image retrieval system by composition. 1201 is a display device, 12
02 and 1207 are composition input screens displayed by the display device,
A search result display screen, 1203, is a storage device used for storing an image database with composition data and for saving images obtained as search results. It is equipped with a hard disk that stores the database and a removable storage device such as a floppy disk or magneto-optical disk that stores the search images. Reference numeral 1204 is a keyboard used when inputting a keyword and the like, and 1205 is a mouse of a coordinate input device used when specifying an area. A printer 1206 outputs a search image and search conditions.
【0029】この装置により、例えば、図5で示した方
法に依り、被検索画面に画像データを付与し、これをハ
ードディスクに記憶させる。また、図1で説明した方法
に依り、検索用の画像データを作成して検索を実施す
る。With this apparatus, for example, by the method shown in FIG. 5, image data is added to the searched screen and stored in the hard disk. Further, according to the method described with reference to FIG. 1, image data for search is created and the search is performed.
【0030】図12は被検索画像に構図データを付加す
る他の例を説明したものである。1301はスクリーンの描
画領域の限界枠、1302は表示領域で、被検索画像が表示
されている。1303は構図データの閉領域を指定した長方
形である。1304は画像の一部分である画像要素で「雲」
が描画されている。1303の長方形によって指定された閉
領域は、画像要素の「雲」を領域によって指定してい
る。1305はキーワードがどの領域に対応しているかを示
す矢印である。1306はキーワードを入力するフィールド
の枠、1307はそのフィールドを示している。閉領域1303
によって指定される領域が十分な広さを持っていないな
ど、フィールド1306を直に閉領域内に置くことができな
い場合には、1305の矢印によって図のように差し示すこ
ともできる。このような作業を各画像要素に対して繰り
返すことによって、被検索画像の構図データを完成す
る。FIG. 12 illustrates another example of adding composition data to the searched image. 1301 is a limit frame of the drawing area of the screen, and 1302 is a display area in which the searched image is displayed. Reference numeral 1303 is a rectangle designating a closed area of composition data. 1304 is an image element that is a part of the image and is a "cloud".
Is drawn. The closed area specified by the rectangle 1303 specifies the "cloud" of the image element by the area. Reference numeral 1305 is an arrow indicating which area the keyword corresponds to. Reference numeral 1306 indicates a frame of a field for inputting a keyword, and 1307 indicates the field. Closed area 1303
If the field 1306 cannot be placed directly within the closed area, such as the area specified by is not large enough, it can also be indicated as indicated by the arrow at 1305. By repeating such work for each image element, the composition data of the searched image is completed.
【0031】図13は、被検索画像の構図データの構造
の一実施例を説明している。構図データ群は、構図デー
タの全体の長さ、構図データの数、そして1つまたは複
数の構図データで構成されている。構図データは、領域
データの長さ、多角形の各頂点の座標データである領域
データ、キーワードの数と、そしてその数だけ存在して
いるキーワード列で構成されている。画像ヘッダーは、
画像がどのようなものであるかを示したものである。実
際は、ヘッダーと画像データ併せて既に存在している画
像データ形式を採用することもできる。FIG. 13 illustrates an embodiment of the structure of the composition data of the searched image. The composition data group is composed of the entire length of the composition data, the number of composition data, and one or more composition data. The composition data is composed of the length of the area data, the area data that is the coordinate data of each vertex of the polygon, the number of keywords, and the keyword string that exists by that number. The image header is
It shows what the image looks like. In fact, the image data format that already exists can be adopted for both the header and the image data.
【0032】ただし、その際にも画像全体に対して付け
られた画像の名称、そして場所や作者、日付などの属性
を付加しておく。ところで図13の例では画像ヘッダー
は、その長さ、画像データの名称や属性、画像のX軸の
画素数、画像のY軸の画素数1画素当りの色データの
数、カラーマップの長さ、カラーマップ、によって構成
されている。1画素当りの色データの数とは、ビットマ
ップなら2個、フルカラー画像であるとRGBの各色毎
に8ビットの輝度情報によって色が表現されているので
24個ということになる。カラーマップとは、画像デー
タと実際のフルカラー画像などの色との対応を示した対
応表のことであり、これによって1画素当りの色データ
数が8個だとしても実際に色データ1個に割りあてられ
る色はもっと多彩なものを表現することができる。もち
ろん、同時に発色できる色の数は、その場合256色で
ある。画像データには、画像ヘッダーで指定された構造
を持ったデータが置かれている。However, at that time, the name of the image given to the entire image and the attributes such as the place, the author, and the date are added. By the way, in the example of FIG. 13, the image header has its length, the name and attribute of the image data, the number of pixels on the X axis of the image, the number of pixels on the Y axis of the image, the number of color data per pixel, and the length of the color map. , Colormap ,. The number of color data per pixel is two in the case of a bitmap and 24 in the case of a full-color image because the color is represented by 8-bit luminance information for each color of RGB. A color map is a correspondence table showing the correspondence between image data and the colors of an actual full-color image, etc. Even if the number of color data per pixel is eight, one color data is actually obtained. The colors that can be assigned can express a wider variety. Of course, the number of colors that can be developed simultaneously is 256 in that case. In the image data, data having a structure designated by the image header is placed.
【0033】ところで、被検索画像の構図データは必ず
しも被検索画像データと一緒にある必要はない。例え
ば、構図データの先頭に被検索画像データが納められて
いる記録装置上の階層や位置を示したポインターを持っ
ているという実装の方法でも可能である。この方法なら
画像データベースには画像データのみを入れておき、構
図データのデータベースには画像データベース上の画像
の位置を示したポインターを含む構図データだけを保存
しておけばよくなる。構図データのデータベースに画像
自身を置く必要がなくなるので、記憶容量の節約に寄与
する。By the way, the composition data of the searched image does not necessarily have to be included with the searched image data. For example, an implementation method is possible in which a pointer indicating the hierarchy or position on the recording device in which the searched image data is stored is provided at the beginning of the composition data. In this method, only the image data is stored in the image database, and only the composition data including the pointer indicating the position of the image on the image database is stored in the composition data database. Since it is not necessary to store the image itself in the composition data database, it contributes to saving the storage capacity.
【0034】図14は、構図データの入力方法の他の実
施例のフローチャートである。この例では図5に示した
例に比較して領域指定が半自動化されている。1701はま
ず大まかに長方形によって領域を指定するブロック。17
02はその領域内の画像のノイズを除去する。1703は同領
域でエッヂ検出を行ない、1704はエッヂ画像の2値化と
2値化ノイズの除去を行う。1705は画像の細線化を実行
し、1706は対話的にその画像エッヂで余計なものを取り
のぞいたり必要な部分を補ったりして修正を施し、1707
エッヂを補間して閉領域を作成する。1708はその指定し
た領域を表示して、その領域で希望の画像要素を指定で
きているかを確認できるようにしている。1709は、その
結果が望み通りのものであったなら終了し、そうでなか
ったなら1706の修正のブロックまで戻る。1710は閉領域
が確定し終了したらその領域にキーワードを作成し付加
する。FIG. 14 is a flowchart of another embodiment of the composition data input method. In this example, the area designation is semi-automatic as compared with the example shown in FIG. 1701 is a block that roughly specifies a region by a rectangle. 17
02 removes the noise of the image in the area. 1703 performs edge detection in the same area, and 1704 binarizes the edge image and removes binarized noise. 1705 performs thinning of the image, 1706 interactively removes unnecessary things in the image edge and supplements necessary parts to make corrections.
Interpolate the edges to create a closed area. The 1708 displays the designated area so that it can be confirmed whether a desired image element can be designated in the area. 1709 ends if the result is what you want, and if not, returns to the block of corrections in 1706. 1710 creates and adds a keyword to the area when the closed area is determined and completed.
【0035】この実施例では、半自動化された複雑なア
ルゴリズムを示した。もちろん、長方形、あるいは多角
形や曲線などによって閉領域を指定して画像のエッヂな
どを用いない方法も別の実施例として挙げられる。In this example, a semi-automated complex algorithm was shown. Of course, a method of designating a closed region by using a rectangle, a polygon, a curve, or the like and not using an edge of an image can be given as another embodiment.
【0036】図15は、被検索画像に構図データを付加
する画像タグ作成システムの外観を説明している。ここ
で言う画像タグは、構図データを意味するが、以後適宜
画像タグあるいは画像データの用語を使用する。図11
で説明した構図データによる画像検索システムに比し、
画像入力装置が付加され、出力装置が省略されている
が、本質的な差異は無い。1801は表示装置、1802は表示
装置によって表示された画像タグの作成画面を示してい
る。1803は画像データベースおよび、構図データ付き画
像の記録装置である。構図データ付きの画像データベー
スがここに構築されていく。1804は構図データのキーワ
ードを入力するなどために使用するキーボード、1805は
構図データの画像要素の領域を指定するために使用する
マウス、1806は画像データを入力するための一手段であ
る8mmビデオまたは8mmビデオデッキなどである。1807
はVHSなどのビデオテープ再生機能を持ったビデオデ
ッキとLDなどの画像記録媒体の再生機能を持ったLD
プレイヤー、あるいはLDなどへ構図データ付き画像を
記録できるLD書き込み装置などが使用される。FIG. 15 illustrates the appearance of an image tag creation system for adding composition data to an image to be searched. The image tag here means composition data, but hereinafter, the terms image tag or image data will be used as appropriate. Figure 11
Compared to the image retrieval system based on the composition data described in
An image input device is added and an output device is omitted, but there is no essential difference. Reference numeral 1801 denotes a display device, and 1802 denotes an image tag creation screen displayed by the display device. 1803 is an image database and a recording device for images with composition data. An image database with composition data will be built here. 1804 is a keyboard used for inputting a keyword of composition data, 1805 is a mouse used for designating an area of an image element of composition data, and 1806 is an 8 mm video or a means for inputting image data. For example, an 8mm VCR. 1807
Is a VCR with a video tape playback function such as VHS and an LD with an image recording medium playback function such as LD
An LD writing device that can record an image with composition data on a player or an LD is used.
【0037】このシステムは図11と同様に、構図デー
タによる画像検索システムとして使用できるが、構図デ
ータによって検索して得た画像に対して、更に構図デー
タを付加し構図データ付き画像データベースへ戻すよう
にすることが可能である。構図データを付加されて保存
された構図データ付き画像データは構図データ検索によ
って再検索が可能である。Similar to FIG. 11, this system can be used as an image retrieval system by composition data, but composition data is further added to an image obtained by retrieval by composition data and returned to the image database with composition data. It is possible to The image data with composition data added with the composition data and stored can be searched again by composition data search.
【0038】このように、一度データベース化したデー
タも更に情報を付加して充実させていくことができる。
この場合、データベースが個人使用ではなく、グループ
あるいは団体使用のものであったならさまざまな人が使
用する度にデータを充実させることができるという点
で、データベースの構築をより早くする効果が期待でき
る。As described above, it is possible to further enhance the data once made into a database by adding information.
In this case, if the database is not for individual use but for groups or groups, the data can be enriched every time various people use it, and the effect of making the database construction faster can be expected. .
【0039】図16は3次元画像の構造検索システムの
データ入出力部分について説明した模式図である。バー
チャル・リアリティというコンピュータによって作られ
た仮想空間を利用して様々な操作を行うことを可能にす
る。2001は光ファイバーによって関節の曲がりを検出で
きるデータグローブである。このデータグローブを用い
てコンピュータが作り出す3次元映像空間に立体の領域
を指定して3次元構図入力を実現する。2002は3次元画
像を投影する表示装置である。両目それぞれに微妙に違
った映像を提示することで両目の間に視差をつくり立体
映像を知覚できるようにする装置である。2003は磁気セ
ンサーである。手や頭部の位置や向きを検出するのに使
用する。2004はフットペダルである。3次元映像中をさ
も自分がその映像の中に存在しているかのように移動す
ることができるが、その際に移動スピードや方向をフッ
トペダルで指示することができる。フットペダルは1つ
または複数用意される。2つの場合には、左右それぞれ
のペダルが左右独立に付いたタイヤの動力のコントロー
ルを受けもち、仮想的にその3次元映像空間を移動する
ことができる。もちろん、その移動にともなって3次元
映像の見え方もその場にいるかのように変化する。2005
は、音声入力のためのマイクである。声または音の入力
によって、キーワードを付加したり条件を選択したりす
ることを可能にする。また、3次元映像中に仮想的な操
縦席を投影しそれを操作することによって、映像空間の
移動や、構図入力、その他の操作を行うこともできる。
その映像空間中の操作は、データグローブや磁気センサ
ーによる入力から構築され、人の動作を検出することに
よって実現する。FIG. 16 is a schematic diagram for explaining the data input / output portion of the three-dimensional image structure retrieval system. Various operations can be performed using a virtual space created by a computer called virtual reality. 2001 is a data glove that can detect bending of joints by optical fibers. Using this data globe, a three-dimensional area is specified in a three-dimensional image space created by a computer to realize three-dimensional composition input. 2002 is a display device that projects a three-dimensional image. It is a device that creates a parallax between both eyes by presenting a slightly different image to each eye so that a stereoscopic image can be perceived. 2003 is a magnetic sensor. It is used to detect the position and orientation of the hand and head. 2004 is a foot pedal. You can move in the 3D image as if you were in the image, and at that time, you can specify the moving speed and direction with the foot pedal. One or more foot pedals are prepared. In the case of two, the left and right pedals receive the power control of the tires attached to the left and right independently, and can virtually move in the three-dimensional image space. Of course, with the movement, the appearance of the 3D image changes as if it were on the spot. 2005
Is a microphone for voice input. By inputting voice or sound, it is possible to add a keyword or select a condition. In addition, by projecting a virtual cockpit in a three-dimensional image and operating it, it is possible to move the image space, input a composition, and perform other operations.
Manipulation in the video space is realized by detecting human movements, which is constructed from data glove inputs and magnetic sensor inputs.
【0040】図17は、構図画像検索ネットワークの物
理的な接続を現わした一実施例の模式図である。2101は
ネットワークの情報伝達の媒体である。例えば、同軸ケ
ーブルや光ファイバー、あるいは電波による通信などに
よって実現される。2102は他のネットワークでありその
間を画像検索ゲートウェイ2103によって接続されてい
る。2104はタグ付き画像のデータベースであり、それを
ネットワークに送信する機能をもつ。2105はタグ付き画
像の検索装置であり画像のデータベース2104に検索機能
を付加したものである。2106は画像検索端末であり、ユ
ーザーはこの端末を利用して画像の検索を行う。FIG. 17 is a schematic diagram of an embodiment showing the physical connection of the composition image retrieval network. 2101 is a medium for transmitting information on the network. For example, it is realized by a coaxial cable, an optical fiber, or communication by radio waves. Reference numeral 2102 is another network, and the other networks are connected by an image search gateway 2103. Reference numeral 2104 is a database of tagged images, which has a function of transmitting it to the network. Reference numeral 2105 is a search device for tagged images, which is obtained by adding a search function to the image database 2104. An image search terminal 2106 is used by the user to search for images using this terminal.
【0041】画像検索端末2106から送出された構図デー
タは、画像検索ゲートウェイ2103やタグ付き画像検索装
置2105へ届き画像の検索を行う。画像検索ゲートウェイ
2103を経由して他のネットワーク2102にも送られる。The composition data sent from the image search terminal 2106 reaches the image search gateway 2103 and the image search device with tag 2105 and searches for an image. Image search gateway
It is also sent to another network 2102 via 2103.
【0042】検索のために被検索画像データの通る一つ
の経路は、タグ付き画像送信装置2104から画像検索端末
2106へ送信され検索されるものである。One route through which the image data to be searched for search is from the image transmitter with tag 2104 to the image search terminal.
It is sent to 2106 and searched.
【0043】検索のもう一つの経路は、タグ付き画像検
索装置2105によって検索されマッチングした画像が画像
検索端末2106へ送られ必要なら更に検索を受けて検索が
完了するものである。The other route of the search is to send the matching image searched by the image search device with tag 2105 to the image search terminal 2106, and if necessary, further search to complete the search.
【0044】検索の更にもう一つの経路は、他のネット
ーワーク2102から送られてきた画像を画像検索ゲートウ
ェイ2103で検索を行ない、ネットワーク2101に転送し
て、それが画像検索端末2106へと届けられるものであ
る。As another route of the search, the image sent from another network 2102 is searched by the image search gateway 2103, transferred to the network 2101, and delivered to the image search terminal 2106. It is a thing.
【0045】画像検索ゲートウェイ2103は、他の物理的
に分けられたネットワークの間に接続されているとデー
タ転送のトラフィック緩和効果によって効率がよいが、
効率を考えなければ一つのネットワークから被検索画像
を入力し、同じネットワークに検索済画像を送出するこ
とも可能である。If the image retrieval gateway 2103 is connected between other physically separated networks, it is efficient due to the traffic mitigation effect of data transfer,
If the efficiency is not considered, it is possible to input the searched image from one network and send the searched image to the same network.
【0046】図18は、構図画像検索ネットワークの情
報伝達上の形状を表した一実施例の模式図である。画像
検索端末2201を頂点とした木構造の上に情報が伝達して
いく。情報伝達上の経路2202は画像検索端末2201と次の
画像検索ゲートウェイ2203を結ぶものである。木構造の
末端には、タグ付き画像検索装置2204やタグ付き画像送
信装置など画像データベースを持った装置が接続され
る。木構造の枝わかれのそれぞれに画像検索ゲートウェ
イ2203が配置される。画像データは検索され絞り込みつ
つ情報伝達の枝を登ってゆき頂点の画像検索端末へ到達
すると検索キーに設定したデータに絞り込まれることに
なる。FIG. 18 is a schematic diagram of an embodiment showing the information transmission shape of the composition image retrieval network. Information is transmitted on the tree structure with the image search terminal 2201 as the apex. The information transmission path 2202 connects the image search terminal 2201 and the next image search gateway 2203. A device having an image database, such as a tagged image search device 2204 or a tagged image transmission device, is connected to the end of the tree structure. An image search gateway 2203 is arranged at each branch of the tree structure. When the image data is searched and narrowed down, it climbs the branch of information transmission and reaches the image search terminal at the apex, and is narrowed down to the data set as the search key.
【0047】もうひとつの実施例としては、画像データ
はネットワーク上へ画像データに附属している構図デー
タのみを伝達させて検索を行ない、全ての検索条件を満
たした画像データのみをデータベースから転送するとい
う方法である。As another embodiment, as the image data, only the composition data attached to the image data is transmitted to the network for searching, and only the image data satisfying all the search conditions is transferred from the database. Is the method.
【0048】図19は、画像検索ゲートウェイの一実施
例を表したブロック図である。今仮に検索キーである構
図データが、ネットワーク2304からネットワーク通信部
2301へ届いたとする。それは、構図画像検索部2302に送
られ設定される。被検索画像は、ネットワーク通信部23
03から送り込まれ、画像毎にマッチングが行なわれ検索
が実行される。検索された画像データは、ネットワーク
通信部2301を通して検索キーである構図データの送り元
へ送り返される。これらの動作は、ネットワーク通信部
2301と2303で等価であり、反対方向から検索キーが届い
ても同様に動作を行なう。また、検索キーと被検索画像
が同じネットワークから届いても同様に動作する。FIG. 19 is a block diagram showing an embodiment of the image search gateway. Now, the composition data that is the search key is temporarily transferred from the network 2304 to the network communication unit.
Suppose it reaches 2301. It is sent to the composition image search unit 2302 and set. The searched image is the network communication unit 23.
It is sent from 03, matching is performed for each image and search is executed. The searched image data is sent back to the sender of the composition data, which is the search key, through the network communication unit 2301. These operations are performed by the network communication unit.
2301 and 2303 are equivalent, and the same operation is performed even when the search key arrives from the opposite direction. Further, even if the search key and the image to be searched arrive from the same network, the same operation is performed.
【0049】図20は、検索依頼ユーザーによる検索画
像データへの新たな構図データの付加する仕組みの一実
施例について説明した図である。2401は検索依頼元であ
りユーザーが構図データ2403の要素である構図データセ
ットa,bを設定して画像を検索する。構図画像データベ
ース2402から構図データというタグの付加された画像デ
ータ2405が送信される。Gが画像データを表わしてい
る。タグ付き画像データ2404は、検索を経て検索依頼元
2401までたどり着きユーザーの元へ提示される。FIG. 20 is a diagram for explaining an embodiment of a mechanism for adding new composition data to the search image data by the search requesting user. Reference numeral 2401 is a search request source, and the user searches for an image by setting the composition data sets a and b which are elements of the composition data 2403. Image data 2405 to which a tag of composition data is added is transmitted from the composition image database 2402. G represents image data. The tagged image data 2404 is the search request source after the search.
It reaches 2401 and is presented to the user.
【0050】ここで今、ユーザーがその画像に対して更
に構図データを付加したとする。その構図データセット
2406をcとすると、それは2407のように構図データベー
スまで戻されて、元の構図データが2408のように更新さ
れる。複数のユーザーによってネットワーク上で使用さ
る場合を想定すると、多くのユーザーが検索した画像に
構図データを付加していくことによって、どんどんデー
タベースが成長していくシステムになっている。Here, it is assumed that the user further adds composition data to the image. The composition dataset
If 2406 is c, it is returned to the composition database as in 2407, and the original composition data is updated as in 2408. Assuming that it will be used on the network by multiple users, the database will grow rapidly by adding composition data to the images searched by many users.
【0051】ただし、ユーザーによる嘘の情報の付加を
防ぐための予防処置が必要である。その一つは構図デー
タベース側での構図登録に人を介してチェックする仕組
みを入れる方法がある。別の一つは全ての構図データに
はユーザーが変更できないフィールドを設定し、構図を
付加した人のメイルアドレスや所属機関などの情報をキ
ーワードの形などで付加しておく。そして、検索するユ
ーザーがそのキーワードなどで検索範囲を指定すること
によって選択できるようにする方法である。後者の場
合、個人によって付加された情報か、公的機関や企業に
よって付加された情報かの区別ができるようにキーワー
ドを決定しておくことは、検索範囲を絞る際のひとつの
有益な分類になると思われる。However, preventive measures are required to prevent the user from adding false information. One of them is to add a mechanism to check composition registration on the composition database side through a person. The other is to set a field that cannot be changed by the user for all composition data, and add information such as the mail address of the person who added the composition and the affiliated organization in the form of a keyword. Then, it is a method that allows the user to search by selecting the search range by the keyword or the like. In the latter case, determining keywords so that it can be distinguished between information added by individuals and information added by public institutions or companies is one useful classification when narrowing the search range. I think it will be.
【0052】図21は、構図画像検索ネットワークにお
いて検索依頼元から画像検索ネットワークへ検索キーで
ある構図データを送信する仕組みの一実施例について説
明した図である。2501が検索依頼元であり構図画像検索
端末などが想定されている。ここからabcdeという5つ
の構図画像データセット2508を持った検索キーを送出す
る。するとそれが各検索ゲートウェイ2502、2503、250
4、2506を経て、構図画像データベース2505、2507など
へ伝達される。FIG. 21 is a diagram for explaining an embodiment of a mechanism for transmitting composition data as a search key from a search request source to the image search network in the composition image search network. 2501 is the search request source, and a composition image search terminal or the like is assumed. From here, a search key having five composition image data sets 2508 called abcde is transmitted. Then it will find each search gateway 2502, 2503, 250
It is transmitted to the composition image databases 2505, 2507, etc. via 4, 2506.
【0053】この説明図では、このデータベースには検
索機能があるものを考えている。検索ゲートウェイに伝
達された構図データは、その要素である構図データセッ
トの1つを採用して残りをネットワーク上の次の検索ゲ
ートウェイなどの検索手段へと転送している。ここで、
検索条件の緩いものから順に採用していくことにする
と、検索条件に合わない多くの画像データは検索条件の
厳しいものによって最初に振り分けられるためネットワ
ークを流れる画像データは少なくなる。In this illustration, it is assumed that this database has a search function. The composition data transmitted to the search gateway adopts one of the composition data sets, which is its element, and transfers the rest to the search means such as the next search gateway on the network. here,
If the search conditions are selected in ascending order, most of the image data that do not meet the search conditions will be sorted first by the ones with the strict search conditions, and the image data that flows through the network will decrease.
【0054】画像検索ネットーワークによるこの検索方
法は、情報転送速度が非常に高速なネットワークを用い
ることを想定しており、検索する時間よりもデータ転送
にかかる時間が少ない場合に非常に有効である。そのよ
うなネットワークとして例えば、並列計算機上のそれぞ
れの演算器のネットワークがある。This search method using the image search network is assumed to use a network with a very high information transfer rate, and is very effective when the time required for data transfer is shorter than the time required for the search. . As such a network, for example, there is a network of respective arithmetic units on a parallel computer.
【0055】更にもうひとつの実施例としては、検索キ
ーに含まれる検索項目、ここでいうところの構図データ
の各検索手段への割り当ては固定せずに、ネットワーク
や検索手段の負荷に応じて前後の検索手段へと割り当て
検索項目を動的に割り振るものである。検索手段の負荷
が重い場合、あるいは入力側のネットワークのデータ転
送の負荷が重い場合に、その検索項目の一部を情報源側
の検索手段へと割り振る。すると、本検索条件が緩くな
るためおそらく検索手段の負荷が下り、情報源側の検索
条件は厳しくなるためネットワークで転送されるデータ
の量が減りネットワークの負荷も下がる。その両方の負
荷が軽いときには、検索項目の一部を検索依頼元側へ割
り振る。As still another embodiment, the search items contained in the search key, the composition of the composition data here, is not fixed to each search means, but it is changed according to the load of the network and the search means. The assigned search items are dynamically assigned to the search means. When the load on the search means is heavy, or when the data transfer load on the input side network is heavy, some of the search items are allocated to the search means on the information source side. Then, since the present search conditions are loosened, the load of the search means is likely to be reduced, and the search conditions on the information source side are also strict, so that the amount of data transferred by the network is reduced and the load of the network is also reduced. When both loads are light, a part of the search items is allocated to the search request source side.
【0056】更にまた別の実施例としては、情報源から
の構図画像データには検索項目に対するチェック項目が
あり、検索した項目に対して印を付加しておく方法であ
る。データを受けとった検索手段は、その項目をチェッ
クしてまだ検索していない項目についてマッチングを行
ない、それをパスしたデータにその検索項目のチェック
を付加して次の検索手段へとデータを転送する。As yet another embodiment, the composition image data from the information source has a check item for the search item, and a mark is added to the searched item. The search means that has received the data checks the item, performs matching on the item that has not been searched yet, adds the check of the search item to the data that passed it, and transfers the data to the next search means. .
【0057】この検索方法に類似な公知例としては、米
国のGeneral Magic社のTelescriptと呼ばれる通信言語
を用いた情報検索法が挙げられる。これは、エージェン
トと呼ばれる仕事の単位にTelescriptによって記述され
た仕事、例えば画像検索などをまかせる。するとそれ
が、ネットワーク上にある Telescriptエンジンと呼ば
れるサーバーを移動したり分裂して増えながら検索など
を行ない、目的のものが見つかった場合にそれを依頼元
へ転送するのである。As a known example similar to this search method, there is an information search method using a communication language called Telescript of General Magic Co., USA. This allows a job called Telescript to be given to a job unit called an agent, such as image search. Then, it moves or splits a server called Telescript engine on the network and performs searches while increasing it, and when it finds the desired one, it transfers it to the requester.
【0058】図22は、被検索画像のキーワードに使用
する名称の例として、画像の対象が持つ階層構造や階層
概念を用いた例とその一実施例を説明したものである。
2601は、「犬」という動物を示す単語である。これは一
般的な名称であり犬といってもさまざまな種類が存在し
ている。2602は、「犬」を更に区別する方法として、犬
の大きさを用いたものである。「小型犬」「中型犬」
「大型犬」の3種類に分類た例である。2603は、それぞ
れの分類2602に対して更に細かく犬の種類を記述した例
である。構造の分け方にはいろいろあるが、その一例と
してこのような階層構造を持たせることができる。FIG. 22 illustrates an example in which a hierarchical structure or a hierarchical concept of an image object is used as an example of a name used as a keyword of an image to be searched, and an embodiment thereof.
2601 is a word indicating an animal "dog". This is a common name, and there are various types of dogs. 2602 uses the size of a dog as a method for further distinguishing "dogs". "Small dog""Mediumdog"
This is an example of classification into three types of "large dogs". 2603 is an example in which the type of dog is described in more detail for each classification 2602. There are various ways to divide the structure, and as an example, it is possible to have such a hierarchical structure.
【0059】2604は、構図データとして入力されるキー
ワードの例を示している。2605は、階層構造を含んだ画
像の名称である。「犬」「小型犬」「ヨークシャテリ
ア」という名称が区切文字をはさんで結合されている。Reference numeral 2604 indicates an example of a keyword input as composition data. 2605 is the name of the image including the hierarchical structure. The names “dog”, “small dog”, and “yorkshire terrier” are combined with delimiters in between.
【0060】検索の方法は、構図検索システムの方にま
かされているが、一般的な検索方法は、この3つのどの
名称でも検索できるようにしておくことである。つまり
「犬」でも検索できるし「ヨークシャテリア」でも検索
できるようにしておくのである。すると、もし「犬」で
検索を行った場合には、「柴犬」や「コリー」も候補に
することができるが「ヨークシャテリア」で検索する
と、その名称が付加された画像のみが候補に挙がるのみ
である。ようするに、検索キーのキーワードに指定する
名称に、この階層構造のレベルのどの名称を選択するか
によって、検索の範囲を指定することができるのであ
る。2606は、その画像の属性が書かれている。その画像
は「ヨークシャテリア」という小型犬であるが、「茶
色」で「やんちゃ」な性格の犬であるという情報が付加
されている。The method of retrieval is up to the composition retrieval system, but a general retrieval method is to enable retrieval by any of these three names. In other words, you can search by "dog" and "yorkshire terrier". Then, if you search for “dog”, you can also select “Shiba Inu” or “Colly”, but if you search for “Yorkshire Terrier”, only the images with that name will be listed as candidates. Only. In this way, the search range can be specified by selecting the name of the level of this hierarchical structure as the name specified as the keyword of the search key. In 2606, the attribute of the image is written. Although the image is a small dog called "Yorkshire Terrier", information that the dog is "brown" and "naughty" is added.
【0061】検索の際に、その属性を指定することで検
索の範囲をせばめることができる。この例の場合、検索
キーとして名称「ヨークシャテリア」属性「茶色」を指
定すると、被検索画像のキーワードの名称のフィールド
のマッチングが行なわれて「ヨークシャテリア」を探
し、かつ属性フィールドがマッチングが行なわれて「茶
色」のものが検索される。2605は階層構造で上位の単語
が含まれていれば良いのであって、階層が上位のものか
ら先頭に並べる必要はない。検索の際には、どの単語も
区別なく走査される。従って、別の階層構造を持つ分類
でもそこに現れた名称すらそこに並べておくことができ
る。また、2606の属性にこの情報を書きこんだ人の情報
を入れておくこともできる。例えば、パブリックな機関
が加えた信頼できる情報と個人が加えた信頼度の低い情
報をその属性を、検索キーのキーワードに加えることに
よって区別することができる。At the time of search, the range of the search can be narrowed by designating the attribute. In this example, if the name "Yorkshire Terrier" attribute "Brown" is specified as the search key, the field of the keyword name of the searched image is matched to search for "Yorkshire Terrier" and the attribute field is matched. Will be searched for "brown". The 2605 has a hierarchical structure as long as the words in the higher order are included, and it is not necessary to arrange the words in the higher order in the hierarchy from the top. When searching, every word is scanned indiscriminately. Therefore, even a classification that has a different hierarchical structure can have even the names that appear there arranged there. Also, you can put the information of the person who wrote this information in the attribute of 2606. For example, reliable information added by a public institution and untrusted information added by an individual can be distinguished by adding the attribute to the keyword of the search key.
【0062】図23は、構図データを付加するタグ作成
装置のキーワード入力に関して、キーワードとして入力
する意味上の階層の構造を説明するための模式図であ
る。例えば、今Kという文字に対する構造が図のように
なっていたとする。ただし、このK,1,2,3などは意味を
持った文字を表わしているとする。すると、そのKの上
位構造というのはAの1-2-3-KとBの4-5-6-Kが考えられ
る。このような候補を、辞書を検索することによって自
動で作成するのである。その際に使用するシソーラスと
いう意味構造を含んだ辞書の例としては、国立国語研究
所の分類語彙表(秀英出版,1964)が挙げられる。FIG. 23 is a schematic diagram for explaining the structure of the semantic hierarchy of inputting as a keyword with respect to the keyword input of the tag creating device for adding composition data. For example, assume that the structure for the letter K is now as shown in the figure. However, it is assumed that K, 1,2,3, etc. represent meaningful characters. Then, the upper structure of K is considered to be 1-2-3-K of A and 4-5-6-K of B. Such candidates are automatically created by searching the dictionary. An example of a dictionary containing a thesaurus, which is used in this case, is the classification vocabulary table of the National Institute for Japanese Language (Shuei Publishing, 1964).
【0063】図24は、構図データを付加するタグ作成
装置のキーワード入力に関して、キーワード候補が挙が
っている例を示したものである。図23のような複数候
補がある場合には、このようにキーワードとして入力す
る候補が複数表示されてそこから選択することになる。
例えばAを選択するとキーワードは「1:2:3:K」のよう
に上位構造を含んだものが設定される。FIG. 24 shows an example in which the keyword candidates are listed regarding the keyword input of the tag creating apparatus for adding the composition data. When there are a plurality of candidates as shown in FIG. 23, a plurality of candidates to be input as keywords are displayed and a user can select from them.
For example, when A is selected, a keyword including a higher-level structure such as "1: 2: 3: K" is set.
【0064】図25は、構図データを付加するタグ作成
装置のキーワード入力に関して、キーワードとして上位
構造をも持った文字を入力する手順について説明したも
のである。2901でまずキーワード入力を行う。すると29
02にその文字を含む意味の構造を辞書から検索してその
上位構造を取りだす。2903はその辞書である。国立国語
研究所の分類語彙表(秀英出版,1964)などが利用でき
る。その候補が1か否かを2904で判定し、もし複数であ
ったなら2905にて、図28のように表示する。2906に
て、そこからひとつの構造を選択する。その構造をキー
ワードとして、2907で設定してキーワード入力が完了す
る。FIG. 25 illustrates a procedure for inputting a character having a higher-level structure as a keyword in inputting a keyword in the tag creating apparatus for adding composition data. First, enter keywords using the 2901. Then 29
In 02, the structure of the meaning including the character is searched from the dictionary and its superstructure is taken out. 2903 is the dictionary. You can use the classification vocabulary table of the National Institute for Japanese Language (Shuei Publishing, 1964). In 2904, it is determined whether or not the candidate is 1, and if there is a plurality of candidates, it is displayed in 2905 as shown in FIG. At 2906, select a structure from it. The keyword input is completed by setting the structure as a keyword in 2907.
【0065】それぞれの請求項に記述されている画像と
は、特に2次元静止画像に限ることなく、動画像や3次
元画像などのデータに対する適用を妨げるものではな
い。The image described in each claim is not limited to a two-dimensional still image, and does not prevent application to data such as a moving image or a three-dimensional image.
【0066】[0066]
【発明の効果】本発明では、画像の領域とその領域が何
であるかという指定をすることによって構図を設定し、
その構図を検索キーとして被検索画像を検索することに
より、画像の名称による画像検索や Mosaicなどのハイ
パーカード式の画像選択に比しても画像の指定の方法に
より広い自由度を持たせることを可能にする。According to the present invention, the composition is set by designating the area of the image and what the area is,
By searching for the image to be searched using that composition as a search key, it is possible to give a wider degree of freedom by the method of specifying the image, compared to image search by image name or hypercard type image selection such as Mosaic. enable.
【0067】また本発明では、構図によって画像を検索
できるデータベースを構築する手段を提供する。Further, the present invention provides a means for constructing a database capable of searching images by composition.
【図1】2次元静止画像データの場合の構図データ入力
の様子を説明した図。FIG. 1 is a diagram for explaining how composition data is input in the case of two-dimensional still image data.
【図2】検索結果の表示の様子を説明した図。FIG. 2 is a diagram illustrating a display of search results.
【図3】検索結果の詳細表示を説明した図。FIG. 3 is a diagram illustrating detailed display of search results.
【図4】構図データ入力の別の実施例を説明した図。FIG. 4 is a diagram illustrating another example of composition data input.
【図5】構図データの保存方法の一実施例を説明した
図。FIG. 5 is a diagram illustrating an example of a method of saving composition data.
【図6】検索キーのデータ構造の一実施例を説明した
図。FIG. 6 is a diagram illustrating an example of a data structure of a search key.
【図7】構図データ検索の一実施例のフローチャート。FIG. 7 is a flowchart of an example of composition data search.
【図8】2次元静止画像の場合の画像検索と結果表示の
方法の一実施例を示したフローチャート。FIG. 8 is a flowchart showing an example of a method of image search and result display in the case of a two-dimensional still image.
【図9】2次元静止画像の場合の構図データによる画像
マッチングの方法の一実施例を示したフローチャート。FIG. 9 is a flowchart showing an embodiment of an image matching method using composition data in the case of a two-dimensional still image.
【図10】2次元静止画像の場合の構図データによる画
像マッチングの方法の別の一実施例を示したフローチャ
ート。FIG. 10 is a flowchart showing another embodiment of an image matching method using composition data in the case of a two-dimensional still image.
【図11】構図データによる画像検索システムの一実施
例の外観図の模式図。FIG. 11 is a schematic diagram of an external view of an embodiment of an image search system based on composition data.
【図12】2次元静止画像における画像タグ作成システ
ムの画像にタグを付加する様子を説明した図。FIG. 12 is a diagram illustrating a state in which a tag is added to an image of the image tag creation system in a two-dimensional still image.
【図13】構図データ付き画像データのデータ構造の一
実施例を説明した図。FIG. 13 is a diagram illustrating an example of a data structure of image data with composition data.
【図14】構図データの入力方法の一実施例のフローチ
ャート。FIG. 14 is a flowchart of an embodiment of a composition data input method.
【図15】画像に構図データを付加する画像タグ作成シ
ステムの外観を説明した図。FIG. 15 is a diagram illustrating the appearance of an image tag creation system that adds composition data to an image.
【図16】3次元画像の構造検索システムのデータ入出
力部分を説明した模式図。FIG. 16 is a schematic diagram illustrating a data input / output portion of a three-dimensional image structure search system.
【図17】構図画像検索ネットワークの物理的な接続を
表わした一実施例の模式図。FIG. 17 is a schematic diagram of an embodiment showing a physical connection of a composition image search network.
【図18】構図画像検索ネットワークの情報伝達上の形
状を表した一実施例の模式図。FIG. 18 is a schematic diagram of an example showing an information transmission shape of a composition image search network.
【図19】画像検索ゲートウェイの一実施例を表したブ
ロック図。FIG. 19 is a block diagram showing an embodiment of an image search gateway.
【図20】検索依頼ユーザーによる検索画像データへの
新たな構図データの付加する仕組みの一実施例について
説明した図。FIG. 20 is a diagram illustrating an example of a mechanism for adding new composition data to search image data by a search requesting user.
【図21】構図画像検索ネットワークにおいて検索依頼
元から画像検索ネットワークへ構図データを送信する仕
組みの一実施例について説明した図。FIG. 21 is a diagram illustrating an example of a mechanism for transmitting composition data from a search request source to the image search network in the composition image search network.
【図22】被検索画像のキーワードに使用する名称の例
として、画像の対象が持つ階層構造や階層概念を用いた
例とその一実施例を説明した図。FIG. 22 is a diagram illustrating an example in which a hierarchical structure or a hierarchical concept of an image target is used as an example of a name used as a keyword of a searched image and an example thereof.
【図23】構図データを付加するタグ作成装置のキーワ
ード入力に関して、キーワードとして入力する意味上の
階層の構造を説明するための模式図。FIG. 23 is a schematic diagram for explaining a hierarchical structure of a meaning input as a keyword in inputting a keyword of a tag creation device to which composition data is added.
【図24】構図データを付加するタグ作成装置のキーワ
ード入力に関して、キーワード候補が挙がっている例を
示す図。FIG. 24 is a diagram showing an example in which keyword candidates are listed regarding keyword input of a tag creation device that adds composition data.
【図25】構図データを付加するタグ作成装置のキーワ
ード入力に関して、キーワードとして上位構造をも持っ
た文字を入力する手順を示すフローチャート。FIG. 25 is a flowchart showing a procedure for inputting a character having a higher-level structure as a keyword in inputting a keyword in the tag creation device which adds composition data.
101:画像描画領域の限界枠、102:多角形の辺を表わし
た直線、103:多角形の頂点、104:キーワードを入力す
るためのフィールド、105:キーワード、106:閉領域、
201:縮小した検索結果の画像、202:その画像の名称や
属性などの説明が表示されるフィールド、301:表示領
域の限界枠、302:画像の名称や属性など画像に関する
説明が表示されるフィールドの枠、303:検索によって
得られた画像、304:302のフィールド内部、305:描画
領域の限界枠、401:描画領域の限界枠、402:領域を示
す長方形、403:閉領域、404:キーワードの入力フィー
ルド、405:キーワード、501:描画領域の限界枠、502,
503,504:閉領域、511:閉領域のデータを保存するフィ
ールド、512:キーワード、505:閉領域と閉領域データ
保存フィールドとの対応関係を示した曲線、1201:表示
装置、1202:構図入力画面と検索結果、1203:記憶装
置、1204:キーボード、1205:マウス、1206:プリンタ
ー、1301:描画領域の限界枠、1302:表示領域で、画像
データが表示されている図、1303:構図データの閉領域
を指定した長方形、1304:画像の一部分である画像要素
で、「雲」が描画されている、1305:キーワードがどの
領域に対応しているかを示す矢印、1306:キーワードを
入力するフィールドの枠、1307:キーワードの入力フィ
ールド、1801:表示装置、1802:画像タグの作成画面、
1803:画像データベースおよび構図データ付き画像の記
録装置、1804:キーボード、1805:マウス、1806:8mm
ビデオまたは8mmビデオデッキなど、1807:VHSなど
のビデオテープ再生機能を持ったビデオデッキと、LD
などの画像記録媒体の再生機能を持ったLDプレイヤ
ー、あるいはLDなどへ構図データ付き画像を記録でき
るLD書き込み装置、2001:データグローブ、2002:3
次元画像を投影する表示装置、2003:磁気センサー、20
04:フットペダル、2005:マイク、2101:ネットワーク
の情報伝達の媒体、2102:他のネットワーク、2103:画
像検索ゲートウェイ、2104:タグ付き画像データベー
ス、2105:タグ付き画像の検索装置、2106:画像検索端
末、2201:画像検索端末、2202:情報伝達経路、2203:
画像検索ゲートウェイ、2204:タグ付き画像検索装置や
タグ付き画像送信装置など、2301:ネットワーク通信
部、2302:構図画像検索部、2303:ネットワーク通信
部、2304:ネットワーク、2401:検索依頼元、2402:構
図画像データベース、2403:構図データ、2404:送信中
のタグ付き画像データ、2405:構図画像データベース中
のタグ付き画像データ、2406:ユーザーが付加した構図
データセット、2407:構図データベースへ戻される構図
データセット、2408:更新された構図画像データ、250
1:構図画像検索端末などの検索依頼元、2502:検索ゲ
ートウェイ(検索用の構図データセットaを持つ)、250
3:検索ゲートウェイ(検索用の構図データセットbを持
つ)、2504:検索ゲートウェイ(検索用の構図データセッ
トcを持つ)、2505:検索データベース(検索用の構図デ
ータセットd,eを持つ)、2506:検索ゲートウェイ(検索
用の構図データセットbを持つ)、2507:検索データベー
ス(検索用の構図データセットc,d,eを持つ)、2508:検
索依頼元から送出された検索用の構図データ、2601:
「犬」という動物を示す単語、2602:「犬」を更に区別
する方法として、犬の大きさを用いたもの、2603:細か
く犬の種類を記述した例でもの、2604:構図データとし
て入力されるキーワードの例、2605:階層構造を含んだ
画像の名称の例、2606:画像の属性、2901:領域内の画
像に付加する文字列の入力部、2902:文字列検索部、29
03:階層構造の辞書、2904:構造の候補数の判定部、29
05:複数候補の表示部、2906:候補の選択部、2907:キ
ーワード設定部。101: limit frame of image drawing area, 102: straight line representing sides of polygon, 103: vertex of polygon, 104: field for inputting keyword, 105: keyword, 106: closed area,
201: Image of reduced search result, 202: Field displaying explanation of name and attribute of the image, 301: Limit frame of display area, 302: Field displaying explanation of image such as name and attribute of image Frame, 303: image obtained by search, 304: inside field of 302, 305: limit frame of drawing area, 401: limit frame of drawing area, 402: rectangle indicating area, 403: closed area, 404: keyword Input field, 405: keyword, 501: limit frame of drawing area, 502,
503, 504: Closed area, 511: Field for storing data of closed area, 512: Keyword, 505: Curve showing correspondence between closed area and closed area data storage field, 1201: Display device, 1202: Composition input screen Search results, 1203: Storage device, 1204: Keyboard, 1205: Mouse, 1206: Printer, 1301: Limit frame of drawing area, 1302: Display area where image data is displayed, 1303: Composition data closed area Specified rectangle, 1304: "Cloud" is drawn in the image element that is a part of the image, 1305: arrow indicating which area the keyword corresponds to, 1306: frame of the field for entering the keyword, 1307: keyword input field, 1801: display device, 1802: image tag creation screen,
1803: Image database and image recording device with composition data, 1804: Keyboard, 1805: Mouse, 1806: 8mm
VCR with video tape playback function such as 1807: VHS such as video or 8mm VCR, and LD
LD player that has a function of reproducing image recording media such as, or an LD writing device that can record images with composition data onto an LD, 2001: Data Grove, 2002: 3
Display device for projecting 3D images, 2003: Magnetic sensor, 20
04: Foot pedal, 2005: Microphone, 2101: Network information transmission medium, 2102: Other networks, 2103: Image search gateway, 2104: Tagged image database, 2105: Tagged image search device, 2106: Image search Terminal 2201: Image search terminal 2202: Information transmission path 2203:
Image search gateway, 2204: image search device with tag, image transmission device with tag, etc. 2301: network communication unit, 2302: composition image search unit, 2303: network communication unit, 2304: network, 2401: search request source, 2402: Composition image database, 2403: Composition data, 2404: Tagged image data being transmitted, 2405: Tagged image data in composition image database, 2406: Composition data set added by user, 2407: Composition data returned to composition database Set, 2408: updated composition image data, 250
1: Composition image search terminal or other search request source, 2502: Search gateway (has composition data set a for search), 250
3: Search gateway (has composition data set b for search), 2504: search gateway (has composition data set c for search), 2505: search database (has composition data set d, e for search), 2506: Search gateway (having composition data set b for search), 2507: Search database (having composition data sets c, d, e for search), 2508: Composition data for search sent from search request source , 2601:
2602: The word that indicates the animal "dog", 2602: The one that uses the size of the dog as a method to further distinguish "dog", 2603: In the example that describes the type of dog in detail, 2604: Input as composition data 2605: example of image name including hierarchical structure, 2606: image attribute, 2901: input part of character string to be added to image in area, 2902: character string search part, 29
03: Dictionary of hierarchical structure, 2904: Judgment unit for number of structure candidates, 29
05: Multiple candidate display section, 2906: Candidate selection section, 2907: Keyword setting section.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹内 勝 埼玉県比企郡鳩山町赤沼2520番地 株式会 社日立製作所基礎研究所内 (72)発明者 広池 敦 埼玉県比企郡鳩山町赤沼2520番地 株式会 社日立製作所基礎研究所内 (72)発明者 森 靖英 埼玉県比企郡鳩山町赤沼2520番地 株式会 社日立製作所基礎研究所内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Masaru Takeuchi 2520 Akanuma, Hatoyama-cho, Hiki-gun, Saitama Stock company Hitachi Research Laboratory (72) Inventor Atsushi Hiroike 2520 Akanuma, Hatoyama-cho, Hiki-gun Saitama Inside Hitachi Research Laboratory (72) Inventor Yasuhide Mori 2520 Akanuma, Hatoyama Town, Hiki-gun, Saitama Stock Company Hitachi Research Laboratory
Claims (9)
意の領域の画像要素を画像内における位置を意味する領
域データと当該領域における画像要素の特徴の表現とで
特定した画像の構図データを有するデータベースと、検
索したい画像が持つべき画像要素の位置を示す領域デー
タ及びその画像要素の特徴の表現とよりなる構図データ
を入力するための表示装置と、表示装置を介して入力さ
れた構図データとデータベースにある構図データとの一
致を検出する処理装置及び検出結果を表示する表示装置
とよりなることを特徴とする画像検索システム。1. Composition data of an image in which an image element of an arbitrary area of a searched image to be displayed on a display device is specified by area data indicating a position in the image and expression of characteristics of the image element in the area. A database that has, a display device for inputting composition data consisting of area data indicating the position of an image element that the image to be searched should have and a feature expression of the image element, and composition data input through the display device And a display device that displays the detection result and a processing device that detects a match between composition data in the database.
画像要素の領域を指定し、その画像要素に画像要素の特
徴を表現する情報を付加して構図データとする機能を持
った入力装置を有する請求項1記載の画像検索システ
ム。2. An input having a function of designating a region of an image element which is a part of an image displayed on a display device and adding information expressing characteristics of the image element to the image element to obtain composition data. The image retrieval system according to claim 1, further comprising a device.
限界の中に閉領域を指定して設定する請求項2記載の画
像検索システム。3. The image search system according to claim 2, wherein the area of the image element is set by designating a closed area within the display limit of the display device.
タに含まれる閉領域と検索データの閉領域との位置ずれ
に、所定の許容範囲を設定して一致を判定する請求項1
記載の画像検索システム。4. A match is determined by setting a predetermined allowable range for the positional deviation between the closed region included in the composition data of the searched image in the database and the closed region of the search data.
Image retrieval system described.
タに含まれる閉領域の面積の大きさと検索データの閉領
域の面積の大きさとの差異に、所定の許容範囲を設定し
て一致を判定する請求項1記載の画像検索システム。5. A predetermined allowable range is set for the difference between the size of the area of the closed region included in the composition data of the searched image in the database and the size of the area of the closed region of the search data, and a match is determined. The image search system according to claim 1.
ドで表現される請求項1から5のいずれかに記載の画像
検索システム。6. The image search system according to claim 1, wherein the information expressing the characteristics of the image element is expressed by a keyword.
特徴を表す情報を付加してデータベースへ戻す機能を備
えた請求項1から6のいずれかに記載の画像検索システ
ム。7. The image search system according to claim 1, further comprising a function of adding information indicating a feature of a new image element to the searched image and returning the added information to the database.
意の領域の画像要素を画像内における位置を意味する領
域データと当該領域における画像要素の特徴の表現とで
特定した画像の構図データを有するデータベースと、検
索したい画像が持つべき画像要素の位置を示す領域デー
タ及びその画像要素の特徴の表現とよりなる構図データ
を入力するための表示装置と、表示装置を介して入力さ
れた構図データとデータベースにある構図データとの一
致を検出する処理装置及び検出結果を表示する表示装置
とよりなることを特徴とする画像検索システム、前記画
像検索システム間を結ぶネットワークよりなり、それぞ
れの画像検索システムが相互にデータベースを利用可能
であることを特徴とする画像検索ネットワークシステ
ム。8. Composition data of an image in which an image element of an arbitrary area of a searched image to be displayed on a display device is specified by area data indicating a position in the image and expression of characteristics of the image element in the area. A database that has, a display device for inputting composition data consisting of area data indicating the position of an image element that the image to be searched should have and a feature expression of the image element, and composition data input through the display device And an image retrieving system for detecting a match between the composition data in the database and a display device for displaying the detection result, and a network connecting the image retrieving systems. An image retrieval network system characterized in that the databases can be used by each other.
特徴を表す情報を付加して当初のデータベースへ戻す機
能を備えた請求項8記載の画像検索ネットワークシステ
ム。9. The image search network system according to claim 8, further comprising a function of adding information indicating characteristics of a new image element to the searched image and returning the information to the original database.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7141592A JPH08335223A (en) | 1995-06-08 | 1995-06-08 | Image retrieval system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7141592A JPH08335223A (en) | 1995-06-08 | 1995-06-08 | Image retrieval system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH08335223A true JPH08335223A (en) | 1996-12-17 |
Family
ID=15295599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7141592A Pending JPH08335223A (en) | 1995-06-08 | 1995-06-08 | Image retrieval system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH08335223A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007193467A (en) * | 2006-01-18 | 2007-08-02 | Dainippon Printing Co Ltd | Image material search system |
WO2007129474A1 (en) * | 2006-05-10 | 2007-11-15 | Nikon Corporation | Object recognition device, object recognition program, and image search service providing method |
JP2007304771A (en) * | 2006-05-10 | 2007-11-22 | Nikon Corp | Subject recognition device, subject recognition program and image retrieval service provision method |
JP2010181991A (en) * | 2009-02-04 | 2010-08-19 | Fujifilm Corp | System for instructing image retrieval and operation-control method for the same |
KR20100138140A (en) * | 2009-06-24 | 2010-12-31 | 삼성전자주식회사 | Method and apparatus for updating a composition database using user pattern, and digital photographing apparatus |
WO2012164685A1 (en) * | 2011-05-31 | 2012-12-06 | 楽天株式会社 | Information providing device, information providing method, information providing processing program, recording medium recording information providing processing program, and information providing system |
JP2017505475A (en) * | 2013-12-20 | 2017-02-16 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | System, method and apparatus for image retrieval |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02157970A (en) * | 1988-12-09 | 1990-06-18 | Matsushita Electric Ind Co Ltd | Picture retrieving system |
JPH0668171A (en) * | 1992-08-17 | 1994-03-11 | Daikin Ind Ltd | Picture database, picture database preparation method, picture retrieval method and device therefor |
JPH0696125A (en) * | 1992-09-09 | 1994-04-08 | Kokusai Denshin Denwa Co Ltd <Kdd> | Retrieved image accumulating system |
-
1995
- 1995-06-08 JP JP7141592A patent/JPH08335223A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02157970A (en) * | 1988-12-09 | 1990-06-18 | Matsushita Electric Ind Co Ltd | Picture retrieving system |
JPH0668171A (en) * | 1992-08-17 | 1994-03-11 | Daikin Ind Ltd | Picture database, picture database preparation method, picture retrieval method and device therefor |
JPH0696125A (en) * | 1992-09-09 | 1994-04-08 | Kokusai Denshin Denwa Co Ltd <Kdd> | Retrieved image accumulating system |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007193467A (en) * | 2006-01-18 | 2007-08-02 | Dainippon Printing Co Ltd | Image material search system |
WO2007129474A1 (en) * | 2006-05-10 | 2007-11-15 | Nikon Corporation | Object recognition device, object recognition program, and image search service providing method |
JP2007304771A (en) * | 2006-05-10 | 2007-11-22 | Nikon Corp | Subject recognition device, subject recognition program and image retrieval service provision method |
JP4725408B2 (en) * | 2006-05-10 | 2011-07-13 | 株式会社ニコン | Subject recognition device and subject recognition program |
US8379990B2 (en) | 2006-05-10 | 2013-02-19 | Nikon Corporation | Object recognition apparatus, computer readable medium storing object recognition program, and image retrieval service providing method |
JP2010181991A (en) * | 2009-02-04 | 2010-08-19 | Fujifilm Corp | System for instructing image retrieval and operation-control method for the same |
KR20100138140A (en) * | 2009-06-24 | 2010-12-31 | 삼성전자주식회사 | Method and apparatus for updating a composition database using user pattern, and digital photographing apparatus |
WO2012164685A1 (en) * | 2011-05-31 | 2012-12-06 | 楽天株式会社 | Information providing device, information providing method, information providing processing program, recording medium recording information providing processing program, and information providing system |
JP5467177B2 (en) * | 2011-05-31 | 2014-04-09 | 楽天株式会社 | INFORMATION PROVIDING DEVICE, INFORMATION PROVIDING METHOD, INFORMATION PROVIDING PROCESSING PROGRAM, RECORDING MEDIUM CONTAINING INFORMATION PROVIDING PROCESSING PROGRAM, AND INFORMATION PROVIDING SYSTEM |
US9886789B2 (en) | 2011-05-31 | 2018-02-06 | Rakuten, Inc. | Device, system, and process for searching image data based on a three-dimensional arrangement |
JP2017505475A (en) * | 2013-12-20 | 2017-02-16 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | System, method and apparatus for image retrieval |
US10346465B2 (en) | 2013-12-20 | 2019-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for digital composition and/or retrieval |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5832494A (en) | Method and apparatus for indexing, searching and displaying data | |
US7801893B2 (en) | Similarity detection and clustering of images | |
JP3489615B2 (en) | Image classification method, image inquiry method, image classification device, image inquiry device | |
Herot | Spatial management of data | |
US20090228817A1 (en) | Systems and methods for displaying a search result | |
US20090228811A1 (en) | Systems and methods for processing a plurality of documents | |
US20160147905A1 (en) | Navigation for large scale graphs | |
US20080010605A1 (en) | Systems and methods for generating and correcting location references extracted from text | |
US20020178153A1 (en) | Document retrieval assisting method and system for the same and document retrieval service using the same | |
JP2004178605A (en) | Information retrieval device and its method | |
JP2004178604A (en) | Information retrieval system and its method | |
US7325010B1 (en) | Information modeling method and database searching method using the information modeling method | |
CN116955707A (en) | Content tag determination method, device, equipment, medium and program product | |
Khanwalkar et al. | Exploration of large image corpuses in virtual reality | |
US5305208A (en) | Database retrieval system for effectively displaying differences between elements of plural drawings | |
JPH08335223A (en) | Image retrieval system | |
JP2000339330A (en) | Method for collecting and providing home page information with coordinate, recording medium and its device | |
JP2006099761A (en) | Method for searching multimedia content | |
JPH08305724A (en) | Device for managing design supporting information document | |
CN112818263B (en) | Implementation method of forest navigation learning system based on augmented reality technology knowledge | |
Verma et al. | Fuzzy logic based interpretation and fusion of color queries | |
JPH06251081A (en) | Hypermedia processor | |
JP4086377B2 (en) | Information retrieval apparatus and method | |
JPH10232871A (en) | Retrieval device | |
Chang | Content-based access to multimedia information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040727 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040913 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050208 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050303 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20050308 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20050408 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060427 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080218 |