JPH07210576A - Image retrieving device, image storage device and retrieving method - Google Patents

Image retrieving device, image storage device and retrieving method

Info

Publication number
JPH07210576A
JPH07210576A JP6007422A JP742294A JPH07210576A JP H07210576 A JPH07210576 A JP H07210576A JP 6007422 A JP6007422 A JP 6007422A JP 742294 A JP742294 A JP 742294A JP H07210576 A JPH07210576 A JP H07210576A
Authority
JP
Japan
Prior art keywords
image
area
character string
keyword
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6007422A
Other languages
Japanese (ja)
Inventor
Mitsuteru Kataoka
充照 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6007422A priority Critical patent/JPH07210576A/en
Publication of JPH07210576A publication Critical patent/JPH07210576A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To provide a document retrieving device for easily performing retrieval. CONSTITUTION:This device is provided with a storage means 107 for storing information, character input means 104 for inputting character strings, image input means 101 for inputting images, image display means 102 for displaying images, image area indicating means 103 for indicating the partial areas of images, and controller 109 for controlling these means. The image containing the character string fetched from the image input means 101 is stored in the storage means 107, the recognition table of the storage means 107 stores information provided with an index for identifying the stored image, the area information of the image indicated by the image area indicating means 103 and the character string provided by performing character recognition to that area and concerning the image to be displayed on the image display means 102, when the image area information in the recognition table is referred to and already recognized in the case of indicating the area with the image area indicating means 103 for retrieving the image again, the correspondent image is provided based on the index for identifying the image in the recognition table.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字を含む画像の検索
装置、記憶装置及び画像検索方法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a search device for an image containing characters, a storage device, and an image search method.

【0002】[0002]

【従来の技術】文字を画像情報として含んでいる画像
(以後「文書画像」と呼ぶ)の格納に用いられる方法は
幾つか存在する。その一つとして文字情報を画像のまま
で蓄積する方法がある。この方法は文書を読み込まれた
そのものの様式で記憶するため読み込み対象の様式が保
存されるという特長がある。この方法での文書画像検索
は、一旦記憶された文書画像に対して画像を特徴付ける
キーワードをあらかじめ登録しておき、検索の際に入力
する文字列と各キーワードとを比較し、該当するキーワ
ードの文書画像を取り出すことで行われる。キーワード
登録における文字列の入力は、キーボードなどを用い入
力する方法の他に、特開平03−278269号公報で
示されているように、表示された文書画像の領域を指定
し、指定した領域を文字認識し、文字認識結果をキーワ
ードとして用いる方法もある。
2. Description of the Related Art There are several methods used to store an image containing characters as image information (hereinafter referred to as "document image"). As one of them, there is a method of accumulating character information as an image. This method has a feature that the format to be read is saved because the document is stored in the read format. In the document image search by this method, keywords that characterize the image are registered in advance for the document image that has been stored, the character string input when searching is compared with each keyword, and the document of the corresponding keyword is searched. This is done by taking out the image. For inputting a character string in keyword registration, in addition to a method of inputting using a keyboard or the like, as shown in Japanese Patent Laid-Open No. 03-278269, an area of a displayed document image is designated and the designated area is designated. There is also a method of character recognition and using the character recognition result as a keyword.

【0003】図5に、そのような、文書画像を画像のま
ま記憶し、文字認識方法によりキーワードを入力する従
来の文書画像記憶検索装置の一例の構成を示す。
FIG. 5 shows an example of the configuration of a conventional document image storage / retrieval device which stores such a document image as it is and inputs a keyword by a character recognition method.

【0004】501は画像入力手段である。画像入力手
段501は文字画像をビットマップ情報として取り込
む。例えば、画像入力装置501はイメージスキャナー
である。
Reference numeral 501 is an image input means. The image input means 501 takes in a character image as bitmap information. For example, the image input device 501 is an image scanner.

【0005】502は画像表示手段である。画像表示手
段502は画像情報を表示し、この表示を利用者は見る
ことができる。例えば、画像表示手段502は液晶やC
RTディスプレーなどのビットマップ・ディスプレーで
ある。
Reference numeral 502 is an image display means. The image display unit 502 displays image information, and the user can see this display. For example, the image display unit 502 is a liquid crystal or C
Bitmap displays such as RT displays.

【0006】503は画像領域指示手段である。利用者
は画像領域指示手段503を用いることで画像表示手段
502に表示された文書画像の領域や点を指定できる。
Reference numeral 503 is an image area designating means. The user can specify the area or point of the document image displayed on the image display means 502 by using the image area designating means 503.

【0007】ここで、例として画像領域指示手段502
がマウスなどのポインティングデバイスである場合の領
域指定の方法を説明する。指定したい領域が長方形であ
る場合には、マウスで線分の両端を指定することで、こ
の線分を対角線とする長方形領域を指定できる。例えば
指定したい長方形領域の左上の頂点でマウスのボタンを
押し、ボタンを押したまま長方形領域の右下の頂点へマ
ウスを移動してボタンを離せばよい。
Here, as an example, the image area designating means 502
A method of designating an area when is a pointing device such as a mouse will be described. If the area to be specified is a rectangle, by specifying both ends of the line segment with the mouse, a rectangular area having the line segment as a diagonal line can be specified. For example, the mouse button may be pressed at the upper left apex of the rectangular area to be designated, the mouse may be moved to the lower right apex of the rectangular area while the button is being held, and the button may be released.

【0008】504は文字入力手段である。例えば、文
字入力手段504はキーボードである。文字入力手段5
04はキーワードとして利用できる文字列を入力する。
Reference numeral 504 is a character input means. For example, the character input unit 504 is a keyboard. Character input means 5
04 inputs a character string that can be used as a keyword.

【0009】文字入力手段504を画像表示手段502
の表示面に張り付けられたペン入力可能で透明なタブレ
ットとする方法も考えられる。タブットを用いる場合に
おいてはペンなどによって書かれた文字を文字認識する
ことで文字を入力することも可能である。また1台のタ
ブレットを画像領域指示手段303と文字入力手段50
4とで共用することも考えられる。
The character input means 504 is replaced by the image display means 502.
It is also possible to use a transparent tablet that can be input with a pen attached to the display surface of. When using a tabt, it is also possible to input characters by recognizing characters written with a pen or the like. Also, one tablet is used as the image area designating means 303 and the character inputting means 50.
Sharing with 4 is also conceivable.

【0010】505は文書画像である。文書画像505
は画像入力手段501から読み込まれる。本装置で扱う
文書画像505は一般の書類のように図や絵だけでなく
文字も含まれているものとする。
Reference numeral 505 is a document image. Document image 505
Is read from the image input means 501. It is assumed that the document image 505 handled by this apparatus includes not only figures and pictures but also characters as in a general document.

【0011】506はキーワード表である。このキーワ
ード表について、図6の例に基づき説明する。
Reference numeral 506 is a keyword table. This keyword table will be described based on the example of FIG.

【0012】601はキーワード表である。602は文
書画像を識別する画像IDを格納する属性「画像ID」
である。603は文書画像に付加されたキーワードを表
す属性「キーワード」である。604はキーワード表に
登録されている組である。組604は属性「画像ID」
602の値が5である画像にキーワード「自然言語」が
登録されていることを表している。
Reference numeral 601 is a keyword table. An attribute “image ID” 602 stores an image ID for identifying a document image
Is. An attribute “keyword” 603 represents a keyword added to the document image. A group 604 is registered in the keyword table. The set 604 is the attribute “image ID”
This indicates that the keyword “natural language” is registered in the image in which the value of 602 is 5.

【0013】図5に於て、507は記憶手段である。記
憶手段507は計算機における二次記憶装置である。例
えば、記憶手段507はハードディスクや光ディスクな
どである。記憶手段507はキーワード表506と複数
の文書画像505とを記憶する。
In FIG. 5, 507 is a storage means. The storage unit 507 is a secondary storage device in the computer. For example, the storage unit 507 is a hard disk, an optical disk, or the like. The storage unit 507 stores a keyword table 506 and a plurality of document images 505.

【0014】508はメモリーである。メモリー508
にはプログラムやデータが格納される。例えば、メモリ
ー508は一般の計算機システムにおける半導体メモリ
ーである。
Reference numeral 508 is a memory. Memory 508
The program and data are stored in. For example, the memory 508 is a semiconductor memory in a general computer system.

【0015】509は中央処理装置であり、この装置5
09は、画像入力手段501、画像表示手段502、画
像領域指示手段503、文字入力手段504、記憶手段
507、メモリー508、と相互に接続されており、こ
れらを制御する。特に中央処理装置509はメモリー5
08に格納されたプログラムを実行して上記制御を行う
ようになっている。さらに、中央処理装置509は文字
認識機能を備えている。なお、中央処理装置509とメ
モリー508が制御手段を構成する。
Reference numeral 509 denotes a central processing unit, and this unit 5
An image input unit 501, an image display unit 502, an image area designating unit 503, a character input unit 504, a storage unit 507, and a memory 508 are mutually connected and control these. In particular, the central processing unit 509 is the memory 5
The program stored in 08 is executed to perform the above control. Further, the central processing unit 509 has a character recognition function. The central processing unit 509 and the memory 508 form a control means.

【0016】次に、上記実施例の動作をフローチャート
に基づいて説明する。
Next, the operation of the above embodiment will be described with reference to the flowchart.

【0017】図7は、文書画像記憶検索装置における文
書画像へのキーワードの登録手順を表すフローチャート
である。以後、各ステップを順に説明する。
FIG. 7 is a flowchart showing a procedure for registering a keyword in a document image in the document image storage / retrieval device. Hereinafter, each step will be described in order.

【0018】(ステップ701)画像表示手段502に
表示されている文書画像の領域を、画像領域指示手段5
03を用いて指定する。
(Step 701) The area of the document image displayed on the image display means 502 is changed to the image area designating means 5.
Specify using 03.

【0019】(ステップ702)ステップ701で指定
された領域に表示されている文書画像を中央処理装置5
09により、文字認識する。ここで用いる文字認識技術
には一般的な手法が利用できる。文献「文字認識概論」
(橋本新一郎著、オーム社、1982)に文字認識技術
の概要が述べられている。
(Step 702) The central processing unit 5 processes the document image displayed in the area designated in step 701.
Character recognition is performed by 09. A general method can be used for the character recognition technology used here. Literature "Introduction to character recognition"
(Shin-ichiro Hashimoto, Ohmsha, 1982) gives an overview of character recognition technology.

【0020】(ステップ703)ステップ702の文字
認識の結果を修正する。一般に文字認識では正しく認識
されない場合が存在する。この場合、認識結果の誤った
部分を探し出して修正する必要がある。例えば、文字認
識の結果を画像表示手段502に表示した後、認識結果
が誤っている場合には、利用者が文字入力手段504か
ら正しい認識結果を入力することで修正する。
(Step 703) The result of character recognition in step 702 is corrected. Generally, there are cases where character recognition does not result in correct recognition. In this case, it is necessary to find and correct the incorrect part of the recognition result. For example, after the character recognition result is displayed on the image display unit 502, if the recognition result is incorrect, the user inputs the correct recognition result from the character input unit 504 to correct it.

【0021】(ステップ704)ステップ703の認識
結果を文書画像のキーワードとして登録する。キーワー
ドの登録は、認識結果である文字列と属性「画像ID」
602とからなる組をキーワード表506に追加するこ
とによって行われる。
(Step 704) The recognition result of step 703 is registered as a keyword of the document image. The keyword registration is the character string that is the recognition result and the attribute "image ID".
This is done by adding a set consisting of 602 and 602 to the keyword table 506.

【0022】図8は、文書画像記憶検索装置における文
書画像へのキーワードによる検索手順を表すフローチャ
ートである。以後、各ステップを順に説明する。
FIG. 8 is a flowchart showing a procedure for searching a document image by a keyword in the document image storage / retrieval apparatus. Hereinafter, each step will be described in order.

【0023】(ステップ801)キーワードを文字入力
手段504から入力する。
(Step 801) A keyword is input from the character input means 504.

【0024】(ステップ802)ステップ801で入力
されたキーワードを登録している文書画像を選択する。
すなわち、ステップ801で入力されたキーワードを属
性「キーワード」603として持つキーワード表506
の組を検索する。そして検索された組の属性「画像I
D」602の値が選択される。例えば、キーワード表が
図5で、ステップ702の認識結果が「自然言語」ある
場合には、組604が検索されるので属性「画像ID」
604の値「5」が選択される。
(Step 802) A document image in which the keyword input in step 801 is registered is selected.
That is, the keyword table 506 having the keyword input in step 801 as the attribute “keyword” 603.
Search for pairs. Then, the attributes of the retrieved set “image I
The value of “D” 602 is selected. For example, when the keyword table is shown in FIG. 5 and the recognition result of step 702 is "natural language", the set 604 is searched, so that the attribute "image ID" is found.
The value “5” of 604 is selected.

【0025】(ステップ803)ステップ802で選択
された文書画像を、記憶手段507から読み出して画像
表示手段502に表示する。例えば、ステップ802で
選択された文書画像の画像IDが「5」である場合には
記憶手段507に記憶された属性「画像ID」602が
「5」である文書画像を読み出し、この文書画像を画像
表示手段502に表示する。
(Step 803) The document image selected in step 802 is read from the storage means 507 and displayed on the image display means 502. For example, when the image ID of the document image selected in step 802 is “5”, the document image whose attribute “image ID” 602 is “5” stored in the storage unit 507 is read, and this document image is displayed. The image is displayed on the image display unit 502.

【0026】[0026]

【発明が解決しようとする課題】しかしながら、検索作
業の際、検索した結果、ある文書画像が表示された際、
その文書画像中の任意の言葉についてさらに詳しい内容
を知るため、その言葉について検索行いたい場合があ
る。
However, when a certain document image is displayed as a result of the search during the search operation,
In order to know more details about an arbitrary word in the document image, it is sometimes desired to search for the word.

【0027】その様な場合でも、従来の装置では、画像
として入力したいキーワードが現在表示されているのに
もかかわらず、これをわざわざあらたにキーボードで入
力する必要があり、繁雑であった。
Even in such a case, in the conventional apparatus, although the keyword to be input as an image is currently displayed, it is necessary to manually input the keyword, which is complicated.

【0028】また、キーワードの登録作業の手間を少し
でも軽くする要望が強い。
There is also a strong demand for reducing the time and effort required for keyword registration.

【0029】本発明は、このような従来の文書画像記憶
装置の課題を考慮し、再検索やキーワード登録を容易に
行うことが可能な画像検索装置、画像記憶装置及び検索
方法を実現することを目的とするものである。
In consideration of the problems of the conventional document image storage device, the present invention realizes an image search device, an image storage device, and a search method that can easily perform re-search and keyword registration. It is intended.

【0030】[0030]

【課題を解決するための手段】請求項1の本発明は、情
報を記憶する記憶手段と、文字列の入力を行う文字入力
手段と、画像を入力する画像入力手段と、画像を表示す
る画像表示手段と、前記画像の一部領域を指示するため
の画像領域指示手段と、前記記憶手段、前記文字入力手
段、前記画像入力手段、前記画像表示手段、及び画像領
域指示手段を制御する制御手段とを備え、前記画像入力
手段から取り込んだ文字列を含む画像を前記記憶手段に
記憶し、記憶した画像を識別する指標と、前記画像領域
指示手段により指示された前記画像の領域情報と、その
領域を文字認識して得られる文字列とを少なくとも有す
る組を前記記憶手段の認識表に記憶しておき、画像表示
手段に表示された画像において、画像の再検索のため
に、前記画像領域指示手段により領域を指示する際、前
記認識表中の画像領域情報が参照され既に認識済みの場
合は、前記認識表中の画像を識別する指標に基づき対応
する目的の画像を得ることを特徴とする画像検索装置で
ある。
According to the present invention of claim 1, a storage means for storing information, a character input means for inputting a character string, an image input means for inputting an image, and an image for displaying an image. Display means, image area instruction means for instructing a partial area of the image, control means for controlling the storage means, the character input means, the image input means, the image display means, and the image area instruction means An image including a character string captured from the image input means is stored in the storage means, an index for identifying the stored image, area information of the image instructed by the image area instructing means, and A group having at least a character string obtained by character recognition of the area is stored in the recognition table of the storage means, and in the image displayed on the image display means, the image area finger is used for re-searching the image. When the area is designated by the means, if the image area information in the recognition table is referred to and already recognized, the corresponding target image is obtained based on the index for identifying the image in the recognition table. It is an image search device.

【0031】また、請求項2の本発明は、情報を記憶す
る記憶手段と、文字列の入力を行う文字入力手段と、画
像を入力する画像入力手段と、画像を表示する画像表示
手段と、前記画像の一部領域を指示するための画像領域
指示手段と、前記記憶手段、前記文字入力手段、前記画
像入力手段、前記画像表示手段、及び画像領域指示手段
を制御する制御手段とを備え、前記画像入力手段から取
り込んだ文字列を含む画像を前記記憶手段に記憶し、記
憶した画像を識別する指標と、前記画像領域指示手段に
より指示された前記画像の領域情報と、その領域を文字
認識して得られる文字列とを少なくとも有する組を前記
記憶手段の認識表に記憶しておき、画像表示手段に表示
された画像において、キーワードの登録のため、前記画
像領域指示手段により領域を指示する際、前記認識表中
の画像領域情報が参照され、既に認識済みの場合は、前
記認識表中の文字列をキーワードとして登録し、登録し
ていない場合は、その領域情報と、その領域を文字認識
して得られる文字列と、対応する画像識別指標との組を
認識表に登録し、この際、キーワード登録することを特
徴とする画像記憶装置である。
Further, according to the present invention of claim 2, a storage means for storing information, a character input means for inputting a character string, an image input means for inputting an image, and an image display means for displaying the image, An image area designating unit for designating a partial area of the image, a storage unit, the character input unit, the image input unit, the image display unit, and a control unit for controlling the image region designating unit, An image including a character string taken in from the image input means is stored in the storage means, an index for identifying the stored image, area information of the image instructed by the image area instructing means, and character recognition of the area. A group having at least the character string obtained by the above is stored in the recognition table of the storage means, and in the image displayed on the image display means, in the image area designating means for keyword registration. When designating an area, the image area information in the recognition table is referred to, if already recognized, the character string in the recognition table is registered as a keyword, and if not registered, the area information An image storage device is characterized in that a set of a character string obtained by character recognition of the area and a corresponding image identification index is registered in a recognition table, and a keyword is registered at this time.

【0032】請求項3の本発明は、所定のデータベース
における任意のキーワードにより、文字列を含む画像を
画面に表示し、その表示画像のなかの所定の文字列を領
域指定し、その領域指定された文字列に基づいて、その
文字列をキーワードとする別の画像を前記データベース
から再検索して表示することを特徴とする画像検索方法
である。
According to the third aspect of the present invention, an image including a character string is displayed on the screen by an arbitrary keyword in a predetermined database, a predetermined character string in the displayed image is designated as an area, and the area is designated. Based on the character string, another image having the character string as a keyword is re-searched from the database and displayed, and displayed.

【0033】[0033]

【作用】請求項1の本発明では、画像表示手段に表示さ
れた画像において、再画像検索のために、前記画像領域
指示手段により領域を指示する際、前記認識表中の画像
領域情報が参照され既に認識済みの場合は、前記認識表
中の画像を識別する指標に基づき対応する目的の画像を
得る。
According to the first aspect of the present invention, in the image displayed on the image display means, when the area is designated by the image area designating means for re-image retrieval, the image area information in the recognition table is referred to. If already recognized, the corresponding target image is obtained based on the index for identifying the image in the recognition table.

【0034】請求項2の本発明では、画像表示手段に表
示された画像において、キーワードの登録のため、前記
画像領域指示手段により領域を指示する際、前記認識表
中の画像領域情報が参照され、既に認識済みの場合は、
前記認識表中の文字列をキーワードとして登録し、登録
していない場合は、その領域情報と、その領域を文字認
識して得られる文字列と、対応する画像識別指標との認
識表を新たに作成し、キーワード登録する。
According to the present invention of claim 2, in the image displayed on the image display means, the image area information in the recognition table is referred to when the area is designated by the image area designating means for the registration of the keyword. , If already recognized,
The character string in the recognition table is registered as a keyword, and if not registered, a new recognition table of the area information, the character string obtained by character recognition of the area, and the corresponding image identification index is newly added. Create and register keywords.

【0035】[0035]

【実施例】以下、本発明の実施例について図面を参照に
しながら詳細に説明する。
Embodiments of the present invention will now be described in detail with reference to the drawings.

【0036】図1は本発明の一実施例における文書画像
検索装置の詳細図である。101は画像入力手段であ
る。画像入力手段101は文字画像をビットマップ情報
として取り込む。
FIG. 1 is a detailed diagram of a document image retrieval apparatus according to an embodiment of the present invention. 101 is an image input means. The image input means 101 takes in a character image as bitmap information.

【0037】102は画像表示手段である。画像表示手
段102は画像情報を表示する。利用者は画像表示手段
102の表示を見ることができる。
Reference numeral 102 is an image display means. The image display means 102 displays image information. The user can see the display of the image display means 102.

【0038】103は画像領域指示手段である。利用者
は画像領域指示手段103を用いることで画像表示手段
102に表示された文書画像の領域を指定できる。また
領域と同様に点も指定できる。
Reference numeral 103 is an image area designating means. The user can specify the area of the document image displayed on the image display means 102 by using the image area designating means 103. You can also specify points as well as areas.

【0039】104は文字入力手段である。文字入力手
段は文字列を入力する。
Reference numeral 104 is a character input means. The character input means inputs a character string.

【0040】105は文書画像である。文書画像105
は画像入力手段101から読み込まれる。図2は文書画
像の例である。
Reference numeral 105 is a document image. Document image 105
Is read from the image input means 101. FIG. 2 is an example of a document image.

【0041】106は認識表である。ここで図3を用い
てこの認識表106を説明する。図3における301は
認識表である。ここで302は文書画像105を識別す
る画像IDを格納する属性「画像ID」である。
Reference numeral 106 is a recognition table. Here, the recognition table 106 will be described with reference to FIG. Reference numeral 301 in FIG. 3 is a recognition table. Here, 302 is an attribute “image ID” that stores an image ID for identifying the document image 105.

【0042】303は属性「画像ID」302で表され
る画像内の領域を指定する属性「画像領域」である。
Reference numeral 303 is an attribute "image area" for designating an area in the image represented by the attribute "image ID" 302.

【0043】304は属性「画像ID」302と属性
「画像領域」303によって指定される画像の領域を文
字認識した結果を格納する属性「文字認識結果」であ
る。
Reference numeral 304 denotes an attribute "character recognition result" for storing the result of character recognition of the area of the image designated by the attribute "image ID" 302 and the attribute "image area" 303.

【0044】305は属性「文字認識結果」304がキ
ーワードか否かを表す属性「キーワードフラグ」であ
る。属性「キーワードフラグ」305の値が1であるこ
とは、キーワードであることと同値である。
Reference numeral 305 denotes an attribute "keyword flag" indicating whether or not the attribute "character recognition result" 304 is a keyword. When the value of the attribute “keyword flag” 305 is 1, it is the same value as that of a keyword.

【0045】306、311、312などは認識結果表
301に格納された組である。
306, 311, 312, etc. are the sets stored in the recognition result table 301.

【0046】307は組306の属性「画像ID」30
2の値である。値307は組306の画像IDが5の画
像に関することを表している。
Reference numeral 307 denotes the attribute “image ID” 30 of the set 306.
It has a value of 2. The value 307 indicates that the image ID of the set 306 is related to the image of 5.

【0047】308は画像の領域((722,25
1),(1341,354))を表している(図2参
照)。ただし((a,b),(c,d))は2点(a,
b)、(c,d)を両端とする線分を対角線とする長方
形の領域を表しているものとする。
Reference numeral 308 denotes an image area ((722, 25
1), (1341, 354)) (see FIG. 2). However, ((a, b), (c, d)) has two points (a,
b) and (c, d) are assumed to represent a rectangular area having a diagonal line segment.

【0048】309は画像領域308の文字認識結果が
文字列「ユーザI/F」であることを表している。
Reference numeral 309 indicates that the character recognition result of the image area 308 is the character string "user I / F".

【0049】310は組306のキーワードフラグの値
である。この値が0であるので文字認識結果309「ユ
ーザI/F」はキーワードではない。
Reference numeral 310 is the value of the keyword flag of the set 306. Since this value is 0, the character recognition result 309 “user I / F” is not a keyword.

【0050】107は記憶手段である。記憶手段107
は計算機における二次記憶装置である。記憶手段107
は認識表106と複数の文書画像105とを記憶する。
Reference numeral 107 is a storage means. Storage means 107
Is a secondary storage device in a computer. Storage means 107
Stores a recognition table 106 and a plurality of document images 105.

【0051】108はメモリーである。メモリー108
にはプログラムやデータが格納される。
Reference numeral 108 is a memory. Memory 108
The program and data are stored in.

【0052】109は中央処理装置であって、画像入力
手段101、画像表示手段102、画像領域指示手段1
03、文字入力手段104、記憶手段107、メモリー
108、と相互に接続されており、これらを制御し、ま
た文字認識を行う。中央処理装置109はメモリー10
8に格納されたプログラムを実行することによって上記
制御等を行う。なお、中央処理装置109とメモリー1
08で制御手段を構成する。
Reference numeral 109 denotes a central processing unit, which includes image input means 101, image display means 102, and image area designating means 1.
03, the character input means 104, the storage means 107, and the memory 108 are mutually connected, and these are controlled and character recognition is performed. The central processing unit 109 is the memory 10
The above-mentioned control and the like are performed by executing the program stored in 8. The central processing unit 109 and the memory 1
08 constitutes a control means.

【0053】次に、上記実施例の動作をフローチャート
に基づいて説明する。
Next, the operation of the above embodiment will be described based on the flowchart.

【0054】図4は文書画像記憶検索装置におけるキー
ワード登録とキーワード検索の操作手順を表すフローチ
ャートである。以後、各ステップを順に説明する。
FIG. 4 is a flowchart showing the operation procedure of keyword registration and keyword search in the document image storage / retrieval apparatus. Hereinafter, each step will be described in order.

【0055】(ステップ401)いま画像表示手段10
1に文書画像105が表示され、その文書について任意
の言葉をキーワードとして登録しようとしている場面、
あるいは所定のキーワードを利用して検索し対応する文
書画像105が画像表示手段101に表示され、その文
書の中で、さらに、任意の言葉について再検索しようと
している場面において、その任意の言葉を領域指定する
ため、その文書画像105上の一点を画像領域指定手段
103で指定する。
(Step 401) Now the image display means 10
1, a document image 105 is displayed, and a scene in which an arbitrary word about the document is registered as a keyword,
Alternatively, the corresponding document image 105 is searched by using a predetermined keyword and is displayed on the image display means 101, and in the document, further, in a scene where an arbitrary word is to be searched again, the arbitrary word is changed to a region. In order to specify, a point on the document image 105 is specified by the image area specifying means 103.

【0056】(ステップ402)ステップ401で指定
された点が認識表301に登録された領域に含まれる場
合ステップ407へ移る。例えば、図2の点206は座
標(1131,339)であるので、既に登録している
領域205(図3においては、306の組で登録されて
いる)内である。含まれない場合は、ステップ403に
移る。
(Step 402) If the point designated in Step 401 is included in the area registered in the recognition table 301, the process proceeds to Step 407. For example, since the point 206 in FIG. 2 has coordinates (1131, 339), it is within the already registered area 205 (registered as a group of 306 in FIG. 3). If not included, the process proceeds to step 403.

【0057】(ステップ403)画像上の座標を更に1
点指定して領域を決定する。例えば、ステップ403で
認識表に登録済みの領域に含まれていない座標(52,
633)の点207が指定された場合を考える。ステッ
プ403でさらに座標(420,745)の点208を
指定することによって領域((52,633),(42
0,745))を表す領域209を決定する。
(Step 403) The coordinate on the image is further incremented by 1.
Specify the points to determine the area. For example, in step 403, the coordinates (52,
Consider the case where the point 207 of 633) is designated. In step 403, by further specifying the point 208 of the coordinates (420, 745), the regions ((52, 633), (42
Area 209 representing 0,745)) is determined.

【0058】(ステップ404)ステップ403で決定
された領域209内の文書画像に対して、中央処理装置
109により文字認識を行う。
(Step 404) The central processing unit 109 performs character recognition on the document image in the area 209 determined in step 403.

【0059】(ステップ405)ステップ404の認識
結果が誤っている場合これを修正する。例えばステップ
404で「文字認識」を表す文書画像の領域が誤って
「又時認識」に認識された場合を考える。このとき利用
者は正しい認識結果である文字列「文字認識」を文字入
力手段104を用いて入力する。
(Step 405) If the recognition result of step 404 is incorrect, it is corrected. For example, consider a case in which the area of the document image representing "character recognition" is erroneously recognized as "again recognition" in step 404. At this time, the user uses the character input means 104 to input the character string “character recognition” which is the correct recognition result.

【0060】(ステップ406)ステップ405で認識
された領域と認識結果と文書画像IDの組を認識表30
1に登録する。但し、とりあえずこのステップではキー
ワードフラグ305の値は0としておく。
(Step 406) The table which recognizes the group of the area recognized in step 405, the recognition result and the document image ID is recognized.
Register to 1. However, for the time being, the value of the keyword flag 305 is set to 0 in this step.

【0061】(ステップ407)認識表301の文字認
識結果に対応する組における属性「キーワードフラグ」
305の値が0でその文書のキーワードでない場合、ス
テップ408へ移り、他方、1である場合、ステップ4
10へ移る。
(Step 407) Attribute "keyword flag" in the set corresponding to the character recognition result in the recognition table 301.
If the value of 305 is 0 and it is not the keyword of the document, the process proceeds to step 408, while if it is 1, the process proceeds to step 4
Move to 10.

【0062】(ステップ408)キーワードでなかった
場合、認識結果をキーワードにするかを利用者に問い合
わせる。問い合わせに対する回答は例えば文字入力手段
104によって行う。再検索作業中においては、通常そ
の文書のキーワードとはされない。すなわち、キーワー
ドにしないと回答された場合にはステップ410へ移
る。また、再検索作業中でも例外的にその文書自体のキ
ーワードにする場合、あるいはキーワード登録のための
作業中ではキーワードとするため、ステップ409に移
行する。
(Step 408) If it is not the keyword, the user is inquired whether or not the recognition result is to be the keyword. The reply to the inquiry is made by the character input means 104, for example. During the re-search operation, it is not usually used as the keyword of the document. That is, when it is answered that the keyword is not used, the process proceeds to step 410. Further, when the keyword of the document itself is exceptionally used even during the re-search operation, or the keyword is used during the keyword registration operation, the process proceeds to step 409.

【0063】(ステップ409)認識結果に対応する組
のキーワードフラグの値を1にすることで認識結果をキ
ーワードとして登録する。キーワード登録作業はこれで
終了する。
(Step 409) The recognition result is registered as a keyword by setting the value of the keyword flag of the set corresponding to the recognition result to 1. This completes the keyword registration work.

【0064】(ステップ410)再検索作業では、認識
結果をキーワードとして認識表を検索する。例えば認識
結果が文字列「文字認識」であった場合、認識表301
の中から属性「文字認識結果」の値が「文字認識」であ
る組を検索する。この結果、元の認識結果が格納されて
いる組311の他に属性「画像ID」302の値が8で
ある組312が検索される。
(Step 410) In the re-search work, the recognition table is searched using the recognition result as a keyword. For example, when the recognition result is the character string “character recognition”, the recognition table 301
From among those, a set in which the value of the attribute “character recognition result” is “character recognition” is searched. As a result, in addition to the set 311 in which the original recognition result is stored, the set 312 in which the value of the attribute “image ID” 302 is 8 is searched.

【0065】(ステップ411)ステップ410の検索
結果に対応する文書画像を表示する。
(Step 411) The document image corresponding to the search result of step 410 is displayed.

【0066】このようにして、キーワード登録作業にお
いては、領域情報が利用され得るので、認識作業が省き
得て簡単となる。
In this way, since the area information can be used in the keyword registration work, the recognition work can be omitted and the operation becomes simple.

【0067】また、再検索作業中では、従来のようにキ
ーワードを新しく入力させる必要がなく、しかも、領域
を利用する場合は、既に登録済みの領域だと、認識作業
が省ける。
Further, during the re-search work, it is not necessary to newly input a keyword as in the conventional case, and when the area is used, the recognition work can be omitted if the area is already registered.

【0068】また、再検索の場合、領域情報がなく、文
字列認識を介して再検索することもできる。この場合で
も、従来のように新たに画面に存在するキーワードをキ
ーボードから入力する手間が省ける。
In the case of the re-search, there is no area information, and the re-search can be performed through the character string recognition. Even in this case, it is possible to save the trouble of inputting a keyword newly existing on the screen from the keyboard as in the conventional case.

【0069】[0069]

【発明の効果】以上述べたところから明らかなように、
本発明は、再検索やキーワード登録を容易に行うことが
可能な画像検索装置、画像記憶装置及び検索方法を実現
することが出来る。
As is apparent from the above description,
INDUSTRIAL APPLICABILITY The present invention can realize an image search device, an image storage device, and a search method that can easily perform re-search and keyword registration.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における装置の構成図FIG. 1 is a block diagram of an apparatus according to an embodiment of the present invention.

【図2】本発明の一実施例における文書画像の例FIG. 2 is an example of a document image according to an embodiment of the present invention.

【図3】本発明の一実施例における認識表の例FIG. 3 is an example of a recognition table in one embodiment of the present invention.

【図4】本発明の一実施例におけるキーワード登録手順
と検索手順のフローチャート
FIG. 4 is a flowchart of a keyword registration procedure and a search procedure according to an embodiment of the present invention.

【図5】従来技術における装置の構成図FIG. 5 is a block diagram of a device in the related art.

【図6】従来技術におけるキーワード表の例FIG. 6 is an example of a keyword table in the related art.

【図7】従来技術におけるキーワード登録手順の例FIG. 7 is an example of a keyword registration procedure in the related art.

【図8】従来技術における検索手順の例FIG. 8 is an example of a search procedure in the related art.

【符号の説明】[Explanation of symbols]

101 画像入力手段 102 画像表示手段 103 画像領域指示手段 104 文字入力手段 105 文書画像 106 認識表 107 記憶手段 108 メモリー 109 中央処理装置(制御手段) 101 Image Input Means 102 Image Display Means 103 Image Area Designating Means 104 Character Input Means 105 Document Images 106 Recognition Tables 107 Storage Means 108 Memory 109 Central Processing Unit (Control Means)

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 情報を記憶する記憶手段と、画像を入力
する画像入力手段と、画像を表示する画像表示手段と、
前記画像の一部領域を指示するための画像領域指示手段
と、前記記憶手段、前記画像入力手段、前記画像表示手
段、及び画像領域指示手段を制御する制御手段とを備
え、 前記画像入力手段から取り込んだ文字列を含む画像を前
記記憶手段に記憶し、記憶した画像を識別する指標と、
前記画像領域指示手段により指示された前記画像の領域
情報と、その領域を文字認識して得られる文字列とを少
なくとも有する組を前記記憶手段の認識表に記憶してお
き、 画像表示手段に表示された画像において、画像の再検索
のために、前記画像領域指示手段により領域を指示する
際、前記認識表中の画像領域情報が参照され既に認識済
みの場合は、前記認識表中の画像を識別する指標に基づ
き対応する目的の画像を得ることを特徴とする画像検索
装置。
1. Storage means for storing information, image input means for inputting an image, image display means for displaying the image,
An image area designating unit for designating a partial area of the image, a storage unit, the image input unit, the image display unit, and a control unit for controlling the image region designating unit are provided. An image including the captured character string is stored in the storage means, and an index for identifying the stored image,
A group having at least area information of the image designated by the image area designating means and a character string obtained by character recognition of the area is stored in the recognition table of the storage means and displayed on the image display means. In the identified image, when the area is instructed by the image area instructing means for re-searching the image, the image area information in the recognition table is referred to, and if the image is already recognized, the image in the recognition table is displayed. An image retrieval apparatus, which obtains a corresponding target image based on an index to be identified.
【請求項2】 情報を記憶する記憶手段と、画像を入力
する画像入力手段と、画像を表示する画像表示手段と、
前記画像の一部領域を指示するための画像領域指示手段
と、前記記憶手段、前記画像入力手段、前記画像表示手
段、及び画像領域指示手段を制御する制御手段とを備
え、 前記画像入力手段から取り込んだ文字列を含む画像を前
記記憶手段に記憶し、記憶した画像を識別する指標と、
前記画像領域指示手段により指示された前記画像の領域
情報と、その領域を文字認識して得られる文字列とを少
なくとも有する組を前記記憶手段の認識表に記憶してお
き、 画像表示手段に表示された画像において、キーワードの
登録のため、前記画像領域指示手段により領域を指示す
る際、前記認識表中の画像領域情報が参照され、既に認
識済みの場合は、前記認識表中の文字列をキーワードと
して登録し、登録していない場合は、その領域情報と、
その領域を文字認識して得られる文字列と、対応する画
像識別指標との組を認識表に登録し、この際、キーワー
ド登録することを特徴とする画像記憶装置。
2. Storage means for storing information, image input means for inputting an image, image display means for displaying the image,
An image area designating unit for designating a partial area of the image, a storage unit, the image input unit, the image display unit, and a control unit for controlling the image region designating unit are provided. An image including the captured character string is stored in the storage means, and an index for identifying the stored image,
A group having at least area information of the image designated by the image area designating means and a character string obtained by character recognition of the area is stored in the recognition table of the storage means and displayed on the image display means. In the registered image, when the area is instructed by the image area instructing means for the registration of the keyword, the image area information in the recognition table is referred to, and if already recognized, the character string in the recognition table is changed. Registered as a keyword, and if not registered, the area information and
An image storage device characterized in that a set of a character string obtained by character recognition of the area and a corresponding image identification index is registered in a recognition table, and at this time, a keyword is registered.
【請求項3】 所定のデータベースにおける任意のキー
ワードにより、文字列を含む画像を画面に表示し、その
表示画像のなかの所定の文字列を領域指定し、その領域
指定された文字列に基づいて、その文字列をキーワード
とする別の画像を前記データベースから再検索して表示
することを特徴とする画像検索方法。
3. An image containing a character string is displayed on a screen by an arbitrary keyword in a predetermined database, a predetermined character string in the displayed image is designated as an area, and based on the character string designated as the area. An image retrieval method, wherein another image having the character string as a keyword is re-retrieved from the database and displayed.
【請求項4】 領域指定された文字列は、文字認識動作
によって得られることを特徴とする請求項3記載の画像
検索方法。
4. The image retrieval method according to claim 3, wherein the region-specified character string is obtained by a character recognition operation.
JP6007422A 1994-01-27 1994-01-27 Image retrieving device, image storage device and retrieving method Pending JPH07210576A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6007422A JPH07210576A (en) 1994-01-27 1994-01-27 Image retrieving device, image storage device and retrieving method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6007422A JPH07210576A (en) 1994-01-27 1994-01-27 Image retrieving device, image storage device and retrieving method

Publications (1)

Publication Number Publication Date
JPH07210576A true JPH07210576A (en) 1995-08-11

Family

ID=11665440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6007422A Pending JPH07210576A (en) 1994-01-27 1994-01-27 Image retrieving device, image storage device and retrieving method

Country Status (1)

Country Link
JP (1) JPH07210576A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (en) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk Device and method for preparing retrievable image data, whetted and device for retrieving image data, storage medium for recording program for preparing retrievable image data and program for retrieving image data storage medium for recording retrievable image
JP2011090427A (en) * 2009-10-21 2011-05-06 Fujifilm Corp Document browsing system and control method of the same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120201A (en) * 1997-10-16 1999-04-30 Bunsei Shoin:Kk Device and method for preparing retrievable image data, whetted and device for retrieving image data, storage medium for recording program for preparing retrievable image data and program for retrieving image data storage medium for recording retrievable image
JP2011090427A (en) * 2009-10-21 2011-05-06 Fujifilm Corp Document browsing system and control method of the same

Similar Documents

Publication Publication Date Title
JPS59183458A (en) Picture retrieving system
JPS6362033A (en) Display device for relative information
JP4054428B2 (en) Image search apparatus and method, and computer-readable memory
JP2005182460A (en) Information processor, annotation processing method, information processing program, and recording medium having information processing program stored therein
JP2005107931A (en) Image search apparatus
JPH07210576A (en) Image retrieving device, image storage device and retrieving method
JPH03276260A (en) Electronic filing device containing title processing function for character code
JPH0991307A (en) Relative information display device and relative information display control method
JPS6249528A (en) Help guidance system
JPS63265367A (en) Image updating method for electronic filing system
JPH04148370A (en) Document processor
JP2008009606A (en) Electronic book browsing device
JPH0514304B2 (en)
JP2616522B2 (en) Document image information editing device
JPS6355667A (en) Image data management system
JPH11328200A (en) Picture retrieving device, its method and information recording medium
JPH08202859A (en) Electronic filing device and its method
JP5067041B2 (en) Document processing apparatus and document processing program
JPH0476773A (en) Map retrieving device
JP2005165562A (en) Image display device, image display method, computer program and recording medium
JPH0354669A (en) Picture display device
JPH08263512A (en) Document retrieval device
JPH08123813A (en) Electronic file device
JP2001142880A (en) Document management device, method therefor, and storage medium
JPH0736916A (en) Image retrieval device