JP3305367B2 - データベースへのデータ入力装置 - Google Patents

データベースへのデータ入力装置

Info

Publication number
JP3305367B2
JP3305367B2 JP21427892A JP21427892A JP3305367B2 JP 3305367 B2 JP3305367 B2 JP 3305367B2 JP 21427892 A JP21427892 A JP 21427892A JP 21427892 A JP21427892 A JP 21427892A JP 3305367 B2 JP3305367 B2 JP 3305367B2
Authority
JP
Japan
Prior art keywords
character
image
database
key
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21427892A
Other languages
English (en)
Other versions
JPH0660129A (ja
Inventor
守人 塩原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21427892A priority Critical patent/JP3305367B2/ja
Publication of JPH0660129A publication Critical patent/JPH0660129A/ja
Application granted granted Critical
Publication of JP3305367B2 publication Critical patent/JP3305367B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータベースへのデータ
入力装置に係り、特に文書や図面等の二値画像だけでは
なく、多値画像データである写真等の自然画像をもデー
タとして蓄積するデータベースのデータの検索用のキー
を自動的に付与するデータベースへのデータ入力装置に
関するものである。
【0002】このような装置は、例えば集合記念写真等
を大量に蓄積し、顧客の求めに応じて取り出してプリン
トを作成するようなデータベースに適用される。そし
て、このような写真には、撮影個所、撮影日時、団体名
等が記載された表示板等が画像として撮影されているこ
とが多く、かかる文字をキーとして採用すれば、検索に
便利である。データベースの検索キーを自動的につける
装置は膨大な量の画像にキーを人手でつける手間を軽減
させるだけでなく、データを入力するユーザが気づかな
いキーを見つけることができるので、画像データベース
を構築するのには欠くことのできない技術である。
【0003】
【従来の技術】従来から、画像データに検索キーを自動
的に付与する技術は存在した。これは、格納すべき画像
からその画像中に含まれる文字列を抽出し、認識するこ
とにより、その認識した文字列を検索キーとするもので
ある。このような、従来の技術では、検索キーをつける
対象の画像は文書や図面のような文字がはっきり認識し
やすいものに限られている。これは、例えば、文字が並
ぶ方向も全て同じであり、また、文字の部分は濃淡値が
1(黒)であり、他の部分は0(白)であるような二値
画像であるものである。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術にあっては自然画像からは検索キーが抽出
できない。これは、 一つの文字が複数の濃淡で書かれていると認識できな
いこと。 不規則な文字の並びは対処できないこと。
【0005】異なる大きさの文字を認識することがで
きないこと。に由来する。そこで、本発明は自然画像か
らでも検索用のキーを抽出して、自然画像とともに格納
することができるデータベースへのデータ入力装置を提
供することを目的とする。
【0006】
【課題を解決するための手段】本発明において上記の課
題を解決するための第1の手段は、図1に示すように、
画像1を登録データとし、当該画像1と共に当該画像に
関連する文字列をデータ検索用のキーとして格納してお
くデータベース2にデータである画像1とキーである文
字列とを入力する装置において、当該画像1中に記録さ
れた文字部分を抽出する文字抽出手段3と、当該文字部
分の角度、大きさを正規化する文字正規化手段4と、正
規化された文字を認識する文字認識手段5と、当該認識
された文字を上記データ検索用のキーとして画像と共に
データベース1に格納する格納手段6とを設けたことで
ある。
【0007】また、本発明では、上記第1の手段におい
て、文字抽出手段3は、画像から類似の色相、明度また
は彩度毎の領域に分割し、当該領域を特定の大きさ以上
である場合には文字ではないと認識して、文字部分を抽
出することができる。さらに、本発明では、上記第1及
び第2の手段において、文字正規化手段4は、抽出した
文字領域を、当該抽出した文字領域に外接する矩形の面
積を最小にする矩形に基づき領域の位置を決定する文字
の正規化処理を行うことができる。
【0008】そして、本発明において、上記第1乃至第
3手段において、文字正規化手段4は、抽出した領域か
ら文字の重心位置を求め、当該重心位置を中心とした軸
を0°から180°まで変化させる間でその軸を中心軸
にもつ外接矩形の面積を最小にする中心軸を算出し、矩
形の中心軸を画面における縦軸とするように位置を決定
することができる。
【0009】また、上記第1乃至第4の手段において、
文字正規化手段4は、文字の大きさを文字認識用の辞書
に登録されている画像の大きさに拡大縮小することがで
きる。そして、本発明では上記第1乃至第5の手段にお
いて、格納手段(6)は、文字方法、外接矩形の横軸の
方向、隣接文字間の間隔がともに同じになる文字列を一
つの検索キーとして認識してキー付加を行うことができ
る。
【0010】
【作用】本発明によれば、画像を予め類似した濃淡もし
くは彩度の領域に分割する(セグメンテーション)。こ
れにより対象はひとつの領域によって表される。これら
の領域に対して1から順番にラベルを付け、ラベル毎に
領域を切りだす。各々の領域を、外接矩形の面積が最小
になるように置きなおし、辞書と同じ大きさになるよう
に縮小/拡大する(正規化)。辞書の中に登録されてい
る文字と類似する領域は文字として認識する。外接矩形
の面積が予め定めた大きさより大きい場合や小さい場合
は背景として認識しない。
【0011】これにより、画像中の文字を認識して、キ
ーとして画像と共に格納できることとなる。
【0012】
【実施例】以下、本発明に係るデータベースへのデータ
入力装置の実施例を説明する。本実施例において、デー
タベースへのデータ入力装置は、写真等の自然画像から
文字の部分を抽出、認識して、画像のキーとして付加
し、データベースに格納するものである。
【0013】本実施例において、データ入力装置は、図
2に示すように、文字抽出手段であるセグメンテーショ
ン部12及び切りだし部13と、正規化手段である正規
化部14と、文字認識手段である認識部15及び辞書1
6と、データベース18への格納手段であるキー付加部
17の各部から構成される。 以下に各部の機能と動作
について述べる。尚、以下画像はすべて左上隅を原点、
横軸をX軸、縦軸をY軸とした座標系をもつものとす
る。処理の全体の流れは、図3に示すように、自然画像
であり、例えば「領域」、「文字認識」及び「切りだ
し」なる文字を含むる画像11(図3(1))から該当
文字をセグメンテーション部12及び切りだし部13で
切りだし(図3(2))、この文字を正規化部14で正
規化後、認識部15で辞書16を参照して認識し(図3
(3))、キー付加部17によりデータベース18に自
然画像とともにキーとして上記「領域」、「文字認識」
及び「切りだし」の文字を登録する(図3(4))。即
ち、本実施例では図4に示すように自然画像中に階調を
有して描かれ、傾いた文字、この例では文字「2」
(図4(1))を切りだし(図4(2))、傾き、大き
さを正規化して(図4(3))、認識する(図4
(4))ものである。
【0014】セグメンテーション部12では図5に示す
ように、原画像を濃淡や彩度の類似した領域毎に区切る
(図5(1))。この処理には公知の領域分割手法を用
いる。切りだし部では画像を走査しながら例えば同一領
域中の最大画素値で全ての画素を塗り替え、更に、同一
画素の領域を1から順に番号をラベルとして付加し、そ
れぞれ違うラベルのついた領域を抽出する(図5
(2),(3))。
【0015】正規化部では、図6に示すように、それぞ
れのラベルのついた領域に対して、上から下に向けて走
査しラベルのある画素のX座標、Y座標の平均を算出し
て(図6(1))領域の重心を求める(図6(2))。
そして、重心を通る直線をY軸に対して0°〜180°
まで例えば1°間隔で回転させ、その際、直線を中心軸
とする領域の外接矩形を算出し、その面積を記録する
(図6(3))。直線の回転が終わった時点で面積が最
小になった角度を求める。この外接矩形を横軸(直線に
垂直な線)をX軸と平行になるように領域を回転させる
(図6(4))。このとき、面積の大きさが予め定めた
値Hよりも大きい場合と、同様に予め定めた値hよりも
小さい場合(H>h)は背景の領域として認識部には送
らない。
【0016】認識部では図7に示すように、辞書(文字
とその画像(文字領域を1、その他を0)とを登録した
もの)に登録されている画像の大きさが横a縦bとする
と、正規化した画像をその大きさに縮小もしくは拡大す
る(図7(1))。具体的には、正規化した画像の大き
さを横A縦Bとすると横をa/A倍、縦をb/B倍す
る。その後、領域を細線化する。具体的には領域を周囲
から1画素ずつ取り去ってゆき、8接近で連結する骨子
だけを残す(図7(2))。この骨子と辞書とを比較し
同じもしくは類似した画素をもつ文字を認識結果とする
(図7(2))。
【0017】類似したか否かの判断は例えば、骨子と辞
書の画素とのXORが最小になる文字を選択する。この
辞書とを比較では、文字を上下回転させて2回比較する
ものとする。キー付加部は、各々文字を文字列として認
識する部分である。この部分では、、図8に示すよう
に、文字の外接矩形の横軸の方向が同じであること、文
字の方向が同じであること、隣接する文字の間隔が同じ
であること、の3つの条件を満たしている文字列を一つ
の文字列として、画像にキーとして付加し、画像ととも
にデータベースに保存する。
【0018】これにより、1つの画像のデータにその画
像に含まれていた文字列がキーとして付加されたデータ
をデータベースに入力される。これは例えば画像が団体
記念写真であれば、当該写真に写っている表示板等に記
載された撮影個所、撮影日時、団体名等がキーとして入
力され、後日必要な写真を検索するのに便利である。
【0019】
【発明の効果】以上説明したように、本発明に係るデー
タベースへのデータ入力装置によれば、自然画像を対象
としたデータベースのキーを自動抽出することが可能と
なる。そして、このキーの抽出に際しては、画像から文
字の方向や大きさに無関係に抽出することができる。
【図面の簡単な説明】
【図1】本発明の原理構成を示す図である。
【図2】本発明の実施例の構成を示す図である。
【図3】実施例の動作の概略手順を示す図である。
【図4】実施例の文字の認識までの手順を示す図であ
る。
【図5】実施例のセグメンテーションの処理を示す図で
ある。
【図6】文字の正規化の処理手順を示す図である。
【図7】文字の認識処理を示す図である。
【図8】文字列の認識処理を示す図である。
【符号の説明】
1 画像 2 データベース 3 文字抽出手段 4 文字正規化手段 5 文字認識手段 6 格納手段
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06K 9/32,9/34,9/42

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像を登録データとし、当該画像と共に
    当該画像に関連する文字列をデータ検索用のキーとして
    格納しておくデータベースにデータである画像とキーで
    ある文字列とを入力する装置において、 当該画像中に記録された文字部分を抽出するときには、
    画像から類似の色相、明度または彩度毎の領域に分割
    し、当該領域を特定の大きさ以上である場合には文字で
    はないと認識して、文字部分を抽出する文字抽出手
    、 当該文字部分の角度、大きさを正規化する文字正規化手
    段と、 正規化された文字を認識する文字認識手段と、 当該認識された文字を上記データ検索用のキーとして画
    像と共にデータベースに格納する格納手段とを設けたこ
    とを特徴とするデータベースへのデータ入力装置。
  2. 【請求項2】 文字正規化手段は、抽出した文字領域
    を、当該抽出した文字領域に外接する矩形の面積を最小
    にする矩形に基づき領域の位置を決定する文字の正規化
    処理を行うことを特徴とする請求項1記載のデータベー
    スへのデータ入力装置。
  3. 【請求項3】 文字正規化手段は、抽出した領域から文
    字の重心位置を求め、当該重心位置を中心とした軸を0
    °から180°まで変化させる間でその軸を中心軸にも
    つ外接矩形の面積を最小にする中心軸を算出し、矩形の
    中心軸を画面における縦軸とするように位置を決定する
    ことを特徴とする請求項1または請求項2記載のデータ
    ベースへのデータ入力装置。
  4. 【請求項4】 文字正規化手段は、文字の大きさを文字
    認識用の辞書に登録されている画像の大きさに拡大縮小
    することを特徴とする請求項1、請求項2または請求項
    3記載のデータベースへのデータ入力装置。
  5. 【請求項5】 格納手段は、文字方向、外接矩形の横軸
    の方向、隣接文字間の間隔がともに同じになる文字列を
    一つの検索キーとして認識してキー付加を行うことを特
    徴とする請求項1、請求項2、請求項3または請求項4
    記載のデータベースへのデータ入力装置。
JP21427892A 1992-08-11 1992-08-11 データベースへのデータ入力装置 Expired - Fee Related JP3305367B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21427892A JP3305367B2 (ja) 1992-08-11 1992-08-11 データベースへのデータ入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21427892A JP3305367B2 (ja) 1992-08-11 1992-08-11 データベースへのデータ入力装置

Publications (2)

Publication Number Publication Date
JPH0660129A JPH0660129A (ja) 1994-03-04
JP3305367B2 true JP3305367B2 (ja) 2002-07-22

Family

ID=16653088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21427892A Expired - Fee Related JP3305367B2 (ja) 1992-08-11 1992-08-11 データベースへのデータ入力装置

Country Status (1)

Country Link
JP (1) JP3305367B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07322184A (ja) * 1994-05-20 1995-12-08 Olympus Optical Co Ltd 登録装置及び登録装置を用いた画像ファイリング装置
JP2001125915A (ja) 1999-10-28 2001-05-11 Fujitsu Ltd 情報検索装置

Also Published As

Publication number Publication date
JPH0660129A (ja) 1994-03-04

Similar Documents

Publication Publication Date Title
US5822454A (en) System and method for automatic page registration and automatic zone detection during forms processing
US5818978A (en) Image pre-processor for character image recognition system
US5867277A (en) Reduced resolution document storage and retrieval system
EP1516264B1 (en) Image retrieval by generating a descriptor for each spot of an image the cells of which having visual characteristics within a selected tolerance
US5809167A (en) Page segmentation and character recognition system
JP4073156B2 (ja) 画像検索装置
US6621941B1 (en) System of indexing a two dimensional pattern in a document drawing
JP4757001B2 (ja) 画像処理装置、画像処理方法
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
US5650799A (en) Programmable function keys for a networked imaging computer system
US6321232B1 (en) Method for creating a geometric hash tree in a document processing system
JPH08255236A (ja) 画像のファイリング装置及びファイリング方法
US20090304271A1 (en) Object region extracting device
JP3602596B2 (ja) ドキュメントファイリング装置および方法
JPH0750483B2 (ja) 文書画像追加情報の蓄積方法
JP3305367B2 (ja) データベースへのデータ入力装置
JPH08180068A (ja) 電子ファイリング装置
JP2001126010A (ja) 帳票処理装置、帳票定義作成方法、領域抽出方法及び記憶媒体
JP2000259847A (ja) 情報検索方法、装置および記録媒体
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
CN113887484B (zh) 一种卡片式文件图像识别方法和装置
JP7231529B2 (ja) 情報端末装置、サーバ及びプログラム
JP2008159049A (ja) 画像記録システム
JPH11306282A (ja) 文字列領域抽出方法及び装置
JP3412998B2 (ja) 画像処理装置及びその方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020423

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080510

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090510

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100510

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees