JP3073206B2 - 画像認識方法及び装置 - Google Patents

画像認識方法及び装置

Info

Publication number
JP3073206B2
JP3073206B2 JP63148317A JP14831788A JP3073206B2 JP 3073206 B2 JP3073206 B2 JP 3073206B2 JP 63148317 A JP63148317 A JP 63148317A JP 14831788 A JP14831788 A JP 14831788A JP 3073206 B2 JP3073206 B2 JP 3073206B2
Authority
JP
Japan
Prior art keywords
area
image
graphic
recognition
resolution data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63148317A
Other languages
English (en)
Other versions
JPH01316883A (ja
Inventor
新子 石谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63148317A priority Critical patent/JP3073206B2/ja
Publication of JPH01316883A publication Critical patent/JPH01316883A/ja
Application granted granted Critical
Publication of JP3073206B2 publication Critical patent/JP3073206B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [発明の属する技術分野] 本発明は画像認識方法及び装置、特に、文字と図形と
が混在する画像を処理する画像認識方法及び装置に関す
るものである。
[従来の技術] 従来の画像認識装置は、16pelラインセンサで画像を
読み取り、読み取つたイメージデータを格納するバツフ
アメモリと、該バツフアメモリ内に展開されたイメージ
データ中の文字記号パターンを認識する文字認識部と、
図形を認識する図形認識部とから構成されている。
第2図は従来の画像認識装置のブロツク構成図であ
る。画像読み取り装置22で原稿21を光学的に読み取り、
読み取つたイメージデータはバツフアメモリ23に格納さ
れる。図形認識部24がバツフアメモリ23のイメージデー
タ中の図形を認識し、一方、文字認識部25は文字フオン
トROM26内のフオント情報及び図形認識部24で得られた
図形内の文字情報を元に、バツフアメモリ23内で展開さ
れたイメージデータ中の文字記号パターンを認識する。
図形認識部24で認識された図形及び文字認識部25で認
識された文字パターンに対応して文字フオントROM26か
ら読み出された文字フオントは、表示用のRAMであるVRA
M27に書込まれる。VRAM27に格納された各種パターン
は、グラフイツクコントローラ(以下GC)28によつて、
CRT29に表示される。20は本装置全体を制御するCPUであ
り、装置全体を制御するための制御プログラムを格納す
るROM20aと、CPU20のワークエリアとして使用するRAM20
bとを有している。
[発明が解決しようとする課題] しかしながら、上記従来例では、16pelで原稿1枚分
を読み取つた後に、認識処理を開始するために、次のよ
うな欠点があつた。
1)原稿1枚分の画像データを格納する膨大なバツフア
メモリが必要である。
2)原稿1枚分を読み取るまでの、読み込みにかかる時
間が大きい。
3)読み込みながら図形及び文字認識を行うようなリア
ルタイム処理ができない。
本発明は、前記従来の欠点を除去し、記憶容量を節約
し、かつ、画像の属性毎に適切な処理を施すことが容易
となり、処理の効率化を図ることができる画像認識方法
及び装置を提供する。
[課題を解決するための手段] この課題を解決するために、本発明に係る画像認識方
法は、 部分画像領域として文字領域及び図形領域が混在する
被認識画像に対し、文字認識及び図形認識を行なう画像
認識方法であって、 前記被認識画像を第1解像度で入力し、第1解像度デ
ータとして第1格納手段に格納する第1入力工程と、 前記第1解像度データを解析して、前記被認識画像に
含まれる前記部分画像領域の位置と文字領域か図形領域
かを自動的に識別する識別工程と、 前記被認識画像を前記第1解像度よりも高い第2解像
度で入力し、前記識別工程で文字領域として識別された
領域の第2解像度データは第2格納手段に格納し、図形
領域として識別された領域の第2解像度データは前記第
1格納手段に格納する第2入力工程と、 前記第2入力工程において前記第2格納手段に所定領
域分の前記第2解像度データが格納される毎に、繰り返
し、前記第2格納手段に格納された第2解像度データに
対して文字認識を行う文字認識工程と、 前記第1格納手段に格納された第2解像度データに対
して図形認識を行なう図形認識工程と、 を有することを特徴とする。
また、本発明に係る画像認識装置は、部分画像領域と
して文字領域及び図形領域が混在する被認識画像に対
し、文字認識及び図形認識を行なう画像認識装置であっ
て、 第1格納手段と、 第2格納手段と、 前記被認識画像を第1解像度で入力し、第1解像度デ
ータとして前記第1格納手段に格納する第1入力手段
と、 前記第1解像度データを解析して、前記被認識画像に
含まれる前記部分画像領域の位置と文字領域か図形領域
かを自動的に識別する識別手段と、 前記被認識画像を前記第1解像度よりも高い第2解像
度で入力し、前記識別手段で文字領域として識別された
領域の第2解像度データは前記第2格納手段に格納し、
図形領域して識別された領域の第2解像度データは前記
第1格納手段に格納する第2入力手段と、 前記第2入力手段によって前記第2格納手段に所定領
域分の前記第2解像度データが格納される毎に、繰り返
し、前記第2格納手段に格納された第2解像度データに
対して文字認識を行う文字認識手段と、 前記第1格納手段に格納された第2解像度データに対
して図形認識を行なう図形認識手段と、 を有することを特徴とする。
また、前記所定領域分の第2解像度データとは、文字
1行分の第2解像度データであることを特徴とする。
[実施例] 以下添付図面に従つて本発明に係る実施例を詳細に説
明する。
第1図は本実施例の画像認識装置のブロツク構成図で
ある。図中1は原稿であり、2は原稿を光学的に読み取
る画像読み取り装置である。3は読み取つたイメージデ
ータを格納するバツフアメモリである。4はバツフアメ
モリ3内に展開されたイメージデータ中の文字領域と図
形領域とを識別する領域の識別部であり、その処理の内
容は後述する。5は1行分のデータを格納するためのラ
インバツフアであり、6は1行分のデータから文字の切
り出し及び認識を行う文字認識部である。7は図形(表
及びグラフ)を認識する図形認識部であり、図形中の文
字(表中の文字など)は、図形認識部7で抽出され文字
認識部6で文字認識される。
図形認識部7で認識された図形パターン及び文字認識
部6で認識された文字パターンに対応して文字フオント
ROM8から読み出された文字パターンは、表示用のRAMで
あるVRAM9に書き込まれる。VRAM9に格納された各種パタ
ーンはGC10によつて、CRT11に表示される。
12は本実施例の画像認識装置全体を制御するCPUてあ
り、制御プログラム(第3図のフローチャート)を格納
するROM12aと、CPU12のワークエリアとして使用するRAM
12bとを有している。
以上の構成における本実施例の画像認識装置の基本的
な処理内容を、第3図のフローチャートに従つて説明す
る。
まずステツプS1で、イメージスキヤナ等により、原稿
を間引きして読み込む。例えば4pelで入力して、バツフ
アメモリ3に格納する。尚、間引きは入力する原稿によ
り種々設定できる。次にステツプS2で、バツフアメモリ
3の間引いたイメージデータから、文字領域と図形領域
の識別を行う。識別の方法としては、従来から、原稿の
x軸方向とy軸方向との黒画素のヒストグラムの特徴か
ら識別する方法や、イメージデータの細線化及びベクト
ル化を行いベクトルの長さやベクトル間の距離関係から
識別する方法などがある。このように、文字領域と図形
領域とを識別すると、第4図のように各領域を表わす座
標値が求まる。
次にステツプS3で原稿を1ラインづつ読み込む。ステ
ツプS4ではステツプS2で求めた座標値をもとに領域を判
定し、文字領域に含まれる場合はステツプS5に進んでラ
インバツフア5にデータを格納し、図形領域に含まれる
データはステツプS6に進んで図形データをバツフアメモ
リ3に格納する。ステツプS7で1行分の入力が終わつた
かをチエツクし、まだの場合はステツプS3に戻り、デー
タの格納を繰り返す。1行分の入力が終われば、ステツ
プS8で図形の入力が全て終了したかをチエツクし、終了
した場合は、ステツプS9で図形に認識を行う。図形認識
の方法は、画像データを細線化,ベクトル化した後ソー
テイング及び形成化処理を行い、枠線などを確認する方
法である。図形の入力が終了してない場合はステツプS9
は飛ばす。
図形入力の状態には関係なく、ステツプS10では文字
の切り出しを行い、ステツプS11では切り出した文字の
大きさの正規化を行い、正規化した文字画像から方向指
数ヒストグラムによる196次元の特徴抽出等を行い、大
分類識別,詳細識別の計算結果より、文字の最終認識結
果を選出し、文字の認識を行う。又、図中の文字(表中
の文字など)も、ステツプS10で切り出され、ステツプS
11で文字認識される。ステツプS12では、1毎分の原稿
が入力されたかをチエツクし、まだならばステツプS3に
戻り、ステツプS3〜S12を繰り返す。
以上説明したように、原稿を間引き入力して領域の識
別をし、バツフアメモリへは図形領域の画像データした
格納されないので、イメージデータを格納するためのバ
ツフアメモリが少なくてすむ。また、読み込んだイメー
ジデータから文字領域と図形領域とを識別分解したデー
タをもつことにより、ラインセンサで入力した文字及び
図形データを、特に文字の場合は1行単位でリアルタイ
ムで認識することが可能になり、読み込みに必要な時間
も短縮された。
[発明の効果] 本願発明によれば、記憶容量を節約し、かつ、被認識
画像の画像データを属性毎に別個に格納するので、画像
の属性毎に適切な処理を施すことが容易となり、処理の
効率化を図ることができる。
【図面の簡単な説明】
第1図は本実施例の画像認識装置のブロツク図、 第2図は従来の画像認識装置のブロツク図、 第3図は本実施例の画像認識装置の処理手順を示すフロ
ーチヤート、 第4図は本実施例の文字領域と図形領域との識別を示す
図である。 図中、1……原稿、2……画像読み取り装置、3……バ
ツフアメモリ、4……領域識別部、5……ラインバツフ
ア、6……文字認識部、7……図形認識部、8……文字
フオントROM、9……VRAM、10……GC、11……CRT、12…
…CPU、12a……ROM、12b……RAMである。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭56−116182(JP,A) 特開 昭63−116282(JP,A) 特開 昭63−24367(JP,A) 特開 昭59−45765(JP,A) 特開 昭63−109591(JP,A) 特開 昭63−59678(JP,A) 実開 昭62−196465(JP,U)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】部分画像領域として文字領域及び図形領域
    が混在する被認識画像に対し、文字認識及び図形認識を
    行なう画像認識方法であって、 前記被認識画像を第1解像度で入力し、第1解像度デー
    タとして第1格納手段に格納する第1入力工程と、 前記第1解像度データを解析して、前記被認識画像に含
    まれる前記部分画像領域の位置と文字領域か図形領域か
    を自動的に識別する識別工程と、 前記被認識画像を前記第1解像度よりも高い第2解像度
    で入力し、前記識別工程で文字領域として識別された領
    域の第2解像度データは第2格納手段に格納し、図形領
    域として識別された領域の第2解像度データは前記第1
    格納手段に格納する第2入力工程と、 前記第2入力工程において前記第2格納手段に所定領域
    分の前記第2解像度データが格納される毎に、繰り返
    し、前記第2格納手段に格納された第2解像度データに
    対して文字認識を行う文字認識工程と、 前記第1格納手段に格納された第2解像度データに対し
    て図形認識を行なう図形認識工程と、 を有することを特徴とする画像認識方法。
  2. 【請求項2】前記所定領域分の第2解像度データとは、
    文字1行分の第2解像度データであることを特徴とする
    請求項1に記載の画像認識方法。
  3. 【請求項3】部分画像領域として文字領域及び図形領域
    が混在する被認識画像に対し、文字認識及び図形認識を
    行なう画像認識装置であって、 第1格納手段と、 第2格納手段と、 前記被認識画像を第1解像度で入力し、第1解像度デー
    タとして前記第1格納手段に格納する第1入力手段と、 前記第1解像度データを解析して、前記被認識画像に含
    まれる前記部分画像領域の位置と文字領域か図形領域か
    を自動的に識別する識別手段と、 前記被認識画像を前記第1解像度よりも高い第2解像度
    で入力し、前記識別手段で文字領域として識別された領
    域の第2解像度データは前記第2格納手段に格納し、図
    形領域として識別された領域の第2解像度データは前記
    第1格納手段に格納する第2入力手段と、 前記第2入力手段によって前記第2格納手段に所定領域
    分の前記第2解像度データが格納される毎に、繰り返
    し、前記第2格納手段に格納された第2解像度データに
    対して文字認識を行う文字認識手段と、 前記第1格納手段に格納された第2解像度データに対し
    て図形認識を行なう図形認識手段と、 を有することを特徴とする画像認識装置。
  4. 【請求項4】前記所定領域分の第2解像度データとは、
    文字1行分の第2解像度データであることを特徴とする
    請求項3に記載の画像認識装置。
JP63148317A 1988-06-17 1988-06-17 画像認識方法及び装置 Expired - Fee Related JP3073206B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63148317A JP3073206B2 (ja) 1988-06-17 1988-06-17 画像認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63148317A JP3073206B2 (ja) 1988-06-17 1988-06-17 画像認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH01316883A JPH01316883A (ja) 1989-12-21
JP3073206B2 true JP3073206B2 (ja) 2000-08-07

Family

ID=15450083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63148317A Expired - Fee Related JP3073206B2 (ja) 1988-06-17 1988-06-17 画像認識方法及び装置

Country Status (1)

Country Link
JP (1) JP3073206B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56116182A (en) * 1980-02-15 1981-09-11 Ricoh Co Ltd Method and device for character judgement of input picture
JPS63116282A (ja) * 1986-11-05 1988-05-20 Hitachi Ltd 画像入力付きocr

Also Published As

Publication number Publication date
JPH01316883A (ja) 1989-12-21

Similar Documents

Publication Publication Date Title
CN110390269B (zh) Pdf文档表格提取方法、装置、设备及计算机可读存储介质
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US5093868A (en) Method for determining lines of character images for use in an optical reader
US5129012A (en) Detecting line segments and predetermined patterns in an optically scanned document
US5526440A (en) Hand-written character recognition apparatus
JP3062382B2 (ja) 画像処理装置及び方法
EP0461760B1 (en) Image processing apparatus and method
EP0457546B1 (en) Image processing method and apparatus
JP3073206B2 (ja) 画像認識方法及び装置
US5787202A (en) Character recognition apparatus
JP2803736B2 (ja) 文字認識方式
JP3052438B2 (ja) 表認識装置
JPH11187231A (ja) 画像検索装置及び画像検索方法
JPH0830725A (ja) 画像処理装置及び方法
JP2762476B2 (ja) 清書装置
JP2740506B2 (ja) 画像認識方法
JPH10116314A (ja) 表処理方法及び表処理装置
JPH0610447Y2 (ja) 画像処理装置
CN116778032A (zh) 答题卡生成方法、装置、设备和存储介质
JPH0620098A (ja) 文字認識装置
JPH03103996A (ja) 光学的文字読取装置
JPH01213690A (ja) 文字表示装置
JPH06101028B2 (ja) 文字ドツト・フオント線分化方式
JPH06119486A (ja) 文字認識装置および表示方法
JPH04360294A (ja) 表認識装置および表認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees