JPH0528317A - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JPH0528317A
JPH0528317A JP3182505A JP18250591A JPH0528317A JP H0528317 A JPH0528317 A JP H0528317A JP 3182505 A JP3182505 A JP 3182505A JP 18250591 A JP18250591 A JP 18250591A JP H0528317 A JPH0528317 A JP H0528317A
Authority
JP
Japan
Prior art keywords
contour
character
starting point
image
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3182505A
Other languages
English (en)
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3182505A priority Critical patent/JPH0528317A/ja
Priority to US07/915,306 priority patent/US5335294A/en
Priority to EP92306651A priority patent/EP0524797B1/en
Priority to DE69228965T priority patent/DE69228965T2/de
Publication of JPH0528317A publication Critical patent/JPH0528317A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 (修正有) 【目的】ラインごとに入力された画像情報から文字情報
を正しく切り出す。 【構成】輪郭線追跡により文字を抽出する際に、罫線の
ある文字や、白黒反転されている文字は抽出できない。
これを解決する為に、ある点から輪郭を追跡して画像の
端に達した時は、罫線があるとして開始点を変えて再度
輪郭追跡を開始することにより、罫線を越えて文字を抽
出することができるようになる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、行または列ごとに入力
された画像情報から文字情報を正しく切り出し、認識し
ようとする画像処理方法及び装置に関するものである。
【0002】
【従来の技術】従来の画像情報から文字を認識すること
のできる装置は図12のように構成されていた。41は
被読み取り物上の文字画像をアナログ電気信号に変換す
るスキヤナ、42はアナログ信号の二値化やノイズ除去
を行う前処理部、43は文字列を1文字ごとに分離する
文字切り出し部、、44は予め定められたアルゴリズム
に従って文字固有の特徴を抽出し特徴ベクトルを生成す
る特徴抽出部、45は特徴ベクトルの字種ごとの統計量
(平均値・分散等)を格納しておく認識辞書、46は入
力文字画像から得られた特徴ベクトルと認識辞書を照合
し最適な候補を選択する照合部、47は単語の翻訳結果
を格納しておく単語辞書、48は認識した文字列から単
語辞書を参照し対応する訳語を取出す辞書検索部、49
は訳語を表示する表示部である。
【0003】
【発明が解決しようとしている課題】上記従来例では、
次の2つの欠点があった。
【0004】(1) 黒地に白色で書かれた、いわゆる
白抜き文字が認識できない。図7、図10に白抜き文字
の例を示す。
【0005】従来技術として、画像バツフア全体におい
て黒画素の数の占める割合を計数し、その割合が一定値
以上であれば白抜き文字と判定し、白黒反転後に認識処
理をする方法が知られている。しかし、この方法は黒画
素の計数に時間がかかり全体の処理時間が増加するとい
う欠点がある。また図5の例のように文字線が非常に太
い場合白抜き文字と誤判定したり、図10のように白抜
き文字であるのに全体としては白画素が多いために白抜
き文字と判定できない場合があり、必ずしも正確な判定
ができないという欠点があった。
【0006】(2) 認識しようとする文字列に先だっ
て罫線(図11)が存在した場合、正しく切り出しが行
われない。
【0007】
【課題を解決する為の手段】上記課題を解決する為に、
本発明は入力した画像情報のある点を開始点として文字
情報の輪郭を追跡し、前記輪郭が前記入力画像の端に達
する時は前記開始点を移動し、該移動された開始点から
再度輪郭の追跡を行うことを特徴とする画像処理方法を
提供する。
【0008】上記課題を解決する為に、本発明は好まし
くは前記輪郭の追跡と前記開始点の移動を輪郭追跡によ
り文字情報が抽出できるまで繰り返す。
【0009】上記課題を解決する為に、本発明は好まし
くは前記輪郭の追跡と前記開始点の移動が繰り返される
時、前記開始点を移動した回数を計数し、該回数が所定
回数を越えたら前記画像情報を反転する。
【0010】上記課題を解決する為に、本発明は入力し
た画像情報のある点を開始点として文字情報の輪郭を追
跡する輪郭追跡手段と、前記輪郭が前記入力画像の端に
達する時は前記開始点を移動する開始点設定手段と、該
移動された開始点から再度輪郭の追跡を行うよう制御す
る制御手段とを有することを特徴とする画像処理装置を
提供する。
【0011】上記課題を解決する為に、本発明は好まし
くは前記輪郭の追跡と前記開始点の移動を輪郭追跡によ
り文字情報が抽出できるまで繰り返す。
【0012】上記課題を解決する為に、本発明は好まし
くは前記輪郭の追跡と前記開始点の移動が繰り返される
時、前記開始点を移動した回数を計数し、該回数が所定
回数を越えたら前記画像情報を反転する。
【0013】
【実施例】図1は本発明を具備した実施例を示すブロツ
ク図であり、手動の読取りにより英文の印刷された文書
を読取って文字認識をし、その結果を用いて辞書検索を
行って単語の日本語訳を表示する認識型電子辞書の構成
を示すものである。
【0014】同図において1は被読取り物の画像情報を
アナログ信号に変換するスキヤナである。2はスキヤナ
1から出力されたアナログ信号を二値のデシタル信号に
変換する二値化回路である。3は手動走査で読取を行っ
た際に同期して回転しその回転をフオトインタラプタで
検知して手動走査に同期した信号を出力するエンコーダ
ユニツトである。4は、エンコーダに回転を与えるため
のローラーの押し込み状態を観測して、読取りの終了を
検知するリードスイツチである。10は、割り込み入力
ポート、割り込み制御回路、クロツクパルス発生器、命
令デコーダ、レジスタ群、ALU、入力ポート、出力ポ
ート及びイメージ入力シフトレジスタを含む大規模集積
回路(LSI)よりなる中央処理装置(CPU)であ
る。11はアドレスごとに割付けられた読み書き可能な
記憶部を有するランダムアクセスメモリ(RAM)であ
り、その記憶部の機能としてはデータを格納するメモリ
機能、判定結果を記憶するフラグ機能、状態をカウント
値により記憶しておくカウント機能、一時記憶のための
レジスタ機能等が挙げられる。12はCPU10によっ
て順次実行されるマイクロプログラム、認識辞書、英和
辞書及び各種判定等で用いられる定数をコード化して格
納しているリードオンリーメモリ(ROM)である。1
3は出力データを受け取って液晶表示装置(LCD)1
4に表示するための信号を発生する液晶表示ドライバ
(LCDドライバ)である。16は外部アドレスバス及
び外部データバスを含む外部バスラインであり、これを
介してROM及びRAMのアドレツシングやデータのや
り取り等が行われる。
【0015】図2は本実施例の装置の外観図である。2
1は上ケース、22は下ケース、23は入力キー、24
は液晶表示装置、25はエンコーダに回転を伝えるロー
ラー、26は読取り部、27は読取り用の目印、28は
保持性を高めるための親指用のくぼみである。
【0016】最初に、RAM11上に配置される画像バ
ツフアについて図3を用いて説明しておく。本実施例で
用いているスキヤナは1次元のラインセンサーで、画像
データは一列ずつ取り込まれる。尚本発明は複数列ずつ
取り込むことの可能なラインセンサーでも実現可能であ
る。31はRAM11上に配置される画像バツフアを模
式的に表わしたもので、x方向を列y方向を行と呼ぶこ
とにする。取り込まれた1列分の画像データは第0列か
ら順に左から右へ格納されていく。画像データは二値化
回路2ですでに二値化されているので、画像バツフア上
の1が原画像における黒画素に、0が白画素に対応す
る。
【0017】図4は、本実施例の全体の処理を表わすフ
ローチヤートであり、ROM12に格納されるプログラ
ムに従ってCPU10の制御のもと、行われる。S40
1でスキヤナ1から文字画像を読取り、S402でCP
U10により一文字ごとの矩形領域を決定するいわゆる
文字切り出しを行い、S403でCPU10により矩形
領域ごとに確認処理を行う。そして得られた文字列を用
いてS402でCPU10はROM12中の辞書を用い
て辞書検索し、S403でLCP14に翻訳結果を表示
する。
【0018】S401の切り出し処理について図5のフ
ローチヤートに従って詳細に説明する。この図5のフロ
ーチヤートの処理は、ROM12に格納されたプログラ
ムに従ってCPU10の制御のもと行なわれる。
【0019】最初にS501でRAM11内のデータに
初期値をセツトする。すなわち切り出し開始位置のx座
標を記憶しておく変数p、白画素に置き変えた列の数を
表わす変数cline及び画像バツフア全体の反転を行
なったことを表わすフラグrflagの値を0にセツト
し、輪郭線追跡による切り出しを行なうため画像ベツフ
アの1列目を白画素にする。図6はRAM11内の画像
バツフアに格納された文字画像の例である。S502で
画像バツフアの左端中央の点a1から右方向に向けて輪
郭線追跡による文字切り出しを行う。a1から右方向に
画素を調べていき最初に黒画素にぶつかった点から輪郭
線追跡を行い、得られた輪郭線座標の最小値(xl,y
l)及び最大値(X2、y2)で与えられる矩形を1文
字の領域とする。輪郭線追跡のアルゴリズムは公知の技
術である。またS502では輪郭線追跡を開始するたび
にそのx座標をpに代入する。1文字分の領域が得られ
たら、次の文字を切り出すためにx=x2、y=(y1
+y2)/2の位置a2から右方向に画素を調べていき
同様の処理を行う。
【0020】図7、図10のような白抜き文字や図11
のように読取る単語の前に罫線が存在する場合は輪郭線
追跡中に画像バツフアの上下または左右の端に到達し、
それ以降輪郭線追跡が不可能になる。ただし図8のよう
に通常の文字であっても、すべての文字を切り出した
後、最終的には画像バツフアの右端に達するので、切り
出しが成功したかどうかのCPU10による判定をS5
03で行う、すなわち、1文字以上切り出した後に端に
到達したときはリターンし、1文字も切り出さずに端に
到達したときはS504に進む。S504ではRAM1
1内のclineの値が所定のしきい値N以下であれば
S505へ進みそうでなければS509へ進む。S50
5では輪郭線追跡を開始したx座標の値pを一定の値d
だけ増加させる。そしてS506で、RAM11上で画
像バツフアとは別のアドレスに設定された列記憶バツフ
アにx=pの列の値を記憶する。列記憶バツフアはN列
分のデータを記憶することができる。S507では画像
バツフア上のx=pの値をすべて0にする。続いてS5
08でRAM11内のclineの値をインクリメント
しS502へ戻って切り出し文字を再実行する。
【0021】図7のように罫線が含まれる場合、1列分
の画像バツフアの値を0にするS505からS508の
処理を、細い罫線ならば1回、太い罫線でも数回切り返
すことによって罫線を乗り越えることができるので、罫
線に続く単語を正しく切り出すことができる。
【0022】一方、S504でRAM11内のclin
eがNより大きくなった場合はS509へ進む。そして
RAM11内のrflagが1の場合はS510へ進
み、S506で記憶しておいたN列分のデータを画像バ
ツフアへ戻し、元の画像データを復元する。S511で
は、画像バツフアのすべての値を反転させる。すなわち
0は1に、1は0に変換する。この処理によって図7、
図10のような白抜き文字も反転され、通常の文字と同
様に認識可能となる。
【0023】反転が行われたことを記憶しておくために
S512でRAM11内のrflagに1をセツトしS
502へ進み、再び切り出し処理を開始する。なおS5
12ではRAM11内のclineとpを0にリセツト
する。
【0024】S509でRAM11内のrflagが1
だった場合は、すでに一度反転が行われたことを表わし
ており、もう一度反転することは意味がないので認識不
可能な画像であったとCPU10は判断し終了する。
【0025】なお、本実施例では、画像バツフア全体に
画像データが格納されるのを待って切り出し処理を開始
したが、スキヤナからの画像データの転送と並行して切
り出し処理を行ってもよい。その場合、ある時間tにお
いてx=x1まで画像データが転送されていたとする
と、図5のフローチヤートにおいてS502、S505
及びS511のステツプではそれぞれの処理がx=xp
を越えないようにウエイトをかける必要がある。
【0026】また、本実施例では、スキヤナから画像バ
ツフアへのデータ転送を1列ごとに行っているが、1行
ごとに行ってもよい。
【0027】また、本実施例では英文を読取り日本語の
訳を表示しているが、読取り対象の言語はスペースが存
在する(分かち書きされる)ものであればその種類を問
わない。
【0028】また、認識アルゴリズム及び単語取り出し
のアルゴリズムにも依存せず本発明は有効である。
【0029】
【発明の効果】以上説明したように、本発明によれば、
白抜き文字や罫線を含んだ文字列に対しても白黒反転処
理や罫線乗り越えの処理が正確に行える。
【0030】また、本発明は画像バツフアに対するアク
セスが少ないので全画像の黒画素を計数するような従来
技術に比べ高速な処理が可能である。
【図面の簡単な説明】
【図1】実施例を表すブロツク図
【図2】実施例の装置の外観図
【図3】画像バツフアの格納方法を表わす模式図
【図4】全体の処理を表わすフローチヤート
【図5】切り出し処理を表わすフローチヤート
【図6】輪郭線追跡による文字切り出しを説明するため
の図
【図7】白抜き文字の例
【図8】通常文字の例
【図9】通常文字(太字)の例
【図10】白抜き文字の例
【図11】罫線を含んだ通常文字の例
【図12】従来の認識型電子辞書の構成例

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 入力した画像情報のある点を開始点とし
    て文字情報の輪郭を追跡し、 前記輪郭が前記入力画像の端に達する時は前記開始点を
    移動し、 該移動された開始点から再度輪郭の追跡を行うことを特
    徴とする画像処理方法。
  2. 【請求項2】 前記輪郭の追跡と前記開始点の移動を輪
    郭追跡により文字情報が抽出できるまで繰り返すことを
    特徴とする請求項1に記載の画像処理方法。
  3. 【請求項3】 前記輪郭の追跡と前記開始点の移動が繰
    り返される時、前記開始点を移動した回数を計数し、該
    回数が所定回数を越えたら前記画像情報を反転すること
    を特徴とする請求項1に記載の画像処理方法。
  4. 【請求項4】 入力した画像情報のある点を開始点とし
    て文字情報の輪郭を追跡する輪郭追跡手段、 前記輪郭が前記入力画像の端に達する時は前記開始点を
    移動する開始点設定手段、 該移動された開始点から再度輪郭の追跡を行うよう制御
    する制御手段とを有することを特徴とする画像処理装
    置。
  5. 【請求項5】 前記制御手段は前記輪郭追跡手段による
    輪郭の追跡と、前記設定手段による開始点の移動とを前
    記輪郭追跡手段により文字情報が抽出できるまで繰り返
    すことを特徴とする請求項4に記載の画像処理装置。
  6. 【請求項6】 前記輪郭追跡手段による輪郭の追跡と、
    前記設定手段による開始点の移動とが繰り返される時、
    前記開始点を移動した回数を計数する計数手段と、 該計数手段が所定回数を計数したら前記画像情報を反転
    する反転手段とを有することを特徴とする請求項4に記
    載の画像処理装置。
JP3182505A 1991-07-23 1991-07-23 画像処理方法及び装置 Pending JPH0528317A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP3182505A JPH0528317A (ja) 1991-07-23 1991-07-23 画像処理方法及び装置
US07/915,306 US5335294A (en) 1991-07-23 1992-07-20 Image processing for pattern extraction
EP92306651A EP0524797B1 (en) 1991-07-23 1992-07-21 Image processing method and apparatus
DE69228965T DE69228965T2 (de) 1991-07-23 1992-07-21 Gerät und Verfahren zur Bildverarbeitung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3182505A JPH0528317A (ja) 1991-07-23 1991-07-23 画像処理方法及び装置

Publications (1)

Publication Number Publication Date
JPH0528317A true JPH0528317A (ja) 1993-02-05

Family

ID=16119475

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3182505A Pending JPH0528317A (ja) 1991-07-23 1991-07-23 画像処理方法及び装置

Country Status (4)

Country Link
US (1) US5335294A (ja)
EP (1) EP0524797B1 (ja)
JP (1) JPH0528317A (ja)
DE (1) DE69228965T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3062382B2 (ja) * 1993-12-09 2000-07-10 キヤノン株式会社 画像処理装置及び方法
JPH07288722A (ja) * 1994-04-15 1995-10-31 Canon Inc 撮像装置
JP3108979B2 (ja) * 1994-07-28 2000-11-13 セイコーエプソン株式会社 画像処理方法および画像処理装置
JP2939147B2 (ja) * 1994-12-29 1999-08-25 シャープ株式会社 手書き文字入力表示装置および方法
JP3601658B2 (ja) * 1997-12-19 2004-12-15 富士通株式会社 文字列抽出装置及びパターン抽出装置
JP4077919B2 (ja) * 1998-01-30 2008-04-23 キヤノン株式会社 画像処理方法及び装置及びその記憶媒体
US7119772B2 (en) * 1999-04-30 2006-10-10 E Ink Corporation Methods for driving bistable electro-optic displays, and apparatus for use therein
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
US7385606B2 (en) * 2002-12-18 2008-06-10 Microsoft Corporation International font measurement system and method
US7271806B2 (en) * 2002-12-18 2007-09-18 Microsoft Corporation International automatic line height system and method
US20040119714A1 (en) * 2002-12-18 2004-06-24 Microsoft Corporation International automatic font size system and method
IL157235A0 (en) * 2003-08-04 2004-02-19 Assistec Ltd Apparatus for detection of objects and image/color identification
KR102421856B1 (ko) * 2017-12-20 2022-07-18 삼성전자주식회사 영상의 상호작용 처리 방법 및 장치

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4183013A (en) * 1976-11-29 1980-01-08 Coulter Electronics, Inc. System for extracting shape features from an image
US4189711A (en) * 1977-11-08 1980-02-19 Bell Telephone Laboratories, Incorporated Multilevel processing of image signals
GB8311813D0 (en) * 1983-04-29 1983-06-02 West G A W Coding and storing raster scan images
JPS6073793A (ja) * 1983-09-29 1985-04-25 Fujitsu Ltd 光学文字読取装置
US4791676A (en) * 1985-09-12 1988-12-13 International Business Machines Corporation Method and means for efficiently handling boundary conditions in connected component labeling
JPS6381574A (ja) * 1986-09-25 1988-04-12 Toshiba Corp 図形デ−タベ−ス入力装置
DE3815869A1 (de) * 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens

Also Published As

Publication number Publication date
DE69228965T2 (de) 1999-10-07
EP0524797B1 (en) 1999-04-21
DE69228965D1 (de) 1999-05-27
US5335294A (en) 1994-08-02
EP0524797A2 (en) 1993-01-27
EP0524797A3 (en) 1993-08-18

Similar Documents

Publication Publication Date Title
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5539841A (en) Method for comparing image sections to determine similarity therebetween
JP3091478B2 (ja) 文書のスキュー識別法及び装置
TWI435276B (zh) 用以辨識手寫符號之方法及設備
JP2713622B2 (ja) 表形式文書読取装置
JPH0528317A (ja) 画像処理方法及び装置
CN111353501A (zh) 一种基于深度学习的书本点读方法及系统
US4607385A (en) Character recognition apparatus
US11756321B2 (en) Information processing apparatus and non-transitory computer readable medium
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
JP2821285B2 (ja) 画像処理方法及び装置
EP0433359A1 (en) Image recognition
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH0247788B2 (ja)
JP3163698B2 (ja) 文字認識方法
JPH0554072A (ja) デジタル翻訳装置
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
JPH0728935A (ja) 文書画像処理装置
JP2972443B2 (ja) 文字認識装置
JPH05298487A (ja) 英文字認識装置
CN115761761A (zh) 一种文本识别方法、装置、电子设备及存储介质
JPH053631B2 (ja)
CN112183538A (zh) 一种满文识别方法及系统
JPH05128305A (ja) 領域分割方法
JPH0830717A (ja) 文字認識方法とその装置