JP2925270B2 - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JP2925270B2
JP2925270B2 JP2228661A JP22866190A JP2925270B2 JP 2925270 B2 JP2925270 B2 JP 2925270B2 JP 2228661 A JP2228661 A JP 2228661A JP 22866190 A JP22866190 A JP 22866190A JP 2925270 B2 JP2925270 B2 JP 2925270B2
Authority
JP
Japan
Prior art keywords
character
pattern
recognition
unit
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2228661A
Other languages
English (en)
Other versions
JPH04109381A (ja
Inventor
健司 三縞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2228661A priority Critical patent/JP2925270B2/ja
Publication of JPH04109381A publication Critical patent/JPH04109381A/ja
Application granted granted Critical
Publication of JP2925270B2 publication Critical patent/JP2925270B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、用紙に記録された文字等の読取りを行なう
文字読取装置に関する。
(従来の技術) 一般に、用紙に記録された文字等の読取りを行なう文
字読取装置は、用紙に予め印刷された文字等の記入位置
を示す記入枠内のイメージパターンを切出し認識処理を
行なっている。例えば、スキャナ装置によって検出され
た用紙全体のイメージから、各文字等のイメージパター
ンの文字切出し位置を決定し、1文字分毎にイメージパ
ターン切出すものである。こうして切出されたイメージ
パターンは、標準パターンとのマッチングが行なわれ
(認識処理)、認識結果が決定される。
さらに、近年では、認識処理の結果について、前後の
文字を含めた例えば単語単位で知識処理を行なうことに
よって、より認識率を向上させる方法がとられている。
ところで、予め用紙に文字記入位置を示す記入枠を印
刷するのは、確実に1文字毎の文字パターンの切出しを
行なうことができるようにするためである。しかしなが
ら、保険,銀行業務等において文字読取装置を用いる場
合、用紙に対する文字等の記入は、一般の人によって行
なわれる場合が多い。このため、記入枠内に正確に記入
されずに、例えば記入枠をはみ出して周囲の文字等(他
にもノイズ等の場合もある)と接触や近接した状態で記
入される場合がある。このような場合、文字切出し位置
が一意に決定できず、認識処理によって正しい認識結果
が得られないものとして切出しリジェクト(読取り拒
否)となっている。さらに、切出しリジェクトの場合、
認識処理に後続して実行される知識処理も機能しないよ
うになっている。
(発明が解決しようとする課題) このように、認識しようとしている文字の文字パター
ンが、周囲の文字,ノイズ等と接触、または近接してい
るために、文字切出し位置を一意に決定できない場合に
は、切出しリジェクトとなっていた。さらに、知識処理
が機能しないために、認識率の低下を招いてしまうとい
う問題があった。
本発明は前記のような点に鑑みてなされたもので、文
字パターンが周囲の文字等と接触、近接している場合で
あっても、正確な文字読取結果を得ることが可能な文字
読取装置を提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、用紙に記録された文字等の読取りを、前記
用紙から検出したイメージパターンをもとに行なう文字
読取装置において、前記イメージパターンから予め設定
されている位置で文字パターンの切出しを行なう第1の
文字切出し手段と、前記第1の文字切出し手段によって
切出された文字パターンについて文字認識処理を行な
い、複数の認識結果を取得する第1の文字認識処理手段
と、前記第1の文字切出し手段により文字パターンの切
出しが行われた位置の前後で、前記イメージパターン中
の文字パターンが接続しているか否かを判別する判別手
段と、前記判別手段によって文字パターンが接続されて
いると判別された場合に、前記第1の文字切出し手段に
よる文字パターンの切出しの位置に近い、文字パターン
が接続していない位置で文字パターンの切出しを行なう
第2の文字切出し手段と、前記第2の文字切出し手段に
よって切り出された文字パターンについて文字認識処理
を行ない、複数の認識結果を取得する第2の文字認識処
理手段と、前記第1及び第2の文字認識処理手段によっ
て取得された複数の認識結果の順番を編集する編集手段
と、前記編集手段によって順番が編集された複数の認識
結果に基づいて知識処理を行なう知識処理手段とを具備
して構成するものである。
(作用) このような構成によれば、複数の切出し位置候補に基
づいて文字パターンの切出しが行われ、文字認識処理が
実行される。従って、隣接する文字が接触等しているた
めに誤認識され易い場合であっても、複数の認識結果が
得られ、所定順に認識順位が編集されて知識処理に供さ
れる。この結果、正確な文字読取結果が得られ認識率が
向上する。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。
第1図は同実施例に係わる文字読取装置の構成を示すブ
ロック図である。第1図において、10はスキャナ部であ
り、読取り処理の対象とする用紙について光学的走査を
行なうことによって用紙全体のイメージ検出を行なうも
のである。12はイメージ格納部であり、スキャナ部10に
おいて検出された用紙全体のイメージを格納するための
ものである。14は文字切出し部であり、イメージ格納部
12に格納された全体のイメージから、1文字毎の文字パ
ターンの切出しを行なうものである。文字切出し部14
は、文字記入枠の位置の他に、後述する文字認識部16に
よる認識結果に応じて文字切出し位置(切出し位置候
補)を変更して、繰り返して文字パターン切出しを行な
うことができる。16は文字認識部であり、文字切出し部
14において切出された文字パターンについて、予め設定
された標準パターンとのマッチングを行なうことによっ
て、認識結果を決定するものである。18は編集部であ
り、文字切出し部14における文字パターンの切出しが良
好でない場合(文字パターンが接触等している場合)
に、繰り返して行なわれる認識処理の結果を、所定の順
番に編集するものである。20は知識処理部であり、編集
部18によって編集された認識結果について順番に知識処
理を施し、読取結果を出力するものである。
次に、同実施例の動作について説明する。
まず、スキャナ部10は、文字読取処理の対象とする用
紙について光学的走査を行ない、用紙全体のイメージの
検出を行なう。スキャナ部10によって検出された用紙全
体のイメージは、イメージ格納部12に格納される。イメ
ージ格納部12に1枚分のイメージが格納されると、文字
切出し部14は、このイメージから文字記入行の切出しを
行ない、さらに各行について1文字毎に文字パターンの
切出しを行なう。
以下、第2図に示すフローチャートを参照しながら説
明する。
文字切出し部14は、文字記入行の切出しを行なうと、
次に文字パターンの切出しを行なう。ここで、第3図に
示すイメージパターンを例にして説明する。まず、文字
切出し部14は、第3図中Aで示す予め設定されている文
字記入枠の位置において第1回の文字パターンの切出し
を行なう(ステップS1)。なお、図中Bで示す文字記入
枠は、通常用紙にドロップアウトカラーによって印刷さ
れるので、イメージ格納部12には枠イメージは格納され
ない。第3図では、枠位置を示すものとする。切出され
た文字パターンは、文字認識部16に転送される。この場
合、第4図(a)(b)に示すような、2つの文字パタ
ーンが切出される。文字認識部16は、文字切出し部14か
ら転送された文字パターンについて認識処理を実行する
(ステップS2)。この結果、第1文字、第2の文字のそ
れぞれに、第5図に示すような認識結果が得られたもの
とする。すなわち、第1文字の第1位「川」、第2位
「ル」、第2文字の第1位「越」、第2位「超」であ
る。同実施例では、マッチングによって得られる類似度
値の順に第2位までの候補を決定するものとする。文字
認識処理によって得られた候補は、編集部18に転送され
る。なお、第1回の文字切出しによって得られた認識結
果を、認識結果1とする。
ここで、文字切出し部14は、文字切出しの対象とする
イメージについて、第3図に示すような縦射影(y方
向)をとり、この射影から文字記入枠の位置(図中Aの
位置)の前後で文字パターンが接続しているか否かを判
別する(ステップS3)。この結果、文字パターンが接続
していないと判別された場合には、この旨が編集部18に
通知され、第5図に示す認識結果1が知識処理部20に転
送される。
一方、ステップS3において、文字パターンが接続して
いると判別された際には、文字切出し部14は、文字枠
(図中A)に最も近い縦射影のゼロ点で第2回の文字切
出しを行なう(ステップS5)。ここでは、第3図中Cで
示す位置において文字切出しが行なわれる。この場合、
第6図(a)(b)に示すような、2つの文字パターン
が切り出され、文字認識部16に転送される。文字認識部
16は、文字切出し部14から転送された文字パターンにつ
いて認識処理を実行する(ステップS6)。この結果、第
1文字、第2の文字のそれぞれに、第7図に示すような
認識結果が得られたものとする。すなわち、第1文字の
第1位「ハ」、第2位「リ」、第2文字の第1位
「殿」、第2位「越」である。文字認識処理によって得
られた候補は、編集部18に転送される。なお、第2回の
文字切出しによって得られた認識結果を、認識結果2と
する。
次に、編集部18は、文字認識部16から転送された認識
結果1,2について編集処理を行なう(ステップS7)。こ
こでは、単純に上位から順、すなわち認識結果1の第1
位候補、認識結果2の第1位候補、認識結果1の第2位
候補、認識結果2の第2候補の順に編集するものとす
る。この結果、第8図に示すような編集結果を得ること
ができる。編集部18は、この編集結果を知識処理部20に
転送する。
知識処理部20では、編集部18から転送された第4位ま
での候補の組み合わせによって得られる単語と、予め設
定された知識ベースに基づいて知識処理を行ない、文字
読取り結果を決定する(ステップS8)。
このようにして、複数箇所(前記実施例では2か所)
で文字切出しを行ない、それぞれにおいて得られる文字
パターンについて文字認識処理を行ない、その結果をも
とにして知識処理が実行される。このため、認識対象と
する文字が周囲の文字に接触している場合であっても、
文字認識処理、さらに知識処理が実行されることによ
り、正確な文字読取結果を得ることが可能となる。
なお、前記実施例における文字切出し部14は、特徴量
として縦射影に基づき、x軸に垂直な直線によって文字
パターンを切出すものとしたが、例えばラベリング法に
よって行なうこともできる。なお、ラベリング法は、連
続するイメージ(黒ドット)のそれぞれに対してラベル
を付し、ラベルを付された適当なイメージの集合によっ
て文字パターンを分類して切出すものである。これによ
れば、例えば第9図に示すように、隣接する文字が互い
に文字記入枠をはみ出しているような場合であっても、
図中破線で示すような曲線によって文字パターンを切出
すので、確実に文字パターンを分離することができる。
なお、この際に、文字記入枠に最も近い曲線によって文
字切出しを行なうようにすることもできる。
また、前記実施例における文字切出し位置候補は、文
字記入枠位置と文字枠に最も近い縦射影のゼロ点位置の
2か所としているが、その候補数は限定されず、3か所
以上としても良い。文字の両側に複数の切出し候補(例
えば縦射影のゼロ点位置)がある場合には、それらの組
み合わせで文字パターンの切出しを行なうこともでき
る。
また、編集部18における編集規則は、単純に上位から
順としているが、認識処理の結果得られる類似度値をも
とにして行なっても良い。
さらに、編集部18から知識処理部20に転送される文字
認識候補数は、所定個数以下に制限しても良い。
[発明の効果] 以上のように本発明によれば、複数の文字切出し位置
候補に基づいて文字切出しを行ない、それぞれにおいて
得られる文字パターンについて文字認識処理を行ない、
その結果をもとにして知識処理が実行される。このた
め、認識対象とする文字が周囲の文字に接触し誤認識さ
れ易い場合であっても、正確な文字読取結果を得ること
が可能となるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例の処理手順
を示すフローチャート、第3図は処理対象とするイメー
ジパターンの一例を示す図、第4図は第1回の文字切出
しによって得られた文字パターンの例を示す図、第5図
は第4図に示す文字パターンについて認識処理を行なっ
た結果得られた認識結果の一例を示す図、第6図は第2
回の文字切出しによって得られた文字パターンの例を示
す図、第7図は第6図に示す文字パターンについて認識
処理を行なった結果得られた認識結果の一例を示す図、
第8図は編集処理の結果の一例を示す図、第9図は文字
パターン切出しの他の方法を説明するための図である。 10…スキャナ部、12…イメージ格納部、14…文字切出し
部、16…文字認識部、18…編集部、20…知識処理部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】用紙に記録された文字等の読取りを、前記
    用紙から検出したイメージパターンをもとに行なう文字
    読取装置において、 前記イメージパターンから予め設定されている位置で文
    字パターンの切出しを行なう第1の文字切出し手段と、 前記第1の文字切出し手段によって切出された文字パタ
    ーンについて文字認識処理を行ない、複数の認識結果を
    取得する第1の文字認識処理手段と、前記第1の文字切
    出し手段により文字パターンの切出しが行われた位置の
    前後で、前記イメージパターン中の文字パターンが接続
    しているか否かを判別する判別手段と、 前記判別手段によって文字パターンが接続されていると
    判別された場合に、前記第1の文字切出し手段による文
    字パターンの切出しの位置に近い、文字パターンが接続
    していない位置で文字パターンの切出しを行なう第2の
    文字切出し手段と、 前記第2の文字切出し手段によって切り出された文字パ
    ターンについて文字認識処理を行ない、複数の認識結果
    を取得する第2の文字認識処理手段と、 前記第1及び第2の文字認識処理手段によって取得され
    た複数の認識結果の順番を編集する編集手段と、 前記編集手段によって順番が編集された複数の認識結果
    に基づいて知識処理を行なう知識処理手段とを具備した
    ことを特徴とする文字読取装置。
JP2228661A 1990-08-30 1990-08-30 文字読取装置 Expired - Lifetime JP2925270B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2228661A JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2228661A JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Publications (2)

Publication Number Publication Date
JPH04109381A JPH04109381A (ja) 1992-04-10
JP2925270B2 true JP2925270B2 (ja) 1999-07-28

Family

ID=16879833

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2228661A Expired - Lifetime JP2925270B2 (ja) 1990-08-30 1990-08-30 文字読取装置

Country Status (1)

Country Link
JP (1) JP2925270B2 (ja)

Also Published As

Publication number Publication date
JPH04109381A (ja) 1992-04-10

Similar Documents

Publication Publication Date Title
JP3031579B2 (ja) 帳票の文字認識領域指定方法
JP2925270B2 (ja) 文字読取装置
JPS6316795B2 (ja)
JP3794285B2 (ja) 光学式文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPH05108806A (ja) 画像特徴抽出方法及びその装置
JP2909132B2 (ja) 光学的文字読取装置
JPH10154191A (ja) 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JPH06111057A (ja) 光学的文字読取装置
JPS5949671A (ja) 光学的文字読取装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JPS5972577A (ja) 図面読取装置
JPH05189599A (ja) 光学文字読取装置
JPH01234985A (ja) 文字読取装置の文字切出し装置
JPS61121184A (ja) 文字認識装置
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JP2002230481A (ja) 光学式文字読取装置
JPH08227440A (ja) 文書画像処理装置
JPH0628521A (ja) 光学的文字読取装置
JPH05274473A (ja) 光学的文字読取装置
JPH05282487A (ja) 文字認識装置
JPS60160486A (ja) 光学的文字読取装置
JPS62295191A (ja) 光学文字画像読取装置
JPH10222607A (ja) 図形要素と文字要素の分離認識方法
JPH04329492A (ja) 文字切り出し方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090507

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100507

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110507

Year of fee payment: 12