JPS60150190A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS60150190A
JPS60150190A JP59006149A JP614984A JPS60150190A JP S60150190 A JPS60150190 A JP S60150190A JP 59006149 A JP59006149 A JP 59006149A JP 614984 A JP614984 A JP 614984A JP S60150190 A JPS60150190 A JP S60150190A
Authority
JP
Japan
Prior art keywords
character
dictionary
size
frame
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59006149A
Other languages
English (en)
Inventor
Katsuhiko Fujita
克彦 藤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59006149A priority Critical patent/JPS60150190A/ja
Publication of JPS60150190A publication Critical patent/JPS60150190A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (、L)技術分野 本発明は自iPJ+文字認識に関し、特に、コンピュー
タ処理による文字認識に関する。
礪)従来技術 最近はコンピュータを用いた自動文字認識の研究、開発
がさかんであり、数種の特許出願や刊行物発表がある。
概略でいうと、所定の取り決めて文字が書き込まれたシ
ー1〜(帳票が多い)を所定の位置決めで画像読取装置
にセラ1−シ、スタートを指示することにより、読取装
置およびコンピュータシステムにより書込み文字が認識
されて、コンピュータにより書込み文字のキャラクタ又
はコードが特定される。
コンピュータシステムは、画像読取装置で読んだ画像情
報より、所定の切り出し処理で所定領域の情報を摘出し
、摘出した情報を文字辞書メモリの各文字の特徴データ
と対比して、最もマツチングした特徴テークに割り当て
られている文字コーI−を特定する。ここまでで文字認
識が完了したことになるが、通常は以後文字コー1くを
文書メモリ。
編狼9表示、プリン1−アウl〜等の処理に用いる。
通常使用する文字種は、日本語、英語ともに。
漢字、ひらがな、カタカナ等、またアルファベラ1−犬
文字、小文字等、蝮数種であり、各文字種で数十以」二
のキャラクタがある。したがって文字認識辞書の各文字
の特徴データがきわめて多い。そこで、文字種を特定し
ないで文字研索をすると研索に長時間がかかる。また、
特徴データも全キャラクタの内で区別し得る細かいもの
としておか、なけ肛ばならない。これが文字認識速度を
更に低くしている。
そこで、シー1〜に、文字を記入する記入枠どは別に文
字種を指定する記入領域を設置−jで、文字、1F込時
に、記入枠に2F込んだ文字の種を示す記IIト込むよ
うにし、文字認識においては、該記号を読んで文字種を
判別して、判別した文字種に対応付けている文字辞書の
みを文字判定に利用する(たとえは特開昭58−101
378号公報)などが提案されている。
これによれば、文字辞書を予め文字種区分としておくこ
とにより、読取文字情報と対比する特徴データの数が少
なくなり、また特徴データ自身も少数の範囲内での区別
が可能な粗いもので済むので1判定時間が短くなる。つ
まり文字認識が高速となる。
しかしながら、シート上への文字の書込みにおいて、文
字書込みとは別に記号を書込まなければならないので、
作業者の負担が大きく作業能率が低下する。特に文字記
入枠と記号書込欄とが別位置になるので、視線の移しが
あり、これが疲れを多くする。
■目的 本発明は文字種に対応した辞書のみを参照して高速で文
字認識をする自動文字認識において、文字書込シー1−
への書込み作業が低減し作業能率が高くなり作業者の疲
れが低減する自動文字認識方法を提供することを目的と
する。
■構成 上記目的を達成するために本発明においては、コンピュ
ータシステム等の電子処理装置において。
文字認識辞書は1文字種毎に区分して文字種そhそれの
文字識別情報を格納した複数の文字辞書でなるものとし
: 読取装置で読んだ画像情報より、文字画像の広がりを、
予め定めた複数の大きさの1つに識別してこの識別した
大きさに予め対応伺けられた文字辞書を特定し: この特定した文字辞書を用いて読取文字画像の文字コー
ドを自動的に特定する、 ものとする。
これによれは、この処理方法に対応して文書込みシー1
−に、たとえば位置指標として第1の文字記入枠と、こ
の文字記入枠に一部もしくは全部が含まれる、第1の文
記入枠よりも小さい第2の記入枠どを印刷しておき、こ
のシー1−への文字書込においては第1の文字種に属す
る文字は第2の記入枠を越える大きい形状で書込み、ま
た第2の文字種に属する文字は第2の記入枠を越えない
大きさで書込むなどにより、電子処理装置が自動的に文
字種をII、II定して、特定した文字種の辞書のみを
参照して文字を認識する。
したがって、文字認識は高速となり、しかも作業者は文
字種に応じて文字の書込み大きさを変えてiIト込むの
(、τ注、a、を払うだけてよいので、書込の作業能率
が11″11<なり疲れも少なくなる。
以F図面をV照して本発明を説明する。
第1図に本発明を一態様で実施する装置構成の概要を示
ず。な、1゛jこの構成は、ハードウェアにおいては従
来知られている文字認識システムの構成と格別に異なる
ところはないが、前処理部3において文字画像の大きさ
を判別しこれを示すデータを出力するプロクラ11が格
納され、認識部4において大きさを示すデータに対応し
てメモリ6又は7を特定して認識に参照するプログラム
が格納されている点が従来のものと異なっている。
第1図を参照すると、この例では漢字(第1の文字種)
とひらがな(第2の文字種)を認識するものとされてお
り、これに対応して辞書メモリは漢字辞書メモリ6とひ
らがな辞書メモリ7て構成されている。
なお、辞書メモリ6と7は1つの記憶媒体に区分して構
成されている場合も含む。データ処理上漢字とひらがな
が区分されておれはよい。
スキャナ1は通常の画像読取装置であり、所定位置にセ
ットされたシー1−」二の画像の所定領域の画像を、記
録あり、なしの2値で読取りピッ1〜マツプメモリ2に
与える。スキャナ1の読取動作およびメモリ2の読み書
きの制御はマイクロコンピュータを1一体とする制御部
8が行なう。 □メモリ24:、 H+i込まれた画像
情報は、制御部8の読出し制御に。l、す1文字領域毎
に、前処理部3に与えられ、ここで画像の大きさ判定お
よび特徴抽出が行なわれる。大きさ判定結果と抽出した
特徴を示すデータ(読取特徴データ)は識別部4に与え
られる1、識別部4は、大きさが第1の大きさであると
漢字RY ?!!メモリ6を特定し、第2の大きさであ
るとひらかな辞書メモリ7を特定して、このメモリ(6
又(+7)の各文字宛の特徴データ(メモリ1、?徴デ
ータ)を順次に読取特徴データと対比してマソチンク度
αを演算し、マソチンク度合が所定のときに、対比した
メモリ特徴デ〜りが読取文字を示すものであるとして該
メモリ特徴データに割り宛てている文字コードを出力す
る。
第2図にこの文字認識で使用する文字書込シー1−」二
の文字書込み領域を矩形線で示す。第2図において外枠
9が第1の文字記入枠であり、この例では、スキャナ1
が読み取らない色および濃度で印刷(以下1−ロップア
ウト印刷という)されている。
外枠9は正方形であり所定のピッチで複数個印刷されて
いる。外枠9の内側に正方形の小さい内枠IOがiくロ
ップアウト印刷されている。この内枠IOも矩形であり
、その2辺が外枠9と共通である。内枠10の辺長dは
外枠9の辺長よりもがなり短い。
文字の書込みにおいては、この例では第3図に例示した
ように、漢字は内枠10よりも外にはめ出す形で太きく
1F込み、ひらがなは内枠10を出ない小さい形で書込
む。
第2図および第3図で横方向をY方向、縦方向をX方向
とし、シー1〜を第3図で左端を先頭として読取走査す
ると仮定すると、スキャナ1はシー1−の先頭の基点マ
ーク(図示省略)よりY方向の読取ライン数をカウント
し、そのカラン1〜値が第1の外枠91の左端相当値に
なると画像摘出を開始し、X方向外枠幅分の画像情報(
2値データ)を1ライン毎にメモリ2に与える。そして
Y方向のカラン1−値が外枠91の右端相当値になると
画像摘出を+1−める。そしてY方向のカラン1−値が
次の外枠92の左端相当値になるとまた同様に画像摘出
を開始する。以下同様である。これにより、メモリ2に
は、外枠91,92. ・・・の両像情報のみがメモリ
されることになる。前処理部3ば外枠11を位で画像情
報を処理して文字必大きさを判別し、読取1.!r徴デ
ータを得る。文字の大きさは、Y方向で外枠9の左端か
ら文字(記録あり情報)の右端までのカウント値がd+
q%差H′(官位よりも大きいと第1の文字サイズ(漢
字)と、またd−誤差許容値よりも小さいと第2の文字
サイズと判定し、こAしを示すデータを識別部4に与え
、いずれでもないと英字とひらがなの両者の研紫を指定
するデータを識別部4に与えると共に、エラーを制御部
8に知らせる。
以−ヒに説明した内容を要約すると次の通りである。
■)作業音は、シート上の外枠9内に、漢字であると内
枠10よりも大きく、ひらがなであると内枠10よりも
小さく文字を書込み、スキャナ1にセットする。セット
すると、このような書込みであることを指定するキー人
力で制御部8に知らせる(読取モードの指定)。
2)作業者がスタートキー人力をすると制御部8がスキ
ャナ1およびメモリ2を制御し、スキャナ1の読取情報
がメモリ2に書込まれる。シー1〜読取終了のタイミン
グでスキャナ1が停止される。
3)1個の外枠分の情報をメモリ2に書込んだ後に制御
部8が1個の外枠区分で、X方向】ライン分包にメモリ
情報を前処理部3に与える。前処理部3は文字大きさ判
定のためのカラン1−および特徴抽出を行なう。
4)1個の外枠分の情報をすべて受けると、前処理部3
はカラン1〜値より大きさを判定してこれを識別部4に
知らせ、また特徴データを与える。
5)識別部4は、大きさデータに応じてメモリ6と7の
一方を特定し、与えられた特徴データを特定したメモリ
の特徴データと列孔して文字コードを研索し出力する。
次に本発明の他の実施例および変形例を説明する。
」二記実施例では文字書込みシート上には第2図に示す
形で外枠9ど内枠10を印刷しておく態様としでいるが
、これらの第4図あるいは第5図に示す形など、′8種
に変形し得る。
たとえば第4図の左端に示すように外枠9の中心に内枠
1.0を配置した態様では、画像情報(記録あり)のX
座標とY座標を内枠10を示す領域と比11U L/ 
tT、前とが後者を外れていると第1の文字り゛イズ(
漢字)と判定し、外れていないと第2の文字りrズ(ひ
らがな)と判定する。
第41゛21の中央に示すように内枠10を外枠9の上
端中火に−1: l!た形、および第4図の右端に示す
ように内枠10を外枠の左上部に配置した形でも文字ナ
ーrズ判定(,1、画像情報(記録あり)が内枠lO領
域内にあるか否かで判定すればよい。
第5図に示すように、内枠線で外枠9内を4個に区分し
た場合には、たとえば漢字は4つの内枠のすべてにまた
がって書込み、ひらがなは左上の内枠内のみに、カタカ
ナは右上の内枠のみに、アルファベラ1−の大文字は左
下の内枠のみに、またアルファベラ1−の小文字は右下
の内枠のみに書込む処理プログラムを定め、前処理部に
おいては、画像情報(記録あり)が4個の内枠すべてに
分布していると漢字辞書を指定するデータを、左上の内
枠内のみに分布しているときにはひらがな辞書を指定す
るデータを、右上の内枠のみに分布しているときにはカ
タカナ辞書を指定するデータを、左下の内枠のみに分布
しているときにはアルファベン1〜大文字辞書を指定す
るデータを、また右下の内枠のみに分布しているときに
はアルファベンl−小文字辞νFを指定するデータを識
別部4に与えるようにすればよい。
上記実施例では、外枠9および内枠10共にドロップア
ラ1−印刷としている。特に内枠10は書込み画像と混
同して読取る可能性が高いのでドロツブアラ1へ印刷と
するのが好ましい。しかし外枠9は、外枠線部の読取情
報を捨ててもよいので、ドロップアウト印刷としなくて
もよい。スキャナ1の読取情報より文字書込み位置を読
取る場合には外枠9を、スA″ヤナ1が読取り得る色お
よび濃度(非ドロップアウ1〜印刷)とする。外枠9を
非ドロップアウ1〜印刷とするときには、文字サイズの
判定は」二連の方法のみならず、外枠線に対する文字画
像情報(記録あり)のX方向およびY方向の距離で判定
し得る。この判定の精度は非常に高い。
幅)効果 ■)文字種が明らかになり、辞書照合対象か限られるの
で、認識精度が向」ニする。また認識速度も向上する。
2)各文字に女1して一々文字種を指定しなくてよいの
で、作業者の使い勝手が白く、能率が向−1ニする。疲
れが少なくなる。
3)元来、平井き文字では漢字とかなの大きさにある程
度の大小関係があるので、この程度の書き方の習得には
、心理的抵抗が少なく、容易に慣れる。アルファベット
の大文字、小文字の関係も同様である。
【図面の簡単な説明】
第1図は本発明を一態様で実施する装置構成の概略を示
すブロック図である。 第2図は本発明の一態様の実施で用いる文字書込シー1
〜の文字書込み領域を示す平面図であり、第3図はそれ
に文字を書込んだ状態を示す平面図である。 第4図および第5図は、文字書込領域の他の例を示す平
面図である。

Claims (5)

    【特許請求の範囲】
  1. (1)位置指標を付したシートの画像情報を読取装置で
    読み取り、読み取った画像情報を処理して、文字識別情
    報を格納した文字辞書のデータと比較して文字コートを
    自動的に特定する電子処理文字認識において; それぞれが複数の文字種のそれぞれの文字識別情報を格
    納した複数の文字辞書を備えて: 読取装置で読んだ画
    像情報より、文字画像の広がりを予め定めた複数の大き
    さの1つ;こ識別してこの識別した大きさに予め対応付
    けられた文字辞書を特定し:該特定した文字辞書を用い
    て読み取った文字画像の文字コー1〜を自動的に特定す
    る:ことを特徴とする文字認識方法。
  2. (2)シー!−の位置指標は第1の文字記入枠と、この
    文字記入枠に一部もしくは全部が含まれる、第1の文記
    入枠よりも小さい第2の記入枠である前記特許請求の範
    囲第(1)項記載の文字認識方法。
  3. (3)第1の文字記入枠と第2の記入枠とは異色である
    +Mf記特a′1請求の範囲第(2)項記載の文字認識
    方法。
  4. (4)第2の記入枠は1つの第1の文字記入枠に対して
    W数個Cある1111記特許請求の範囲第(2)項記載
    の文字認識力θζ。
  5. (5)第2の記入枠は読取装置では実質上読取り得ない
    色もしくは濃度である前記特許請求の範囲第(2)項、
    第に1)項又は第(4)項記載の文字認識方法。
JP59006149A 1984-01-17 1984-01-17 文字認識方法 Pending JPS60150190A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59006149A JPS60150190A (ja) 1984-01-17 1984-01-17 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59006149A JPS60150190A (ja) 1984-01-17 1984-01-17 文字認識方法

Publications (1)

Publication Number Publication Date
JPS60150190A true JPS60150190A (ja) 1985-08-07

Family

ID=11630461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59006149A Pending JPS60150190A (ja) 1984-01-17 1984-01-17 文字認識方法

Country Status (1)

Country Link
JP (1) JPS60150190A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6410857U (ja) * 1987-07-07 1989-01-20
JPS6421588A (en) * 1987-07-16 1989-01-24 Nec Corp Character recognition system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6410857U (ja) * 1987-07-07 1989-01-20
JPS6421588A (en) * 1987-07-16 1989-01-24 Nec Corp Character recognition system

Similar Documents

Publication Publication Date Title
US4553261A (en) Document and data handling and retrieval system
Casey et al. Intelligent forms processing
JPH03161873A (ja) データベース構築機能を有する電子フアイリング装置
US3925760A (en) Method of and apparatus for optical character recognition, reading and reproduction
US5644339A (en) Electronic information apparatus
EP0042968B1 (en) Multi-registration in optical character recognition
JPS60150190A (ja) 文字認識方法
JP5455364B2 (ja) 情報処理装置及び軌跡データ認識方法
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JP3841318B2 (ja) アイコン生成方法、ドキュメント検索方法及びドキュメント・サーバー
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0991385A (ja) 文字認識辞書追加方法及びこれを用いた端末ocr装置
JP3000349B2 (ja) キー入力編集方法及び編集装置
JPH0247788B2 (ja)
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JP2529421B2 (ja) 文字認識装置
CN116129446A (zh) 基于深度学习的手写中文字体识别方法
JP2931485B2 (ja) 文字切出し装置及び方法
JPS5972577A (ja) 図面読取装置
JP3217442B2 (ja) 光学的文字読み取り装置
JPH07152856A (ja) 光学的文字読取装置
JPS6326789A (ja) 文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2000339405A (ja) 光学的文字認識システム、同システムに於ける帳票のフォーマットコントロール作成方法、及び同方法が格納された記憶媒体