JPH07152864A - 手書き英数字認識のための図形作成方式 - Google Patents

手書き英数字認識のための図形作成方式

Info

Publication number
JPH07152864A
JPH07152864A JP3285395A JP28539591A JPH07152864A JP H07152864 A JPH07152864 A JP H07152864A JP 3285395 A JP3285395 A JP 3285395A JP 28539591 A JP28539591 A JP 28539591A JP H07152864 A JPH07152864 A JP H07152864A
Authority
JP
Japan
Prior art keywords
graphic
character
recognition
fax
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3285395A
Other languages
English (en)
Inventor
Michitaka Nami
通隆 波
Shinichi Nagao
信一 長尾
Hiroyuki Takahashi
裕之 高橋
Hitoshi Saito
整 斉藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hokkaido Prefecture
Original Assignee
Hokkaido Prefecture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hokkaido Prefecture filed Critical Hokkaido Prefecture
Priority to JP3285395A priority Critical patent/JPH07152864A/ja
Publication of JPH07152864A publication Critical patent/JPH07152864A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimiles In General (AREA)

Abstract

(57)【要約】 【目的】FAXアダプタ、GP−IBもしくはRS−2
32C付きFAX、または自動給紙装置付きイメージス
キャナを通して標準的入出力インターフェース付きコン
ピュータへ転送された手書き英数字を認識する際のマッ
チングのための図形を得ることを特徴とする手書き英数
字認識を目的とする図形作成方式 【構成】本発明では、マッチングのための図形を作成す
る際、文字図形の縦方向については線密度イコライゼー
ションを用いた従来の非線形正規化を行うが、横方向に
ついては文字の外接長方形の外の左右空間の非線形度合
を考慮し、その最適値を与える。数字”1”を例とした
文字図形3である選択図の第1図において、1と2が各
々考慮すべき左右空間である。英字と数字について各々
最適な非線形度合を決定する。従来は、この左右空間の
非線形度合は考慮されていなかった。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は手書き英数字認識のた
めの図形作成方式に関し、特に、FAXアダプタ、FA
Xまたはイメージスキャナから標準的入出力インターフ
ェースを通してコンピュータへ転送された手書き英数字
をそのコンピュータにより認識する際のマッチングのた
めの図形作成方式である。ここで、標準的入出力インタ
ーフェースとはRS−232C、セントロニクス、GP
−IB、SCSI、拡張スロットのいずれかである。し
たがって、この方式を用いた文字認識によって、転送さ
れた文書内容を標準的入出力インターフェース付きコン
ピュータへ自動入力することが可能となり、柔軟で、効
率の良い事務処理システムを構築することができる。
【0002】
【従来の技術】手書き英数字を含めた従来の手書き文字
の認識では、代表的な文字認識手法であるパターンマッ
チング法と構造解析法のいずれか、またはこれらを組み
合わせて構成される認識方式が用いられている。ここ
で、パーソナルコンピュータを含めた一般のコンピュー
タによりFAX受信手書き英数字認識またはイメージス
キャナ入力手書き英数字認識が可能で、そのためのシス
テム構築が可能なためには、コンピュータによる認識処
理時間が少ないほど良い。この点で、構造解析法による
認識方式の適用は難しい。そこで、一般のコンピュータ
を用いても認識の高速化が可能である認識方式としてパ
ターンマッチング法を用いた認識方式がある。この方式
におけるマッチングのための図形作成法には、一般に、
文字図形を含む最小の長方形である外接長方形を用いた
線形正規化と線密度イコライゼーションなどを用いた非
線形正規化がある。いずれの正規化も、斜めに傾くFA
X受信手書き英数字またはイメージスキャナ入力手書き
英数字の認識に用いることは考慮されておらず、それら
文字のマッチングが難しい。また、斜めに傾いた文字辞
書を用意しても、全体としての認識率向上は期待できな
い。これは辞書の数が増えるので、文字相互の誤認識が
増えるためである。
【0003】
【発明が解決しようとする問題点】FAX受信手書き英
数字またはイメージスキャナ入力手書き英数字の文書内
容を完全自動事務処理するためには、認識率100%の
文字認識手法を用いなければならない。これは対象文字
が手書き英数字であることから不可能である。したがっ
て、後処理にFAXイメージデータまたはイメージスキ
ャナ入力イメージデータとその認識結果とを比較し、認
識結果を修正する作業を行う。修正作業を簡単化するに
は高認識率が必要である。
【0004】しかし、従来の線形及び非線形正規化によ
るマッチングのための図形作成法は対象を英数字のみに
限定した方法ではなく、FAXまたはイメージスキャナ
への文書のセットの仕方により斜めに傾く場合のあるF
AX受信文字またはイメージスキャナ入力文字を対象と
した方法でもなかった。
【0005】このため、この図形作成に基づくパターン
マッチング法を用いた認識方式をFAX受信手書き英数
字認識またはイメージスキャナ入力手書き英数字認識に
応用しても高認識率を得ることが難しかった。さらに、
線密度イコライゼーションを用いた非線形正規化では、
まっすぐ縦に棒状に書かれた数字”1”を”1”と認識
するマッチングは非常に難しかった。
【0006】
【問題点を解決するための手段】本発明では、マッチン
グのための図形を作成する際、文字図形の縦方向につい
ては線密度イコライゼーションを用いた従来の非線形正
規化を行うが、横方向については文字の外接長方形の外
の左右空間の非線形度合を考慮し、その最適値を与え
る。数字”1”を例とした文字図形である第1図(a)
において、1と2が各々考慮すべき左右空間である。英
字と数字について各々最適な非線形度合を決定する。従
来は、この左右空間の非線形度合は考慮されていなかっ
た。したがって、どのような文字図形であっても、その
作成された図形は必ず指定された大きさの枠内いっぱい
に広げられて求められた。本発明でのマッチングのため
の図形の幅は、原図形の傾き度合、形に応じて変化す
る。以下、本発明のマッチングのための図形作成方式を
準正規化方式、その図形を準正規化図形と呼ぶことにす
る。この準正規化図形によるマッチングにより、斜めに
傾き、縦長文字が多いFAX受信手書き英数字またはイ
メージスキャナ入力手書き英数字について高認識率を得
ることが可能になる。また、従来の非線形正規化を用い
たマッチングにおいて難しかった縦にまっすぐ棒状に書
かれた”1”を”1”と認識することが容易に可能とな
る。第1図では数字”1”の準正規化例と従来の非線形
正規化例を示している。第1図(a)において、3は原
文字図形、第1図(b)において、4は3の準正規化図
形である。第1図(C)において、5は3についての従
来の非線形正規化図形である。5は文字枠いっぱいの図
形となり、他の文字との誤認識が増える可能性があるた
め、文字辞書として持つことが適当でないことが分か
る。
【0007】
【実施例】次に本発明の準正規化を用いた認識の実施例
をFAXからの受信伝票内容の認識を例として示す。実
施例での伝票の1文字の認識方式を第2図に示す。認識
は、最初にFAXからの受信伝票を伸張した伝票パター
ン(ステップ200)から1文字を切り出す(ステップ
201)。ステップ202ではこの切り出した文字図形
の雑音を除去し、次に、ステップ203での文字を図形
枠の中央に移動する処理を行う。ステップ204では、
この文字図形について、本発明の準正規化方式を適用す
る。ステップ205では、この準正規化図形について4
方向パターン化を行い、ぼけ処理(ステップ206)
後、類似度計算(ステップ207)を行い、最大値を検
出し(ステップ208)、認識結果を出力する(ステッ
プ209)。実施例のシステム構成を第3図に示す。F
AX6はシヤープ(株)製UX−10A型でファインモ
ードで使用した。FAXアダプタはカードFAX7でメ
ガソフト(株)製STARFAX model20型で
ある。データ形式は一次元符号化(MH)データであ
る。主走査線密度は8本/mm、副走査線密度は7.7
本/mmである。パーソナルコンピュータ8は日本電気
(株)製PC−9801RA型である。
【0008】伝票がFAX6から専用回線9を通し、カ
ードFAX7へ受信され、そのデータは拡張スロットを
通してパーソナルコンピュータ8へ転送される。転送さ
れた伝票は、第2図の認識方式にしたがって自動認識
後、その認識結果とFAXイメージデータをディスプレ
イ上に表示させ、カーソルを移動して、誤認識文字を修
正する。修正された結果はファイル化され、適当な事務
処理ソフトウェアにより処理される。第4図の伝票を例
とした認識結果を第5図に示す。この認識結果では、や
や左に傾いた”1”、まっすぐな”1”などの”1”を
含めた数字の認識率は100%であった。全体の認識率
は98.8%であった。
【0009】
【効果】本発明は、以上説明したように、コンピュータ
を利用して、FAX、FAXアダプタまたは自動給紙装
置付きイメージスキャナからの手書き英数字を認識する
ための準正規化方式である。この方式を用いることによ
り、例えば、今までの非常に高価で、柔軟性のないFA
X受信伝票処理システムに比べ、使用したいコンピュー
タ、FAXアダプタを選択し、希望する価格内で、使用
者に合った極めて柔軟なシステムを構築できる。したが
って、事務処理関連業務に携わる多くの分野への波及効
果が大きく、いままで手作業に頼っていたそれら分野の
業務効率を著しく向上させる効果がある。
【図面の簡単な説明】
【図1】第1図において、(a)は数字の”1”を例と
した原文字図形であり、考慮すべき非線形度合の空間を
示している。(b)は(a)についての本発明の準正規
化例を示している。(c)は(a)についての従来の正
規化例を示している。
【図2】第2図は実施例において用いた認識方式を示
す。
【図3】第3図は実施例のシステム構成である。
【図4】第4図は実施例で用いた伝票である。「出庫伝
票」を例としている。
【図5】第5図は実施例での認識結果である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 斉藤 整 北海道札幌市中央区北1条西20丁目46番地 133 株式会社ニユークリアス内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】FAXアダプタ、GP−IBもしくはRS
    −232C付きFAX、または自動給紙装置付きイメー
    ジスキャナを通して標準的入出力インターフェース付き
    コンピュータへ転送された手書き英数字を認識する際の
    マッチングのための図形を得ることを特徴とする手書き
    英数字認識のための図形作成方式。
JP3285395A 1991-08-07 1991-08-07 手書き英数字認識のための図形作成方式 Pending JPH07152864A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3285395A JPH07152864A (ja) 1991-08-07 1991-08-07 手書き英数字認識のための図形作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3285395A JPH07152864A (ja) 1991-08-07 1991-08-07 手書き英数字認識のための図形作成方式

Publications (1)

Publication Number Publication Date
JPH07152864A true JPH07152864A (ja) 1995-06-16

Family

ID=17690982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3285395A Pending JPH07152864A (ja) 1991-08-07 1991-08-07 手書き英数字認識のための図形作成方式

Country Status (1)

Country Link
JP (1) JPH07152864A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132187A (ja) * 1984-07-19 1986-02-14 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文字認識方式
JPS63183890A (ja) * 1987-01-27 1988-07-29 杉本 治江 名刺情報入力方法とその装置及びそれに適した名刺
JPH01112387A (ja) * 1987-10-26 1989-05-01 Toshiba Corp 文字読取システム
JPH01309192A (ja) * 1988-06-07 1989-12-13 Nec Corp 光学文字読取装置
JPH0365781A (ja) * 1989-08-04 1991-03-20 Canon Inc パターン正規化方式

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6132187A (ja) * 1984-07-19 1986-02-14 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション 文字認識方式
JPS63183890A (ja) * 1987-01-27 1988-07-29 杉本 治江 名刺情報入力方法とその装置及びそれに適した名刺
JPH01112387A (ja) * 1987-10-26 1989-05-01 Toshiba Corp 文字読取システム
JPH01309192A (ja) * 1988-06-07 1989-12-13 Nec Corp 光学文字読取装置
JPH0365781A (ja) * 1989-08-04 1991-03-20 Canon Inc パターン正規化方式

Similar Documents

Publication Publication Date Title
JPH06274680A (ja) 文書認識方法およびシステム
JPH0798765A (ja) 方向検出方法および画像解析装置
JPH02264386A (ja) 表認識方法
US20200320325A1 (en) Image processing system, image processing apparatus, image processing method, and storage medium
US20020028020A1 (en) Image processing device, image processing method, and image processing program
JP2017212575A (ja) 画像読込み装置及びプログラム
JPH07152864A (ja) 手書き英数字認識のための図形作成方式
JPH06290251A (ja) 電子ファイル装置の文書画像処理方法
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP3159087B2 (ja) 文書照合装置および方法
JP2003154774A (ja) 名刺、名刺出力装置、名刺入力装置、名刺出力プログラムおよび名刺入力プログラム
JPH03214281A (ja) 文字認識装置
Mai et al. An independent character recognizer for distantly acquired mobile phone text images
CN112632934B (zh) 基于比例计算还原表格图片为可编辑的word文件表格的方法
TWI773444B (zh) 影像識別系統與方法
JP3163577B2 (ja) ベクトル・フォント生成方法
JPS63155385A (ja) 光学文字読取装置
JPH08212287A (ja) データ管理システム及びデータ処理方法
JP2933947B2 (ja) 画像処理方法及び装置
JPS61267126A (ja) プロツタ制御装置
Radošević et al. Optical Text Recognition: Basic Procedures and Current State
JPH0757052A (ja) 文字認識装置
JP3077580B2 (ja) 文字読取装置
JP3182694B2 (ja) 図形編集方法および装置
JPH01206479A (ja) 光学文字読取システム

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees