JPH04242491A - 光学文字読取装置 - Google Patents

光学文字読取装置

Info

Publication number
JPH04242491A
JPH04242491A JP3003592A JP359291A JPH04242491A JP H04242491 A JPH04242491 A JP H04242491A JP 3003592 A JP3003592 A JP 3003592A JP 359291 A JP359291 A JP 359291A JP H04242491 A JPH04242491 A JP H04242491A
Authority
JP
Japan
Prior art keywords
character
kanji
field
characters
control information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3003592A
Other languages
English (en)
Inventor
Mitsuo Tanaka
満雄 田中
Toshifumi Yamauchi
山内 俊史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3003592A priority Critical patent/JPH04242491A/ja
Publication of JPH04242491A publication Critical patent/JPH04242491A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は光学文字読取装置に関し
、特に手書きの漢字混在フィールドの読取精度を向上さ
せた光学文字読取装置に関する。
【0002】
【従来の技術】従来の文字認識技術としては、あらかじ
め指定したフォーマット情報により各フィールドごとの
文字種を判断し、その文字種に対応する認識辞書との照
合により判定を行っていた。
【0003】また、フォーマット情報は、読取帳票の寸
法、読取フィールドの位置、フィールドごとの文字種等
から構成されており、その中のフィールドごとの文字種
指定により辞書選択を行い判定処理を行っていた。
【0004】
【発明が解決しようとする課題】上述した従来の光学文
字読取装置の、文字認識技術は、フォーマット情報によ
ってあらかじめ定められている文字種指定情報を使用し
、各文字ごとの判定を行っているが、例えば、図3に示
すような文字が書かれているフィールドの読取りを行っ
たとき、漢字の「木」とカナの「ホ」、数字の「2」と
漢字の「乙」とがそれぞれ類似しているため、図3に示
すように誤って判定する場合があるという欠点を有して
いる。
【0005】また、ひとつのフィールド内に漢字と他の
文字種(数字、英字、記号、カナ)が混在して書かれて
いる場合には、すべての文字について漢字辞書と英字・
数字・記号・カナ混在辞書の両方と照合を行い、判定し
なければならないので、判定処理に時間がかかるという
欠点を有している。
【0006】本発明の目的は、漢字と漢字以外の文字と
の類似字型を判別することができ、手書きの漢字混在フ
ィールドの認識精度を向上することができるとともに、
判定処理時間を短縮することができる光学文字読取装置
を提供することにある。
【0007】
【課題を解決するための手段】第1の発明の光学文字読
取装置は、手書き帳票を読取りの対象とし、前記帳票を
光学的に走査して、前記帳票のイメージパターンを入力
するスキャナ走査部と、フォーマット情報に基づいて、
前記スキャナ走査部より入力された前記帳票のイメージ
パターンから1文字ずつ切り出す文字切出し部とを備え
、読取った文字を出力する光学文字読取装置において、
(A)前記フォーマット情報に基づいて、1文字ずつ切
り出された文字を照合し、フリガナフィールドに書かれ
た文字があるか否かを調べ、前記フリガナフィールドに
書かれた文字がある場合は、前記文字に対応する漢字混
在フィールドの文字には認識制御情報を付加して出力す
るフリガナフィールド・漢字混在フィールド照合部、(
B)前記フリガナフィールド・漢字混在フィールド照合
部から出力された文字が、前記認識制御情報を付加され
た文字のときは、前記文字を漢字辞書と照合して文字を
判定し、前記認識制御情報を付加されていない文字のと
きは、漢字を除く他種の文字が混在して収容されている
辞書と照合して文字を判定する判定部、を備えて構成さ
れている。
【0008】また、第2の発明の光学文字読取装置は、
手書き帳票を読取りの対象とし、前記帳票を光学的に走
査して、前記帳票のイメージパターンを入力し、フォー
マット情報に基づいて、入力された前記帳票のイメージ
パターンから1文字ずつ切り出し、読取った文字を出力
する光学文字読取装置において、前記フォーマット情報
に基づいて、前記1文字ずつ切り出された文字を照合し
、フリガナフィールドに書かれた文字があるか否かを調
べ、前記フリガナフィールドに書かれた文字がある場合
は、前記文字に対応する漢字混在フィールドの文字には
認識制御情報を付加し、前記前記認識制御情報を付加さ
れた文字については、漢字辞書と照合して文字を判定し
、前記認識制御情報を付加されていない文字のときは、
漢字を除く他種の文字が混在して収容されている辞書と
照合して文字を判定するように構成されている。
【0009】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0010】図1は、本発明の光学文字読取装置の一実
施例を示すブロック図である。
【0011】本実施例の光学文字読取装置は、図1に示
すように、帳票を光学的に走査して、そのイメージパタ
ーンを入力するスキャナ走査部1、入力されたイメージ
パターンをあらかじめ定められたフォーマット情報に基
づいて1文字単位に切り出す文字切出し部2、フォーマ
ット情報に基づいてフリガナフィールドに文字が書かれ
ているか否かを判断し、文字が書かれていた場合は、そ
の文字に対応する漢字混在フィールドの文字に認識制御
情報を付加するフリガナフィールド・漢字混在フィール
ド照合部3、フリガナフィールド・漢字混在フィールド
照合部3からの文字を、文字認識用の辞書である漢字辞
書及び英字・数字・記号・カナ混在辞書との照合により
判定を行う判定部4から構成されている。
【0012】次に、動作を説明する。
【0013】図2は、本実施例の光学文字読取装置の読
取対象の帳票とその判定結果を示す図である。
【0014】図2に示すフリガナフィールドは、フォー
マット情報により、カナ単独指定、住所記入欄は漢字、
英字、数字、記号、カナ混在指定で記入されているもの
とする。
【0015】図1において、フォーマット情報に基づい
て、スキャナ走査部1より出力されたイメージパターン
から、文字切出し部2によりフリガナフィールドの入力
イメージを1文字ずつ切り出したとき、空白以外が検出
された場合は、フリガナフィールド・漢字混在フィール
ド照合部3において、その文字に対応する漢字混在フィ
ールドの文字に認識制御情報を付加し判定部4に出力す
る。判定部4では、認識制御情報を付加された文字を漢
字辞書で照合して文字を判定し、認識制御情報を付加さ
れていない文字を、英字・数字・記号・カナ混在辞書と
照合して文字を判定し、判定結果を出力する。
【0016】図2に示す「木」の場合には、スキャナ走
査部1より入力されたフリガナフィールドのイメージは
文字切出し部2により1文字ごとに切り出される。この
場合にはフリガナフィールドに「キ」が記入されている
ため、フリガナフィールド・漢字混在フィールド照合部
3において対応する漢字混在フィールドの文字に認識制
御情報が付加される。この認識制御情報を付加された文
字は、判定部4で漢字辞書により照合され「木」と判定
される。この場合は、認識制御情報を付加されているの
で、英字・数字・記号・カナ混在辞書とは照合されず、
従って「ホ」と誤って認識されることはない。
【0017】このように、フリガナフィールドと漢字混
在フィールドとを照合することにより、漢字の「木」と
カナの「ホ」のような類似字型を誤りなく判別すること
ができるようになり、手書きの漢字混在フィールドの認
識精度を向上することができる。
【0018】また、漢字は漢字辞書、英字、数字、記号
、カナは英字・数字・記号・カナ混在辞書で判定するこ
とにより判定処理時間を短縮することができる。
【0019】
【発明の効果】以上説明したように、本発明の光学文字
読取装置は、フリガナフィールドと漢字混在フィールド
とを照合することにより、漢字の「木」とカナの「ホ」
のような類似字型を誤りなく判別することができるよう
になり、手書きの漢字混在フィールドの認識精度を向上
することができるという効果を有している。
【0020】また、漢字は漢字辞書で判定し、英字、数
字、記号、カナ等は英字・数字・記号・カナ混在辞書で
判定することにより判定処理時間を短縮することができ
るという効果を有している。
【図面の簡単な説明】
【図1】本発明の光学文字読取装置の一実施例を示すブ
ロック図である。
【図2】本実施例の光学文字読取装置の読取対象の帳票
とその判定結果を示す図である。
【図3】従来の光学文字読取装置の読取対象の帳票とそ
の判定結果を示す図である。
【符号の説明】
1    スキャナ走査部 2    文字切出し部 3    フリガナフィールド・漢字混在フィールド照
合部4    判定部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】  手書き帳票を読取りの対象とし、前記
    帳票を光学的に走査して、前記帳票のイメージパターン
    を入力するスキャナ走査部と、フォーマット情報に基づ
    いて、前記スキャナ走査部より入力された前記帳票のイ
    メージパターンから1文字ずつ切り出す文字切出し部と
    を備え、読取った文字を出力する光学文字読取装置にお
    いて、(A)前記フォーマット情報に基づいて、1文字
    ずつ切り出された文字を照合し、フリガナフィールドに
    書かれた文字があるか否かを調べ、前記フリガナフィー
    ルドに書かれた文字がある場合は、前記文字に対応する
    漢字混在フィールドの文字には認識制御情報を付加して
    出力するフリガナフィールド・漢字混在フィールド照合
    部、(B)前記フリガナフィールド・漢字混在フィール
    ド照合部から出力された文字が、前記認識制御情報を付
    加された文字のときは、前記文字を漢字辞書と照合して
    文字を判定し、前記認識制御情報を付加されていない文
    字のときは、漢字を除く他種の文字が混在して収容され
    ている辞書と照合して文字を判定する判定部、を備えた
    ことを特徴とする光学文字読取装置。
  2. 【請求項2】  手書き帳票を読取りの対象とし、前記
    帳票を光学的に走査して、前記帳票のイメージパターン
    を入力し、フォーマット情報に基づいて、入力された前
    記帳票のイメージパターンから1文字ずつ切り出し、読
    取った文字を出力する光学文字読取装置において、前記
    フォーマット情報に基づいて、前記1文字ずつ切り出さ
    れた文字を照合し、フリガナフィールドに書かれた文字
    があるか否かを調べ、前記フリガナフィールドに書かれ
    た文字がある場合は、前記文字に対応する漢字混在フィ
    ールドの文字には認識制御情報を付加し、前記前記認識
    制御情報を付加された文字については、漢字辞書と照合
    して文字を判定し、前記認識制御情報を付加されていな
    い文字のときは、漢字を除く他種の文字が混在して収容
    されている辞書と照合して文字を判定することを特徴と
    する光学文字読取装置。
  3. 【請求項3】  請求項1及び請求項2記載の光学文字
    読取装置において、前記漢字を除く他種の文字が英字、
    数字、記号、カナであることを特徴とする光学文字読取
    装置。
JP3003592A 1991-01-17 1991-01-17 光学文字読取装置 Pending JPH04242491A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3003592A JPH04242491A (ja) 1991-01-17 1991-01-17 光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3003592A JPH04242491A (ja) 1991-01-17 1991-01-17 光学文字読取装置

Publications (1)

Publication Number Publication Date
JPH04242491A true JPH04242491A (ja) 1992-08-31

Family

ID=11561741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3003592A Pending JPH04242491A (ja) 1991-01-17 1991-01-17 光学文字読取装置

Country Status (1)

Country Link
JP (1) JPH04242491A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592191A (ja) * 1982-06-29 1984-01-07 Fujitsu Ltd 手書き日本語文の認識処理方式
JPS60189582A (ja) * 1984-03-09 1985-09-27 Fujitsu Ltd 文字認識後処理方式
JPH02157986A (ja) * 1988-12-09 1990-06-18 Nec Corp 認識文字種指定方式

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS592191A (ja) * 1982-06-29 1984-01-07 Fujitsu Ltd 手書き日本語文の認識処理方式
JPS60189582A (ja) * 1984-03-09 1985-09-27 Fujitsu Ltd 文字認識後処理方式
JPH02157986A (ja) * 1988-12-09 1990-06-18 Nec Corp 認識文字種指定方式

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
JPS63182793A (ja) 文字切り出し方式
US10997452B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP3159087B2 (ja) 文書照合装置および方法
JPH04242491A (ja) 光学文字読取装置
JP3151866B2 (ja) 英文字認識方法
KR100473660B1 (ko) 단어인식방법
JPH10162103A (ja) 文字認識装置
JPH11120294A (ja) 文字認識装置および媒体
JPS61114388A (ja) 文字入力装置
JPH09218921A (ja) 一般文書読取装置
JP2851102B2 (ja) 文字切出し方法
JPH06333083A (ja) 光学式文字読取装置
JPH06223221A (ja) 文字認識装置
JPH06251187A (ja) 文字認識誤り修正方法及び装置
JPH05217017A (ja) 光学式文字読取装置
JPS6081688A (ja) 情報認識方式
JPH0496882A (ja) 全角/半角判定方法
JP3595081B2 (ja) 文字認識方法
JPS63188284A (ja) 文字読取装置
JPH03123989A (ja) 文字認識装置
JPH0436885A (ja) 光学式文字読取装置
JPH1011542A (ja) 文字認識装置
JP2000215273A (ja) オンライン手書き文字認識装置及びコンピュ―タ読み取り可能な記録媒体
JPH04318687A (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980303