JPH06243285A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH06243285A
JPH06243285A JP5024610A JP2461093A JPH06243285A JP H06243285 A JPH06243285 A JP H06243285A JP 5024610 A JP5024610 A JP 5024610A JP 2461093 A JP2461093 A JP 2461093A JP H06243285 A JPH06243285 A JP H06243285A
Authority
JP
Japan
Prior art keywords
character
entry frame
recognition
line
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5024610A
Other languages
English (en)
Inventor
Koichi Higuchi
浩一 樋口
雅寛 ▲桜▼井
Masahiro Sakurai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5024610A priority Critical patent/JPH06243285A/ja
Publication of JPH06243285A publication Critical patent/JPH06243285A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 帳票への記入における負担を軽減し、操作性
の向上、認識処理の簡単化、ハード量の削減、及び処理
速度の向上を図る。 【構成】 文字記入枠の行末に句読点記入枠が設けられ
た帳票20が入力されると、それが入力行データの形で
ラインバッファ32に記憶される。この入力行データ
は、前処理部33で文字パターンS33aの切り出しが
行われると共に、該切り出した文字が文字記入枠の文字
であるか、句読点記入枠の文字であるかの選択信号S3
3bが出力される。辞書選択部42は、認識対象文字が
文字記入枠内の文字であれば、文字認識辞書41から全
文字種の標準文字特徴を選択し、句読点記入枠内の文字
であれば、文字認識辞書41から句読点等の標準文字特
徴を選択する。文字認識部51は、文字パターンS33
aの特徴抽出を行い、その特徴と、辞書選択部42から
の標準文字特徴とを比較して文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票に書かれた手書き
文書等を入力し、簡単で高速に文字認識を行う文字認識
方法に関するものである。
【0002】
【従来の技術】従来、帳票上に書かれた漢字を含む手書
き文字を認識対象とする文字認識方法は、例えば特開昭
58−101378号公報等に記載されている。この種
の文字認識方法では、人間が書いた文字を認識し、その
文字符号を例えばコンピュータ等に自動的に入力して活
用できることから、今後の情報化社会にはなくてはなら
ないものとして期待されている。前記文献等に記載され
た従来の文字認識方法においては、光学的読み取り対象
から除外するためのドロップアウトカラーで印刷された
文字記入枠を有する帳票を入力媒体として用い、その帳
票上の文字記入枠内に記載された文字パターンを、予め
辞書に登録してある文字記入枠の座標に基づき抽出し、
さらに、抽出され入力された文字パターン(これを入力
文字パターンと称する)に対して認識処理を行い、その
認識処理の結果得られた文字符号(例えば、JISの文字
コード)を認識結果として出力するようになっている。
【0003】図2は、従来の帳票記入例を示す図であ
る。この図に示すように、帳票10には、大きさが等し
い複数の文字記入枠11が均等に並べられており、記入
者は文字記入枠11内に所望する文字を順次、一文字づ
つ記入するようになっている。ところが、一般の文章で
は、句読点が、行の先頭にならないように一行の文字数
を調整(これを禁則処理という)して印刷するのが通例
となっているのに関わらず、帳票10に文字を記入する
場合、図2に示すように句読点が先頭に来るような場合
が発生する。そのため、非常に読みにくい文章となる。
これを避けるため、記入者に対して、句読点が先頭に来
ることを避けて記入するように注意させなければなら
ず、非常に負担を強いることとなる。また、同一の文字
記入枠11に文字と句読点を記入してしまうという誤り
を発生し易いという問題もある。このような不都合をな
くすためには、文字と句読点の混在記入を許した場合、
文字と句読点を認識するために、 (A) 全ての文字と句読点との組み合わせを考えた辞
書を用意して認識する。 (B) 文字記入枠11内の文字と句読点を分離して独
立に認識する。
【0004】等の方法が考えられていた。
【0005】
【発明が解決しようとする課題】しかしながら、前記
(A)の方法では、全ての文字との組み合わせを辞書に
用意しなければならず、辞書メモリの増大及び処理速度
の低下を招いていた。また、前記(B)の方法では、文
字と句読点を分離する為の処理が別に必要となり、その
処理が複雑となってハード量の増大や処理速度の低下を
招いていた。本発明は、前記従来技術が持っていた課題
として、処理の複雑化、ハード量の増大、及び処理速度
の低下という点について解決した、帳票を文書入力媒体
として用いる文字認識方法を提供するものである。
【0006】
【課題を解決するための手段】第1の発明は、前記課題
を解決するために、帳票を入力媒体として用い、前記帳
票上に記入された文字を読み取って前処理手段で文字パ
ターンの切り出しを行い、前記切り出された文字パター
ンの特徴を文字認識手段で抽出して辞書の内容と照合
し、前記帳票上の文字を認識する文字認識方法におい
て、次のような手段を講じている。即ち、前記帳票は、
通常の1文字単位の文字が記入される文字記入枠と、前
記文字記入枠の行末に該文字記入枠とは大きさの異なる
行末の記入枠とを有している。そして、前記前処理手段
での文字パターン切り出しの際に判別される、前記文字
記入枠内の文字か、前記行末の記入枠内の文字かの判別
結果に基づき、前記辞書の内容を選択して前記文字認識
手段で照合処理を行うようになっている。第2の発明で
は、第1の発明の行末の記入枠は、句読点または促音、
拗音を記載するためのサイズの小さな記入枠で構成し、
この記入枠に記入された句読点、促音、拗音の全て、ま
たは、その一部を前記文字認識手段での認識対象とする
ようになっている。
【0007】
【作用】第1の発明によれば、以上のように前記の帳票
を入力媒体として用いる文字認識方法を構成したので、
行末に来た句読点等が帳票の句読点記入枠に記入され
る。そして、このような帳票が入力されると、文字記入
枠に記入された通常の文字と、行末の句読点記入枠に記
入された句読点等とは、異なる認識対象で認識処理が行
われる。第2の発明によれば、行末の記入枠には句読点
または促音、拗音が記載され、それらの句読点等が、文
字記入枠内の文字とは異なる認識対象として認識処理が
行われる。これにより、帳票への記入における負担の軽
減と、それによる操作性の向上、処理の簡単化、ハード
量の削減、及び処理速度の向上が図れる。従って、前記
課題を解決できるのである。
【0008】
【実施例】図1は、本発明の実施例の文字認識方法に用
いられる文字認識装置の一構成例を示す概略のブロック
図である。図3は、本実施例で用いられる横書きの帳票
例を示す図であり、その帳票記入例が図4に示されてい
る。図1の文字認識装置は、例えば図3のような帳票2
0に記載された文字を認識する装置であるため、まず図
3について説明する。図3の帳票20は、文字、図形、
記号等(以下、文字と称する)を記載するものであり、
1文字単位で文字が記入される文字記入枠21を行方向
に例えば7個、列方向に多数個有すると共に、各行末に
文字記入枠21より小さい句読点記入枠22を有してい
る。このような帳票20を光学的に読み取る図1の文字
認識装置は、該帳票20からの光信号S20を例えば行
単位で光電変換して2値のディジタル信号を行単位(以
下、入力行データと称することもある)で出力する光電
変換部31を有している。光電変換部31の出力側に
は、該光電変換部31からの入力行データを記憶するラ
インバッファ32が接続され、その出力側に前処理部3
3を介して文字パターンレジスタ34が接続されてい
る。前処理部33は、ラインバッファ32内の入力行デ
ータより文字パターンS33aの切り出しを行い、その
文字パターンS33aを文字パターンレジスタ34に格
納すると共に、切り出した文字パターンS33aが帳票
20の文字記入枠21または句読点記入枠22内のもの
か否かの選択信号S33bを出力する機能を有してい
る。
【0009】また、この文字認識装置には、標準文字特
徴が格納された文字認識辞書41が設けられ、その出力
側に辞書選択部42を介して文字認識部51が接続され
ている。辞書選択部42は、前処理部33からの選択信
号S33bに基づき、認識対象となっている文字が文字
記入枠21内の文字のときには、文字認識辞書41から
全文字種の標準文字特徴を選択して文字認識部51へ送
り、句読点記入枠22内の文字であれば、句読点及び
「っ」のような促音、「キャ」、「ク 」等の拗音だけ
の標準文字特徴を該文字認識辞書41から選択して該文
字認識部51へ送る機能を有している。文字認識部51
は、文字パターンレジスタ34の出力側に接続され、該
文字パターンレジスタ34に格納された文字パターンに
対して特徴抽出を行い、その特徴と、辞書選択部42か
らの標準文字特徴とを比較して文字認識し、その認識結
果を出力する機能を有している。この文字認識部51の
出力側には、結果編集部52が接続され、さらにその出
力側に文字名を出力する出力端子53が接続されてい
る。結果編集部52は、文字認識部51からの認識結果
を編集し、出力端子53に文字名を出力する機能を有し
ている。出力端子53には、例えばコンピュータやプリ
ンタ等の装置が接続されており、結果編集部52で決定
された認識結果(例えば、文字コードや制御文字コード
が付加された文字コード等)を出力する。
【0010】次に、以上のような構成の文字認識装置を
用いた本実施例の文字認識方法を説明する。例えば、図
4のような文字が記入された帳票20が入力されると、
その帳票20からの光信号S20が図1の光電変換部3
1で光電変換される。光電変換部31は、帳票20から
の光信号S20を例えば行単位で光電変換するが、帳票
20が1行中に例えば7個の文字記入枠21及び1個の
句読点記入枠22を有しているので、該帳票20の1行
を例えば256×2048個の画素に分解し、各画素毎
で光信号S20の強度に応じた2値のデジタル信号を
得、これらの信号を入力行データの形でラインバッファ
32へ出力する。なお、本実施例の場合、帳票20の文
字域において、符号の部分に対応する画素は黒ビット、
そうでない部分に対応する画素は白ビットとしている。
【0011】ラインバッファ32は、各画素の1行中に
おける2次元座標を再現できる形で、光電変換部31か
らの入力行データを記憶する。そのため、1行分の画素
数に対応して、256×2048ビットの容量を有して
いる。前処理部33は、ラインバッファ32内の入力行
データより文字パターンS33aの切り出しを行い、そ
の切り出された文字パターンS33aを文字パターンレ
ジスタ34へ出力する。さらに、前処理部33は、切り
出した文字が文字記入枠21の文字であるか、句読点記
入枠22の文字であるかの選択信号S33bを辞書選択
部42へ送る。ここで、文字パターンS33aを文字パ
ターンレジスタ34へ出力することは、各文字の文字記
入枠21の座標を予め登録しておき、これに基づいて文
字パターンS33aを切り出すことで行える。文字パタ
ーンレジスタ34は、例えば128×128ビットの記
憶容量を有し、前処理部33から出力された文字記入枠
21に対応する画素から得たディジタル信号を格納す
る。
【0012】文字認識部51は、文字パターンレジスタ
34に格納された文字パターンに対して特徴抽出を行
う。さらに、文字認識部51は、文字認識辞書41内よ
り辞書選択部42を介して得られる標準文字特徴と、文
字パターンレジスタ34からの抽出された特徴とを比較
し、最も一致度の高い文字の文字符号(例えば、JISの文
字コード)を認識結果として、結果編集部52へ出力す
る。ここで、辞書選択部42は、前処理部33からの選
択信号S33bに基づき、当該文字が文字記入枠21内
の文字であれば、文字認識辞書41から全文字種の標準
文字特徴を選択し、句読点記入枠22内の文字であれ
ば、該文字認識辞書41から句読点及び促音、拗音だけ
の標準文字特徴を選択する。結果編集部52は、文字認
識部51で得られた認識結果を編集し、出力端子53へ
文字名を出力する。即ち、結果編集部52では、文字記
入枠21の文字の認識結果は順次、文字名出力として出
力端子53へ出力し、句読点記入枠22において、認識
結果が空白でない場合には当該認識結果を出力し、認識
結果が空白であった場合には当該空白コードを出力しな
いという編集を行う。
【0013】以上のように、本実施例では、帳票20の
文字記入枠21の各行末に別の句読点記入枠22が設け
られ、行末に来た句読点が該句読点記入枠22に記入さ
れる。そして、このような帳票20が文字認識装置に入
力されると、文字記入枠21は全文字、句読点記入枠2
2は句読点及び促音、拗音のみが認識対象となる。その
ため、文字記入枠21に、通常の文字と句読点を同一記
入枠に記入することを防ぐことができ、記入者の負担を
軽減することができる。さらに、同一文字記入枠21に
記入された文字の認識が不必要となるので、文字認識辞
書41を格納する辞書メモリの削減や、前処理部33で
の文字切り出しのアルゴリズムの簡単化が図れる。従っ
て、装置の小型化、高速化が実現できる。しかも、句読
点記入枠22に記入された文字は、句読点、促音、拗音
に字種を限定できるので、認識処理を、簡単かつ高速に
行える。なお、本発明は上記実施例に限定されず、種々
の変形が可能である。例えば、図3の帳票20におい
て、文字記入枠21を任意の数にしたり、あるいはそれ
らを縦書きの形式にしてもよい。また、図1に示す文字
認識装置は、他の構成に変更してもよい。
【0014】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、入力媒体として用いる帳票の各行末に文字記
入枠と別の記入枠を設けたので、行末に来た句読点等は
該行末の記入枠に記入される。そのため、文字記入枠
に、通常の文字と句読点等を同一記入枠に記入すること
を防ぐことができ、記入者の負担を軽減することができ
る。さらに、通常文字の文字記入枠と行末の記入枠につ
いて認識対象を異ならせて認識される。これにより、同
一記入枠に記入された文字の認識が不必要となるので、
辞書メモリの削減や、前処理手段における文字切り出し
のアルゴリズムの簡単化が図れる。従って、装置の小型
化、及び高速化が実現できる。第2の発明によれば、行
末の記入枠は、句読点または促音、拗音を記載するため
のサイズの小さな記入枠で構成され、その行末の記入枠
について、句読点、促音、拗音の全てまたは、その一部
を認識対象としている。そのため、行末の記入枠に記入
された文字は、句読点、促音、拗音に字種が限定され、
それによって認識処理が簡単かつ高速に行える。従っ
て、帳票の記入における負担を軽減でき、操作性が優
れ、小型で高速な文字認識装置を実現できる。
【図面の簡単な説明】
【図1】本発明の実施例の文字認識方法に用いられる文
字認識装置の概略を示す構成ブロック図である。
【図2】従来の帳票記入例を示す図である。
【図3】本発明の実施例の帳票例を示す図である。
【図4】図3の帳票記入例を示す図である。
【符号の説明】
20 帳票 21 文字記入枠 22 句読点記入枠 31 光電変換部 32 ラインバッファ 33 前処理部 34 文字パターンレジスタ 41 文字認識辞書 42 辞書選択部 51 文字認識部 52 結果編集部 53 文字名出力端子

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 帳票を入力媒体として用い、前記帳票上
    に記入された文字を読み取って前処理手段で文字パター
    ンの切り出しを行ない、前記切り出された文字パターン
    の特徴を文字認識手段で抽出して辞書の内容と照合し、
    前記帳票上の文字を認識する文字認識方法において、 前記帳票は、通常の1文字単位の文字が記入される文字
    記入枠と、前記文字記入枠の行末に該文字記入枠とは大
    きさの異なる行末の記入枠とを有し、 前記前処理手段での文字パターン切り出しの際に判別さ
    れる、前記文字記入枠内の文字か、前記行末の記入枠内
    の文字かの判別結果に基づき、前記辞書の内容を選択し
    て前記文字認識手段で照合処理を行うことを特徴とする
    文字認識方法。
  2. 【請求項2】 前記行末の記入枠は、句読点または促
    音、拗音を記載するためのサイズの小さな記入枠で構成
    し、この記入枠に記入された句読点、促音、拗音の全
    て、または、その一部を前記文字認識手段での認識対象
    とすることを特徴とする請求項1記載の文字認識方法。
JP5024610A 1993-02-15 1993-02-15 文字認識方法 Pending JPH06243285A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5024610A JPH06243285A (ja) 1993-02-15 1993-02-15 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5024610A JPH06243285A (ja) 1993-02-15 1993-02-15 文字認識方法

Publications (1)

Publication Number Publication Date
JPH06243285A true JPH06243285A (ja) 1994-09-02

Family

ID=12142924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5024610A Pending JPH06243285A (ja) 1993-02-15 1993-02-15 文字認識方法

Country Status (1)

Country Link
JP (1) JPH06243285A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19724719A1 (de) * 1997-06-11 1998-12-17 Siemens Ag Audiokonferenzsystem

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19724719A1 (de) * 1997-06-11 1998-12-17 Siemens Ag Audiokonferenzsystem
DE19724719C2 (de) * 1997-06-11 2000-05-11 Siemens Ag Audiokonferenzsystem

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US4933979A (en) Data reading apparatus for reading data from form sheet
JPH0727543B2 (ja) 文字認識装置
US5854860A (en) Image filing apparatus having a character recognition function
Pal et al. Computer recognition of printed Bangla script
JPH0516632B2 (ja)
JPH05303619A (ja) 電子スクラップブック
JPH06243285A (ja) 文字認識方法
JP2584973B2 (ja) 文字認識装置における認識結果出力方法
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JPH0991371A (ja) 文字表示装置
JPH07168913A (ja) 文字認識システム
JPS6120887B2 (ja)
JPH07262317A (ja) 文書処理装置
JP3025382B2 (ja) 文書処理装置
JP2570571B2 (ja) 光学文字読取装置
JPS6336389A (ja) 文字読取装置
JP2931485B2 (ja) 文字切出し装置及び方法
JP3196603B2 (ja) バーコード認識方法及びシステム
JP2939945B2 (ja) ローマ字住所認識装置
JPH0589279A (ja) 文字認識装置
JPH08123904A (ja) 書体種類処理装置
JPH03230288A (ja) 情報処理装置
Radošević et al. Optical Text Recognition: Basic Procedures and Current State
JPS6327990A (ja) 文字認識方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20020305