JP2000331122A - 文字認識方法および装置 - Google Patents

文字認識方法および装置

Info

Publication number
JP2000331122A
JP2000331122A JP11141053A JP14105399A JP2000331122A JP 2000331122 A JP2000331122 A JP 2000331122A JP 11141053 A JP11141053 A JP 11141053A JP 14105399 A JP14105399 A JP 14105399A JP 2000331122 A JP2000331122 A JP 2000331122A
Authority
JP
Japan
Prior art keywords
character
characters
handwritten
center position
printed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11141053A
Other languages
English (en)
Other versions
JP4229521B2 (ja
Inventor
Junji Kashioka
潤二 柏岡
Satoshi Naoi
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14105399A priority Critical patent/JP4229521B2/ja
Publication of JP2000331122A publication Critical patent/JP2000331122A/ja
Application granted granted Critical
Publication of JP4229521B2 publication Critical patent/JP4229521B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識処理における手書き/活字判別の精
度を向上させ、文字認識による処理時間を短縮するとも
に文字認識精度を向上させること。 【解決手段】 文字列を抽出し手書き/活字判別処理を
行い、その結果に基づき手書き文字認識処理もしくは活
字認識処理を行う。上記手書き/活字判別処理におい
て、文字列から濁点を含めずに文字を抽出し、抽出した
全文字の中心位置を求め、その規則性から、手書き文字
と活字の判別を行う。また、文字列に含まれる小文字を
含めずに抽出した全文字の中心位置を求め、その規則性
をから、手書き文字と活字の判別を行う。これにより、
濁点、小文字を含む活字において、中心位置のバラツキ
が大きくなるという問題を解決でき、手書き/活字判別
処理が可能となる。また、帳票等のレイアウト情報を利
用して、手書き/活字判別処理を行うことにより、手書
き/活字判別処理の精度を向上させることができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】近年、入力周辺機器として文
字認識技術の需要が増加している。本発明は、この文字
認識に使用される文字認識方法および装置に関し、特に
本発明は、手書き文字と活字が混在する文書において、
より高い認織精度で高速に認識結果を得ることができる
文字認識方法及び装置に関するものである。
【0002】
【従来の技術】手書き文字と活字が混在する文書の文字
認識においては、通常、手書き文字認識と活字認識の2
つの処理を行い、両者の認識結果を比較して信頼度の高
い結果を採用していた。この方法は、認識のために手書
き文字認識と活字認識を行う必要があり処理時間を要す
る。そこで、予め認識の対象となる文字(列)が手書き
文字か活字かを判別し、その結果に応じて手書き文字認
識もしくは活字認識を行う方法が提案されている。この
方法によれば、文字認識処理を2度行う必要がないので
処理時間を短縮することができる。
【0003】手書き文字/活字判別法としては、例え
ば、文書や帳票からスキャナ等により文書画像を得て、
該文書画像から文字列を抽出し、さらに文字列に含まれ
る文字を抽出し、全文字についてピッチ、中心位置のず
れなどの文字の配置の規則性を求め、文字列の文字の配
置に規則性があるときに活字文字列とし、配置に規則性
がないときに文字列を手書き文字列と判別する方法が用
いられる。
【0004】
【発明が解決しようとする課題】文字列中の文字の配置
の規則性を、文字列中の全文字の文字の高さ方向への中
心位置の規則性により表す方法としては、例えば前記し
たように、文字列から文字を切り出し、高さ方向の文字
の中心位置を求めて、中心位置のバラツキが小さい場合
は活字、バラツキが大きい場合は手書き文字と判別方法
が用いられる。この方法は、漢字又は数字の場合の多く
については、活字では文字の大きさが一定かつ規則的に
配置されているため、中心位置にバラツキが少なく、手
書き文字との判別に利用可能な特徴ではある。
【0005】しかし、図14に示すようにカタカナの場
合にみられる文字に濁点が含まれる文字列の場合、濁点
により文字の中心位置が上にずれ(例えば図中の
「ジ」)、活字でも文字の中心位置のバラツキが大きく
なる。また、文字列に小文字が含まれると、文字の中心
位置が、下の方向にずれるため、中心位置のバラツキが
活字でも大きくなる(図中の「ョ」)。以上の理由か
ら、カタカナ、平仮名など、濁点、小文字をもつ字種を
対象に含む場合、従来方法を適用することはできなかっ
た。
【0006】また、前記した手書き/活字判別法は、対
象がレイアウト情報の既知な帳票でも、レイアウト情報
を手書き/活字判別処理に利用していなかった。すなわ
ち、予めレイアウト情報が登録されている帳票において
は、例えば、金額欄などの項目はこれに続く文字記入領
域に数字が書かれることが明白であるが、従来方法で
は、レイアウト情報から判別できる文字記入欄に書かれ
る字種に関する情報を利用せずに手書き/活字判別を行
っており、手書き文字/活字の判別精度が悪かった。ま
た、帳票においては、金額欄などの項目に続く文字記入
欄は一つの帳票内では手書き文字または活字にほとんど
が統一されて文字が記入されるが、この情報も利用して
おらず、各文字記入欄毎の手書き/活字判別結果をその
まま利用していた。このため、手書き文字/活字の判別
精度を向上させることが難しかった。本発明は上記した
事情を考慮してなされたものであって、文字認識処理に
おける手書き/活字判別の精度を向上させ、文字認識に
よる処理時間を短縮するともに文字認識精度を向上させ
ることである。
【0007】
【課題を解決するための手段】図1(a)〜(c)は本
発明の原理図であり、同図に示すように本発明において
は次のようにして上記課題を解決する。 (1)図1(a)に示すように、文字列を抽出し、手書
き/活字判別処理を行い、その結果に基づき手書き文字
認識処理もしくは活字認識処理を行う。上記手書き/活
字判別処理において、次のようにして手書き文字と活字
の判別を行う。 (a) 文字列から濁点を含めずに文字を抽出し、抽出した
全文字の中心位置を求め、その規則性から、手書き文字
と活字の判別を行う。これにより、濁点を含む活字にお
いて、中心位置のバラツキが大きくなる問題を解決でき
る。 (b) 文字列に含まれる小文字を含めずに抽出した全文字
の中心位置を求め、その規則性をから、手書き文字と活
字の判別を行う。これにより、小文字を含む活字におい
て、中心位置のバラツキが大きくなる問題を解決でき
る。上記、小文字を含めずに文字の中心位置の規則性を
求める方法としては、例えば、文字列から基準とする1
文字を抽出し、この文字に対して大きさが小さく、か
つ、この基準とする文字の下方に位置する文字を除去し
て、文字の中心位置の規則性を求める方法を用いること
ができる。また、文字列中の文字の高さ方向の中心位置
の規則性を手書き/活字判別に利用するに際し、文字列
に含まれる文字数が少ない場合は、手書き/活字の判別
を保留するようにしてもよい。これにより文字数がすく
ない場合でも、手書き/活字の判別を誤ることがなくな
る。なお、手書き/活字の判別を保留した場合には、文
字認識処理において、手書き文字認識処理、活字認識処
理を両方を行い信頼性の高い結果を採用する。 (2)図1(b)に示すように、帳票のレイアウトを解
析し、項目領域とそれに続く文字記入欄にグループ分け
し、まず、項目領域の文字認識を行う。次いで、項目領
域の文字認識結果に基づき、同一グループに属する文字
記入欄の字種を判定し、その字種の手書き/活字判別を
行うのに適した特徴量により上記文字記入欄の手書き/
活字の判別を行う。そして、その結果に基づき手書き文
字認識処理もしくは活字認識処理を行う。上記のように
手書き/活字判別処理を行うことにより、字種によって
精度の高い判別方法を選択でき、手書き/活字判別の精
度を高めることが可能である。 (3)図1(c)に示すように、帳票のレイアウトを解
析し、文字記入欄をグループ分けする。次いで、帳票中
の各文字記入欄の文字列の手書き/活字判別を行う。さ
らに、グループ毎に判別結果を集計し、集計結果に基づ
き、上記手書き/活字判別結果を修正する。そして、そ
の結果に基づき手書き文字認識処理もしくは活字認識処
理を行う。上記のように手書き/活字判別処理を行うこ
とにより、判別を誤っている文字列の判別結果を、同一
のグループに属する手書き/活字判別結果により修正す
ることができる。
【0008】
【発明の実施の形態】図2は本発明が適用されるシステ
ムの構成例を示す図である。同図において、11はCP
Uであり、CPU11にはバス10が接続されており、
バス10には、RAM12、ROM13、通信インタフ
ェース14、外部記憶装置15、記憶媒体読み取り装置
16、画像読み取りを行うスキャナ17、ディスプレ
イ、キーボード等の入出力装置18等が接続されてい
る。ROM13、RAM12にはOSや本実施例の処理
を行うためのプログラム、データ等が格納される。スキ
ャナ17は、文字認識の対象となる文字等が記録された
画像を読み取る。また、入出力装置18は、キーボード
やマウス等の入力デバイス、ディスプレイモニタ、プリ
ンタ等の出力デバイスを含み、本発明のデータ処理を行
うためのデータを入力したり、処理されたデータを出力
する。
【0009】本発明の文字認識処理を行うためのプログ
ラム、データ等は、ハードディスク等の記憶装置15あ
るいはCD−ROM、フロッピー(登録商標)ディスク
等の記録媒体に記録されており、データ処理実行時、記
録装置15から、あるいは、記録媒体読み取り装置17
により記録媒体から読み取られRAM12に格納され、
CPU11により実行される。また、バス10には通信
インタフェース14が接続されており、通信回線を介し
て、データやプログラムの授受を行うことができる。
【0010】図3は本発朋の実施例の文字認識処理の処
理フローを示す図である。同図に示すように、スキャナ
17等の画像入力手段により文書又は帳票の画像が獲得
され、獲得された画像に対してノイズ除去、傾き補正等
の前処理がなされる(ステップS1)。ついで、画像か
ら一文字列を抽出して(ステップS2)、本発明に係わ
る手書き/活字の識別が行なわれる(ステップS3)。
そして、抽出された文字列が手書き文字として判別され
た場合には、フラグを1に設定し、また活字として判別
された場合にはフラグを2に設定する。さらに、手書き
文字か活字かの判別不可能の場合には、フラグを3に設
定する(ステップS4)。
【0011】文字認識処理においては上記フラグを参照
し、次のように文字認識を行う(ステップS5〜S
6)。 手書き文字と判別された場合には、手書き文字認識
処理を行う。 活字として判別された場合には、活字認識処理を行
う。 手書き文字、活字の判別が不可能な場合には、手書
き文字認識処理と活字認識処理を行い、より信頼性が高
い方を採用する。 上記のように、予め手書き文字か活字であるかを判別
し、文字認識処理を行うことにより、文字認識処理の信
頼性を向上させることができるとともに、手書き文字認
識処理と活字認識処理の両方の処理を行うことなく文字
認識を行うことができるので処理の高速化を図ることが
できる。
【0012】次に上記文字認識処理における手書き/活
字判別処理について本発明の実施例を説明する。 (1)実施例1 図4は本発明の第1の実施例の手書き活字判別の処理フ
ローを示す図である。図4に示すように、まず、抽出し
た文字列の文字から連結成分を取り出す(ステップS
1)。例えば、抽出された文字列が前記図14に示した
「モジニンシキショリ」の場合、最初の文字「モ」は文
字を構成する全画素が連結しているので図4に示すよう
に1つの連結成分として抽出される。また、例えば、次
の文字「ジ」については、5つの連結成分が抽出され
る。次に抽出した連結成分から濁点を除去し(ステップ
S2)、連結成分を統合する(ステップS3)。すなわ
ち、濁点除去処理で残った連結成分を、適当な条件の元
に統合し、文字を構成する単位に分離する。統合条件
は、例えば、連結成分の外接矩形同士を比較し、重なり
がある場合などに統合する。図14の例の場合には図4
に示すように「ジ」の濁点が除去され、残りの連結成分
が統合される。
【0013】ついで、ステップS4において、小文字を
除去する。図14の例の場合には、小文字の「ョ」が除
去される。ステップS5において、残りの文字数を、予
め定められた閾値と比較し、残り文字数が閾値より小さ
い場合には、ステップS6に行き、手書き/活字の判別
ができないとしてフラグを3に設定して処理を終わる。
【0014】すなわち、抽出した文字数が少ない場合
は、後述する文字の中心位置のバラツキの値に信頼性が
乏しいため、判別を誤る可能性を有する。従って、抽出
した文字数が少ない場合は、判別を保留して、前記の
ように手書き/活字の両認識処理を行い、信頼性の高い
方を採用する。また、残り文字数が閾値より大きい場合
には、ステップS7に行き、文字の中心位置の規則性を
算出する。すなわち、図5に示すように各文字を分離し
て抽出し、各文字の高さ方向の中心位置を求める。そし
て、各文字の中心位置のバラツキを分散などにより数値
化する。次いでステップS8において、中心位置のバラ
ツキの大小に応じて手書き文字か活字かを判別する。す
なわち、中心位置のバラツキが大きい場合には手書き文
字列であるとしてフラグを1に設定し、バラツキが小さ
い場合には、活字の文字列であるとしてフラグを2に設
定する。
【0015】図6は上記濁点の除去方法を示す処理フロ
ーである。濁点の除去方法としては、図6の処理フロー
に示すように、まず、ステップS1において、所定値よ
り上方にあり、かつ小さい連結成分を抽出する。例えば
図7に示すように「ジ」の場合には、所定値より大きな
連結成分c,d,eが抽出される。次に、ステップS2
において、抽出された連結成分の相互間の距離を算出す
る。図7の例の場合には連結成分c,d,eの相互の距
離を算出する。ステップS3において、連結成分間の距
離が閾値より小さいものがあるかを調べる。そして、連
結成分間の距離が閾値より小さいものがない場合には濁
点がないとして処理を終了する。また、連結成分間の距
離が閾値より小さい場合には、ステップS4に行き、距
離が閾値より小さい連結成分のペアを濁点として除去す
る。図7の場合には連結成分d,eの距離が閾値より小
さいので濁点として除去される。その結果、図8に示す
ように濁点候補1,2が除去される。
【0016】以上のように濁点を除去したのち、前記し
たように連結成分を統合し、文字を構成する単位に分離
する。この処理により分離抽出された文字から小文字を
除去するための処理フローを図9に示す。まず、ステッ
プS1において基準文字を抽出し、ステップS2におい
て基準文字の高さ、下座標を抽出する。
【0017】例えば、最初の1文字目(図10の横書き
文字列では一番左の文字)の文字を基準文字とし、その
高さと高さ方向への下座標を抽出する。なお、その他、
文字列の内の高さが最大の文字を基準文字としてもよ
い。ステップS3において、基準文字と各文字の下座標
を比較し、下座標の差が所定値以下の文字の高さと基準
文字の高さの差(もしくは比)を算出する。そして残り
の各文字につき、高さが基準文字の高さに比して小さ
く、下座標が基準文字の下座標に近いものを小文字とし
て除去する(ステップS4)。例えば図10の例の場合
には、「ョ」が除去される。以下、前記したように、小
文字を除去して残った文字に対して、文字の中心位置の
規則性を、文字の高さ方向の中心位置の座標の分散など
により数値化して求め、この数値の大きさにより、手書
き文字か、活字かを判別する。
【0018】以上のように本実施例においては、濁点、
小文字を除去した文字列中の文字の中心位置の規則性に
より手書き/活字判別を行っているので、カタカナ、平
仮名など、濁点、小文字をもつ字種を対象に含む場合で
あっても、手書き/活字判別処理を精度よく行うことが
できる。なお、本実施例に示した文字の中心位置の規則
性による判別処理を単独で用いて手書き/活字の判別を
行ってもよいが、この特徴量に加えて、文字列から他の
特徴量を複数抽出して、これらの特徴と合わせて総合的
に判別することも可能である。その場合、判別の方法
は、特徴量の大小による判別だけではなく、判別分析な
どの方法も用いることも可能である。
【0019】(2)実施例2 次に本発明の第2の実施例について説明する。本実施例
の処理フローを図11に示し、また、本実施例の処理概
念図を図12に示す。本実施例においては、まず、図1
1のステップS1において、画像データに変換された帳
票に対し、帳票のレイアウトを解析し、ステップS2に
おいて、項目とそれに続く文字記入領域にグループに分
けする。グループ分けは、帳票の列毎にグループを作成
するなどの方法を用いることができる。例えば、図12
の場合には、項目として「銀行名」、「支店名」、「口
座番号」、「金額」等の項目文字とそれに続く、文字記
入欄にグループ分けされる。ステップS3において、帳
票の項目領域に対して文字認識を行い、項目文字を認識
する。
【0020】次いでステップS4において、文字認識の
結果得られた情報から、文字記入領域の字種を判定す
る。例えば、項目領域に「金額」とかかれている場合に
は、この項目と同じグループに属する文字記入欄の字種
を数字と推定する。字種の推定方法としては、例えば、
図11に示すように、項目とそれに続く文字記入欄の字
種の対応データを参照し文字記入領域の字種を判定する
ことができる。ステップS5において、上記判定結果か
ら得られた字種に限定して、特徴量を抽出し、手書き文
字/活字判別処理を行う。特徴量としては、第1の実施
例に示した文字列中に含まれる文字の中心位置のバラツ
キや、文字の高さのバラツキなどを用いることができ
る。また判別方法としては、特徴量を予め設定した閾値
を比較して、バラツキの量が閾値以下なら活字、閾値以
上なら手書き文字と判別できる。また、特徴量を複数用
いて、判別分析などにより特徴空間上で総合的に判別す
ることも可能である。
【0021】以上のように本実施例では、帳票のレイア
ウト情報を利用し、項目領域の文字認識結果に基づき、
文字記入欄の字種を限定して手書き/活字判別処理を行
っているので、手書き文字/活字判別処理精度を向上さ
せることができる。なお、上記実施例では、未知の帳票
に対しては、項目領域の文字を認識した結果により、こ
の項目と同一のグループに属する文字記入領域の文字の
字種を限定して手書き/活字判別を行うようにしたが、
帳票のレイアウト情報と文字記入領域の字種情報が予め
登録されている場合は、まず処理対象の帳票のレイアウ
ト情報を抽出し、レイアウト情報を用いて帳票照合を行
い、登録されている帳票と一致した場合には、登録され
ている帳票の文字記入欄についての字種情報を用いて、
文字記入欄毎に字種を限定して手書き/活字判別を行う
ことも可能である。
【0022】(3)実施例3 次に本発明の第3の実施例について説明する。本実施例
の処理フローを図13に示す。図13のステップS1に
おいて、画像データに変換された帳票に対して、帳票の
構造を解析し、レイアウト情報を取得する。次に、ステ
ップS2において、帳票の文字記入領域をグループ分け
する。グループ分けは、帳票の列毎にグループを作成す
るなどの方法を用いることができる。例えば、前記図1
2に示した帳票の場合には、項目「銀行名」の文字記入
欄(グループ1)、項目「支店名」の文字記入欄(グル
ープ2)、…、項目「金額」(グループ4)の文字記入
欄にグループ分けする。
【0023】そして、ステップS3において、各文字記
入欄の文字列毎に手書き/活字判別を行う。すなわち、
図12の場合、グループ1〜グループ4について文字記
入欄の手書き/活字判別を行う。ステップS4におい
て、グループ毎に、手書き/活字判別結果を集計し、ス
テップS5において、上記集計結果で、数の多い方の判
別結果を正解とし、数の少ない方の判別結果を数の多い
方の判別結果に修正する。例えば、図12の例では、グ
ループ1について、手書き文字に判別した結果が多く、
活字に判別した結果が少ない場合には、そのグループは
手書き文字であるとして、活字と判別した結果を手書き
文字の判別結果に修正する。また、逆に活字に判別した
結果が多く、手書き文字に判別した結果が少ない場合に
は、手書き文字と判別した結果を活字の判別結果に修正
する。同様に各グループ1〜4について、判別結果を修
正する。以上のように本実施例では、帳票のレイアウト
情報を利用し、各グループの手書き/活字判別結果を集
計し、集計結果に基づき同じグループに属する文字記入
欄の手書き/活字判別処理結果を修正しているので、第
2の実施例と同様、手書き文字/活字判別処理精度を向
上させることができる。
【0024】
【発明の効果】以上説明したように、本発明おいては以
下の効果を得ることができる。 (1)文字列から濁点を含めずに求めた文字の中心位置
の規則性を抽出して、手書き文字と活字の判別を行うた
め、濁点を含む可能性のあるカタカナ、平仮名などの任
意の文字列の手書き/活字判別が可能となる。 (2)文字列に含まれる小文字を含めずに文字の中心位
置の規則性を抽出して、手書き文字と活字の判別を行う
ため、小文字を含む可能性のあるカタカナ、平仮名など
の任意の文字列の手書き/活字判別が可能となる。ま
た、対象とする文字列の文字数が少ない場合は、判別保
留(リジェクト)の判別結果を出力し、手書き、活字の
両認識処理に認識を委ねることにより、文字認識の精度
を損なうことがない。 (3)帳票のレイアウト情報を用いて、文字種を限定し
て手書き/活字判別を行うことにより、判別精度を向上
することができる。 (4)帳票のレイアウト情報により文字記入領域をグル
ープ化し、グループ内の手書き/活字判別結果をもと
に、各文字記入領域の判別結果を修正することにより、
判別精度を向上することができる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明が適用されるシステムの構成例を示す図
である。
【図3】本発朋の実施例の文字認識処理の処理フローを
示す図である。
【図4】本発明の第1の実施例の手書き活字判別の処理
フローを示す図である。
【図5】本実施例の手書き/活字判別処理の概念を説明
する図である。
【図6】濁点の除去方法を示す処理フローである。
【図7】濁点の除去方法を説明する図である。
【図8】濁点の除去処理の概念を説明する図である。
【図9】小文字を除去するための処理フローを示す図で
ある。
【図10】小文字除去処理の概念を説明する図である。
【図11】本発明の第2の実施例の処理フローである。
【図12】本発明の第2の実施例の処理概念を説明する
図である。
【図13】本発明の第3の実施例の処理フローである。
【図14】従来方法で問題となる濁点、小文字を含むカ
タカナ活字の文字例である。
【符号の説明】
11 CPU 10 バス 12 RAM 13 ROM13 14 通信インタフェース 15 外部記憶装置 16 記憶媒体読み取り装置 17 スキャナ 18 入出力装置

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文書を画像データに変換して得られる文
    書画像から文字列を抽出し、前記文字列中の各文字の高
    さ方向の中心位置を求め、全文字の高さ方向の中心位置
    の規則性により前記文字列が手書き文字か活字かを判別
    し、該判別結果に基づき文字認識を行う文字認識方法で
    あって、 文字列に含まれる濁点を含めずに求めた前記文字の中心
    位置の規則性により、手書き文字と活字の判別を行うこ
    とを特徴とする文字認識方法。
  2. 【請求項2】 文書を画像データに変換して得られる文
    書画像から文字列を抽出し、前記文字列中の各文字の高
    さ方向の中心位置を求め、全文字の高さ方向の中心位置
    の規則性により、前記文字列が手書き文字か活字かを判
    別し、該判別結果に基づき文字認識を行う文字認識方法
    であって、 文字列に含まれる小文字を含めずに求めた前記文字の中
    心位置の規則性により、手書き文字と活字の判別を行う
    ことを特徴とする文字認識方法。
  3. 【請求項3】 帳票を画像データに変換して得られる画
    像から、前記帳票の文字記入欄を抽出し、文字記入欄の
    文字が手書き文字か活字かを判別し、該判別結果に基づ
    き文字認識を行う文字認識方法であって、 前記帳票のレイアウトを解析して、項目領域とそれに続
    く文字記入欄にグループ分けし、項目領域の文字認識を
    行って認識結果に基づきそれに続く文字記入欄の字種を
    判定し、 上記字種判定結果により、上記グループ毎に項目領域に
    続く文字記入欄の字種を限定して手書き/活字判別を行
    うことを特徴とする文字認識方法。
  4. 【請求項4】 帳票を画像データに変換して得られる画
    像から、前記帳票の文字記入欄を抽出し、文字記入欄の
    文字が手書き文字か活字かを判別し、該判別結果に基づ
    き文字認識を行う文字認識方法であって、 前記帳票のレイアウトを解析して、文字記入欄に対して
    グループを作成し、同一グループの文字記入欄の手書き
    /活字判別結果の集計値に基づき、該同一グループに属
    する各文字記入欄の手書き/活字判別結果を修正するこ
    とを特徴とする文字認識方法。
  5. 【請求項5】 文書を画像データに変換して得られる文
    書画像から文字列を抽出する文字列抽出手段と、 前記文字列中の各文字の高さ方向の中心位置を求め、全
    文字の高さ方向の中心位置の規則性により前記文字列が
    手書き文字か活字かを判別する手書き/活字判別手段
    と、 上記該判別結果に基づき文字認識を行う文字認識手段を
    備えた文字認識装置であって、 上記手書き/活字判別手段は、文字列中の文字から濁点
    を除いて各文字の中心位置を求める第1の手段と、文字
    列中から小文字を除いて各文字の中心位置を求める第2
    の手段と、第1、第2の手段により求めた文字の中心位
    置の規則性により文字列が手書き文字であるか活字かを
    判別する第3の手段を備えていることを特徴とする文字
    認識装置。
JP14105399A 1999-05-21 1999-05-21 文字認識方法および装置 Expired - Fee Related JP4229521B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14105399A JP4229521B2 (ja) 1999-05-21 1999-05-21 文字認識方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14105399A JP4229521B2 (ja) 1999-05-21 1999-05-21 文字認識方法および装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008272706A Division JP4968236B2 (ja) 2008-10-23 2008-10-23 文字認識方法

Publications (2)

Publication Number Publication Date
JP2000331122A true JP2000331122A (ja) 2000-11-30
JP4229521B2 JP4229521B2 (ja) 2009-02-25

Family

ID=15283167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14105399A Expired - Fee Related JP4229521B2 (ja) 1999-05-21 1999-05-21 文字認識方法および装置

Country Status (1)

Country Link
JP (1) JP4229521B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
US7469063B2 (en) 2004-09-24 2008-12-23 Fuji Xerox Co., Ltd. Apparatus, method and storage medium storing program for recognizing characters
JP2009009179A (ja) * 2007-06-26 2009-01-15 Univ Of Tokyo 画像処理装置及び画像処理プログラム
JP2011018337A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc 文書内のテキスト行を区分するための方法
WO2011074067A1 (ja) 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
JP2020004124A (ja) * 2018-06-28 2020-01-09 富士通株式会社 筆記選択プログラム、筆記選択方法および情報処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7469063B2 (en) 2004-09-24 2008-12-23 Fuji Xerox Co., Ltd. Apparatus, method and storage medium storing program for recognizing characters
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2009009179A (ja) * 2007-06-26 2009-01-15 Univ Of Tokyo 画像処理装置及び画像処理プログラム
JP2011018337A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc 文書内のテキスト行を区分するための方法
WO2011074067A1 (ja) 2009-12-15 2011-06-23 富士通フロンテック株式会社 文字認識方法、文字認識装置および文字認識プログラム
US8588520B2 (en) 2009-12-15 2013-11-19 Fujitsu Frontech Limited Character recognition method, character recognition apparatus, and character recognition program
JP2020004124A (ja) * 2018-06-28 2020-01-09 富士通株式会社 筆記選択プログラム、筆記選択方法および情報処理装置
JP7035852B2 (ja) 2018-06-28 2022-03-15 富士通株式会社 筆記選択プログラム、筆記選択方法および情報処理装置

Also Published As

Publication number Publication date
JP4229521B2 (ja) 2009-02-25

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
Naz et al. The optical character recognition of Urdu-like cursive scripts
US8155425B1 (en) Automated check detection and image cropping
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JPH11120293A (ja) 文字認識/修正方式
JP4280355B2 (ja) 文字認識装置
Zoizou et al. A new hybrid method for Arabic multi-font text segmentation, and a reference corpus construction
Biswas et al. Writer identification of Bangla handwritings by radon transform projection profile
US6549662B1 (en) Method of recognizing characters
Haboubi et al. Discrimination between Arabic and Latin from bilingual documents
JP7282989B2 (ja) テキスト分類
JP4229521B2 (ja) 文字認識方法および装置
Sharma et al. Primitive feature-based optical character recognition of the Devanagari script
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
Sagar et al. Character segmentation algorithms for Kannada optical character recognition
Srinivas et al. An overview of OCR research in Indian scripts
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
Kumar et al. Line based robust script identification for indianlanguages
Chowdhury et al. Bengali handwriting recognition and conversion to editable text
JPH08255223A (ja) 文字認識装置における類似文字判別方法
JP4968236B2 (ja) 文字認識方法
JP2917427B2 (ja) 図面読取装置
Dhandra et al. Morphological reconstruction for word level script identification
JP2001283157A (ja) 単語認識方法および単語認識プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees