JP3127413B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3127413B2
JP3127413B2 JP04102984A JP10298492A JP3127413B2 JP 3127413 B2 JP3127413 B2 JP 3127413B2 JP 04102984 A JP04102984 A JP 04102984A JP 10298492 A JP10298492 A JP 10298492A JP 3127413 B2 JP3127413 B2 JP 3127413B2
Authority
JP
Japan
Prior art keywords
limit value
density
character
lower limit
upper limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04102984A
Other languages
English (en)
Other versions
JPH05298486A (ja
Inventor
仁保 美藤
滋 加福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP04102984A priority Critical patent/JP3127413B2/ja
Publication of JPH05298486A publication Critical patent/JPH05298486A/ja
Application granted granted Critical
Publication of JP3127413B2 publication Critical patent/JP3127413B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マルチフォントの印刷
文字認識に用いられる文字認識装置に関するものであ
る。
【0002】
【従来の技術】最近の文字認識技術の進歩は目覚ましい
ものがあり、各分野において広く用いられるようになっ
ている。
【0003】ところで、文字認識には、印刷文字に対す
る認識を行うものがあるが、このような印刷文字認識で
は、インクの濃さ、汚れ、染み、文字の片打ちなどによ
る文字線幅の変動などが原因で誤認識を生じることが知
られている。
【0004】そこで、従来では文字認識を実行するまで
の前処理として、種々の方法が考えられており、例えば
文字の特徴を抽出する手段として、メッシュ特徴を抽出
する方法とベリフェラル特徴を抽出する方法を組み合わ
せたものが考えられている。ここで、メッシュ特徴は、
文字パターンを複数の小領域に分割し、それぞれの小領
域に含まれる文字部分の面積を計数してメッシュ特徴を
抽出する方法であり、また、ベリフェラル特徴は、文字
パターンの外接枠から最初と2回目にそれぞれ文字線に
出会うまでの距離を求めることにより、文字特徴を抽出
する方法である。
【0005】しかして、従来から用いられているメッシ
ュ特徴およびベリフェラル特徴の抽出は、イメージスキ
ャナにより文字パターンを構成する文字線濃度を多階調
で読み取り、これら多階調で求められた文字パターンを
所定の濃度のしきい値で2値化したものについてそれぞ
れの特徴を求めるようにしている。
【0006】しかし、このような方法によると、しきい
値の設定が難しく、このしきい値の取り方によっては、
汚れやしみに異常に敏感であったり、文字のかすれなど
に全く反応しないなど誤認識の原因となることが多々あ
った。
【0007】例えば、図12(a)(b)(c)および
図13(a)(b)(c)は、“木”および“警”のそ
れぞれの文字パターンを多階調(0〜63)で読み取
り、この結果を濃度のしきい値12,24,36を用い
て2値化した状態を示すものである。この場合、しきい
値=12を用いると、“木”については、図12(a)
に示すように比較的良好な状態が得られるが、“警”に
ついては、図13(a)に示すように黒潰れ状態になっ
てしまう。また、しきい値=36を用いると、“木”に
ついては、図12(c)に示すように、かすれてほとん
ど字の体裁をなさなくなるが、“警”については、図1
3(c)に示すように比較的良好な状態が得られる。そ
して、しきい値=24を用いると、“木”については、
図12(b)に示すように、わずかにかすれを生じ、
“警”についても、図13(b)に示すようにやや黒潰
れ状態となり、これらの結果からも明らかなように同じ
文字であっても、しきい値の設定の仕方一つで全く別の
文字となってしまうことがあった。
【0008】そして、これらの結果に基づいて1次およ
び2次ベリフェラル特徴を求めると図14に示すように
なり、同図からも明らかなように同じ文字であっても、
しきい値の設定の仕方一つで全く別の文字となってしま
うことがあった。
【0009】
【発明が解決しようとする課題】このように従来の文字
認識システムにおいて、メッシュ特徴およびベリフェラ
ル特徴を抽出する方法を組み合わせたものによると、多
階調で求められた文字データを2値化する際のしきい値
の設定の仕方によって、それぞれの特徴の抽出結果が全
く異なるものになることがあるなど文字認識の精度の著
しい低下を招く問題点があった。本発明は、上記事情に
鑑みてなされたもので、精度の高い文字認識を実現可能
にした文字認識システムを提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、文書を読取り
多階調の読取りデータを出力する文字読取り手段、文字
読取り手段より出力される読取りデータより文字単位の
データを切出す切出し手段、切出し手段より切出された
文字単位のデータを多分割し複数の小領域を形成する領
域分割手段、領域分割手段により各領域について予めし
きい値として設定される複数の濃度について、それぞれ
最初に黒点群にぶつかるまでの距離を求める1次ペリフ
ェラル特徴と2回目に黒点群にぶつかるまでの距離を求
める2次ペリフェラル特徴を抽出し3次元ペリフェラル
特徴を出力する3次元ペリフェラル特徴抽出手段および
前記領域分割手段により分割された小領域のドット濃度
のドット濃度について所定の濃度範囲の下限値より小さ
い濃度については0、上限値より大きい濃度については
上限値−下限値にそれぞれ設定するとともに下限値と上
限値の間については下限値に従って濃度変換を行い3次
元メッシュ特徴を抽出する3次元メッシュ特徴抽出手段
を有し、これら3次元ペリフェラル特徴抽出手段および
3次元メッシュ特徴抽出手段より得られるペリフェラル
特徴に基づいて文字認識を行うように構成されている。
【0011】また、本発明は、文書を読取り多階調の読
取りデータを出力する文字読取り手段、文字読取り手段
より出力される読取りデータより文字単位のデータを切
出す切出し手段、切出し手段より切出された文字単位の
データを多分割し複数の小領域を形成する領域分割手
段、領域分割手段により分割された小領域のドット濃度
について所定の濃度範囲の下限値より小さい濃度につい
ては0、上限値より大きい濃度については上限値−下限
値にそれぞれ設定するとともに下限値と上限値の間につ
いては下限値に従って濃度変換を行い3次元メッシュ特
徴を抽出する3次元メッシュ特徴抽出手段を有し、この
3次元メッシュ特徴抽出手段より得られるメッシュ特徴
に基づいて文字認識を行うように構成されている。
【0012】
【作用】この結果、本発明によれば、多階調で読取られ
た文字単位データの各分割領域について予めしきい値と
して設定される複数の濃度に対して1次ペリフェラル特
徴と2次ペリフェラル特徴が求められ各領域についての
3次元ペリフェラル特徴を抽出するとともに、各領域の
ドット濃度のうち所定の濃度範囲のものについて一定値
で濃度変換して3次元メッシュ特徴を抽出するようにな
るので、文字認識の精度を文字の画数などに左右されな
い安定したものにできるとともに、文書中の汚れやしみ
は勿論、文字のかすれなどに対しても安定した認識を実
現することができる。
【0013】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。
【0014】図1は同実施例の概略構成を示している。
図において、1はOCRのような光学式の文字読取り部
で、この文字読取り部1は、読み込み指令信号により図
示しない文書の印刷文字をイメージデータとして読取
る。そして、文字読取り部1で読み取ったデータを多階
調でメモリ2に格納するようにしている。この読取りデ
ータのメモリ2の格納は、例えば文書の1頁単位で行わ
れる。そして、メモリ2に格納されたデータは、データ
読取り終了により行切出し部3および桁切出し部4に送
られる。
【0015】行切出し部3は、メモリ2から引き出され
る頁単位のデータの横方向についての濃度の和を求め、
この濃度和のエッジの立上がりから傾補正と行切出しを
行い、この結果データをメモリ2に格納するようにして
いる。また、桁切出し部4は、行切出し部3で切出され
た行単位のデータをメモリ2から取り込み、縦方向につ
いての濃度の和を求め、この濃度和の形から桁(1文
字)を切出し、この1文字単位のデータをメモリ2に格
納するようにしている。この場合のすべての行について
同様な動作を行うようにしている。
【0016】メモリ2に格納された1文字単位のデータ
は、接辺切出し小領域分割部5に送られる。この接辺切
出し小領域分割部5は、図2に示すように、行切出しお
よび桁切出しで残った周辺の空間を取り除くとともに、
縦方向を#11から#1m、横方向を#21から#2n
の複数領域に分割するようにしている。
【0017】そして、この接辺切出し小領域分割部5で
多分割された1文字単位のデータは、3次元ペリフェラ
ル特徴抽出部6および3次元メッシュ特徴抽出部7に送
られる。
【0018】3次元ペリフェラル特徴抽出部6では、最
初に#11の領域について上から下方向に最初に黒点群
にぶつかるまでの距離を求める1次ペリフェラル特徴と
2回目に黒点群にぶつかるまでの距離を求める2次ペリ
フェラル特徴を、複数のしきい値として設定される各濃
度についてそれぞれ求め、これらの1次ペリフェラル特
徴による距離の合計と2次ペリフェラル特徴による距離
の合計から3次元ペリフェラル特徴を求める。この場合
のしきい値としては、予めその値が決められた複数の濃
度によって設定される。次に#12の領域についても上
から下方向に1次ペリフェラルと2次ペリフェラルの特
徴についてもそれぞれ複数のしきい値として設定される
各濃度について求め、以下、#1mの領域まで上から下
方向に1次ペリフェラルと2次ペリフェラルの特徴につ
いても、それぞれしきい値として設定される複数濃度に
ついて求める。このようなペリフェラル特徴の抽出は、
#11から#1mの領域について下から上方向に、#2
1から#2nの領域について左から右方向および右から
左方向にそれぞれ同様にして行うようにする。
【0019】また、3次元メッシュ特徴抽出部7では、
小領域分割部5で分割された各小領域についてそれぞれ
のデータを取り込み、これら小領域の各ドット濃度のう
ちで式(1)で設定される所定の濃度範囲のものについ
て一定の値に基づいて濃度変換する。この場合、所定の
濃度範囲の下限値Dl より小さい濃度Di については
0、上限値Du より大きい濃度についてはDU −DL に
それぞれ設定されるとともに、下限値Dl と上限値Du
の間の濃度については下限値DL に従って濃度変換が行
われるようになっている。そして、式(2)に従って加
算し、体積で正規化することによりメッシュ特徴を抽出
するようにしている。
【0020】
【数1】
【0021】そして、これら3次元ペリフェラル特徴抽
出部6および3次元メッシュ特徴抽出部7により求めら
れた特徴パラメータは認識部8に送られる。認識部8
は、3次元ペリフェラル特徴抽出部6および3次元メッ
シュ特徴抽出部7からの特徴パラメータと辞書9のデー
タとの距離を式(3)に従って計算し、
【0022】
【数2】 距離の最小のものを認識結果として出力するようにして
いる。
【0023】なお、10は予め所定のプログラムを格納
した制御部で、この制御部9は、文字読取り部1、メモ
リ2、行切出し部3、桁切出し部4、接辺切出し小領域
分割部5、3次元ペリフェラル特徴抽出部6、3次元メ
ッシュ特徴抽出部7および認識部8に対してプログラム
にしたがって所定の制御指令を出力するようになってい
る。次に、以上のように構成した実施例について説明す
る。
【0024】まず、制御部10からの読み込み指令信号
により文字読取り部1で図示しない文書の印刷文字が読
取られる。そして、文字読取り部1の出力は、多階調の
読取りデータとしてメモリ2に格納される。この読取り
データのメモリ2への格納は、例えば文書の1頁単位で
行われる。
【0025】そして、このメモリ2に格納されたデータ
は、制御部10の指示により行切出し部3および桁切出
し部4に送られ、行切出しが行われるとともに、桁切出
しが行われ、1文字単位の切出しデータとしてメモリ2
に格納される。このような1文字単位のデータの切出し
は1頁単位すべてについて行われる。
【0026】メモリ2に格納された1文字単位のデータ
は、再び制御部10の指示により接辺切出し小領域分割
部5に送られる。ここで、接辺切出し小領域分割部5に
対して、例えば、図3に示すような1文字単位の切出し
のデータが与えられたとすると、まず、図4に示すよう
に行切出しおよび桁切出しで残った周辺の空間が取り除
かれ縦44ドット、横43ドットの切出しデータとした
後、図5に示すように縦方向を#11から#18、横方
向を#21から#28の領域に分割される。この場合の
各分割された領域のドット数は等しくなくともよい。
【0027】そして、この接辺切出し小領域分割部5で
多分割された1文字分のデータは、3次元ペリフェラル
特徴抽出部6に送られ、3次元ペリフェラル特徴が抽出
される。この場合、まず、#11の領域について上から
下方向に最初に黒点群にぶつかるまでの距離を求める1
次ペリフェラル特徴と、2回目に黒点群にぶつかるまで
の距離を求める2次ペリフェラル特徴をそれぞれ求める
ようになる。いま、#11の領域を拡大して示すと、図
6のように横5ドット、縦44ドットの領域で表され
る。そして、最初のドット列について上から下方向に最
初に黒点群にぶつかるまでの距離を求める1次ペリフェ
ラル特徴を、しきい値として濃度を12〜36の範囲で
2ずつ変化させた合計13の濃度について求めるように
する。この場合、濃度12〜24の範囲は、上から13
ドット目でぶつかり距離は12ドット分となり、濃度2
6〜30の範囲は、上から38ドット目でぶつかり距離
は37ドット分となり、濃度32〜36の範囲は、上か
ら44ドット目の端まで達し距離は44ドット分とな
る。従って、これらを纏めると図7(a)に示すように
(12ドット×7本)+(37ドット×3本)+(44
ドット×3本)=327が1次ペリフェラル特徴として
求められることになる。
【0028】同様にして、最初のドット列について上か
ら下方向に2回目に黒点群にぶつかるまでの距離を求め
る2次ペリフェラル特徴を、しきい値として12〜36
の範囲で2ずつ変化させた合計13本の濃度について求
めるようにする。この場合、濃度26〜30の範囲は、
上から38ドット目でぶつかり距離は37ドット分とな
り、濃度32〜36の範囲は上から44ドット目の端ま
で達し距離は44ドット分となる。従って、これらを纏
めると図8(a)に示すように(37ドット×7本)+
(44ドット×6本)=523が2次ペリフェラル特徴
として求められることになる。
【0029】以下、#11の領域の2〜5番目のドット
列についても上述したと同様にして上から下方向に最初
に黒点群にぶつかるまでの距離を求める1次ペリフェラ
ル特徴と、2回目に黒点群にぶつかるまでの距離を求め
る2次ペリフェラル特徴がそれぞれ求められる。この場
合、2〜5番目までの1次ペリフェラル特徴は、図7
(b)〜(e)に示すように得られ、2次ペリフェラル
特徴は、図8(b)〜(e)に示すように得られること
になる。
【0030】これにより、#11の領域での1次ペリフ
ェラル特徴の合計は1698、2次ペリフェラル特徴の
合計は2622として求められる。そして、この結果
を、横5ドット、縦44ドットおよび濃度13本の体
積、すなわち、5×44×13=2860で割って、2
55に正規化すると、 1698/2860*255=151 2622/2860*255=234 となり、#11の領域での3次元ペリフェラル特徴とし
て151、234が抽出されることになる。
【0031】以下、同様にして、#12〜#1mの領域
について上から下方向に1次ペリフェラルと2次ペリフ
ェラル特徴を求めるとともに、#11から#1mの領域
について下から上方向に、#21から#2nの領域につ
いても左から右方向および右から左方向についてそれぞ
れ同様にして1次ペリフェラルと2次ペリフェラル特徴
を求めることにより3次元ペリフェラル特徴が抽出され
る。
【0032】一方、接辺切出し小領域分割部5で多分割
された1文字分のデータは、3次元メッシュ特徴抽出部
7に送られ、メッシュ特徴が抽出される。この場合、一
例として図5の上から4番目および左から4番目の6×
6ドットの小領域に注目すると、この小領域内の36点
の各ドット濃度は、図9に示すようになる。そして、上
述した式(1)において、所定濃度範囲の下限値Dl =
8、上限値Du =48とすると、図10に示すように下
限値Dl =8より小さい濃度Di については0、上限値
Du =48より大きい濃度については40にそれぞれ設
定され、また、下限値Dl と上限値Du の間の濃度につ
いては下限値Dl (=8)を差し引くことにより濃度変
換が行われるようになる。
【0033】これにより、図9に示す6×6ドットの小
領域の各ドット濃度については、図11に示す結果が得
られることになり、この結果を式(2)に従って加算す
ると659となって、さらに、体積で255に正規化す
ることにより (659*255)/{(48−8)*6*6}=166.69 がメッシュ特徴として得られることになる。
【0034】そして、3次元ペリフェラル特徴抽出部6
により求められた特徴パラメータと3次元メッシュ特徴
抽出部7により求められた特徴パラメータは認識部8に
送られ、ここで、3次元ペリフェラル特徴抽出部6およ
び3次元メッシュ特徴抽出部7からの特徴パラメータと
辞書9のデータとの距離が式(3)に従って計算され、
距離の最小のものが認識結果としてメモリ2に一時格納
されるとともに、外部からの要求などによりインターフ
ェース11を介して出力されることになる。
【0035】従って、このようにすれば、3次元ペリフ
ェラル特徴抽出部6では、文字単位データの各分割領域
についてしきい値として設定される複数の濃度に対する
1次ペリフェラル特徴と2次ペリフェラル特徴より3次
元ペリフェラル特徴を抽出するようになり、また、3次
元メッシュ特徴抽出部7では、文字単位データの各分割
領域のドット濃度のうちで式(1)で設定される所定の
濃度範囲のものについて一定値で濃度変換しメッシュ特
徴を抽出するようにしている。ここで、従来、しきい値
の設定の方法として1文字のみの濃度平均により決定す
る方法があるが、この方法では汚れやしみなどの特異点
によってしきい値が大きく変動することからペリフェラ
ル特徴の変動が大きくなることがあり、また、濃度分布
からしきい値を決める方法もあるが、この方法は1文字
では行えず十数文字を必要とすることから1文字づつへ
の対応が難しかったが、本願では、上述のようにしきい
値として設定される濃度に幅があるので、多少の特異点
が存在しても安定した状態で3次元ペリフェラル特徴お
よびメッシュ特徴を抽出できるとともに、1文字づつへ
の対応も可能となり、さらに、文字の画数などに左右さ
れない認識を実現できるるとともに、文書中の汚れやし
みは勿論、文字のかすれなどに対しても安定した認識を
実現することができる。
【0036】なお、上述した実施例では、しきい値とし
ての濃度の値が固定的であったが、認識領域中の黒点の
平均濃度Davを求め、これから3次元メッシュ特徴抽出
の場合は、式(4)に示すように平均濃度Davに基づい
て濃度範囲の下限値Dl と上限値Du を求め、上述した
式(1)に従って濃度変換を行うようにすることもでき
る。
【0037】
【数3】
【0038】また、ペリフェラル特徴の場合は、Dm =
Dav*E(Eは定数)で濃度中心を表す中央濃度Dm を
求め、次いで、WD =Dav*F(Fは定数)で中央濃度
Dmを含む濃度範囲WD を求め、中央濃度Dm を中心
に1/2・WD の範囲を取り、この範囲をn等分して各
濃度を設定することによりペリフェラル特徴を求めるよ
うにしてもよい。その他、本発明は上記実施例にのみ限
定されず、要旨を変更しない範囲で適宜変形して実施で
きる。
【0039】
【発明の効果】本発明によれば、文字認識の精度を文字
の画数などに左右されない安定したものにできるととも
に、文書中の汚れやしみは勿論、文字のかすれなどに対
しても安定した認識を実現することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示す図。
【図2】実施例の領域分割を説明するための図。
【図3】実施例の領域分割の具体例を説明するための
図。
【図4】実施例の領域分割の具体例を説明するための
図。
【図5】実施例の領域分割の具体例を説明するための
図。
【図6】実施例の3次元ペリフェラル特徴抽出の動作を
説明するための図。
【図7】実施例の3次元ペリフェラル特徴抽出の動作を
説明するための図。
【図8】実施例の3次元ペリフェラル特徴抽出の動作を
説明するための図。
【図9】実施例の3次元メッシュ特徴抽出の動作を説明
するための図。
【図10】実施例の3次元メッシュ特徴抽出の動作を説
明するための図。
【図11】実施例の3次元メッシュ特徴抽出の動作を説
明するための図。
【図12】従来の一例を説明するための図。
【図13】従来の一例を説明するための図。
【図14】従来の一例を説明するための図。
【符号の説明】
1…文字読取り部、2…メモリ、3…行切出し部、4…
桁切出し部、5…接辺切出し小領域分割部、6…3次元
ペリフェラル特徴抽出部、7…3次元メッシュ特徴抽出
部、8…認識部、9…辞書、10…制御部。
フロントページの続き (56)参考文献 特開 昭54−141529(JP,A) 特開 平4−68482(JP,A) 特開 昭55−49780(JP,A) 「電子通信学会論文誌」Vol.J65 −D No.8 p.1026−1033 (1982)”マルチフォント印刷漢字の認 識" 「電子通信学会技術研究報告 PRL 80−69」Vol.80 No.231 p. 1−8(1981)”マルチフォント印刷漢 字認識シミュレーションシステム" 「電気通信研究所研究実用化報告」V ol.32 No.2 p.393−403 (1983)”特徴パターンの多段階整合に よるマルチフォント印刷漢字の認識" (58)調査した分野(Int.Cl.7,DB名) G06K 9/46 - 9/62 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書を読取り多階調の読取りデータを出
    力する文字読取り手段と、 この文字読取り手段より出力される読取りデータより文
    字単位のデータを切出す切出し手段と、 この切出し手段より切出された文字単位のデータを多分
    割し複数の小領域を形成する領域分割手段と、 この領域分割手段により分割された各領域について予め
    しきい値として設定される複数の濃度についてそれぞれ
    最初に黒点群にぶつかるまでの距離を求める1次ペリフ
    ェラル特徴と2回目に黒点群にぶつかるまでの距離を求
    める2次ペリフェラル特徴を抽出し3次元ペリフェラル
    特徴を出力する3次元ペリフェラル特徴抽出手段と、 前記領域分割手段により分割された小領域のドット濃度
    について所定の濃度範囲の下限値より小さい濃度につい
    ては0、上限値より大きい濃度については上限値−下限
    値にそれぞれ設定するとともに下限値と上限値の間につ
    いては下限値に従って濃度変換を行い3次元メッシュ特
    徴を抽出する3次元メッシュ特徴抽出手段と、 これら3次元ペリフェラル特徴抽出手段および3次元メ
    ッシュ特徴抽出手段より出力されるペリフェラル特徴に
    基づいて文字認識を行う手段とを具備したことを特徴と
    する文字認識装置。
  2. 【請求項2】 3次元ペリフェラル特徴抽出手段に用い
    られるしきい値は、予めその値が固定された複数の濃度
    により設定されることを特徴とする請求項1記載の文字
    認識装置。
  3. 【請求項3】 3次元ペリフェラル特徴抽出手段に用い
    られるしきい値は、認識領域の黒点の平均濃度の中心を
    含む所定濃度範囲を複数等分した複数の濃度により設定
    されることを特徴とする請求項1記載の文字認識装置。
  4. 【請求項4】 3次元メッシュ特徴抽出手段は、認識領
    域の黒点の平均濃度に基づいて濃度範囲の下限値と上限
    値を定め、下限値より小さい濃度については0、上限値
    より大きい濃度については上限値−下限値にそれぞれ設
    定するとともに下限値と上限値の間については下限値に
    従って濃度変換を行うことを特徴とする請求項1記載の
    文字認識装置。
  5. 【請求項5】 文書を読取り多階調の読取りデータを出
    力する文字読取り手段と、 この文字読取り手段より出力される読取りデータより文
    字単位のデータを切出す切出し手段と、 この切出し手段より切出された文字単位のデータを多分
    割し複数の小領域を形成する領域分割手段と、 前記領域分割手段により分割された小領域のドット濃度
    について所定の濃度範囲の下限値より小さい濃度につい
    ては0、上限値より大きい濃度については上限値−下限
    値にそれぞれ設定するとともに下限値と上限値の間につ
    いては下限値に従って濃度変換を行い3次元メッシュ特
    徴を抽出する3次元メッシュ特徴抽出手段と、 この3次元メッシュ特徴抽出手段より出力されるメッシ
    ュ特徴に基づいて文字認識を行う手段とを具備したこと
    を特徴とする文字認識装置。
JP04102984A 1992-04-22 1992-04-22 文字認識装置 Expired - Fee Related JP3127413B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04102984A JP3127413B2 (ja) 1992-04-22 1992-04-22 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04102984A JP3127413B2 (ja) 1992-04-22 1992-04-22 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05298486A JPH05298486A (ja) 1993-11-12
JP3127413B2 true JP3127413B2 (ja) 2001-01-22

Family

ID=14341985

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04102984A Expired - Fee Related JP3127413B2 (ja) 1992-04-22 1992-04-22 文字認識装置

Country Status (1)

Country Link
JP (1) JP3127413B2 (ja)

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
「電子通信学会技術研究報告 PRL80−69」Vol.80 No.231 p.1−8(1981)"マルチフォント印刷漢字認識シミュレーションシステム"
「電子通信学会論文誌」Vol.J65−D No.8 p.1026−1033(1982)"マルチフォント印刷漢字の認識"
「電気通信研究所研究実用化報告」Vol.32 No.2 p.393−403(1983)"特徴パターンの多段階整合によるマルチフォント印刷漢字の認識"

Also Published As

Publication number Publication date
JPH05298486A (ja) 1993-11-12

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US7054485B2 (en) Image processing method, apparatus and system
US6970601B1 (en) Form search apparatus and method
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
US8229214B2 (en) Image processing apparatus and image processing method
US7130085B2 (en) Half-tone dot elimination method and system thereof
JP3127413B2 (ja) 文字認識装置
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JPH08272902A (ja) 異字体異品質文字の認識方法
JP2708604B2 (ja) 文字認識方法
CN117095423B (zh) 一种银行单据字符的识别方法及装置
US5754689A (en) Image processing method and apparatus
JP3084833B2 (ja) 特徴抽出装置
JP2747136B2 (ja) 文字認識装置
JPH0916715A (ja) 文字認識装置および方法
JP3090928B2 (ja) 文字認識装置
JPH0656625B2 (ja) 特徴抽出方式
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH0628522A (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JPH03126188A (ja) 文字認識装置
CN113537216A (zh) 一种点阵字体文本行倾斜校正方法及装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
CN117252767A (zh) 文本图片矫正方法及装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071110

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081110

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081110

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091110

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101110

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111110

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees