JPH0589279A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0589279A
JPH0589279A JP3251933A JP25193391A JPH0589279A JP H0589279 A JPH0589279 A JP H0589279A JP 3251933 A JP3251933 A JP 3251933A JP 25193391 A JP25193391 A JP 25193391A JP H0589279 A JPH0589279 A JP H0589279A
Authority
JP
Japan
Prior art keywords
character
pattern
group
unit
character group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3251933A
Other languages
English (en)
Inventor
Toshiaki Morita
敏昭 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP3251933A priority Critical patent/JPH0589279A/ja
Publication of JPH0589279A publication Critical patent/JPH0589279A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 予め定められた1文字の領域に少なくとも2
つ以上の文字を配置して所定の意味を有した文字群を含
む画像データを入力し、通常の文字と同様に、この文字
群内に示される各文字を認識する文字認識装置を提供す
ることである。 【構成】 文字認識装置20は、文字群パターンと標準
の文字パターンとをその特徴を対応付けながら記憶した
パターン記憶部D1を有し、与えられた画像データの中
に文字群が含まれる場合、認識部3は切出部1において
切出された文字群の、抽出特徴に基づいて記憶部D1を
検索し、該当する文字群パターンがあれば、文字群内切
出部5は、切出された文字群の各文字について再切出を
行ない、特徴抽出部2および認識部3は再切出しされた
各文字について記憶部D1を再検索しながら文字認識す
るよう構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は文字認識装置に関し、
特に、予め定められた一文字の領域に少なくとも2つ以
上の文字を配置して所定の意味を有した文字群を含む画
像データを入出力し、この文字群を通常の文字と異なる
と判断し、さらにこの文字群内の文字を一文字ずつ切出
して認識することのできる文字認識装置に関する。
【0002】
【従来の技術】文字を認識する装置を文字認識装置とい
い、印字ないし手書きされた文字を読む光学的文字読取
器(OCR:optical character r
eader)に代表される装置である。
【0003】OCRは、走査・光電変換部、認識処理部
および出力部を主要な構成要素としている。
【0004】まず認識したい文字が記載される資料は、
オペレータなどによって走査・光電変換部に送り込ま
れ、応じて走査・光電変換部は二次元の平面を持つこの
資料を走査し、光による文字の濃淡情報(1または0)
を電気の強弱信号に変換し、次段に接続される認識処理
部に与える。
【0005】認識処理部は、文字認識方式の主要な部分
を実現している。認識方式は、対象である文字パターン
が1個独立に存在していることを前提として考えられて
いるのに対し、実際は資料上には多くの文字が連続的
に、または離散的に記されていることから、まず文字パ
ターンを1つ単独な形で切出す(セグメンテーションと
も呼ぶ)ことが必要である。この切出しは、切離された
文字枠、文字の存在する行の位置、文章の始めや終わり
などを指示する適当な印を予め認識すべき資料上に印刷
しておき、これを利用して行なわれる。
【0006】上述したように文字パターンが切出される
と、入力が文字パターンであり、出力がその文字名であ
るようなパターン処理が行なわれる。このパターン処理
を要約すれば、予め各文字名に対応する標準パターン
を、認識したい文字名すべてに対して記憶装置などに記
憶して準備しておき、入力文字パターンが与えられる
と、応じて記憶された標準の文字パターンと比較して最
も類似しているものを捜し出し、その結果特定された標
準パターンのもつ文字名が入力パターンのそれとするよ
うに認識するものである。
【0007】上述のようにして認識された文字名は、一
時的に結果記憶部などへ蓄えられる場合もあり、もし、
この文字認識装置が他の計算機のデータ入力装置として
使用されている場合には、出力部においてデータ処理さ
れて、その結果符号化された文字名が、次段の計算機へ
データ伝送される。
【0008】上述した予め準備される標準パターンは、
数字・英字・片仮名・平仮名・漢字などの文字パターン
を含んでいる。
【0009】
【発明が解決しようとする課題】図5は、文字群を含む
認識すべき文章データの一例を示す図である。図5に示
されるようにこの文章データには漢字一文字の印字領域
に、4文字あるいは5文字を配置して一つの意味を表す
文字群G1〜G3が含まれる。このような文字群を含む
文章は、最近、新聞や名刺などにおいても頻繁に見受け
られる。従来の、文字認識装置による文字切出手法であ
れば、図5に示された文書データの各文字を認識しよう
とする場合、文字群G1、G2およびG3は1文字とし
て誤認識される場合や、半角の2文字として誤認識され
る場合もあり、意味として重要な「株式会社」、「主任
研究員」などの情報は得られないという問題があった。
【0010】それゆえにこの発明の目的は、予め定めら
れた1文字の領域に少なくとも2つ以上の文字を配置し
て所定の意味を有した文字群を、通常の文字とは異なる
判断し、さらに文字群内の文字を1文字ずつ切出して認
識を行なうことのできる文字認識装置を提供することで
ある。
【0011】
【課題を解決するための手段】この発明にかかる文字認
識装置は、第1切出手段、第1特徴抽出手段、記憶手
段、パターン特定手段、第2切出手段、第2特徴抽出手
段、文字名特定手段および出力手段とを備えて構成され
る。
【0012】第1切出手段は、予め定められた1文字の
領域に少なくとも2つ以上の文字を配置して所定の意味
を有した文字群を含む画像データを入力し、応じて文字
領域ごとにパターンを切出すよう構成される。
【0013】第1の特徴抽出手段は、第1切出手段によ
り切出されたパターンの特徴を抽出するよう構成され
る。
【0014】記憶手段は、予め認識したい文字名すべて
に対して個別に用意される文字パターンと、予め認識し
たい文字群すべてに対して個別に用意される文字領域内
の文字の配置状態を示す文字群パターンとを、それぞれ
の特徴を対応付けて記憶するように構成される。
【0015】パターン特定手段は、第1特徴抽出手段に
より抽出された特徴に基づいて、記憶手段を検索し、そ
の特徴が最も類似する文字パターンまたは文字群パター
ンを特定するよう構成される。
【0016】第2切出手段は、パターン特定手段により
特定されたパターンが文字群パターンであることに応じ
て、第1切出手段により切出された文字群の各文字のパ
ターンを切出すよう構成される。
【0017】第2特徴抽出手段は、第2切出手段により
切出されたパターンごとに特徴を抽出するよう構成され
る。
【0018】文字名特定手段は、第2特徴抽出手段によ
り抽出された各特徴に基づいて、記憶手段を検索し、そ
の特徴が最も類似する文字パターンごとに対応する文字
名を特定するよう構成される。
【0019】出力手段は、文字名特定手段により特定さ
れた各文字名を、第1切出手段により予め切出された文
字群ごとに出力するように構成される。
【0020】また、この発明にかかる文字認識装置は上
述したような構成において、出力手段が出力する文字群
ごとに、該当する所定の情報を付加しながら出力する情
報付加手段をさらに備えて構成されてもよい。
【0021】
【作用】この発明にかかる文字認識装置は、予め定めら
れた1文字の領域に少なくとも2つ以上の文字を配置し
て所定の意味を有した文字群と、通常の文字とを混在し
た画像データを入力し、文字群を通常の文字とは異なる
と判断し、さらに判断された文字群内の文字を1文字ず
つ切出し認識するために、まず記憶手段が設けられる。
【0022】この記憶手段には、文字群のパターンは、
そこに含まれるそれぞれの文字間に空白があり、それは
通常の文字パターンとはかなり異なったパターンにて構
成されているということに着目し、各パターンごとに特
徴を対応させながら、通常の文字パターンと文字群であ
る文字群パターンとに分類して記憶する。
【0023】与えられる画像データを入力し、応じて第
1切出手段、第1特徴抽出手段およびパターン特定手段
により画像データ中にある文字群が特定された後は、特
定された文字群について第2切出手段により文字群内で
各文字パターンの切出が行なわれ、切出された個々の文
字パターンについて第2特徴抽出手段により特徴が抽出
され、この抽出された特徴に基づいて文字名特定手段は
記憶手段を検索し、該当する文字名を特定する。そし
て、出力手段は特定された各文字名を文字群ごとに出力
するので、通常の文字と同様に文字群についてもその表
わす意味を出力される各文字名にして得ることが可能と
なる。
【0024】
【実施例】以下、この発明の一実施例について図面を参
照して詳細に説明する。
【0025】図1は、本発明の一実施例による文字認識
装置の概略構成図である。文字認識装置20は、たとえ
ば、図5に示される認識すべき文書データを画像データ
にして入力し、これについて文字認識処理する。このと
き、通常の文字は認識された文字名にして出力し、通常
の文字領域に「株式会社」の4文字が集約して示される
文字群G1 およびG2、「主任研究員」が集約して表示
される文字群G3については、文字群内の各文字を個別
に認識して各文字群が表示する意味を連続して出力する
文字名で表わすように構成される。
【0026】文字認識装置20は、切出部1、特徴抽出
部2、認識部3、文字群判定部4、文字群内切出部5、
項目認識部6および結果出力部7を備えるともに、認識
部3によりそこにストアされるデータが検索されて読出
される一種の記憶装置である認識標準パターン記憶部D
1、項目認識部6によりアクセスされてデータが読出さ
れる項目判定用データベースD2を備える。
【0027】図2は、本発明の一実施例による認識標準
パターン記憶部D1のデータ記憶形式を説明するための
図である。
【0028】図2において認識標準パターン記憶部D1
は、通常の文字のカテゴリと文字群であるカテゴリとに
予め分類される。通常の文字のカテゴリは文字標準パタ
ーンに関するデータが格納され、アドレス0〜アドレス
(N−1)にそれらのデータがストアされる。また、文
字群のカテゴリは文字群標準パターンに関するデータが
ストアされ、アドレスN〜N+6にこれらのデータがス
トアされる。
【0029】図示されるように、認識標準パターン記憶
部D1は文字標準パターンごとおよび文字群標準パター
ンごとにそれらに関するデータをレコード形式にしてス
トアしており、各レコードはアドレス、文字パターンお
よび文字群パターンI1および濃度分布特徴データI2
を項目として含む。
【0030】濃度分布特徴データI2は、対応する文字
パターンおよび文字群パターンI1の所定の1文字の領
域(本実施例では、全角文字の領域)における画像の濃
度分布の状況を表わすデータがストアされる。
【0031】また文字群標準パターンがストアされる領
域においては、濃度分布特徴データI2は、対応する文
字パターンおよび文字群パターンI1にストアされるパ
ターンについての画像濃度の分布状況に関するデータが
ストアされる。この文字群標準パターンにストアされる
データI2は、文字群にはそれぞれの文字間に空白が存
在するという特徴データも併せてストアされる。
【0032】次に、認識標準パターン記憶部D1にスト
アされる文字群標準パターンのパターン1〜パターン7
に関して説明する。
【0033】図3(a)ないし(g)は、本発明の一実
施例による文字群標準パターンを説明する図である。
【0034】図示されるように、文字群が全角文字とし
て切出された場合には、図3(a)ないし(e)に示さ
れるパターン1ないしパターン5の5つのパターンが発
生する。また、図3(a)および(g)に示されるよう
に文字群が半角文字として切出されれば、パターン6と
パターン7の2つのパターンが発生する。これらパター
ン1ないしパターン7の文字群パターンは、1文字群内
における各文字の配置状態を表わすデータとも言える。
【0035】図1に戻り、切出部1は画像データを入力
し、応じて画像データに含まれる文字を、例えば全角文
字の文字領域ごとに文字パターンを切出す。
【0036】特徴抽出部2は、与えられる文字パターン
について文字の特徴抽出(濃度分布特徴)を行なう。
【0037】認識部3は、切出された各文字パターンに
ついて、予め抽出された特徴に基づいて、認識標準パタ
ーン記憶部D1をアクセスし、文字標準パターンおよび
文字群標準パターンのすべてとマッチングを行ない、最
もその特徴が類似する標準パターンを特定して読出すよ
うに動作する。
【0038】文字群判定部4は、認識部3が読出した標
準パターンが文字群標準パターンであるか否かを判定す
る。この判定は、認識部3がマッチング処理をして、最
もその特徴が類似している標準パターンがストアされて
いたアドレス値に基づいて行なわれる。図2を参照して
わかるように、マッチング結果得られたアドレス値が、
アドレスN以上であれば、切出された文字パターンは、
文字群パターンであると判定される。このようにして文
字群パターンと判定されれば、判定された文字群内の個
々の文字の認識を行なうために、個別認識の処理に移行
する。
【0039】文字群内切出部5は、文字群判定部4で文
字群パターンであると判定された文字群の画像に対して
のみ水平・垂直方向に画像の濃淡度合いを表わすヒスト
グラムをとる。そして、このヒストグラムに基づいて、
文字群内のそれぞれの文字の切出を行なう。このように
して文字群から切出された各文字は、文字標準パターン
を有する。
【0040】文字群内切出部5において切出された各文
字パターンは、特徴抽出部2および認識部3において前
述と同様に処理される。詳細には、抽出された各特徴に
基づいて認識標準パターン記憶部D1がアクセスされ
て、文字標準パターン、すなわちアドレス0〜アドレス
(N−1)の文字標準パターンについてのみマッチング
処理が行なわれる。これにより、文字群内のそれぞれの
文字について認識結果が得られる。この認識結果は、文
字群判定部4を通過し、項目認識部6に与えられる。
【0041】項目認識部6は、たとえば図5に示される
文字群G1を認識部3が「株式会社」と認識した場合に
は、「株」、「式」、「会」、「社」を順次出力するよ
う構成される。
【0042】また、項目認識部6は、必要に応じて項目
判定用データベースD2を検索し、この検索結果により
得られた情報を、出力すべきデータに付加して出力する
よう動作する。項目判定用データベースD2は,たとえ
ば、この文字認識装置20が名刺上に印刷された画像デ
ータから文字を認識する場合に、たとえば図5の文字群
G1が記される行の項目を「会社名」と判断したり、図
5の文字群G3が記される行の項目を「肩書」と判断す
るためにアクセスされるデータベースである。
【0043】結果出力部7は、項目認識部6が出力する
認識した文字名および項目判定用データベースD2から
読出された項目をそれに該当するコードに変換して装置
外部に出力する機能を備える。
【0044】図4は、前掲図1に示された文字認識装置
20の動作を示す処理フロー図である。
【0045】次に、図1ないし図5を参照し、図4の処
理フローに従って装置20の文字認識動作について説明
する。
【0046】なお、認識標準パターン記憶部D1には、
予め認識したい文字名すべてに対しての文字パターンI
1およびその濃度分布特徴データI2がストアされると
ともに、予め認識したい文字群すべてに対してその文字
群パターンI1および対応する濃度分布特徴データI2
ストアされていると想定する。
【0047】また、項目判定用データベースD2には、
項目認識部6において項目を認識するために必要とされ
るデータが予めストアされていると想定する。
【0048】文字認識装置20は、たとえば、光学的に
読取られた図5に示されるような認識すべき文書データ
の濃淡の画像データが切出部1に与えることに応じて、
図4に示されるステップST1以降の処理を実行開始す
る。
【0049】まず、ステップST1の処理において、切
出部1は与えられる濃淡画像データを入力し、行抽出お
よび文字切出を行なう。
【0050】行抽出は、与えられた画像データに基づい
て、水平方向または垂直方向に画像の濃淡度合いを表わ
すヒストグラムをとり、このヒストグラムに基づいて濃
淡度合いの少ない部分を行間と判断し、応じて1行の抽
出を行なう。このときに、与えられる画像データが縦書
きの画像データであるか、横書きの画像データであるか
の判定も同時に行なわれる。
【0051】このように行抽出が行なわれると、次に文
字切出が行なわれる。文字切出は、抽出された行につい
て、垂直方向(縦書きの場合)に画像の濃淡度合いを表
わすヒストグラムをとり、そのヒストグラムに基づく濃
度のばらつきの状態から、1文字と思われる文字パター
ンの抽出を行なう。この文字パターンの抽出は、全角文
字ごと、または半角文字ごとの文字領域毎に行なわれ
る。
【0052】上述のようにして文字パターンが抽出され
ると、次のステップST4の処理において、認識に関す
る処理が行なわれる。この処理は、特徴抽出部2および
認識部3において行なわれる。
【0053】特徴抽出部2は前述したように切出部1に
おいて切出された所定の文字領域ごとのパターンについ
て画像濃度分布特徴の抽出を行ない、この抽出された特
徴は認識部3に与えられる。また、特徴抽出部2は、図
3に示されるように与えられるパターンが文字群パター
ンである場合、各文字間にある空白の存在に関する特徴
抽出データも認識部3に与える。
【0054】認識部3は与えられる特徴データに基づい
て認識標準パターン記憶部D1をアクセスしてマッチン
グ処理を行なう。このマッチング処理の結果、その特徴
が最も類似する標準文字パターンまはた文字群パターン
I1が特定されると、この特定された文字パターンまた
は文字群パターンI1とそれがストアされるアドレスの
データとを文字群判定部4に与える。
【0055】文字群判定部4は、与えられるアドレスの
データに基づいてステップST5の処理を実行する。ス
テップST5の処理において、文字群判定部4は与えら
れるアドレス値がNより小さいか否かにより、切出され
たパターンは文字標準パターンであるか文字群標準パタ
ーンであるかを判定する。このとき、与えられるアドレ
ス値がN以上であれば、文字群判定部4は切出された文
字パターンは文字群標準パターンであることを判定し、
応じて次に示されるステップST6以降の処理に移る。
一方、文字群パターンでないことを判定すると、後述す
るステップST8以降の処理に移行する。
【0056】ステップST6の処理においては切出され
た文字群パターン内の各文字についてパターン切出が行
なわれる。この各文字のパターン切出は、文字群内切出
部5において行なわれる。
【0057】切出部5により文字群内の各文字が文字パ
ターンにして切出されると、その各文字パターンについ
て特徴抽出部2がステップST7の処理において前述し
たように濃度分布特徴の抽出を行ない、認識部3が、抽
出された特徴に基づいて認識標準パターン記憶部D1の
文字標準パターンをアクセスし、該当する文字パターン
I1を特定する。詳細には、文字群内切出部5は、切出
部1において切出された文字群パターンの画像に対して
のみ水平・垂直方向に画像の濃淡度合いを表わすヒスト
グラムをとり、このヒストグラムに基づきそれぞれの文
字パターンの切出を行なった後、各文字パターンについ
て特徴抽出を行なう。そして、抽出特徴に基づき記憶部
D1にストアされる文字標準パターンをアクセスしてマ
ッチング処理を行なう。このことにより、該文字群内の
それぞれの文字についての認識結果が、文字名にして得
られる。文字群パターンおよび通常の文字パターンにお
いて得られた認識結果である文字名は、項目認識部6に
与えられる。
【0058】項目認識部6は、図4のステップST8の
処理を実行する。ステップST8の処理においては項目
判定が行なわれる。項目認識部6は、たとえば図5の文
字群G1が認識された場合には、「株」、「式」、
「会」および「社」にして順次、かつ連続して結果出力
部7に出力する。
【0059】また、この文字認識装置20が名刺上に印
刷された画像データを入力した場合には、その名刺上に
印字された文字群、たとえば図5の文字群G2およびG
3を認識すると、この認識結果に基づいて項目判定用デ
ータベースD2を検索し、該当する項目を読出し、認識
された文字群の各文字名とともに、読出された項目を出
力する。たとえば、図5の文字群G2が認識された場合
は、文字群G2の行を「会社名」という項目で特定し、
文字群G3が認識された場合は、文字群G3の行を「氏
名」という項目で認識するよう処理する。項目認識部6
が出力する項目認識結果および認識された文字名は結果
出力部7に導出される。
【0060】結果出力部7においてはステップST9に
示される出力に関する処理が行なわれる。結果出力部7
は導出された項目認識結果、および認識して得られた文
字名を印字出力、画像出力、音声出力、またコード出力
などするよう動作する。
【0061】また、この文字認識装置20に計算機が接
続され、装置20自体がこの計算機の入力装置である場
合、結果出力部7は計算機に対してそのデータ処理が容
易となるように、認識された文字名および項目認識結果
を、所定のコードに変換しながら出力するよう処理す
る。
【0062】以上は、ステップST3の処理において切
出された1つのパターンに関する処理を説明したが、1
行に複数のパターンがある場合は、ステップST3ない
しステップST9に関する処理がその行に含まれるパタ
ーンの数だけ繰返し実行される。さらに、与えられる画
像データに複数の行が存在する場合は、ステップST2
ないしステップST9の処理が、ステップST3におけ
る各行の文字パターンの切出が繰返されながら、この画
像データに含まれる行の数だけさらに繰返される。
【0063】また、認識されるべき文字群の情報が一定
の場合(たとえば、「株式会社」、「財団法人」な
ど)、および予めわかっている場合は、その知識を利用
して、上述した文字群の認識結果の正誤の確認、誤って
いる場合の自動修正も行なうような機能を追加してもよ
い。
【0064】また、文字群内の各文字の配置も、縦書き
横書きで異なるため、図4のステップST2の処理にお
いて得られた行切出結果に伴う縦書きおよび横書きの判
定に基づき、縦書きまたは横書きの予め定められたルー
ルを参照して、文字群内の各文字の認識結果から文字名
の出力時の順序付けを行なうようにしてもよい。
【0065】
【発明の効果】以上のようにこの発明によれば、予め定
められた1文字の領域に少なくとも2つ以上の文字を配
置して所定の意味を有した文字群を含む画像データが入
力されても、この文字群を認識し、さらに文字群内にあ
る各文字を個別に認識し、文字群ごとにその文字群を構
成する各文字名を文字群毎に出力することができるの
で、このような文字群が表す意味を通常の文字と同様に
正確に認識できるという効果がある。
【0066】また、情報付加出力手段は、出力する文字
群ごとに該当の所定意味を予め分類した情報を付加しな
がら出力するので、この出力結果を用いれば、付加され
た情報を重要なキー単語にして、それに続く文字名から
なるデータを分類しながらファイルにしてデータ管理す
ることもできるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例による文字認識装置の概略構
成図である。
【図2】本発明の一実施例による認識標準パターン記憶
部のデータ記憶形式を説明するための図である。
【図3】(a)ないし(g)は、本発明の一実施例によ
る文字群標準パターンを説明する図である。
【図4】図1に示される文字認識装置の動作を示す処理
フロー図である。
【図5】文字群を含む認識すべき文書データの一例を示
す図である。
【符号の説明】
1 切出部 2 特徴抽出部 3 認識部 4 文字群判定部 5 文字群内切出部 6 項目認識部 7 結果出力部 D1 認識標準パターン記憶部 D2 項目判定用データベース なお、各図中、同一符号は同一または相当部分を示す。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 予め定められた一文字の領域に少なくと
    も2つ以上の文字を配置して所定の意味を有した文字群
    を含む画像データを入力し、応じて前記文字領域ごとに
    パターンを切出す第1切出し手段と、 前記第1切出手段により切出された前記パターンの特徴
    を抽出する第1の特徴抽出手段と、 予め認識したい文字名すべてに対して個別に用意される
    文字パターンと、予め認識したい前記文字群すべてに対
    して個別に用意される前記文字領域内の文字の配置状態
    を示す文字群パターンとを、それぞれの前記特徴を対応
    付けて記憶する記憶手段と、 前記第1特徴抽出手段により抽出された前記特徴に基づ
    き、前記記憶手段を検索し、その特徴が最も類似する前
    記文字パターンまたは前記文字群パターンを特定するパ
    ターン特定手段と、 前記パターン特定手段により特定されたパターンが前記
    文字群パターンであることに応じて、前記第1切出手段
    により切出された前記文字群の各文字のパターンを切出
    す第2切出手段と、 前記第2切出手段により切出された前記パターンごとに
    前記特徴を抽出する第2の特徴抽出手段と、 前記第2特徴抽出手段により抽出された前記各特徴に基
    づいて、前記記憶手段を検索し、その特徴が最も類似す
    る前記文字パターンごとに対応する前記文字名を特定す
    る文字名特定手段と、 前記文字名特定手段により特定された前記各文字名を、
    前記第1切出手段により切出された前記文字群ごとに出
    力する出力手段とを備えた、文字認識装置。
  2. 【請求項2】 前記出力手段は、出力する前記文字群ご
    とに該当する所定の情報を付加しながら出力する情報付
    加出力手段をさらに備えた、請求項1記載の文字認識装
    置。
JP3251933A 1991-09-30 1991-09-30 文字認識装置 Withdrawn JPH0589279A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3251933A JPH0589279A (ja) 1991-09-30 1991-09-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3251933A JPH0589279A (ja) 1991-09-30 1991-09-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0589279A true JPH0589279A (ja) 1993-04-09

Family

ID=17230133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3251933A Withdrawn JPH0589279A (ja) 1991-09-30 1991-09-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0589279A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080642A1 (ja) * 2006-01-13 2007-07-19 Fujitsu Limited 帳票処理プログラムおよび帳票処理装置
JP2009169911A (ja) * 2008-01-21 2009-07-30 Sharp Corp 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080642A1 (ja) * 2006-01-13 2007-07-19 Fujitsu Limited 帳票処理プログラムおよび帳票処理装置
JP2009169911A (ja) * 2008-01-21 2009-07-30 Sharp Corp 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体

Similar Documents

Publication Publication Date Title
JP3292388B2 (ja) 文書画像の復号なしに文書を要約するための方法と装置
Kleber et al. Cvl-database: An off-line database for writer retrieval, writer identification and word spotting
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
JP2973944B2 (ja) 文書処理装置および文書処理方法
JP3232143B2 (ja) 復号していない文書画像の修正版を自動的に作成するための装置
JP3452774B2 (ja) 文字認識方法
EP2166488A2 (en) Handwritten word spotter using synthesized typed queries
JP2713622B2 (ja) 表形式文書読取装置
JPH05250408A (ja) 取り込んだ情報で文書画像を復号することなく選択した文書の重要な部分を補完するための方法
WO2003069554A2 (en) Method and system for interactive ground-truthing of document images
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
Isheawy et al. Optical character recognition (ocr) system
US6535652B2 (en) Image retrieval apparatus and method, and computer-readable memory therefor
WO2007070010A1 (en) Improvements in electronic document analysis
CN112036330A (zh) 一种文本识别方法、文本识别装置及可读存储介质
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP3319203B2 (ja) 文書ファイリング方法及び装置
Kumar et al. Line based robust script identification for indianlanguages
JPH0589279A (ja) 文字認識装置
CN112348022A (zh) 一种基于深度学习的自由格式文档识别方法
CN110727820B (zh) 一种为图片获得标签的方法和系统
JPH0757040A (ja) Ocr付きファイリング装置
JP2931485B2 (ja) 文字切出し装置及び方法
Eqbal EXTRACTION AND DETECTION OF TEXT FROM IMAGES

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19981203