JP3071048B2 - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JP3071048B2
JP3071048B2 JP4258386A JP25838692A JP3071048B2 JP 3071048 B2 JP3071048 B2 JP 3071048B2 JP 4258386 A JP4258386 A JP 4258386A JP 25838692 A JP25838692 A JP 25838692A JP 3071048 B2 JP3071048 B2 JP 3071048B2
Authority
JP
Japan
Prior art keywords
character
rectangular
small
rectangle
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP4258386A
Other languages
English (en)
Other versions
JPH06111069A (ja
Inventor
晃 森
幸久 角田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP4258386A priority Critical patent/JP3071048B2/ja
Publication of JPH06111069A publication Critical patent/JPH06111069A/ja
Application granted granted Critical
Publication of JP3071048B2 publication Critical patent/JP3071048B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の部分要素からな
る分離文字が存在する日本語印刷文書を読み取って、文
字の認識を行うのに好適な認識装置及び方法に関する。
【0002】
【従来の技術】分離文字や英数字等の半角文字が混在す
る日本語文書を読み取る装置は、種々提案されており、
例えば、特開平1−277989号公報では、分離文字
の部分要素について予め辞書部に標準パターンを記憶し
ておき、画像データから切り出されたパターンに対し辞
書との照合により認識処理を行い、認識結果から切り出
されたパターンが分離文字の部分要素であるか否か判定
し、部分要素であるときは、そのパターンとそれに先行
あるいは後続する一定範囲のパターンを統合して、統合
した文字パターンについて文字の認識を行うようにして
いる。即ち、分離文字1文字の全体の認識に先立ち、分
離文字を構成する部分要素について認識処理を行うこと
が従来から行われていた。
【0003】また、特開平2−230484号公報に
は、分離文字について全体とこれを構成する部分要素と
の対応関係を記憶した分離文字辞書手段を設け、分離文
字の部分要素の認識処理を行うだけでなく、2個以上連
続して部分要素の認識結果が得られたときには、それら
の部分要素を有する分離文字を上記分離文字辞書手段か
ら読み出して、文字を特定する認識装置が開示されてい
る。
【0004】
【発明が解決しようとする課題】従来では、上述の2つ
の例に記載されるているように、分離文字1文字の全体
の認識に先立ち、分離文字を構成する部分要素について
認識処理を実行することは、既に行われていたことであ
る。しかしながら、前者の場合は、認識の結果得られる
部分要素であるという判定結果が、文字全体の切出しに
利用されるだけであって、コード等の認識結果そのもの
は文字全体の認識には有効に利用されていなかった。
【0005】一方、後者の場合は、分離文字辞書手段に
分離文字の全てについて全体とこれを構成する部分要素
との対応関係を記憶しておかなければならないので、分
離文字辞書手段の容量が膨大になり、しかも、この例で
は、分離文字1文字全体の認識を行うことなく、2以上
の部分要素の認識結果のみに依存して文字を特定するた
め、認識対象文字に1つでも認識し辛い部分要素が含ま
れる場合、誤認識を起こす恐れがあった。
【0006】
【課題を解決するための手段】本発明は、上記課題を解
決するため、文字列を画像データとして記憶する画像記
憶部と、分離文字の部分要素のうちサイズが所定値以下
の小部分要素について標準パターンを記憶した部分要素
辞書と、前記画像記憶部から前記小部分要素を切出し前
記部分要素辞書を用いて認識処理を行う部分要素認識部
と、前記画像記憶部から1文字毎に文字を切り出す文字
切出し部と、各文字の標準パターンを記憶した辞書と、
2個の小部分要素からなる分離文字について、小部分要
素と分離文字とを対応させて記憶した第1テーブルと、
小部分要素を少なくとも1つ含む分離文字について、同
一の小部分要素を含む文字に関する情報を小部分要素毎
に記憶した第2テーブルと、前記文字切出し部から切り
出された文字が2個の小部分要素からなる分離文字であ
る場合、前記辞書との照合を行うことなく、2個の小部
分要素の前記部分要素認識部での認識結果によって前記
第1テーブルを参照して文字を特定し、切り出された文
字が2個の小部分要素からなる分離文字ではないが少な
くとも1つの小部分要素を含む場合、該小部分要素の前
記部分要素認識部での認識結果に対して前記第2テーブ
ルに記憶された文字について、前記辞書との照合を行う
文字認識部とを設けたものである。
【0007】
【0008】更に、本発明では、前記第1テーブルを参
照して文字が特定できない場合は、前記第2テーブルを
用いた辞書との照合を行うようにすることができる。
【0009】前記小部分要素のうち類似度が所定値以上
の複数の小部分要素については、前記部分要素認識部で
の認識結果が前記複数の小部分要素のいずれであって
も、該複数の小部分要素の少なくとも1つを含む全ての
文字について前記辞書との照合を行うように照合範囲を
拡張することもできる。
【0010】また、前記画像記憶部の画像データ内の文
字行から矩形パターンを生成する矩形パターン生成手段
と、該生成された矩形パターンについて大きさ,矩形間
距離等の矩形特徴を抽出する矩形特徴抽出手段と、矩形
パターンが小矩形となるあらゆる小矩形要素について、
その要素が占める文字上での位置、結合する可能性のあ
る相手側要素の矩形パターン等の特性情報を予め記憶し
た小矩形特性情報データベースとを更に備え、生成され
た矩形パターンの組み合わせ及び前記矩形特徴並びに特
性情報に応じて、切出し文字が分離文字であるか否か、
あるいは、切出し文字中にいくつの小部分要素を含むか
を判定することもできる。
【0011】
【作用】本発明では、分離文字を構成する部分要素のう
ちサイズが所定値以下の小部分要素についてのみ、部分
要素の認識処理が行われ、且つ、同一の部分要素の文字
に関する情報を記憶するテーブルにも、小部分要素を含
む文字情報のみが記憶されており、上記テーブルの他
に、2個の小部分要素からなる分離文字について、小部
分要素と分離文字とを対応させたて記憶した別のテーブ
ルを備えるときには、このような分離文字が切り出され
た場合に限り、辞書との照合を行うことなく、2個の小
部分要素に関する部分要素の認識結果のみによって別の
テーブルが参照させて文字が特定される。そして、他の
場合には、上述の如く限定された辞書照会が行われる。
【0012】
【0013】
【実施例】図2は、本発明の実施例の全体構成を示すブ
ロック図であり、光学走査部1は、文書が印刷された原
稿を光学的に走査し、文字列を2値化画像データに変換
して画像記憶部2に記憶する。文字行切出し部3は、画
像記憶部2に記憶された複数行の画像データについて、
文字行に平行な方向への射影データを求め、これに基づ
き1文字行の画像データを切出し、行画像記憶部4に記
憶する。この際、射影データの幅をその行の文字の標準
縦幅Hとして記憶しておく。
【0014】次に、矩形パターン生成部5では、切り出
された1文字行の画像データについて、文字行に垂直な
方向に、即ち、横書きの場合は縦方向、縦書きの場合は
横方向に、黒連結処理を行って文字要素の外接枠内が黒
画素によって塗りつぶされた矩形パターンを生成し、そ
の縦幅を文字標準縦幅Hに統一する。これにより、非分
離文字の場合は文字単位に、そして、分離文字の場合は
文字の部分要素毎に矩形パターンが生成されることとな
る。例えば、切り出された1文字行の画像データが図3
アで示すデータであれば、図3イに示すような合計9個
の矩形パターンが生成される。但し、この矩形パターン
としては、必ずしも上述の如く黒連結処理によって生成
したものを用いる必要はなく、通常の外接枠や文字行に
垂直な方向への射影データを用いてもよい。
【0015】また、この矩形パターン生成部5では、生
成された矩形パターンに先頭から順にナンバーリングす
ると共に、各矩形パターンについて、縦幅,横幅,直前
の矩形パターンとの距離を求め、更に、その大きさによ
って、大矩形,中矩形,小矩形の3つに分類するように
している。具体的には、矩形パターンの横幅/標準縦幅
Hが、0.7以下であれば小矩形、0.7〜1.2であ
れば中矩形、1.2以上であれば大矩形とする。そし
て、これら矩形パターンに関する特徴(以下、矩形特徴
という)を各矩形番号毎に矩形情報記憶部6に記憶す
る。図3イに示したNO.1〜9の各矩形パターンに関
する矩形特徴を示すと図4のようになる。
【0016】本実施例では、矩形パターンが小矩形と成
り得るような分離文字の部分要素及び半角の英数文字全
てと、ひらがな及びカタカナの一部(以下、これを小矩
形要素という)について、位置,結合矩形,文字種,コ
ードよりなる特性情報を、予め小矩形特性情報データベ
ース7に格納している。このデータベースの一例を図5
に示す。ここで、「位置」とは、小矩形要素が分離文字
の部分要素である場合、その要素が左,中,右のいずれ
に位置するかを示し、「結合矩形」とは、この要素が結
合する可能性の相手側の要素の矩形パターンを示す。一
方、小矩形辞書8には、小矩形文字要素の各々について
標準パターンが記憶されている。
【0017】そして、小矩形要素認識部9は、矩形パタ
ーン生成部5で生成された矩形パターンが小矩形である
要素(小矩形要素)について、その画像データを行画像
記憶部4から切出し、正規化,特徴抽出,小矩形辞書8
の標準パターンとのマッチングにより認識処理を行い、
類似度が最も大きい小矩形要素のコードを認識結果とし
て出力する。このコードとしては、半角の英数文字につ
いてはシフトJISコードを用い、分離文字の部分要素
については、本システムにおいて割り付けた独自のコー
ドを用いている。更に、小矩形要素認識部9は、認識結
果として得たコードにより小矩形特性情報データベース
7を検索して特性情報を読み出し、読み出した特性情報
をコードと共に矩形番号に対応させて矩形情報記憶部6
に記憶する。図3イのNO.1,2,3,5,6,8,
9の7個の小矩形要素についての認識結果及び特性情報
を示したのが図6である。
【0018】次に、文字切出し部10における文字の切
出しについて説明する。
【0019】文字の切出しは、矩形情報記憶部6に記憶
された矩形特徴,特性情報,コードに基づいて行われ、
大きく分けて、グループ分け処理と切出し確定処理の2
つの処理からなる。
【0020】まず、予め隣接する矩形パターンの組み合
わせ及び矩形特徴に応じてグループを図7に示すように
定めておき、グループ分け処理部11において、矩形パ
ターン生成部5で生成された矩形パターンがいずれのグ
ループに属するかグループ分けを行う。図7での、a,
b,c,・・・・・・・ は先頭からの各矩形パターンを示し、
A+B+C+・・・・・・・ は矩形間距離を含む複数の矩形パ
ターンの合計の横幅を示し、Xは各行の標準縦幅Hの
1.2倍の値を示す。尚、本実施例では、文字の接触は
ないものとし、大矩形を含まない組み合わせについて説
明する。
【0021】更に、図8に示すように、グループ毎に予
め特性情報に応じて切出しの確定条件を定めておき、こ
の条件にしたがって切出し確定処理部12は文字の切出
し位置を確定する。
【0022】以下、図3に示した例を用いて具体的な文
字の切出しについて説明する。
【0023】まず、矩形情報記憶部6から、NO.1と
NO.2の矩形に関して図4に示す矩形特徴を読み出
し、そのうちの矩形分類から矩形a(NO.1)が小矩
形,矩形b(NO.2)も小矩形であることが分かる。
更に、横幅及び直前矩形との距離から合計横幅A+B,
A+B+Cが計算され、A+B<X(=1.2H)<A
+B+Cと判定される。ここで、H=132である。従
って、図7から矩形NO.1はグループ6に属する。
【0024】次に、図6に示すNO.1とNO.2に関
する特性情報を読み出し、図8のグループ6における確
定条件の判定を行う。この場合、矩形aのコードが単独
コードのシフトJISコードで、且つ、矩形bの位置情
報が分離文字の「右」ではないので、結果として矩形N
O.1の要素は単独文字として切り出されることが確定
する(図9ア参照)。このように、ある要素の切出しが
確定すると、次の矩形NO.2が先頭矩形aとなり、同
様の処理が繰り返される。この場合、矩形a(NO.
2)と矩形b(NO.3)も小矩形で且つA+B<X<
A+B+Cなのでグループ6にグループ分けされ、矩形
a(NO.2)のコードが単独コードで矩形b(NO.
3)の位置情報が分離文字の「左」であるので、矩形N
O.2の要素も単独文字として切り出されることが確定
する(図9イ)。
【0025】続く矩形NO.3は小矩形,NO.4は中
矩形で、A+B<X<A+B+Cなのでグループ4にグ
ループ分けされ、矩形NO.3の位置情報が左で且つ結
合可能な矩形が小矩形または中矩形なので、これらの矩
形NO.3とNO.4は分離文字の部分要素と判断さ
れ、2つの要素が合成して切り出されることになる(図
9ウ)。NO.5とNO.6の組み合わせは、NO.1
とNO.2と同様グループ6に属するが、NO.5は位
置情報が「左」で小矩形と結合可能であり、且つ、N
O.6は位置情報が「右」で小矩形と結合可能なので、
この場合、NO.5とNO.6は分離文字の部分要素と
判断され2つの要素が合成して切り出される(図9
エ)。NO.7とNO.8では、A+B>Xとなりグル
ープ1に属するので、NO.7は単独文字となる(図9
オ)。NO.8とNO.9の組み合わせは、NO.5と
NO.6と同様グループ6に属し確定条件も同一の条件
を満足するので、両矩形は分離文字の部分要素と判断さ
れ2つの要素が合成して切り出される(図9カ)。
【0026】以上のように、矩形特徴,特性情報,コー
ドを利用して、9個の矩形要素が6個の文字として切り
出されることとなる。
【0027】ところで、文字切出し部10では、以降の
文字認識処理のために、更に、切出し文字に含まれる矩
形パターンの組み合わせによって、その文字が全角の非
分離文字か、分離文字であって2個の小矩形要素のみか
らなる文字か、その他の分離文字か、半角の英数等の単
独文字かを大別して、各々の文字の状態を、状態1,状
態2,状態3,状態4と表すようにしている。例えば図
8では、矩形パターンの組み合わせが、「1」,「2」
のときは状態1、「13」のときは状態2、「3」,
「8」,「10」,「11」のときは状態3、「7」,
「9」,「12」のとき状態4である。
【0028】そして、文字認識部13へは、切出し情報
として、図10に示すように各文字毎に、上記文字状態
を第1ワードに有する合計3ワードの状態情報と、切出
し文字の行画像記憶部4上での先頭及び末尾のアドレス
を表す切出し位置情報とを、送出するようにしている。
状態情報の第2、3ワードは、第1ワードが状態1、
2,3、4のいずれであるかによってその内容が異な
り、状態1の場合は意味を持たない。状態2の場合は、
第2ワードに左側の小矩形要素の認識結果であるコー
ド、第3ワードに右側の小矩形要素の認識結果であるコ
ードが格納され、状態3の場合は、切出し文字中に含ま
れる小矩形要素の認識結果であるコードが第3ワード
に、その小矩形要素の特性情報中の位置情報が第2ワー
ドに格納される。状態4の場合は、半角の英数等の単独
文字を表すシフトJISコードが第2ワードに格納され
る。
【0029】文字認識部13は、このような切出し情報
に基づき文字の認識を行い、認識結果をディスプレイ等
の出力部15に送出して画面表示を行う。勿論、文字認
識部13に接続される辞書14はあらゆる文字の標準パ
ターンを記憶するものである。
【0030】以下、文字認識処理について、図1の詳細
構成図及び図11、12の説明図を参照しながら、詳し
く説明する。
【0031】図1に示すように、文字認識処理部13
は、切出し情報制御部100,正規化部101,特徴抽
出部102,マッチング部103,小矩形組み合わせテ
ーブル104,全辞書参照テーブル106,分離参照テ
ーブル107,出力制御部108から構成される。
【0032】小矩形組み合わせテーブル104は、図1
に示すように、左側小矩形要素を行方向に、右側小矩
形要素を列方向に配列し、その交差する位置に両要素を
有する文字コードを記憶している。一方、分離参照テー
ブル107は、各小矩形要素毎に異なる記憶領域1,
2,3,4、‥‥‥‥を有し、そこに、対応する小矩形
要素を含む文字のコードと辞書14のアドレスとを記憶
しており、更に、ヘッダ部107aには、各小矩形要素
毎に対応する領域の番号が記憶されている。また、全辞
書参照テーブル106には、全ての文字についてそのコ
ードと辞書14のアドレスが記憶されている。そして、
これら3つのテーブル106,104,107は、上述
の切出し情報に含まれる第1ワードの状態情報に応じ
て、いずれかが利用される。
【0033】さて、切出し情報が入力されると、切出し
情報制御部100は、まず、状態情報の第1ワードが状
態1,2,3のいずれであるか判定し、状態1であれ
ば、切出し位置情報に従って行画像記憶部4から文字を
切出し、正規化部101,特徴抽出部102で、従来と
全く同様に、正規化及び特徴抽出を行う。そして、マッ
チング部103は、全辞書参照テーブル106を参照す
ることによって、抽出した特徴パターンを辞書14の全
領域の標準パターンとマッチングする。
【0034】一方、状態情報の第1ワードが状態3であ
れば、状態1の場合と同様、文字の切出し、正規化、特
徴抽出が行われるが、この場合、マッチング部103
は、分離参照テーブル107を参照し、ヘッダ部分から
切出し情報中のコードに対応する領域番号を得、その番
号の領域内に含まれる文字についてのみ、抽出した特徴
パターンを辞書14の標準パターンとマッチングする。
即ち、マッチング範囲が限定されるのである。例えば、
図9の3文字目の切出し情報には、図12に示すよう
に、第1、2,3ワードに各々「状態3」、「左」、
「人偏コード」が記憶されているので、分離参照テーブ
ル107では参照範囲が人偏コードに対応する領域1の
みに限定され、従って、辞書の照合範囲が領域1に格納
されている文字「化、個、佃、仙、伯」に限定される。
【0035】尚、第2ワードの位置情報は、小矩形要素
が左側と右側のいずれにも成り得る場合、これを区別す
るためのものである。例えば、このような例として
「田」があり、分離参照テーブル107上では、同一の
コードであってもその位置情報によって「左」のときは
領域5、そして、「右」のときは領域6が、選択される
ように構成されている。
【0036】これに対し、状態情報の第1ワードが状態
2であるときは、従来のような、正規化、特徴抽出、辞
書とのマッチングは行わず、切出し情報制御部100
が、小矩形組み合わせテーブル104を参照することに
よって、一義的に文字を特定する。例えば、図9の6文
字目の切出し情報には、図11に示すように、第1、
2,3ワードに各々「状態2」、「割の左側小矩形コー
ド」、「割の右側小矩形コード」が記憶されているの
で、両コードから小矩形組み合わせテーブル104を参
照すれば、文字「割」が特定される。図9の4文字目
も、同様に小矩形組み合わせテーブル104を参照する
ことによって、文字「に」が特定される。
【0037】そして、出力制御部108は、切出し情報
制御部100もしくはマッチング部103からの文字コ
ードを、認識結果として出力部15に送出する。
【0038】状態情報の第1ワードが状態4であるとき
は、既にコードが確定しているので文字の認識処理を行
うことなく、第2ワードに格納されているコードをその
まま出力部15に送出する。
【0039】以上のように、本実施例では、切り出され
た文字が分離文字か否か、また、分離文字の場合は部分
要素の構成に応じて、異なる文字認識処理が行われる。
【0040】ところで、小矩形要素には、「申」と
「巾」のように類似度が非常に大きいものがあり、この
ような場合には、切出し情報中に小矩形要素「申」が格
納されていても、分離参照テーブル107の小矩形要素
「巾」を含む文字領域4内に正しい文字が含まれていた
り、反対に、切出し情報中に小矩形要素「巾」が記憶さ
れていても、分離参照テーブル107の小矩形要素
「申」を含む文字領域3内に正しい文字が含まれている
可能性が十分にあり得る。そこで、本実施例では、分離
参照テーブル107において、「申」と「巾」の各々の
ヘッダ部には、双方の小矩形要素に対応する領域番号
3,4を共に記憶するようにしている。これによって、
いずれの小矩形要素が切り出されても、双方の小矩形要
素を含む文字とのマッチングが可能となる。
【0041】また、切出し情報制御部100が小矩形組
み合わせテーブル104を参照しても文字が特定できな
い場合は、次に、状態3での分離参照テーブル107を
利用した認識を行うようにすればよい。この際、小矩形
要素が2個含まれるので、各々について分離参照テーブ
ル107を参照し、類似度が大きい候補文字を認識結果
にするとよい。
【0042】ここで、図13に本実施例と従来例の実験
結果を示す。この実験は、ワープロ原稿A,信学論文
B,新聞Cの3種類を入力原稿に用いたものであり、各
々の場合の切出し率、及び、第1位認識率を示してい
る。切出しにおいては、半角文字同士を合成処理したミ
スや、分離文字が他の文字要素と合成されてしまうミス
が殆どなくなり、切出し率が1〜2%向上した。また、
文字の認識においては、分離文字の誤認識が著しく減
り、第1位認識率は4〜5%と大きく向上した。
【0043】
【0044】
【0045】
【発明の効果】本発明では、画像記憶部の画像データ内
の文字行から矩形パターンを生成する矩形パターン生成
手段と、該生成された矩形パターンについて大きさ、矩
形間距離等の矩形特徴を抽出する矩形特徴抽出手段と、
矩形パターンが小矩形となるあらゆる小矩形要素につい
て、その要素が占める文字上での位置、結合する可能性
のある相手側要素の矩形パターン等の特性情報を予め記
憶した小矩形特性情報データベースとを更に備え、生成
された矩形パターンの組み合わせ及び前記矩形特徴並び
に特性情報に応じて、切出し文字が分離文字であるか否
か、あるいは、切出し文字中にいくつの小部分要素を含
むかを判定することによって、文字の構成に応じて、認
識結果を極めて有利に利用出来る。
【図面の簡単な説明】
【図1】実施例における文字認識部の詳細構成を示すブ
ロック図である。
【図2】実施例の全体構成を示すブロック図である。
【図3】矩形パターンの生成を説明するための説明図で
ある。
【図4】矩形パターンから抽出される矩形特徴を示す図
である。
【図5】小矩形特性情報データベースの内容を示す図で
ある。
【図6】生成された矩形パターンについて取り出された
特性情報を示す図である。
【図7】グループ分け処理部でのグループ化を説明する
ための説明図である。
【図8】切出し確定処理部でのグループ毎の切出し確定
条件を示す図である。
【図9】文字切出し処理の具体例を示す図である。
【図10】切出し情報のフォーマットを示す図である。
【図11】小矩形組み合わせテーブルを用いた認識処理
を説明するための説明図である。
【図12】分離参照テーブルを用いた認識処理を説明す
るための説明図である。
【図13】実験結果を示す図である。
【符号の説明】
2 画像記憶部 4 行画像記憶部 5 矩形パターン生成部 6 矩形情報記憶部 7 小矩形特性情報データベース 8 小矩形辞書 9 小矩形要素認識部 10 文字切出し部 11 グループ分け処理部 12 切出し確定処理部 13 文字認識部 14 辞書 15 出力部 100 切出し制御部 103 マッチング部 104 小矩形組み合わせテーブル 106 全辞書参照テーブル 107 分離参照テーブル 108 出力制御部
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 G06K 9/34

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字列を画像データとして記憶する画像
    記憶部と、該画像記憶部の画像データ内の文字行から矩
    形パターンを生成する矩形パターン生成手段と、該生成
    された矩形パターンについて大きさ、矩形間距離等の矩
    形特徴を抽出する矩形特徴抽出手段と、矩形パターンが
    小矩形となる小矩形要素について、その要素が占める文
    字上での位置、結合する可能性のある相手側要素の矩形
    パターン等の特性情報を予め記憶した小矩形特性情報デ
    ータベースとを更に備え、生成された矩形パターンの組
    み合わせ及び前記矩形特徴並びに特性情報に応じて、切
    出し文字が分離文字であるか否か、あるいは、切出し文
    字中にいくつの小部分要素を含むかを判定することを特
    徴とした文字認識装置。
JP4258386A 1992-09-28 1992-09-28 文字認識装置及び方法 Expired - Lifetime JP3071048B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4258386A JP3071048B2 (ja) 1992-09-28 1992-09-28 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4258386A JP3071048B2 (ja) 1992-09-28 1992-09-28 文字認識装置及び方法

Publications (2)

Publication Number Publication Date
JPH06111069A JPH06111069A (ja) 1994-04-22
JP3071048B2 true JP3071048B2 (ja) 2000-07-31

Family

ID=17319525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4258386A Expired - Lifetime JP3071048B2 (ja) 1992-09-28 1992-09-28 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JP3071048B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6127685B2 (ja) * 2013-04-19 2017-05-17 富士通株式会社 情報処理装置、プログラム、及び形状認識方法

Also Published As

Publication number Publication date
JPH06111069A (ja) 1994-04-22

Similar Documents

Publication Publication Date Title
US4610025A (en) Cryptographic analysis system
US6212299B1 (en) Method and apparatus for recognizing a character
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
US6970601B1 (en) Form search apparatus and method
JPH11120293A (ja) 文字認識/修正方式
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JPH0634256B2 (ja) 接触文字切出し方法
JP3071048B2 (ja) 文字認識装置及び方法
JP2931485B2 (ja) 文字切出し装置及び方法
JP3159087B2 (ja) 文書照合装置および方法
JP3000349B2 (ja) キー入力編集方法及び編集装置
JPH06162263A (ja) 文字認識装置及び方法
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JPH1078997A (ja) 文字認識装置及びその方法並びにその方法を記録した記録媒体
JP3195405B2 (ja) 文字認識装置
JP2752499B2 (ja) 文字読取り装置
JP3217442B2 (ja) 光学的文字読み取り装置
JP3377719B2 (ja) 文字認識装置及びコンピュータ読み取り可能な記録媒体
JPH10116321A (ja) 文字認識方法および文字認識装置
JP3064508B2 (ja) 文書認識装置
JP2576984B2 (ja) 文字認識処理装置
JP2963474B2 (ja) 類似文字識別方法
JP2570571B2 (ja) 光学文字読取装置
JP2784004B2 (ja) 文字認識装置
JPH08279022A (ja) 文字認識装置