JPH0816728A - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JPH0816728A
JPH0816728A JP6146053A JP14605394A JPH0816728A JP H0816728 A JPH0816728 A JP H0816728A JP 6146053 A JP6146053 A JP 6146053A JP 14605394 A JP14605394 A JP 14605394A JP H0816728 A JPH0816728 A JP H0816728A
Authority
JP
Japan
Prior art keywords
character
candidate
characters
similar
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6146053A
Other languages
English (en)
Other versions
JP3548233B2 (ja
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP14605394A priority Critical patent/JP3548233B2/ja
Publication of JPH0816728A publication Critical patent/JPH0816728A/ja
Application granted granted Critical
Publication of JP3548233B2 publication Critical patent/JP3548233B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 速度的に問題なく、且つ、認識対象の文字の
取りこぼしの発生を抑制し、高い精度で文字を認識す
る。 【構成】 画像の読みよりを行って文字の切り出しを行
う(S201、S202)。そして、その切り出した文
字から特徴抽出し、文字サイズに依存しないように正規
化する(S203、204)。そして、第1次照合によ
って高速な文字認識を行ない、ベクトルの最も近似して
いる順に10個の候補文字を抽出する(S205、20
6)。この後、その抽出された候補文字の中の最も近似
していると思われる文字の類似文字をテーブルを検索す
ることで10個抽出する(S207)。こうして、高速
文字認識処理及びテーブルから抽出された文字群を、高
精度の文字認識処理における候補群として文字認識を行
い、出力する(S208、209)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置及び方法に
関するものである。
【0002】
【従来の技術】一般に、文字認識処理にもいくつかある
が、図4に示すような例も有効である。以下、順を追っ
て説明する。
【0003】先ず、ステップS401で文書画像のスキ
ャンを行い画像情報を2値のデジタル画像データに変換
する。次のステップS402では、読み取った画像デー
タに対して、1文字ごとの領域を取り出していく文字切
り出し処理を行い、ステップS403で予め定められた
アルゴリズムにしたがって特徴抽出を行う。
【0004】例えば、一文字の画像を8×8の小領域
(計64個の領域)に分割し、その小領域内で黒画素の
数を集計する。64個の領域ごとに黒画素の特徴が計算
されるので64次元の特徴ベクトルが生成されることに
なる。さらに文字の大きさの影響を取り除くためにステ
ップS404で文字の大きさによって特徴ベクトルを正
規化する。元の特徴ベクトルをX、正規化後の特徴ベク
トルをX’とすると、 X’=(a/(h×w))X という正規化を行う。ただし、h,wはそれぞれ文字の
高さと幅で、aは定数である。
【0005】こうして、正規化された特徴ベクトルと認
識辞書の学習パターンを照合し最適な文字種を選び出す
わけだが、ここで認識精度を高めようとして、精度の高
い距離計算を用いて照合を行おうとすると、必然的に計
算量が増大し、処理速度が低下してしまうという問題が
発生し、逆に処理速度を向上させようとする場合には簡
単な距離計算を行うことになるので認識精度が低下する
という問題が発生する。
【0006】そこで、簡単な距離計算を用いた第一次照
合により文字種を絞り込み、絞り込まれた文字種(候
補)に対してのみ、より精度が高く演算量の多い第二次
照合を行うという処理が考えられる。
【0007】ステップS405では、演算量の少ない距
離計算を用いて第一次照合を行う。本例ではシティ・ブ
ロック距離を用いる。そして、個々の正規な文字kに対
する平均ベクトルμ(k)(=μ1 (k),…,μ64
(k))を予め記憶させた辞書を用意しておき、この平
均ベクトルと認識対象の文字から得られた入力特徴ベク
トルX(=x1(k),…,x64(k))との距離dc
(k)を下記の式で求める。
【0008】
【数1】 全ての文字種に足してdC が計算され、ステップS40
6でdC の小さい方から上位10個の文字種が選択され
る。こうして選択された上位10個の文字種に対してス
テップS407で第二次照合を行う。第二次照合では精
度を重視して、演算量は多いが、精度の高い距離計算と
して次式で与えられるマハラノビス距離を用いる。
【0009】
【数2】 ここで、S(k)は文字種kの共分散行列である。ま
た、右肩の添え字tは転置を、−1は逆行列を表す。
【0010】こうして、ステップS408において、最
も小さいdMを与える文字種を最終的な候補と判定しス
テップS409で出力する。
【0011】
【発明が解決しようとする課題】上記処理によれば、2
段階で文字を絞り込むという点で、ある面で優れている
が、これは第1次照合で絞られた候補の中に正解となる
文字が含まれるというのが前提である。つまり、もし第
1次照合で得られた候補内に正解となる文字が含まれて
いない場合には、第2次照合の精度にかかわらず正しい
認識結果が得られないという問題がある。
【0012】
【課題を解決するための手段】本発明は上記問題点に鑑
みなされたものであり、速度的に問題なく、且つ、認識
対象の文字の取りこぼしの発生を抑制し、高い精度で文
字を認識する文字認識装置及び方法を提供しようとする
ものである。
【0013】この課題を解決するため、例えば本発明の
文字認識装置は以下に示す構成を備える。すなわち、入
力情報から文字を認識する文字認識装置において、文字
と当該文字に対する類似文字群の組みで構成された辞書
と、速度優先の第1の文字認識手段によって候補文字群
を抽出する第1の抽出手段と、抽出された候補文字群中
における類似度の高い所定個数の候補文字それぞれに対
する類似文字群を前記辞書から抽出する第2の抽出手段
と、前記第1、第2の抽出手段で抽出された文字群を候
補範囲とし、精度優先の第2の文字認識手段を実行させ
る制御手段とを備える。
【0014】ここで本発明の好適な実施態様に従えば、
第2の抽出手段は、第1の抽出手段で得られた候補文字
群の最も類似してる一個の候補文字に対する類似文字群
を前記辞書から抽出することが望ましい。これによっ
て、第2の文字認識手段が処理する対象が多くはなら
ず、高速に文字認識が行える。
【0015】また、前記第1の文字認識手段は、シティ
・ブロック距離によって文字認識することが望ましい。
これによって、認識対象の候補文字を高速に絞り込むこ
とが可能になる。
【0016】また、前記第2の文字認識手段は、マハラ
ノビス距離によって文字認識することが望ましい。これ
によって、高精度に文字を認識することが可能になる。
【0017】また、前記2の抽出手段における類似文字
群を抽出する対象の候補文字の個数(第1の抽出手段で
抽出された候補文字群中の類似度の高い候補文字の個
数)は、変更可能であることが望ましい。これによっ
て、認識しようとするオリジナル文字の品位に応じた高
精度の文字認識が行える。
【0018】
【作用】かかる本発明において、例えば、第1の抽出手
段は速度優先の第1の文字認識手段を使用して候補文字
群を抽出する。そして、この候補文字群中の類似度の高
い所定個数の文字それぞれに対して類似している文字群
を辞書より第2の抽出手段が抽出する。こうして、第
1、第2の抽出手段で抽出された文字群を精度優先の第
2の文字認識手段の候補範囲として処理を行う。
【0019】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0020】本実施例では、OCR(光学的文字認識装
置)に適用した場合である。図1は第1の実施例の構成
を表すブロック図である。
【0021】図1において、101は画像原稿に光を照
射し、その反射光を読み取り電気信号に変換するスキャ
ナ、102はスキャナ101で得られた電気信号を2値
のデジタル電気信号に変換し他の装置構成要素に伝送す
るためのスキャナインターフェース回路、103はディ
スプレイのウィンドウ上で所望とする座標を入力するた
めのポインティングデバイス(マウス等)、104はポ
インティングデバイス103からの信号を受け、それを
他の装置構成要素に伝送するためのインターフェース回
路、105は装置全体の制御及び文字切り出し処理や認
識処理を実行するためのCPU、106はCPU105
が実行する制御プログラム、各種処理プログラム、認識
辞書、類似文字種テーブルなどを格納しているROM、
107は文字画像の展開や文字認識処理のための作業領
域などとして用いられるRAMである。また、108は
入力イメージや認識結果を表示するためのディスプレ
イ、109はディスプレイインターフェース回路、そし
て110は各装置構成要素を接続するバスである。
【0022】先ず、実施例における類似文字種テーブル
の作成法を説明する。文字同士の近さの度合いを各文字
種の平均特徴ベクトル間の距離で定義する。平均特徴ベ
クトルは同じ文字でもフォントや大きさ印刷状態などの
異なるさまざまな学習データから予め求めておく。本実
施例では距離はユークリッド距離を用いて類似文字種を
定める。すなわち、ある文字種mに注目した場合、他の
文字種kとの平均ベクトル距離D(m,k)は次のよう
にする。
【0023】
【数3】 ここで、Pは文字種の総数である。そして、すべてのk
に対してD(m,k)を計算し、距離の小さい方から上
位10個を類似文字とする。ただし、自分自身はD=0
で最も距離が小さくなるが意味がないので除く。この計
算によりすべての文字種に対する類似文字種が定義され
るのでこれをテーブル状態で予め格納しておく。尚、こ
のテーブルは、実際にはその内容が変更されることはな
いので、実施例ではROM106に予め書き込んでお
く。但し、ROMに限定されるものではなく、ハードデ
ィスク装置等の記憶装置に保持させてもよいし、電源投
入時にそれら不揮発性記憶装置からRAMにロードする
ようにしても良い。
【0024】以上の結果、例えば“間”という文字に着
目したとき、この文字“間”に平均ベクトルの一番小さ
いものから10個が瞬時に取り出せるようになってい
る。
【0025】図3は上記類似文字テーブルの構造を模式
的に示したものである。注目文字300に連続して格納
されている文字がその先頭文字に類似している文字群で
あり、その類似度(平均ベクトル距離の小さい順)に配
置されている。従って、このテーブルには10文字毎
に、その先頭文字に対して類似している文字が並んでい
るので、テーブルの先頭位置から10文字間隔で検索す
ることで、注目文字に対する10個の類似文字を抽出す
ることが可能になっている。従って、文字“間”に着目
した場合には、図示の符号380に該当する文字(文字
コード)を検索できるので、その結果、間、問、聞、…
の計10文字をいっきに抽出できる。
【0026】尚、図では文字そのもので表しているが、
実際には文字コード(例えば、JISコード等)が格納
されている。
【0027】次に、上記テーブルを備えた装置における
CPU105の処理内容を図2のフローチャートに従っ
て説明する。尚、同図における処理手順に対応するプロ
グラムはROM106に格納されているものである。
【0028】ステップS201〜S205は従来例のS
401〜S405と同じであるものとし、説明が重複す
るので簡単に説明する。先ず、原稿画像を読み取り、そ
の読み取った2値画像データを一旦RAM107の所定
エリアに格納し、文字の切り出しを行う。1つの文字
は、先に説明したのと同じ個数、すなわち、8×8の小
領域(全部で64個の領域)に分割し、64次元の特徴
ベクトルを生成する。次いで、文字のサイズによる影響
を除くためにその生成した特徴ベクトルを正規化する
(正規化の原理は先に説明した通り)。こうして、正規
化された特徴ベクトルに基づいて、辞書(ROM106
に格納されているものとする)を参照する以上がステッ
プS201〜S205の処理である。
【0029】さて、辞書を参照することで、正規化され
た特徴ベクトルに近い方から数文字(説明を簡単にする
ためここでも10文字にする)を選び出す(ステップS
206)。
【0030】この結果、例えば以下の文字が選択された
としよう。
【0031】 間 問 聞 開 闘 閣 閉 岡 向 商 (1) 最も距離の近かった文字は「間」なので、類似文字種テ
ーブル(図3参照)で「間」をキーとして検索する(ス
テップS207)。図3の類似文字種テーブルにおい
て、テーブルの先頭から10個おきに照合していくこと
によってキーと380のコードが一致する。その結果、
符号381の位置から符号390の位置まで格納されて
いる10個の類似文字 間 問 聞 開 関 闘 閉 閑 岡 商 (2) を得ることができる。(2)と元々の10個の候補
(1)を合わせ、重複しているものを除くと 間 問 聞 開 関 闘 閉 閑 岡 商 閣 向 (3) という12個の文字が得られる。
【0032】次に、処理はステップS208に進んで、
(3)の12個の文字に対して第二次照合を行う。第二
次照合は、先に説明したのと同じように精度の高いマハ
ラノビス距離を次式で得る。
【0033】
【数4】 ここで、kは12個の文字種を表し、Xは認識しようと
している文字イメージから得たベクトルである。
【0034】そして、最終的に、上記演算のよる12個
のdM(k)の中で距離の近い順に並び替え、その先頭
文字を第1候補として出力する(ステップS209)。
尚、表示画面に表示された第1候補を見た操作者が、キ
ーボードやポインティングデバイスを使用して次候補表
示指示を行った場合には、第2候補以下を表示画面にそ
の順番に表示する。操作者は、この表示された候補の中
から目的の文字を探し出し、選択することになる。
【0035】尚、ここでは12個に対してマハラノビス
距離を算出したが、第1次照合と第2時照合とでそれぞ
れ10個の類似文字を用いるわけであるから、計算する
個数は10〜20の範囲である。
【0036】以上の結果、本実施例によれば、認識対象
の文字イメージに基づいて高速な手法によって先ず所定
数の第1の候補文字(上記実施例では10文字)を抽出
する。そして、その候補文字群における一番類似してい
る文字そのもの対する類似文字をテーブルから所定数の
第2の候補文字(実施例ではこれも10文字)を抽出す
る。そして、これら第1の候補文字群と第2の候補文字
群の論理和された結果(重複する文字を除くという意
味)に対して、より高精度の認識処理を行い、その結果
に基づいて候補文字をう。従って、精度が多少落ちるも
のの高速に処理できる認識処理による候補文字群中に目
的の文字がない場合であっても、その候補文字を越える
範囲で、しかも、不要に広範囲にならずに高精度の文字
認識を行えることで、処理速度の高速性を保ちながら、
認識結果のとりこぼしの発生を低く抑えることが可能に
なる。
【0037】[第2の実施例の説明]上記実施例(第1
の実施例)では、類似文字種の定義として(1)式のよ
うに平均ベクトル同士の距離を用いたが、次式のように
学習サンプルの中で最も近いもの同士の距離によって類
似度を定義してもよい。ある文字m(m=1,2,…,
P)に対して、i番目の学習データをai(m)で表
し、学習データの数をnとすると
【数5】 ここで、1≦i,j≦nなるすべてのi,jを文字種m
と文字種kの距離とする。この場合、学習サンプルの分
布も考慮して類似文字種を計算できることになる。
【0038】[第3の実施例の説明]また、第1の実施
例では第一次照合の結果もっとも距離の小さい文字種の
類似文字種だけをテーブルから抽出し、それらを第2次
照合の対象に追加していたが、第一次照合の結果距離の
小さい方から上位N個の文字種の類似文字種を第二次照
合の候補に追加してもよい。たとえば、第一次照合の結
果上位3個の文字種が「間」「聞」「開」であった場
合、この上位3個の文字種すべての類似文字種テーブル
を参照することによ次のような類似文字種が得られたと
する。
【0039】 類似文字 テーブルからの抽出文字 間 → 問 聞 開 関 闘 閣 閉 岡 向 商 聞 → 間 開 問 闘 関 閣 閉 向 闇 岡 開 → 間 問 聞 関 閉 闘 閣 岡 閑 閥 参照された文字種のうち重複するものを除いて、以下の
ものが得られる。
【0040】関 闘 閣 閉 岡 向 商 闇 閑 閥
そして、この候補文字群を第2次照合の候補として追加
することになる(勿論、第1次照合処理と重複するもの
は追加しない)。
【0041】尚、上記Nは固定であっても良いが、例え
ば認識対象の原稿が鮮明な場合には少ない数を、不鮮明
な場合には大きい数字を与えることで、適宜変更できる
ようにすることが望ましい。尚、ユーザに対しては、N
がいかなる意味を持つかを意識させないで済むように、
例えば、原稿画像の鮮明度を数段階で指示することで対
処させれば良い。場合によっては、手書き原稿か、ファ
クシミリ受信画像か、プリンタ等で印刷したものか等を
設定しても良い。この場合、Nは手書き>ファクシミリ
受信画像>プリンタ出力に対応する値を持つことになろ
う。
【0042】[第4の実施例の説明]また、更に、第1
の実施例においてひとつの文字に対する類似文字種の数
を一定としたが、これは文字種によって可変にしてもよ
い。ある文字種mに対して他の文字種kの距離をd
(m,k)で表すと、 d(m,k)<d0 を満足する文字種kを類似文字種とする。距離の定義は
第1の実施例に同じでもよくまたそれ以外の距離の定義
を用いてもよい。d0 は実験的に定めた定数であり、例
えば候補群に目的の文字が含まれる確率に基づくもので
よい。
【0043】このように類似文字種を定めると、類似文
字種が多くて間違えやすい文字に対して候補字種が増
え、類似文字の少ない文字種に対して必要以上に候補文
字種を増やして速度を低下させることもなく効率よく削
減させることができる。
【0044】また、第2次照合によって得られる候補群
の数も10に限定されるものではなく、それぞれの着目
文字によって異なっても良い。
【0045】このためには、例えば図5に示すように、
テーブルを2つに分け、テーブル50には文字コードと
その文字コードに対する類似文字群を記憶しているテー
ブルの格納先アドレスを格納しておく。テーブル50は
例えば文字コード順に並んでいて、尚且つ、1つのレコ
ード(文字コードとアドレスの構造体の大きさ)は固定
であるので、与えられた文字コードからテーブルの位置
は簡単に計算でき、瞬時に目的のアドレスを得ることが
可能になる。そして、そのテーブルの次のレコードのア
ドレスを調べれば目的の類似文字の個数が判別できる。
【0046】この結果、テーブル51からその個数分の
候補文字を第2次候群として抽出する。
【0047】尚、本発明は、活字文字だけでなく手書き
文字にも適用でき、また言語の種類を問わない。
【0048】また、上記実施例では、第1次照合に文字
イメージを複数領域に分割し、その小領域単位の特徴ベ
クトルでもって第1次候補群を決定し、第2次候補群は
マハラノビス距離で算出し抽出した。しかしながら、本
願発明はこれによって限定されるものではない。
【0049】要は、第1次照合においては速度優先、第
2次照合には精度優先をその根底の思想とするものだか
らである。従って、この思想の範疇にあるものであれ
ば、本願発明はいかように改良変更しても構わない。
【0050】また、本発明はスキャナ、ディスプレイ等
の個々の装置を接続したシステムとして説明したが、単
独の装置内にこれらの機能を実現させる場合にも適応で
きることは言うまでもない。また、処理手順(プログラ
ム)はROMに格納されているものではなく、外部から
供給することで動作する場合にも適応できるのは、上記
実施例からすれば容易に想到できよう。
【0051】更に、実施例ではスキャナ等の光学機器か
ら原稿を読み取り、文字認識する例を説明したが、フロ
ッピー等の記憶媒体に予め原稿画像を記憶しておいて、
この記憶媒体から画像データを入力し文字認識しても構
わない。また、回線を介して受信した画像(ファクシミ
リ受信画像)から直接文字認識するようにしても良い。
【0052】
【発明の効果】以上説明したように本発明によれば、少
ない演算量の計算による第1次照合を行い、その結果距
離が近い方から上位N個の文字に詳細な識別計算による
第2次照合を行う文字認識処理において、第一次照合の
上位M個(M≦N)の認識結果の類似文字種を加えて詳
細な識別計算による第2次照合を行うことによって、正
しい候補が第一次照合でもれてしまった場合でも類似文
字種として復活する可能性が高く、精度の高い文字認識
が実現できる。
【0053】
【図面の簡単な説明】
【図1】第1の実施例の構成を表すブロック図である。
【図2】第1の実施例のフローチャートである。
【図3】類似文字テーブルの構造を説明するための図で
ある。
【図4】従来例の処理のフローチャートである。
【図5】他の実施例における類似文字検索テーブルの構
造を示す図である。
【符号の説明】
101 スキャナ 102 スキャナインターフェース回路 103 ポインティングデバイス 104 ポインティングデバイスインターフェース回路 105 CPU 106 ROM 107 RAM 108 ディスプレイ 109 ディスプレイインターフェース回路 110 CPUバス

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力情報から文字を認識する文字認識装
    置において、 文字と当該文字に対する類似文字群の組みで構成された
    辞書と、 速度優先の第1の文字認識手段によって候補文字群を抽
    出する第1の抽出手段と、 抽出された候補文字群中における類似度の高い所定個数
    の候補文字それぞれに対する類似文字群を前記辞書から
    抽出する第2の抽出手段と、 前記第1、第2の抽出手段で抽出された文字群を候補範
    囲とし、精度優先の第2の文字認識手段を実行させる制
    御手段とを備えることを特徴とする文字認識装置。
  2. 【請求項2】 前記第2の抽出手段は、第1の抽出手段
    で得られた候補文字群の最も類似してる一個の候補文字
    に対する類似文字群を前記辞書から抽出することを特徴
    とする請求項第1項に記載の文字認識装置。
  3. 【請求項3】 前記第1の文字認識手段は、シティ・ブ
    ロック距離によって文字認識することを特徴とする請求
    項第1項に記載の文字認識装置。
  4. 【請求項4】 前記第2の文字認識手段は、マハラノビ
    ス距離によって文字認識することを特徴とする請求項第
    1項に記載の文字認識装置。
  5. 【請求項5】 前記2の抽出手段における類似文字群を
    抽出する対象の候補文字の個数(第1の抽出手段で抽出
    された候補文字群中の類似度の高い候補文字の個数)
    は、変更可能であることを特徴とする請求項第1項に記
    載の文字認識装置。
  6. 【請求項6】 入力情報から文字を認識する文字認識方
    法において、 文字と当該文字に対する類似文字群の組みで構成された
    辞書と、 速度優先の第1の文字認識手段によって候補文字群を抽
    出する第1の抽出工程と、 抽出された候補文字群中における類似度の高い所定個数
    の候補文字それぞれに対する類似文字群を、文字と当該
    文字に対する類似文字群の組みで構成された辞書から抽
    出する第2の抽出工程と、 前記第1、第2の抽出工程で抽出された文字群を候補範
    囲とし、精度優先の第2の文字認識手段を実行させる制
    御工程とを備えることを特徴とする文字認識装方法。
  7. 【請求項7】 前記第2の抽出工程は、第1の抽出工程
    で得られた候補文字群の最も類似してる一個の候補文字
    に対する類似文字群を前記辞書から抽出することを特徴
    とする請求項第6項に記載の文字認識方法。
  8. 【請求項8】 前記第1の文字認識手段は、シティ・ブ
    ロック距離によって文字認識することを特徴とする請求
    項第6項に記載の文字認識方法。
  9. 【請求項9】 前記第2の文字認識手段は、マハラノビ
    ス距離によって文字認識することを特徴とする請求項第
    6項に記載の文字認識方法。
  10. 【請求項10】 前記2の抽出工程における類似文字群
    を抽出する対象の候補文字の個数(第1の抽出工程で抽
    出された候補文字群中の類似度の高い候補文字の個数)
    は、変更可能であることを特徴とする請求項第6項に記
    載の文字認識方法。
JP14605394A 1994-06-28 1994-06-28 文字認識装置及び方法 Expired - Fee Related JP3548233B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14605394A JP3548233B2 (ja) 1994-06-28 1994-06-28 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14605394A JP3548233B2 (ja) 1994-06-28 1994-06-28 文字認識装置及び方法

Publications (2)

Publication Number Publication Date
JPH0816728A true JPH0816728A (ja) 1996-01-19
JP3548233B2 JP3548233B2 (ja) 2004-07-28

Family

ID=15399031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14605394A Expired - Fee Related JP3548233B2 (ja) 1994-06-28 1994-06-28 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JP3548233B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013001774A1 (ja) * 2011-06-28 2013-01-03 日本電気株式会社 文字チェック装置、方法及びプログラム
JP2021179926A (ja) * 2020-05-15 2021-11-18 ソフトバンク株式会社 学習プログラム、学習装置および学習方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013001774A1 (ja) * 2011-06-28 2013-01-03 日本電気株式会社 文字チェック装置、方法及びプログラム
JP2013011932A (ja) * 2011-06-28 2013-01-17 Nec Corp 文字チェック装置、方法及びプログラム
JP2021179926A (ja) * 2020-05-15 2021-11-18 ソフトバンク株式会社 学習プログラム、学習装置および学習方法

Also Published As

Publication number Publication date
JP3548233B2 (ja) 2004-07-28

Similar Documents

Publication Publication Date Title
JP3452774B2 (ja) 文字認識方法
Khurshid et al. Word spotting in historical printed documents using shape and sequence comparisons
Hazra et al. Optical character recognition using KNN on custom image dataset
KR19980018029A (ko) 문자 인식 장치
Andreeva et al. Comparison of scanned administrative document images
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
Barnouti et al. An efficient character recognition technique using K-nearest neighbor classifier
Shi et al. An invoice recognition system using deep learning
CN116030469A (zh) 一种处理方法、装置、设备和计算机可读存储介质
JPH0816728A (ja) 文字認識装置及び方法
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
Sotoodeh et al. A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques
Nagy et al. Adaptive and interactive approaches to document analysis
JP3727422B2 (ja) 文字認識装置及びその方法
Sakila et al. Content Based Text Information Search and Retrieval in Document Images for Digital Library.
Slavin et al. Matching Digital Copies of Documents Based on OCR
JP3114446B2 (ja) 文字認識装置
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
Eqbal EXTRACTION AND DETECTION OF TEXT FROM IMAGES
AU2021100089A4 (en) A method to word recognition for the postal automation and a system thereof
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2002312398A (ja) 文書検索装置
Dinh et al. Improved Lexicon-driven based Chord Symbol Recognition in Musical Images
Razak Old Jawi manuscript: digital recognition

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040416

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090423

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100423

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110423

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees