JP3195038B2 - 複数の文字認識プロセッサを備えた記号判定システムのための選択装置 - Google Patents

複数の文字認識プロセッサを備えた記号判定システムのための選択装置

Info

Publication number
JP3195038B2
JP3195038B2 JP07740892A JP7740892A JP3195038B2 JP 3195038 B2 JP3195038 B2 JP 3195038B2 JP 07740892 A JP07740892 A JP 07740892A JP 7740892 A JP7740892 A JP 7740892A JP 3195038 B2 JP3195038 B2 JP 3195038B2
Authority
JP
Japan
Prior art keywords
character
candidates
candidate
accuracy
selection device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07740892A
Other languages
English (en)
Other versions
JPH06318269A (ja
Inventor
ロジャー・ディー・メレン
ハリー・ティー・ガーランド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH06318269A publication Critical patent/JPH06318269A/ja
Application granted granted Critical
Publication of JP3195038B2 publication Critical patent/JP3195038B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は光学文字認識(OC
R)システムに関係し、特に、複数のOCRプロセッサ
の出力からの数学的にもっとも確度の高い記号候補を識
別する選択装置を備えたシステムに関する。
【0002】
【従来の技術】従来、特願平3−325830号に記述
されているように、文字のビットマップの形式で記号イ
メージデータを認識するために、個別のプロセッサを用
いるものはあった。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では、文字のビットマップの形式で記号イメー
ジデータを認識すべく用いる、個別のプロセッサは、入
力イメージを総体として識別する為の選択装置を備え
ず、プロセッサアレイという形態では用いられなかっ
た。
【0004】(目的)従って、本発明は、複数の記号候
補を持つ記号判定システムのための、改善された選択装
置を与えることを目的とする。
【0005】従って、本発明は、各々の候補に関連した
確信因子に基いて、記号候補を選択するような選択装置
を与えることを目的とする。
【0006】従って、本発明は、一群の類似候補の連結
確信因子に選択の基礎を置くような選択装置を与えるこ
とを目的とする。
【0007】従って、本発明は、一群の類似候補の連結
誤読因子に選択の基礎を置くような選択装置を与えるこ
とを目的とする。
【0008】従って、本発明は、複数の候補から数学的
にもっとも確度の高い候補を選択するような選択装置を
与えることを目的とする。
【0009】略述すると、本発明の目的は、以下の点に
ある。複数のOCRプロセッサから入力文字コード(I
CC)を読み取る、文字選択装置を提供することによっ
て、達成される。選択装置は、各々のICCに関連した
確信因子(CF)に基いて複数のICCの中から数学的
にもっとも確度の高いコード(MPC)を選択する。選
択装置の入力手段は複数のICCおよびこれらに関連す
るCFを読取り、複数の入力位置へ入れる。ソーター
は、複数のICCをソートして、それぞれが同一コード
からなる複数の群に分類し、ソートメモリ内にそれらを
記憶する。連結確信因子(JCF)演算器は、各々の群
内のICCのCFに基いて、同一コードの各群のJCF
を判定する。進め回路は、群のJCFを判定するために
JCF演算器手段へ各ICC群を進める。出力手段はJ
CF演算器手段からJCFを読み込み、関連するJCF
に基いてMPCを選択する。
【0010】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0011】尚、添付図面においては、この発明の諸要
素を2桁の参照数字によって指定する。第1の桁は、そ
の要素が最初に示される図面の番号あるいはその要素に
ついての記述が主に言及する図面の番号を示す。第2の
桁は、全部の図面を通じて、類似した特徴および構造を
示す。その要素の属性あるいは特徴を示す添字がいくつ
かの参照数字の後に続く。
【0012】〔記号判定システム〕ここで、記号判定シ
ステムについて図1を用いて詳細に説明する。
【0013】連結記号判定システム10は、入力スキャ
ナ105を介してCPU 10Cへ文書10Dの文書お
よび/若しくは図形データを読み込み、生じたイメージ
をビットマップメモリ12M内に格納する。ビットマッ
プ内の記号あるいは文字セル12Cは分離ソフトウェア
によって識別され、データ排除プロセッサ14Exおよ
びニューロネットワークプロセッサ14NNのような複
数の適切な光学文字認識(OCR)プロセッサへ提示さ
れる。文字選択装置16は、複数のプロセッサ出力の中
から、数学的に最も確度の高い文字(MPC)を選択
し、CPUに記憶させたり、出力プリンタ10Pに印刷
させる。
【0014】文字イメージのビットはOCRプロセッサ
へ送られ、各々のプロセッサによって系統的に検索され
検査される。各々のプロセッサによって生成された文字
データは、ライブラリ15に格納されている既知もしく
は定義された参照文字のセットから引き出された対応す
る文字データと比較される。その後、各OCRプロセッ
サが、参照セット内のどの文字が各OCRプロセッサに
よって検査され提示されたイメージにもっとも似ている
かに基き、提示されたイメージに最もよくマッチした文
字を確定する。その後、最良のマッチングを示す出力文
字が入力文字コード(ICC)、すなわち選択装置16
による選択候補文字になる。候補文字は、ASCIIコ
ードあるいは圧縮ASCIIコードのような適切な2進
コードシステムで表現される。
【0015】多くの種類のOCRプロセッサがあり、各
々のプロセッサは、文字認識のためにそれぞれ他とは異
なる手法を用いる。データ排除プロセッサ14Exは、
提示されたイメージのスペクトルパワーを検査し、線幅
およびラインカウント情報を引き出す。スペクトルパワ
ーは漸進的に減じられ、イメージデータを除外して確信
因子を生成する。このことは、特願平3−325830
号“データ排除および確信因子を備えた、記号解析シス
テムとその解析方法”に記述されている。ニューロネッ
トワーク・プロセッサ14NNは生物の神経システムに
固有のマッチングプロセスを用いる、適合人工知能型の
実施例である。
【0016】特定の連結判定システムで用いられる複数
のOCRプロセッサは互いに同一でないか、少なくとも
機能的に同等でないことが望ましい。互いにオーバラッ
プする複数の該当性プロファイルを備えた複数の光学文
字認識原理のアレイを提供するべく、異なる種類のプロ
セッサーが選択される。アレイを構成するプロセッサ
は、高い該当性の広いオーバラップ領域と限定された該
当性の狭い非オ−バラップ領域とを有している。
【0017】各々の種類のOCRプロセッサは、それぞ
れ特別な機能と能力とをもって記号認識のためのユニー
クな手法を行なうものである。モーメント/加重型のO
CR手法は、イメージを形成する顔料の分布を判定し、
イメージ輝度およびグレイスケ−ルの処理においてとり
わけすぐれている。しかしながら、モーメント型手法は
他のOCR手法と同様に“丸め”処理を行なうものでは
ない。エッヂ検査型のOCR手法は、外部のエッヂから
内部のエッヂを解像認識するために、イメージのエッヂ
に注目する。エッヂ型手法は、短いストロークあるいは
長いストロークの検査という点においては、とりわけす
ぐれているというわけではない。他のOCR手法は、ラ
イン特徴抽出および円抽出に関係がある。
【0018】複数のプロセッサの個々の該当性能プロフ
ァイルは互いに補完しあって数学的に丸められた集合的
該当性プロファイルを与える。同じイメージがすべての
プロセッサに対して提示されるので、全OCRプロセッ
サが確定する最良マッチング文字およびICC候補はた
いていの場合同一となる。しかしながら、原文からスキ
ャンされたイメージが不十分だったり、記号フォーマッ
トが普通でないために、候補文字が同じではない場合も
ある。一つのプロセッサについて候補文字が、低該当性
領域内にある結果、この候補文字が異なるプロセッサに
よって異なる文字として解釈されてしまうといった可能
性がある。その様な結果生じた候補判定上の矛盾は、確
信因子を検査することによって解決される。
【0019】〔確信因子−CF〕プロセッサは、各々の
入力文字コード(ICC)候補に関連した確信因子(C
F)を生成し、これは提示されたイメージの正確なAS
CIIコードとして各々のICCの確度を示す。CF値
は、ICC候補の正確さの確度(P)と関係がある。す
なわち、 確信因子=Kx確度 CF=KxP ここでCFは任意の記数法で表わし得る。
【0020】Pの値が0に向かって減少するほどCFの
値は低くなり、1に近い最大値に向かって増加するほど
CFの値が高くなる。また、Kは較正係数である。
【0021】CFは、OCRプロセッサを適切に較正す
ることによってPと同一値になり得る。それは以下のと
おりである: 較正後の確信因子=確度 CFcal=P OCRプロセッサの較正は、較正用特殊文書をスキャン
する、長期期間にわたる較正テストを含んでいる。実験
的に出されたCFと経験的に判定された確度の間には相
関関係が観察される。CFは調整され、K=1の経験的
な確度で正規化される。
【0022】一般に、確度Pは確信因子CFの特殊な場
合である。K=1で較正された時、CFは正確さの確度
と等しく、不正確あるいは誤読(“e”)確度に換算し
て述べてもよい: CFcal=P=(1−e) ここで、eが0に接近するほどCFは高くなる。不正確
さの確度と正確さの確度との和は、1と常に等しい: P+e=1 P=.99999(e=.00001)のCFは、プロ
セッサへ示された100,000の記号イメージにつき
99,999の割合で正確な記号の候補認識が行なわれ
ることを表す。あるいはまた、表Aの中で示されている
ように、P=.99999は、100,000の中で1
つの記号あるいは50ページごとに平均しておよそ1つ
の誤認識という候補誤認識割合を表す。
【0023】
【表1】
【0024】表Aは、シングルスぺ−スで、約2,00
0文字を含む、8.5”x11”の1ページのタイプ資
料に基く。
【0025】[連結確信因子−JCF]2つのOCRプ
ロセッサがICC候補として互いに同一の候補を確定す
る場合、それらの連結確信因子(JCF)は個々のCF
のいずれよりも大きい。JCFは次のJCF関係式によ
って表現される: JCF2=1−(1−CF1)(1−CF2) “N”項(N個のOCRプロセッサからのN個の類似候
補)に対する一般的なJCF方程式は、次のとおりであ
る: JCFn=1−(1−CF1)(1−CF2)...(1−CFn) CFが確度と等しくなっている較正後の較正システムの
場合には、JCF方程式は連結確度(JP)方程式にな
る: JP2=1−(1−P1)(1−P2) “N”項(N個のOCRプロセッサからのN個の類似候
補)に対する一般的なJP方程式は、次のとおりであ
る: JPn=1−(1−P1)(1−P2)....(1−Pn) JP方程式は不正確さの確度を代入することによって、
単純化してもよい: JP2=1−(e1)(e2) ここで2つのe項は掛け合わされ、単一の誤読積項を形
成する。
【0026】“N”項(N個のOCRプロセッサからの
N個の類似候補)に対する一般的なJP誤読方程式は、
次のとおりである: JPn=1−(e1)(e2)(e3).....(en) e(誤読)積項は連結誤読確度(Jepn)を定義し、
候補忠実度情報を含んでいる: JPn=1−Jepn Jepn項は、CFの値が大きくなるほど、またNの値
が大きくなるほど0に接近する。
【0027】一群の複数候補文字のJPは、個々の候補
文字の単一のPに較べて更に確度の高い指標である。数
学的にもっとも確度の高い候補を単一のPの検査から明
白に得ることは不可能かもしれない。例えば、表Bは、
3台のプロセッサシステムによってそれぞれ与えられる
PおよびJPの値を示している。この中で各プロセッサ
は確度の高い順序に、もっとも有望な4つの候補を与え
る。
【0028】
【表2】
【0029】上記の表B(OQGC例)の中で数学的に
もっとも確度の高い候補はJP=.78の“O”であ
る。最も高い単一の確度を備えた候補はP=.52の
“Q”とP=.47の“G”である。第1プロセッサに
おいて、円形記号の該当性領域が限定されており、この
プロセッサが入力イメージデータに対して“D”応答を
与える唯一のプロセッサであった。
【0030】表Bに示す例では、PおよびJPの値は概
して低いが、これは低品質のプリントの文書をスキャン
した結果生成された入力イメージが不良だったことによ
るものである。一般使用の文書ではプリントの品質はも
っと高いので、記号イメージの信頼性はもっと高い。表
C(3つの9)は、JP=.999のより典型的なOQ
GC例を示す。また、表D(6つの9)は、JP=.9
99,999の例を示す。
【0031】
【表3】
【0032】
【表4】
【0033】[デフォールトイメージモード]スキャン
されたテキストイメ−ジは、入力文書が低品質であった
りフォーマットが標準的でないことによって不明瞭なも
のになることがある。最良マッチング文字およびICC
を判定することができない(あるいは、他に選択の手段
がない)場合、文字選択装置は非認識デフォールトモー
ドへ入る。選択装置は、未判定のASCIIコードの代
りに文字のビットマップを印刷するようにCPUに命じ
るデフォールトイメージ信号を送出する。CPUプリン
ト出力は文字コード(例えば8ビットのASCII)に
イメージデータを加えた複合的テキストフォーマットを
持つ。イメージデータは、イメージビットマップのCP
Uメモリ中における位置を識別するアドレスコードであ
ることが望ましい。イメージビットマップは何千ものビ
ット(50ビットのイメージで100ビットのイメージ
を表す5,000ビットのような)を含んでいることも
ある。イメージ圧縮アルゴリズムを用いて、デフォール
トイメージマップのメモリ必要条件を減らしてもよい。
【0034】OCRプロセッサでの不十分なマッチング
によって、生成されたCFの値が小さくなった場合、こ
れに応じて選択装置がデフォールトイメージモードに入
るように構成してもよい。選択目的にとって無用のもの
として、しきい値より下のCFあるいはJCFを持つI
CC候補を切り捨てるようにしてもよい。不十分なマッ
チングは、ライブラリの中で定義されてない非定形文字
あるいはプロセッサの認識範囲を越えた普通でないフォ
ントによって引き起される場合もある。不十分なマッチ
ングは、更に、折り目、破れ、パンチホール、ステップ
ル孔や異物のしみなどのスキャンされた媒体の欠陥によ
って引き起されることもある。更に、フォントの変形、
色素の退色、および色素の退色やページの黄変などによ
るコントラストの低下などの欠陥によってマッチング不
良が生じる場合もある。
【0035】[文字選択装置]文字選択装置について図
2を用いて詳細に説明する。文字選択装置16は、文字
毎にICC(入力文字コード)候補を類似文字の群にソ
ートし、次に、各々の群内部でCF(あるいはPあるい
はe項)を組合せて、群のJCP(あるいはJPあるい
はJep)を与える。
【0036】入力レジスタ22は、“N”個のOCRプ
ロセッサ(その各々はICC選択の“C”レベルを与え
る)からICC候補を読み込む。すなわち、各々のOC
Rプロセッサによって確定された、Cでもっともよくマ
ッチした複数候補は、入力レジスタの中へ読み込まれ
る。これらは図2の実施例では、N=5(対応する入力
サブレジスタ22A、22B、22C、22Dおよび2
2Eで)およびC=3(対応するレジスタ位置(第1の
C、第2のCおよび第3のC)で)である。候補入力数
はNxC(5x3=15)であり、それと同数の入力位
置が必要とされる。
【0037】ソーター24Sは各々の入力位置にアクセ
スし、文字毎に候補をソートしてソートメモリ24M内
の記憶場所へ入れる。複数の同一候補は、ソートメモリ
中の隣接した記憶場所へソートされ、類似の候補群を形
成する。ソーター24Sによる入力レジスタ22の探索
順序は、最初から最後へ、最も高いCFから最も低いC
Fへ、あるいは第1の選択から第2もしくは第3の選択
へというような、任意の適切な順序でよい。
【0038】進め回路26は、連結確度方程式に基いて
群のJCFを演算するために、JCF演算器28Cへ各
々の群の候補を順次進める。出力レジスタ28Rは
“J”群候補およびこれに関連するJCFを格納する。
CPUへの選択装置の出力は最も高いJCFあるいはJ
値が最も高い複数のJCFを持つ群候補になることもあ
る。あるいはまた、出力は、JCFの順序ですべての群
候補を含むものであってもよい。原文に示されたイメー
ジの完全な系図を表わすために、出力は、デフォールト
イメージビットマップのアドレスを含む入力レジスタ2
2の中のすべての情報を含んでいてもよい。
【0039】データフィールド(図4および図5)入力
レジスタの各々のICC候補は、データフィールドに整
列された関連データを持つものであってもよい。(図4
を参照)。リードデータフィールドは、候補(Can
ASCII)を表わすASCIIコードと、これに続く
候補(Can CF)のCFを含んでいることが望まし
い。省略イメージ目的のために、CPU中に示されるイ
メージ(Add DIm)のビットマップアドレスとこ
れに続くASCIIコードを生成したプロセッサ(Pr
o Num)を識別する番号あるいはコードとを含むよ
うにしてもよい。
【0040】更に、ICC候補は、テキスト印刷条件や
文書ステータス情報を保存するための、関連するテキス
ト制御コード(テキストCont)を持つものであって
もよい。テキストコードは、ワードプロセッシング条件
(ボールドやアンダーラインテキストのような)や文書
全体について検討されるべき事柄(行送り間隔およびフ
ォントタイプのような)を含んでもよい。
【0041】出力レジスタ28Rの中で各々の群候補
は、群ASCIIコード(Grp ASCII)、群連
結確信因子(GrpJCF)、デフォールトイメージア
ドレス(Add DIm)、およびテキスト制御コード
(テキストCont)のような対応する関連データを持
っている。プロセッサ番号(Num Pro)は群レベ
ルで適用できず、群の中の候補の数(Num Can)
のようなより有用な情報と取替えられることもある。候
補の数はCF方程式のCF項の数あるいはJePの因子
の数である。
【0042】[進め回路]進め回路について図3を用い
て詳細に説明する。進め回路26は、ソートメモリ24
M中の複数の候補に順次アクセスし、ASCIIコード
を比較するための、真偽コンパレーター32(図3を参
照)のような適切な群検出デバイスにこれらの候補をロ
ードする。コンパレーターは、群乗算のためにJCF演
算器28Cへ、更にそれから出力レジスタ28Rへ、各
群の複数の候補を進める。
【0043】コンパレーターは支配的な側32Dそして
非支配的な側32Nを持っている。ソートメモリの第1
群からの第1候補は、非支配的な側にロードされ、直ち
に支配的な側へ移ると同時にJCF演算器へ進む。この
第1候補が第1群のリード候補である。そして、比較に
よって、このリード候補の属する群の各候補(類似AS
CIIコード)を進め、次の群のリード候補(非類似A
SCIIコード)を検知する。
【0044】第一群の中の次の候補は、非支配的な側に
ロードされ、リード候補と比較される。コンパレーター
は、比較が真(“T”)あるいは偽(“F”)かどうか
判定する。T/F制御装置34Cは、次の信号を出し
て、コンパレーターのT/F出力へ応答する:すなわち 比較が真の場合“T−Adv”信号 比較が偽の場合“F−Adv”信号 また いずれの場合にも“進め”信号。
【0045】比較が真の場合、非支配的な側の中にある
候補はJCF演算器(T−Adv)へ進む。また、ソー
トメモリからの次の候補は非支配的な側へロードされ、
比較が真である場合には、T/F制御装置は、“乗算”
信号を出してJCT演算器に進められた候補と演算器中
に得られている積との乗算を行なわせる。
【0046】比較が偽(F−Adv)の場合、非支配的
な側の中にある候補は支配的な側へ移り、古いリード候
補に取って代わる。メモリアドレッサー34Aは進め信
号を1個読み込む度にインクリメントされて、ソートメ
モリの中の次の候補にアクセスする。そして、次候補は
非支配的な側にロードされる。比較が偽である度に、T
/F制御装置は、JCF演算器に“クリア群”信号を送
って、演算器内のJCFを出力レジスタ28Rへ進め
て、次の群のために演算器をクリアする。
【0047】尚、本発明のコンセプトからはずれずに、
ここに示された構造および実施例を様々に変更し得るこ
とは明らかであろう。更に、ある図の中で示された実施
例の特徴を、他の図による実施例に用いることも可能で
ある。
【図面の簡単な説明】
【図1】記号判定システムのブロック図
【図2】選択装置のより詳しいブロック図
【図3】進め回路のより詳しいブロック図
【図4】候補データのデータフィールドフォーマットの
実施例を示す図
【図5】群データのデータフィールドフォーマットの実
施例を示す図
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ハリー・ティー・ガーランド アメリカ合衆国カリフォルニア州パロ・ アルト・ミランダ・アヴェニュー・スタ ンフォード・リサーチ・パーク4009キヤ ノン・リサーチ・センター・アメリカ, インコーポレイテッド内 (56)参考文献 特開 平1−259475(JP,A) 特開 平4−205690(JP,A) 特開 平3−268088(JP,A) 特開 昭57−25082(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 - 9/62 JICSTファイル(JOIS)

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数の文字認識部それぞれから、複数の
    文字候補と各文字候補に関連した確信因子(CF)とを
    受け取る受け取り手段と、 前記文字候補の中に、同一の文字候補がn個あった場合
    に、連結確信因子(JCFn)を関係式、 JCFn=1−(1−CF1)(1−CF2)・・・(1−CFn) に基づいて算出する連結確信因子演算手段と、 前記複数の文字候補の中から、前記関係式より算出した
    連結確信因子の最も高い文字候補を出力する出力手段
    と、 を有することを特徴とする文字選択装置。
  2. 【請求項2】 更に、前記受け取り手段から受け取った
    複数の文字候補を、同一の文字候補の群にグループ分け
    するソート手段と、 前記ソート手段によりグループ分けされた複数の文字候
    補群をソートメモリに記憶させる記憶手段とを有し、 前記連結確信因子演算手段は、前記ソートメモリに記憶
    された文字候補群毎に、連結確信因子を算出することを
    特徴とする請求項1に記載の文字選択装置。
  3. 【請求項3】 前記ソート手段は、前記同一の文字候補
    の群をソートメモリ内の連続する領域に記憶することを
    特徴とする請求項2に記載の文字選択装置。
  4. 【請求項4】 前記連結確信因子演算手段が、前記ソー
    トメモリに記憶された同一の文字候補群の文字候補に順
    次アクセスし、該同一文字候補群の連結確信因子の算出
    が終了する毎に、前記連結確信因子(JCFn)の演算
    をクリアするように制御する制御手段を更に有すること
    を特徴とする請求項2又は3のいずれかに記載の文字選
    択装置。
  5. 【請求項5】 更に、前記ソートメモリに記憶された文
    字候補を順次アクセスし、次の文字候補が同一文字候補
    であるか比較することにより、同一文字候補群を識別す
    るコンパレータ手段を有することを特徴とする2乃至4
    のいずれかに記載の文字選択装置。
  6. 【請求項6】 前記確信因子は、各文字候補の正確さを
    表す確度(P)に関連することを特徴とする請求項1乃
    至5のいずれかに記載の文字選択装置。
  7. 【請求項7】 前記文字認識部は、前記確信因子と前記
    確度が一致するように調整されることを特徴とする請求
    項6に記載の文字選択装置。
  8. 【請求項8】 前記連結確信因子演算手段は、前記確信
    因子と前記確度が一致する場合、同一の文字候補がn個
    あった場合に、連結確度(JP)を関係式、 JPn=1−(1−P1)(1−P2)・・・(1−Pn) に基づいて算出し、 前記出力手段は、前記複数の文字候補の中から前記算出
    した連結確度の最も高い文字候補を出力することを特徴
    とする請求項7に記載の文字選択装置。
  9. 【請求項9】 前記連結確信因子演算手段は、前記連結
    確度(JP)を関係式、 JPn=1−(e1)(e2)・・・(en) (ここで、eは誤読の確度であり、P+e=1を満た
    す)に基づいて算出することを特徴とする請求項8に記
    載の文字選択装置。
  10. 【請求項10】 更に、連結誤読確度(Jepn)を関
    係式、 Jepn=(e1)(e2)・・・(en) に基づいて算出し、前記連結確信因子演算手段は、関係
    式、 JPn=1−Jepn に基づいて、連結確度を算出することを特徴とする請求
    項9に記載の文字選択装置。
JP07740892A 1991-05-29 1992-03-31 複数の文字認識プロセッサを備えた記号判定システムのための選択装置 Expired - Fee Related JP3195038B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US707035 1991-05-29
US07/707,035 US5257323A (en) 1991-05-29 1991-05-29 Selection agent for a symbol determination system with multiple character recognition processors

Publications (2)

Publication Number Publication Date
JPH06318269A JPH06318269A (ja) 1994-11-15
JP3195038B2 true JP3195038B2 (ja) 2001-08-06

Family

ID=24840097

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07740892A Expired - Fee Related JP3195038B2 (ja) 1991-05-29 1992-03-31 複数の文字認識プロセッサを備えた記号判定システムのための選択装置

Country Status (4)

Country Link
US (1) US5257323A (ja)
EP (1) EP0516316B1 (ja)
JP (1) JP3195038B2 (ja)
DE (1) DE69228895T2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JP3046111B2 (ja) * 1991-11-08 2000-05-29 キヤノン株式会社 文字認識方法及びその装置
US5875261A (en) * 1991-12-20 1999-02-23 International Business Machines Corporation Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing
US5359673A (en) * 1991-12-27 1994-10-25 Xerox Corporation Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
JPH05244414A (ja) * 1992-02-28 1993-09-21 Canon Inc 画像処理装置
US5459739A (en) * 1992-03-18 1995-10-17 Oclc Online Computer Library Center, Incorporated Merging three optical character recognition outputs for improved precision using a minimum edit distance function
JP3131287B2 (ja) * 1992-05-27 2001-01-31 株式会社日立製作所 パターン認識装置
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
FR2709361B1 (fr) * 1993-08-26 1995-09-22 Thepaut Andre Reconnaissance de forme par réseau de neurones.
US5555325A (en) * 1993-10-22 1996-09-10 Lockheed Martin Federal Systems, Inc. Data capture variable priority method and system for managing varying processing capacities
DE4407998C2 (de) * 1994-03-10 1996-03-14 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
US5434932A (en) * 1994-07-28 1995-07-18 West Publishing Company Line alignment apparatus and process
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
FI97176C (fi) * 1994-09-27 1996-10-25 Abb Industry Oy Puolijohdekytkimen ohjauspiiri
DE4436408C1 (de) * 1994-10-12 1995-12-07 Daimler Benz Ag Mustererkennungsverfahren
US6181837B1 (en) * 1994-11-18 2001-01-30 The Chase Manhattan Bank, N.A. Electronic check image storage and retrieval system
JP2737734B2 (ja) * 1995-12-13 1998-04-08 日本電気株式会社 指紋分類装置
US5889897A (en) * 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
US6151423A (en) * 1998-03-04 2000-11-21 Canon Kabushiki Kaisha Character recognition with document orientation determination
US6662180B1 (en) * 1999-05-12 2003-12-09 Matsushita Electric Industrial Co., Ltd. Method for searching in large databases of automatically recognized text
JP2001043212A (ja) * 1999-07-23 2001-02-16 Internatl Business Mach Corp <Ibm> 電子文書における文字情報の正規化方法
US6395648B1 (en) 2000-02-25 2002-05-28 Wafermasters, Inc. Wafer processing system
WO2002045002A1 (de) * 2000-11-28 2002-06-06 Siemens Aktiengesellschaft Verfahren und system zur reduzierung der fehlerrate bei mustererkennungen
US7095875B2 (en) * 2001-05-15 2006-08-22 Lockheed Martin Corporation Method and system for address result arbitration
US7379978B2 (en) * 2002-07-19 2008-05-27 Fiserv Incorporated Electronic item management and archival system and method of operating the same
US20050144189A1 (en) * 2002-07-19 2005-06-30 Keay Edwards Electronic item management and archival system and method of operating the same
RU2234734C1 (ru) * 2002-12-17 2004-08-20 Аби Софтвер Лтд. Способ многоэтапного анализа информации растрового изображения
US20050094861A1 (en) * 2003-10-31 2005-05-05 International Business Machines Corporation Positional synchronization in a multivoting character recognition environment
GB0611561D0 (en) * 2006-06-08 2006-07-19 Ibm A validation engine
GB0623236D0 (en) 2006-11-22 2007-01-03 Ibm An apparatus and a method for correcting erroneous image identifications generated by an ocr device
US8379027B2 (en) * 2007-06-20 2013-02-19 Red Hat, Inc. Rendering engine test system
WO2021251972A1 (en) * 2020-06-11 2021-12-16 Hitachi, Ltd. Method to improve probability calculation of knowledge base construction

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2978675A (en) * 1959-12-10 1961-04-04 Bell Telephone Labor Inc Character recognition system
US3341814A (en) * 1962-07-11 1967-09-12 Burroughs Corp Character recognition
FR2191788A5 (ja) * 1972-06-30 1974-02-01 Honeywell Bull
US3988715A (en) * 1975-10-24 1976-10-26 International Business Machines Corporation Multi-channel recognition discriminator
JPS60108981A (ja) * 1983-11-18 1985-06-14 Hitachi Ltd 光学文字読取装置
JPS6443942U (ja) * 1987-09-10 1989-03-16
US4876735A (en) * 1987-12-18 1989-10-24 International Business Machines Corporation Method and apparatus for character recognition systems
JP2553608B2 (ja) * 1988-01-04 1996-11-13 住友電気工業 株式会社 光学文字読取装置
JPH0385691A (ja) * 1989-08-30 1991-04-10 Meidensha Corp 認識結果判定方式
US5075896A (en) * 1989-10-25 1991-12-24 Xerox Corporation Character and phoneme recognition based on probability clustering
JPH043753U (ja) * 1990-04-25 1992-01-14

Also Published As

Publication number Publication date
EP0516316B1 (en) 1999-04-14
EP0516316A3 (en) 1993-10-20
DE69228895D1 (de) 1999-05-20
US5257323A (en) 1993-10-26
DE69228895T2 (de) 1999-09-16
JPH06318269A (ja) 1994-11-15
EP0516316A2 (en) 1992-12-02

Similar Documents

Publication Publication Date Title
JP3195038B2 (ja) 複数の文字認識プロセッサを備えた記号判定システムのための選択装置
US11922318B2 (en) System and method of character recognition using fully convolutional neural networks with attention
US6151423A (en) Character recognition with document orientation determination
US7519226B2 (en) Form search apparatus and method
US5754671A (en) Method for improving cursive address recognition in mail pieces using adaptive data base management
EP0163377B1 (en) Pattern recognition system
US5359671A (en) Character-recognition systems and methods with means to measure endpoint features in character bit-maps
EP0649113B1 (en) Multifont optical character recognition using a box connectivity approach
US5394484A (en) Image recognition apparatus
US9047655B2 (en) Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
US6272238B1 (en) Character recognizing method and apparatus
US6549662B1 (en) Method of recognizing characters
JPH06501801A (ja) 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置
EP0674794A1 (en) Methods and apparatus for classification of images using distribution maps
CA2036274A1 (en) Document processor including method and apparatus for identifying and correcting errors
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
EP0955600B1 (en) Process and equipment for recognition of a pattern on an item presented
JPH07239899A (ja) 光学的文字読取装置
CN113837129B (zh) 手写签名错别字识别方法、装置、设备及存储介质
JP2747136B2 (ja) 文字認識装置
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
CN116682114A (zh) 一种基于四角号码字典的汉字图像识别方法及相关组件
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JPH0567238A (ja) 文字読取装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010427

LAPS Cancellation because of no payment of annual fees