JP3095069B2 - 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 - Google Patents

文字認識装置、学習方法および文字認識プログラムを記録した記録媒体

Info

Publication number
JP3095069B2
JP3095069B2 JP10080022A JP8002298A JP3095069B2 JP 3095069 B2 JP3095069 B2 JP 3095069B2 JP 10080022 A JP10080022 A JP 10080022A JP 8002298 A JP8002298 A JP 8002298A JP 3095069 B2 JP3095069 B2 JP 3095069B2
Authority
JP
Japan
Prior art keywords
character recognition
recognition result
character
provisional
case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10080022A
Other languages
English (en)
Other versions
JPH11282964A (ja
Inventor
孝文 越仲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10080022A priority Critical patent/JP3095069B2/ja
Publication of JPH11282964A publication Critical patent/JPH11282964A/ja
Application granted granted Critical
Publication of JP3095069B2 publication Critical patent/JP3095069B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙などに書かれた
文字を光学センサで取り込んで読み取る光学的文字認識
装置および文字認識装置の学習方法に関し、特に複数の
文字認識手段を組み合わせて用いることを特徴とする文
字認識装置に関する。
【0002】
【従来の技術】従来、この種の文字認識装置では、単一
の文字認識手段を用いるものが一般的であった。このよ
うな文字認識装置では、認識対象を特定の限られた側面
からしか捕らえられないため、認識精度に限界があっ
た。
【0003】そこで近年では、複数の文字認識手段を組
み合わせて文字を読み取る文字認識装置が用いられるよ
うになってきている。尚、ここでいう複数の文字認識手
段を組み合わせた文字認識装置とは、全く異なる特徴抽
出方式や特徴分類方式を組み合わせて、それぞれの手法
から認識結果を得るものから、方式の枠組みは同じで単
に2値化閾値などのパラメータを複数種類用意していく
つかの認識結果を得るものまで、複数の認識結果を得
て、それらを統合して単一の文字認識結果を出力する装
置全般を指すものとする。
【0004】ここで問題となるのは、複数の認識手段か
らそれぞれ得られる複数の認識結果からどのようにして
1つの認識結果を決定するか、ということである。この
問題に対しての従来技術の一例が、特開昭62−191
989号公報「パターン認識方法」(以下、第1の先行
技術と呼ぶ)や特開昭62−2119091号公報「文
字認識判定方式」(以下、第2の先行技術と呼ぶ)に記
載されている。これら第1および第2の先行技術に記載
されている方式では、複数の認識手段の後段に多数決回
路を備えることにより、できるだけ多くの文字認識手段
が出力する認識結果の文字コードを文字認識装置全体と
しての認識結果として出力している。
【0005】また、従来技術の別の一例が特開平8−2
72907号公報(以下、第3の先行技術と呼ぶ)に記
載されている。この第3の先行技術に記載された「文字
認識装置および方法」では、ある文字wqが第i番目の
認識手段(i=1,2,・・・、N)の出力する認識結
果中の第xqi位候補として現れたとして、ベクトルXq
=(xq1,xq2,・・・,xqN)を評価して、最も信頼
のおける認識結果を選び出している。なお、ベクトルX
qの評価には多層ニューラルネットワークを用い、ニュ
ーラルネットワークの出力が最も大きくなるような文字
を最終的な認識結果として出力している。認識結果中の
順位xqiの代わりとして認識結果の信頼性の尺度として
認識スコアsqiを用いても良い。
【0006】更に、本発明に関連する他の先行技術も種
々知られている。例えば、特開平5−2660号公報
(以下、第4の先行技術と呼ぶ)には、棄却文字数を大
幅に減少させ、認識精度を著しく向上することができる
「文字認識装置」が記載されている。この第4の先行技
術では、少なくとも2種の文字分類手段を併用すること
により誤読される文字数を減らすと同時に、各文字分類
手段が出力する候補の文字コードに対して計算された評
価値の大小比較と1回のしきい値判定処理で棄却判定を
行っている。
【0007】また、特開平7−160830号公報(以
下、第5の先行技術と呼ぶ)には、認識精度を高くした
ニューロネットワークを使った「ニューロを用いた文字
認識装置」が開示されている。すなわち、第5の先行技
術では、小領域ネットワークにより小領域毎の学習を行
い、この学習結果を利用した統合ネットワークにおり更
に学習を行い、その学習結果を利用して文字認識を行っ
ている。
【0008】更に、特開平2−165287号公報(以
下、第6の先行技術と呼ぶ)には、各段階が独立して
(単独で)出力するあいまい性のある結果と、他の段階
の出力から決定されるあいまい性のある結果を統合し
て、1文字領域を切り出し、1文字認識及び用語照合に
関する知識を相互にすべて活用することにより、全体と
して最もふさわしい結果を得るようにして、文字切り出
しの信頼性を高めた「文字列入力方式」が開示されてい
る。
【0009】更にまた、特開平3−97086号公報
(以下、第7の先行技術と呼ぶ)には、予め位置を限定さ
れてグレイ値像で存在する文字を分類するための方法で
あって、加工片に打刻または打印された文字又は加工片
に浮き出された文字を任意の照明条件のもとで確実に認
識する「文字認識方法」が開示されている。この第7の
先行技術に開示された文字認識方法は、利用される学習
可能な文字認識装置をトレーニングする段階と、文字を
認識する段階とを含む。トレーニングする段階は、認識
すべき文字を含む文字集合に相応する数および様式の、
直線群により表示された基準文字(アイデアル)を発生
し、またこの基準文字を学習可能な文字認識装置の作業
メモリのなかに記憶する過程と、各規準文字の各画素に
1つの方向を対応付ける過程と、期待値に対する1つの
分散関数を定める過程と、基準文字をグレイ値像から決
定されたグレイ値エッジ方向と比較するため1つの角度
比較関数を定める過程と、分散関数および角度比較関数
により評価マトリックスを作成する過程とを有する。ま
た、文字を認識する段階は、認識すべきディジタル化さ
れた文字を文字認識装置のなかに書込み、それによって
当該のグレイ値像を準備する過程と、当該の文字の分類
が実行可能であるように、認識すべき文字を前処理する
過程と、前処理された文字をすべての予め文字認識装置
により学習された基準文字と比較する過程と、部分特徴
が最大数の部分特徴により認識すべき文字と合致する基
準文字を決定するための多数決判定を実行する過程と、
文字認識装置のその後の処理のために文字認識装置から
1つの結果信号を発生する過程とを有する。
【0010】
【発明が解決しようとする課題】しかしながら、上述し
た第1乃至第3の先行技術には、それぞれ、次に述べる
ような問題点がある。
【0011】第1及び第2の先行技術では、単純な多数
決によって複数の認識結果の中から1つの認識結果を選
択するので、それぞれの認識手段が全く異なる認識結果
を出力した場合には、どの認識手段の出力も選ぶことが
できずに読み取り不能に陥る。また、各々の認識手段の
重要度を対等、或いは入力画像に拘らず一定として扱う
ので、それぞれの認識手段の得手不得手といった特性を
反映させることが出来ない。
【0012】一方、第3の先行技術は、第1及び第2の
先行技術と比べて、1)すべての認識手段の認識結果が
破棄されて読み取り不能に陥ることが少ない、2)認識
手段ごとの特性がいくらか反映される、3)ニューラル
ネットワークにより複数認識結果の統合手続きが学習で
獲得できるなどの点で優れている。
【0013】しかしながら、この第3の先行技術では、
ある認識結果の文字が正しいかどうかを評価するのに、
その文字がそれぞれの認識手段が出力する候補文字の第
何位に現れているかを基にしているが、対象としている
文字によらず、単一の評価関数f(X)を用いているた
めに、その認識結果がどういう文字であるかを考慮に入
れることができない。元来、実世界で用いられている文
字体系の中には、数字やひらがなのように変形が頻繁に
起こる文字や、“7”に対する“ク”のように、他の文
字と類似した文字が存在するため、読み誤りやすさは文
字ごとに異なる。それにも拘らず、この第3の先行技術
に開示された方式では、そのような文字ごとの誤りやす
さを考慮せずに、単一の基準で複数の認識結果の間の優
劣を決めて最終的な認識結果を出力している。そのた
め、第3の先行技術では、相違点の微妙な類似文字を確
実に正しいとして出力したり、正しく認識することが比
較的容易な文字が入力されても認識結果を一意に決定で
きずに、破棄してしまうことがある。
【0014】さらに、第3の先行技術では、準備されて
いる複数の認識手段が出力する認識結果をすべてニュー
ラルネットワークへの入力として使用しているが、多数
の認識手段が同一の認識結果を出力している場合など
は、この種の情報は冗長であり、複数の認識結果として
は無駄が多く、処理時間も必要以上に費やすことにな
る。
【0015】そこで、本発明は、これら従来技術の有す
る問題を解消すべく、複数の文字認識手段を組み合わ
せ、それらが出力する認識結果を、個々の文字の誤りや
すさの傾向や個々の認識手段の特性に応じて、かつ高速
に統合することによって、誤りや棄却が少なくかつ高速
な文字認識装置を提供することを目的とする。
【0016】また、本発明の他の目的は、上記複数の文
字認識手段が出力する文字認識結果を統合する手続きを
サンプルの学習により獲得できる文字認識装置を提供す
ることにある。
【0017】尚、上述した第4の先行技術は、少なくと
も2種の文字分類手段を併用することにより誤読される
文字数を減らすと同時に、各文字分類手段が出力する候
補の文字コードに対して計算された評価値の大小比較と
1回のしきい値判定処理で棄却判定を行うことにより棄
却される文字数を大幅に減らして、認識精度を著しく向
上された技術思想を開示しているにすぎず、上記本発明
の目的を達成するための手段については何ら開示してい
ない。
【0018】また、上述した第5の先行技術は、単なる
ニューロネットワークを使った文字認識装置を開示して
いるにすぎず、上記本発明の目的を達成するための手段
については何ら開示していない。
【0019】更に、上述した第6の先行技術は、文字枠
なしで書かれた手書き文字列に対して高精度に文字列の
入力を行う技術思想を開示しているにすぎず、本発明の
目的を達成するための手段については何ら開示していな
い。
【0020】更にまた、上述した第7の先行技術も、予
め位置を限定されてディジタル・グレイ値像で存在する
文字を認識するための方法を開示しているにすぎず、本
発明の目的を達成するための手段については何ら開示し
ていない。
【0021】
【課題を解決するための手段】本発明は、上記の目的を
達成するために次のような技術的構成を採用する。すな
わち、本発明による文字認識装置は、複数の文字認識手
段と、これら複数の文字認識手段が出力する複数の仮の
文字認識結果を受け取る認識結果統合手段とを備え、そ
の認識結果統合手段は、いくつかの段階の論理規則に従
って、複数の仮の文字認識結果から最終的な(統合し
た)文字認識結果を決定することを特徴とする。
【0022】上記論理規則は、IF−THEN規則であ
って、例えば、「第iの文字認識手段の第1位認識候補
がAでかつ第jの文字認識手段の第1位認識候補がBな
らば、最終的な文字認識結果はA」というようなもので
ある。
【0023】また、ここで用いられる論理規則は、文字
認識装置の設計者が経験に基づいて決めるのではなく、
予め収集された事例データセットの正解例の集まりから
所定の手続きによって、出来る限り簡略化された論理規
則が人手を介せずに獲得される。なお、事例データセッ
トとは、例えば、「第1の文字認識手段の第1位候補がC
1、第2の文字認識手段の第1位候補がC2、・・・、第
nの文字認識手段の第1位候補がCnのときに正解はDで
あった」というようなものである。
【0024】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0025】図1を参照して、本発明の一実施の形態に
係る文字認識装置について説明する。図示の文字認識装
置は、画像記憶手段10と、第1乃至第N(Nは2以上
の整数)の文字認識手段21,22、・・・、2Nと、
認識結果統合手段30と、事例データ記憶手段40と、
論理記憶生成手段50とを備えている。
【0026】画像記憶手段10は、入力された文字画像
を光学センサ(図示せず)で取り込んで格納する。第1
乃至第Nの文字認識手段21〜2Nは、画像記憶手段1
0より受け取った文字画像を仮に認識し、それぞれ、第
1乃至第Nの仮の文字認識結果を出力する。第1乃至第
Nの仮の文字認識結果は、文字コードのセットを示して
いる。認識結果統合手段20は、第1乃至第Nの文字認
識手段21〜2Nが出力する第1乃至第Nの仮の文字認
識結果(即ち、文字コードのセット)を受け取って、後
述するような論理規則に従って、第1乃至第Nの仮の文
字認識結果を統合し、統合した文字認識結果を、単一の
最終的な文字認識結果として、即ち読取結果を出力す
る。
【0027】事例データ記憶手段40は、認識結果統合
手段30において使用される論理規則を構成する際の学
習サンプルである事例データを格納する。論理規則生成
手段50は、事例データ記憶手段40に記憶された事例
データを後述するように処理し、認識結果統合手段30
において使用される論理規則を生成する。
【0028】尚、この技術分野において周知のように、
各文字認識手段において文字認識を行う場合には、入力
画像に対して前処理を行うのが一般的である。そのよう
な前処理としては、多値画像をより扱いやすい2値画像
に変換する2値化処理、文字の大きさやストロークの間
隔、傾き等を整形する正規化処理、画像中の細かな汚れ
やかすれを除くノイズ除去処理などが考えられる。ここ
では図示しないが、必要に応じて導入しても良い。ま
た、これらの前処理は前後関係を問わず、任意の順序で
適用することができる。
【0029】次に、図1に示した文字認識装置の動作に
ついて説明する。
【0030】入力画像はスキャナ等(図示せず)によっ
て光学的に入力され、画像記憶手段10に格納され、さ
らに、第1乃至第Nの文字認識装置21〜2Nへと送ら
れる。
【0031】第1乃至第Nの文字認識装置21〜2N
は、それぞれ、異なる手順に従って文字画像を認識し、
第1乃至第Nの仮の文字認識結果を出力する。尚、各文
字認識手段21〜2Nは、画像記憶手段から受け取った
文字画像に対して、必要であれば上述した前処理を施
し、文字画像から文字の識別に必要ないくつかの特徴量
を抽出し、それらと辞書(図示せず)に登録された参照
特徴とを比較し、尤も類似していると判断される参照特
徴に対応する文字コードを出力する。
【0032】なお、ここでは各々の文字認識手段は、た
だ1つの仮の文字認識結果、すなわち、第1位候補を出
力しているとして説明するが、例えば、第1位から第5
位までの認識候補を出力するというように、いくつかの
文字コードを出力していも良い。その場合は、第1位か
ら第5位までのそれぞれの認識候補を別個の文字認識手
段から出力された1つずつの仮の文字認識記結果と考え
て、これ以降の処理を同様の手順で行えば良い。
【0033】それぞれの文字認識手段は、前処理や特徴
抽出、識別の内部における処理内容が異なり、したがっ
て文字認識の出力傾向がある程度異なる。例えば、特徴
抽出で画像各部の濃淡パターンを抽出するものと、文字
の輪郭の方向を抽出するもののように、特徴抽出処理全
体の内容が異なるとか、あるいは前処理の中の2値化処
理における閾値パラメータの値が異なるなどの部分的な
差異でも良い。
【0034】認識結果統合手段30は、第1乃至第Nの
文字認識手段21〜2Nから、第1乃至第Nの仮の文字
認識結果(C1,C2,・・・,CN)を受け取り、後述
する論理規則に従って、1つの最終的な文字認識結果D
を出力する。ただし、ここに、C1,C2,・・・,CN
は、それぞれ、第1乃至第Nの文字認識手段21〜2N
が出力する第1乃至第Nの文字認識結果の文字コードで
あり、Dは認識結果統合結合手段30が文字コード
1,C2,・・・,CNを統合することによって、得る
最終的な文字認識結果の文字コードである。
【0035】以下では(C1,C2,・・・,CN)の個
々の要素Ci(1≦i≦N)を条件属性、Dを決定属性
と呼ぶことにする。認識結果統合手段30は、条件属性
(C1,C2,・・・,CN)と決定属性Dの関係に関わ
るいくつかの論理規則を記憶しており、受け取った条件
属性にこれらの論理規則を適用することによって、決定
属性、すなわち、出力すべき最終的な文字認識結果を決
定する。
【0036】ここに論理規則は、IF PC THEN
Dと表される。そして、PCは条件属性に関する基本
命題Ci=c(i=1,2,・・・、Nかつcは実際の
文字コード)、またはそれらのいくつかを論理積〓およ
び論理和〓で連結した命題であり、PDは決定属性に関
する基本命題D=d(dは実際の文字コード)である。
【0037】たとえば、IF((C1=‘A’)〓
((C4=‘A’)〓(C5=‘A’)))THEN(D
=‘A’)という論理規則は、「第1の文字認識手段2
1から出力される第1の仮の文字認識結果C1が‘A’
であり、かつ第4の文字認識手段24から出力される第
4の仮の文字認識結果C4と第5の文字認識手段25か
ら出力される第5の仮の文字認識結果C5のうち少なく
とも1つの仮の文字認識結果が‘A’であれば、最終的
な文字認識結果として‘A’を選択する」という規則を
表す。
【0038】多くの場合、論理規則は数個の条件属性の
値、すなわち文字コードの中から1つの文字コードを選
択する規則となるが、条件属性の中に全く含まれない文
字コードを認識結果として選択するような論理規則も形
式的には許される。
【0039】認識結果統合手段30の動作について簡単
な例をあげて説明する。例えば、第1の文字認識手段2
1が文字の輪郭線の方向を特徴として用いる文字認識手
段であり、第2の文字認識手段22が画像の各部分の濃
淡値を特徴として用いる文字認識手段であるとしよう。
一般的な特性として、輪郭線の方向を特徴として用いた
文字認識手段は、濃淡値を特徴として用いた文字認識手
段に比べて精度が高く信頼度が高い。しかしながら、輪
郭線の方向を特徴として用いる文字認識手段は、文字ス
トリークの途切れやかすれに対しては敏感で、途切れや
かすれに起因する誤りが多い。一方、濃淡値を特徴とし
て用いた文字認識手段は、輪郭線の方向を特徴として用
いた文字認識手段と比べて精度は劣るが、文字ストロー
クの途切れやかすれに対して頑健であるという特性を有
する。
【0040】これらの文字認識手段に図2に示すように
‘P’と書かれた画像が入力されたとしよう。この場
合、濃淡値を特徴とする第2の文字認識手段22は、
‘P’の右端部分の途切れに影響されることなく‘P’
と認識することができる。これに対して、輪郭線の方向
を特徴とする第1の文字認識手段21は、途切れによっ
て特徴が変動してしまい、‘F’と認識することが頻繁
に起こる。このように複数の文字認識手段間での文字認
識結果の一定の食い違いがある程度頻繁に起こる場合、
後述する論理規則生成手段50により生成され、認識結
果統合手段30に記憶された論理規則の1つである、I
F((C1=‘F’)〓(C2=‘P’))THEN(D
=‘P’)が適用され、認識結果統合手段30が最終的
な文字認識結果として‘P’を出力する。
【0041】次に、認識結果統合手段30が用いる論理
規則を、事前に事例データ記憶手段40に格納された事
例データから学習する、論理規則生成手段50の動作に
ついて説明する。
【0042】生成される複数の論理規則は、互いに矛盾
することなく、かつ、できる限り冗長性を排して簡略化
された形で構成される。事例データ記憶手段40には、
「第1の文字認識手段21の第1の仮の文字認識結果が
1、第2の文字認識手段22の第2の仮の文字認識結
果がC2,・・・、第Nの文字認識手段2Nの第Nの仮
の文字認識結果がCNのときに正解はDであった」とい
うような、条件属性と決定属性の対が多数格納されてい
る。これらの事例(その件数をL件とする)は次の表1
のような形式で事例データ記憶部40に格納されてい
る。
【0043】
【表1】 上記のような事例データベースを、本明細書では、決定
表と呼ぶことにする。これらの事例は、予め準備したL
個の文字画像データを第1乃至第Nの文字認識手段21
〜2Nに入力して、第1乃至第Nの仮の文字認識結果を
得ることによって作成することができる。決定表を基に
して、論理規則生成手段50における論理規則生成は、
以下のような手順で行われる。
【0044】1)個々の事例間で矛盾がないかどうか、
つまり同じ条件属性で異なる決定属性を持つような事例
がないかどうかを調べ、矛盾がある場合にはその矛盾が
解消されるように事例間で調整を行う。すなわち、同一
の条件属性を持つ事例を決定属性ごとに計数し、度数最
大となる事例の度数とそれ以外の事例の度数の比が一定
値より大きければ、その事例だけを残し、他を削除す
る。そうでなければ、すべての事例を削除する。
【0045】2)条件属性も決定属性も完全に一致する
事例が複数あれば、1つを残し他を削除する。
【0046】3)条件属性C1,C2,・・・、CNを一
つずつ順に取り除いてみて、もしも決定表全体で矛盾が
生じなければ、その条件属性は取り除く。矛盾が生じれ
ば、その条件属性は決定表に戻す。
【0047】4)条件属性の個々の値cij(i=1,
2,・・・、N;j=1,2,・・・、L)を一つずつ
取り除いてみて、もしも決定表全体で矛盾が生じなけれ
ば、その条件属性の値を不要である可能性がある属性値
として記憶する。矛盾が生じれば、その条件属性の値は
決定表に戻す。
【0048】5)前段で記憶された不要である可能性が
ある条件属性値を1つずつ順に戻してみて、対応する事
例が決定表内で独立かつ真であれば、それをもとの事例
から得られる論理規則として記憶する。
【0049】6)記憶されたすべての論理規則をIF−
THEN規則に書き換える。つまり、取り除かれずに残
った条件属性の値のみを論理積で結合し、IF((Ci
=cil)〓(Cj=cjl)〓・・・〓(Ck=ckl))T
HEN(D=dl)として記憶する。
【0050】上記の手続きについて簡単な具体例を用い
て説明する。図3は4個の文字認識手段に関する9個の
事例を示した決定表である。
【0051】まず、手順1に従い、決定表内の矛盾を解
決する。
【0052】図3では、事例4と事例5が、また事例7
と事例8でそれぞれ矛盾が発生している。事例4と事例
5のどちらを選ぶかについていは、この場合は度数1で
等しいので、一方だけを選ぶことはできない。従って事
例4と事例5を決定表から除く。なお、どちらかの度数
が他方に対して十分大きいときは、大きい方を選べば良
い。事例7と事例8についていも双方を決定表から除
く。結果として、図4に示すうように、事例1,2,
3,6,9が残る。削除された事例4,5,7,8は別
表に記憶しておく。
【0053】手順2では、条件属性も決定属性も等しい
事例を決定表から除く。但し、ここでは、該当する事例
がない(いかなる2つの事例をとっても少なくとも1つ
の条件属性の値が異なる)ので、何もしないこととす
る。
【0054】事例3では、条件属性C1,C2,・・・、
Nのうち不要なものを探す。
【0055】まず、まずC1が欠けたとする。この場
合、事例2と事例3との間に矛盾が生じるので、C1
必要な属性である。また、C2が欠けたとする。この場
合、事例6と手順1において矛盾する事例として除いた
事例8との間に矛盾が発生するので、C2も必要な属性
である。
【0056】同様にしてC3を調べると、C3が欠けても
矛盾は発生しない。したがって、ここでC3を除く。結
果として、図5に示すような、決定表が得られる。続い
て、C4を除いた場合を調べると、事例9と手順1にお
いて矛盾する事例として除いた事例7との間で矛盾が生
ずる。したがって、C4は必要な属性であるので、除か
ない。
【0057】手順4では、手順3で得られた決定表の中
の属性の値をすべて調べ、不要となる可能性のあるもの
を記憶する。
【0058】まず事例1の条件属性C1の値‘7’を除
いてみる。残った属性値C2=‘7’とC4=‘7’およ
び決定属性値D=‘7’は他の事例と矛盾しない。した
がって、事例1の条件属性C1の値‘7’は不要である
可能性がある。次に、事例1の条件属性値を元に戻し、
事例1の条件属性C2の値‘7’を除いてみる。この場
合も同様に他の事例との矛盾が生じないので、事例1の
条件属性C2は不要である可能性がある。事例1の条件
属性C4の値‘7’についても同様である。
【0059】次に事例2の条件属性C1の値‘7’を除
いてみると、この事例2が事例3と矛盾する。したがっ
て、事例2の条件属性C2の値‘7’は必要である。
【0060】このようにして、不要である可能性の持つ
属性値をすべて記憶ずる。結果として図6を得る。図6
の表でブランクを入れた項目が、不要である可能性があ
る。
【0061】手順5では、手順4において不要である可
能性があるとして記憶された属性値、すなわち図6の表
でブランクとなった属性値を順に1つずつ決定表に戻し
てみて、対応する事例が論理規則としての真偽を調べ、
真であれば論理規則として記憶する。
【0062】まず事例1の条件属性C1の値‘7’を決
定表に戻してみると、事例1はC1=‘7’とD=
‘7’で表される。これは決定表内の他の事例2,3,
6,9と矛盾しないので真である。したがって、C1
‘7’とD=‘7’を論理規則1として記憶する。
【0063】次に、事例1の条件属性C1を再びブラン
クにし、事例1の条件属性C2の値‘7’を戻してみ
る。すると、事例1はC2=‘7’とD=‘7’で表さ
れるが、これは事例3と矛盾するので、論理規則として
は採用しない。次の条件属性C4の値‘7’を戻した場
合も同様に採用されない。
【0064】次に、事例2の条件属性C2の値‘7’を
決定表に戻してみると、事例2はC1=‘7’,C2
‘7’とD=‘7’で表される。これは他の事例と矛盾
しないので、論理規則2として採用される。
【0065】以下同様にして、無矛盾な論理規則を順次
記憶していくことで、図7の表を得る。
【0066】更に、図7の表の中から独立なもののみを
残して他を削除する。ある論理規則から他の論理規則が
導出可能なとき、導出される論理規則を削除する。
【0067】図7では、論理規則1を仮定したときに常
に真となる論理規則2および論理規則2’を削除する。
結果として図8に示すような論理規則を得る。
【0068】手順6で、これらの論理規則をIF−TH
EN規則で表す。それを、下記の表2に示す。
【0069】
【表2】 上記の例の場合、認識結果統合手段30は、これらの7
つの論理規則を検証するのみで、4つの仮の文字認識結
果を統合する。これらの論理規則に当てはまらない仮の
文字認識結果が第1乃至第Nの文字認識手段21〜2N
より得られた場合は、認識結果統合手段30はすべての
認識結果を棄却する。但し、実際応用上は多数の学習デ
ータを使用して初期決定表を作成して論理規則の学習を
行うので、棄却となるケースはほとんどない。
【0070】また、上記の例における第2の論理規則の
ように、決定属性として個々の文字認識手段21〜2N
に一度も現れていない条件属性(認識結果)が採用され
ていることがある。これは直感に反するように思われる
が、事例データにそのような論理的傾向が存在するとい
う意味であり、誤りではない。この現象は文字認識手段
の中に極めて特異な特性を持つものがある場合や、学習
用の事例データが少ない場合にみられる。
【0071】上の例で得られた論理規則では、第3の文
字認識手段23から出力される第3の仮の文字認識結果
3が全く参照されていない。これは、第3の文字認識
手段23は文字認識装置の構成要素として不要だという
ことを意味する。このように装置構成の上で認識性能に
寄与せず、処理量増加の原因にしかなっていないような
不要な文字認識手段が発見された場合は、その文字認識
手段を文字認識装置から取り除く。
【0072】図9を参照して、本発明の第2の実施の形
態に係る文字認識装置について説明する。第2の実施の
形態に係る文字認識装置も、上述した第1の実施の形態
と同様に、画像記憶手段10と、第1乃至第N(Nは2
以上の整数)の文字認識手段21,22、・・・、2N
と、認識結果統合手段30Aと、事例データ記憶手段4
0と、論理記憶生成手段50Aとを備えている。
【0073】画像記憶手段10は、入力された文字画像
を光学センサ(図示せず)で取り込んで格納する。第1
乃至第Nの文字認識手段21〜2Nは、画像記憶手段1
0より受け取った文字画像を仮に認識し、それぞれ、第
1乃至第Nの仮の文字認識結果を出力する。第1乃至第
Nの仮の文字認識結果は、文字コードのセットを示して
いる。認識結果統合手段30Aは、第1乃至第Nの文字
認識手段21〜2Nが出力する第1乃至第Nの仮の文字
認識結果(即ち、文字コードのセット)を受け取って、
後述するような論理規則に従って、第1乃至第Nの仮の
文字認識結果を統合し、複数の最終的な文字認識結果を
出力する。
【0074】事例データ記憶手段40は、認識結果統合
手段30Aにおいて使用される論理規則を構成する際の
学習サンプルである事例データを格納する。論理規則生
成手段50Aは、事例データ記憶手段40に記憶された
事例データを後述するように処理し、認識結果統合手段
30Aにおいて使用される論理規則を生成する。
【0075】尚、この技術分野において周知のように、
各文字認識手段において文字認識を行う場合には、入力
画像に対して前処理を行うのが一般的である。そのよう
な前処理としては、多値画像をより扱いやすい2値画像
に変換する2値化処理、文字の大きさやストロークの間
隔、傾き等を整形する正規化処理、画像中の細かな汚れ
やかすれを除くノイズ除去処理などが考えられる。ここ
では図示しないが、必要に応じて導入しても良い。ま
た、これらの前処理は前後関係を問わず、任意の順序で
適用することができる。
【0076】次に、図9に示した第2の実施の形態に係
る文字認識装置の動作について説明する。
【0077】入力画像はスキャナ等(図示せず)によっ
て光学的に入力され、画像記憶手段10に格納され、さ
らに、第1乃至第Nの文字認識装置21〜2Nへと送ら
れる。
【0078】第1乃至第Nの文字認識装置21〜2N
は、それぞれ異なる手順に従って文字画像を認識し、第
1乃至第Nの仮の文字認識結果を出力する。尚、各文字
認識手段は、画像記憶手段から受け取った文字画像に対
して、必要であれば上述した前処理を施し、文字画像か
ら文字の識別に必要ないくつかの特徴量を抽出し、それ
らと辞書(図示せず)に登録された参照特徴とを比較
し、尤も類似していると判断される参照特徴に対応する
文字コードを出力する。
【0079】なお、ここでは各々の文字認識手段は、た
だ1つの仮の文字認識結果、すなわち、第1位候補を出
力しているとして説明するが、例えば、第1位から第5
位までの認識候補を出力するというように、いくつかの
文字コードを出力していも良い。その場合は、第1位か
ら第5位までのそれぞれの認識候補を別個の文字認識手
段から出力された1つずつの仮の文字認識記結果と考え
て、これ以降の処理を同様の手順で行えば良い。
【0080】それぞれの文字認識手段は、前処理や特徴
抽出、識別の内部における処理内容が異なり、したがっ
て文字認識の出力傾向がある程度異なる。例えば、特徴
抽出で画像各部の濃淡パターンを抽出するものと、文字
の輪郭の方向を抽出するもののように、特徴抽出処理全
体の内容が異なるとか、あるいは前処理の中の2値化処
理における閾値パラメータの値が異なるなどの部分的な
差異でも良い。
【0081】認識結果統合手段30Aは、前述した第1
の実施の形態と同様に、第1乃至第Nの文字認識手段2
1〜2Nから、第1乃至第Nの仮の文字認識結果
(C1,C2,・・・,CN)を、つまり条件属性を受け
取り、確信の高い順に複数の文字認識結果D1,D2,・
・・およびそれらに対応する確信度Q1,Q2,・・・
を、つまり決定属性を出力する。認識結果統合手段30
Aは、(C1,C2,・・・、CN)とD1,D2,・・・
およびQ1,Q2,・・・の関係に関わるいくつかの論理
規則を記憶しており、第1乃至第Nの文字認識手段21
〜2Nより受け取った第1乃至第Nの仮の文字認識結果
にこれらの論理規則を適用することによって、複数の最
終的な文字認識結果を順位づけして出力する。
【0082】ここに論理規則は、IF PC THEN
Dと表される。そして、PCは条件属性に関する基本
命題Ci=c(i=1,2,・・・、Nかつcは実際の
文字コード)、またはそれらのいくつかを論理積〓およ
び論理和〓で連結した命題であり、PDは確信度によっ
て順位づけされた複数の文字認識結果を表す命題(D1
=d1,Q1=q1)〓(D2=d2,Q2=q2)〓・・・
(diは実際の文字コード、qiはその文字コードに対す
る確信度である。
【0083】たとえば、IF((C1=‘A’)〓
((C4=‘B’)〓(C5=‘A’)))THEN(D
1=‘A’,Q1=0.8)〓(D2=‘B’=0.2)
という論理規則は、「第1の文字認識手段21から出力
される第1の仮の文字認識結果C1と第5の文字認識手
段25から出力される第5の仮の文字認識結果C5
‘A’であり、かつ第4の文字認識手段24から出力さ
れる第4の仮の文字認識結果C4が‘B’であれば、文
字認識結果は確信度0.8で‘A’、確信度0.2で
‘B’である」という規則を表す。
【0084】このように、認識結果統合手段30Aは、
確信度つきで複数の文字認識結果を、確信度によって順
位づけされた複数の文字認識結果を表す命題PDの形式
で出力する。
【0085】次に、認識結果統合手段30Aが用いる論
理規則を、事前に事例データ記憶手段40に格納された
事例データから学習する、認識規則生成手段50Aの動
作について説明する。
【0086】生成される複数の論理規則は、互いに矛盾
することなく、かつできる限り冗長性を排して簡略化さ
れた形で構成される。事例データ記憶手段40には、
「第1の文字認識手段21の第1の仮の文字認識結果が
1、第2の文字認識手段22の第2の仮の文字認識結
果がC2,・・・、第Nの文字認識手段2Nの第Nの仮
の文字認識結果がCNのときに正解はDであった」とい
うような、条件属性と確信度のつかない単純な決定属性
の対が多数格納されている。これらの事例(その件数を
L件とする)は次の表3のような形式で事例データ記憶
部40に格納されている。
【0087】
【表3】 上記のような事例データベースを、本明細書では、決定
表と呼ぶことにする。これらの事例は、予め準備したL
個の文字画像データを第1乃至第Nの文字認識手段21
〜2Nに入力して、第1乃至第Nの仮の文字認識結果を
得ることによって作成することができる。決定表を基に
して、論理規則生成手段50Aにおける論理規則生成
は、以下のような手順で行われる。
【0088】1)すべての事例を条件属性の組(C1
2,・・・、CN)別に分類する。そして、それぞれの
条件属性について、以下の手続きを行う。
【0089】i)決定属性Dごとに出現回数を数え、度
数ヒストグラムを作成する。着目する条件属性について
m種類の決定属性が存在するとして、決定属性の値(文
字コード)をd1,d2,・・・、dm、それらに対応す
る度数をq’1,q’2,・・・、q’mとおく。
【0090】ii)決定属性の値di(i=1,2,・・
・、m)に対する確信度qiを、qi=q’i/(q’1
q’2+・・・+q’m)によって計算する。
【0091】iii)確信度によって順位づけされた複数
の文字認識結果を表す決定属性((D1=d1,Q1
1)〓(D2=d2,Q2=q2)〓・・・〓(Dm
m,Qm=qm))とする。
【0092】2)条件属性C1,C2,・・・、CNを一
つずつ順に取り除いてみて、もしも決定表全体で矛盾が
生じなければ、その条件属性は取り除く。矛盾が生じれ
ば、その条件属性は決定表に戻す。
【0093】3)条件属性の個々の値cij(i=1,
2,・・・、N,j=1,2,・・・、L)を一つずつ
取り除いてみて、もしも決定表全体で矛盾が生じなけれ
ば、その条件属性の値を不要である可能性がある属性値
として記憶する。矛盾が生じれば、その条件属性の値は
決定表に戻す。
【0094】4)前段で記憶された不要である可能性が
ある条件属性値を1つずつ順に戻してみて、対応する事
例が決定表内で独立かつ真であれば、それをもとの事例
から得られる論理規則として記憶する。
【0095】5)記憶されたすべての論理規則をIF−
THEN規則に書き換える。つまり、取り除かれずに残
った条件属性の値のみを論理積で結合し、IF((Ci
=cil)〓(Cj=cjl)〓・・・〓(Ck=ckl))T
HEN(D1=d1,Q1=q1)〓(D2=d2,Q2
2)〓・・・)として記憶する。
【0096】本発明の第2の実施の形態では、手順1に
よって事例データ間の矛盾が解決された新たな決定表が
次の表4に示す形式で作成される。
【0097】
【表4】 この新しい決定表から論理規則を生成する手順2〜5
は、前述した第1の実施の形態の手順3〜6と同様で、
不要な条件属性を削除し、不要である可能性のある条件
属性の値を探索して記憶し、それら不要である可能性の
ある条件属性の値を1つずつ決定表に戻して検証しなが
ら論理規則を抽出し、決定表の形で得られた論理規則を
IF−THEN規則の形に表す。
【0098】次に、本発明の第3の実施の形態について
図面を参照して説明する。
【0099】図10を参照すると、本発明の第3の実施
の形態は、文字認識プログラムを記録した記録媒体60
を備える。ここで、この記録媒体60は、CD−RO
M、磁気ディスク、半導体メモリその他の記録媒体であ
って、ネットワークを介して利用される場合も含む。
【0100】文字認識プログラムは、記録媒体60から
データ処理装置70に読み込まれ、データ処理装置70
の動作を制御する。データ処理装置70は、文字認識プ
ログラムの制御により、複数の文字認識手段を用いて画
像記憶手段10に入力(記憶)された文字画像を認識
し、それら複数の仮の文字認識結果を論理規則に従って
統合して最終的な文字認識結果を出力する。
【0101】また、事例データ記憶手段40に各々の文
字認識手段の仮の文字認識結果と正解との対の形式で記
憶された事例データより、複数の仮の文字認識結果を統
合する際の論理規則を学習によって獲得する。
【0102】本第3の実施の形態における第1の実施例
としては、データ処理装置70は、文字認識プログラム
の制御により、図1に示した第1の実施の形態における
第1乃至第Nの文字認識手段21,22、・・・、2
N、認識結果統合手段30、および論理規則生成手段5
0による処理と同一の処理を実行して、統合した文字認
識結果として単一の最終的な文字認識結果を出力する。
【0103】また、第3の実施の形態における第2の実
施例としては、データ処理装置70は、文字認識プログ
ラムの制御により、図9に示した第2の実施の形態にお
ける第1乃至第Nの文字認識手段21,22、・・・、
2N、認識結果統合手段30A、および論理規則生成手
段50Aによる処理と同一の処理を実行して、統合した
文字認識結果として順序づけされた複数の最終的な文字
認識結果を出力する。
【0104】尚、本発明は、上述した実施の形態に限定
されず、本発明の要旨を脱逸脱しない範囲内で種々の変
更が可能なのはいうまでもない。例えば、上述した実施
の形態では、文字認識装置についてのみ説明している
が、他のパターン認識装置にも適用できるのは勿論であ
る。ここで、文字以外の「パターン」としては、音声、
味、香り、匂い等が考えられる。
【0105】
【発明の効果】以上説明したように、本発明によれば、
任意の複数個の文字認識手段を用いて得られた複数の仮
の文字認識結果を統合して統合した文字認識結果を出力
しようとする際、変形が頻繁に起こるため、あるいは類
似文字が存在するために誤りやすい文字や、逆に誤りが
少ない文字などといった文字の種類に適応して、論理的
な規則によって適切に複数の仮の文字認識結果を統合で
き、誤りの少ない文字認識を実現できる。
【0106】また、過去の事例データからの学習によ
り、できる限り簡略化された論理規則を獲得できるた
め、処理時間の短縮が可能となる。
【0107】さらに、他の文字認識手段に包含されてい
るなどして有益な情報を出力できていない文字認識結手
段があった場合にも、これを発見して文字認識装置から
取り除くことができるので、大幅な処理時間の短縮が可
能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態による文字認識装置
の機能的な構成を示すブロック図である。
【図2】文字の誤り方がその字種に依存する例を示す文
字画像の図である。
【図3】いくつかの文字を文字認識手段で認識させた際
の事例データベースの例(決定表)を示す図である。
【図4】決定表内の無矛盾な事例とそれ以外の事例への
分割例を示す図である。
【図5】決定表に従い不要な文字認識手段を削除する例
を示す図である。
【図6】個々の文字認識手段の仮の文字認識結果から不
要である可能性のあるものを消去する例を示す図であ
る。
【図7】事例データベースから得られた論理規則の例を
決定表の形式で示す図である。
【図8】事例データベースから得られた最も簡略化され
た論理規則の例を示す図である。
【図9】本発明の第2の実施の形態による文字認識装置
の機能的な構成を示すブロック図である。
【図10】本発明の第3の実施の形態による、文字認識
プログラムを記録した記録媒体を備える情報処理装置の
構成を示すブロック図である。
【符号の説明】
10 画像記憶手段 21,22、・・・、2N 文字認識手段 30,30A 認識結果統合手段 40 事例データ記憶手段 50,50A 論理規則生成手段 60 記録媒体 70 データ処理装置
フロントページの続き (56)参考文献 特開 平7−271899(JP,A) 特開 平9−204490(JP,A) 特開 昭56−60980(JP,A) 特開 平2−21383(JP,A) 特開 平9−282418(JP,A) 特開 平6−348900(JP,A) 特開 平10−78999(JP,A) 特開 平8−272907(JP,A) 特開 昭60−254285(JP,A) 特開 平6−131498(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/03 G06K 9/62 G06K 9/68

Claims (19)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字画像を入力して記憶する画像記憶手
    段と、 前記画像記憶手段から得た文字画像を認識するための異
    なる複数の文字認識手段と、 前記複数の文字認識手段から得られる複数の仮の文字認
    識結果を、当該仮の文字認識結果に特定の文字が現れる
    という条件を論理積や論理和で統合した条件式に基づい
    て統合した文字認識結果を決定するような論理規則を用
    いることによって統合して、統合した文字認識結果を出
    力する認識結果統合手段と、 該認識結果統合手段において使用される前記所定の論理
    規則を構成する際の学習サンプルとしての事例データを
    記憶する事例データ記憶手段と、 該事例データ記憶手段に記憶された前記事例データから
    学習して前記所定の論理規則を生成する論理規則生成手
    段とを備えた文字認識装置であって、 前記事例データは、前記複数の文字認識手段の出力する
    仮の文字認識結果と正解との対として与えられており、 前記認識結果統合手段において適用される論理規則が前
    記事例データから学習により獲得される際、前記個々の
    文字認識手段の要不要や、個々の文字認識手段の出力す
    る個々の仮の文字認識結果の要不要を順次判定し、事例
    データを逐次的に簡略化してゆくことによって単純な論
    理規則を生成することを特徴とする文字認識装置。
  2. 【請求項2】 文字画像を入力して記憶する画像記憶手
    段と、 前記画像記憶手段から得た文字画像を認識するための異
    なる複数の文字認識手段と、 前記複数の文字認識手段から得られる複数の仮の文字認
    識結果を、当該仮の文字認識結果に特定の文字が現れる
    という条件を論理積や論理和で統合した条件式に基づい
    て統合した文字認識結果を決定するような論理規則を用
    いることによって統合して、統合した文字認識結果を出
    力する認識結果統合手段と、 該認識結果統合手段において使用される前記所定の論理
    規則を構成する際の学習サンプルとしての事例データを
    記憶する事例データ記憶手段と、 該事例データ記憶手段に記憶された前記事例データから
    学習して前記所定の論理規則を生成する論理規則生成手
    段とを備えた文字認識装置であって、 前記事例データは、前記複数の文字認識手段の出力する
    仮の文字認識結果と正解との対として与えられており、 前記認識結果統合手段において適用される論理規則が前
    記事例データより学習により獲得される際、前記個々の
    文字認識手段の要不要を判定し、不要な文字認識手段が
    発見された場合にその文字認識手段を除去することによ
    り必要な文字認識手段の選択を行うことを特徴とする文
    字認識装置。
  3. 【請求項3】 文字画像を入力して記憶する画像記憶手
    段と、 前記画像記憶手段から得た文字画像を認識するための異
    なる複数の文字認識手段と、 前記複数の文字認識手段から得られる複数の仮の文字認
    識結果を、当該仮の文字認識結果に特定の文字が現れる
    という条件を論理積や論理和で統合した条件式に基づい
    て統合した文字認識結果を決定するような論理規則を用
    いることによって統合して、統合した文字認識結果を出
    力する認識結果統合手段と、 該認識結果統合手段において使用される前記所定の論理
    規則を構成する際の学習サンプルとしての事例データを
    記憶する事例データ記憶手段と、 該事例データ記憶手段に記憶された前記事例データから
    学習して前記所定の論理規則を生成する論理規則生成手
    段とを備えた文字認識装置であって、 前記事例データは、前記複数の文字認識手段の出力する
    仮の文字認識結果と正解との対として与えられており、 前記認識結果統合手段において適用される前記論理規則
    が前記事例データより学習により獲得される際、いくつ
    かの事例データ間で矛盾があった場合、それらの事例の
    正解ごとに計数される事例データの個数により事例ごと
    の頻度を評価し、事例を取捨選択することにより矛盾を
    解決することを特徴とする文字認識装置。
  4. 【請求項4】 前記いくつかの事例データ間で矛盾があ
    った場合とは、文字認識手段が出力する仮の文字認識結
    果に対して複数の異なる正解が与えられている場合であ
    る、請求項3に記載の文字認識装置。
  5. 【請求項5】 文字画像を入力して記憶する画像記憶手
    段と、 前記画像記憶手段から得た文字画像を認識するための異
    なる複数の文字認識手段と、 前記複数の文字認識手段から得られる複数の仮の文字認
    識結果を、当該仮の文字認識結果に特定の文字が現れる
    という条件を論理積や論理和で統合した条件式に基づい
    て統合した文字認識結果を決定するような論理規則を用
    いることによって統合して、統合した文字認識結果を出
    力する認識結果統合手段と、 該認識結果統合手段において使用される前記所定の論理
    規則を構成する際の学習サンプルとしての事例データを
    記憶する事例データ記憶手段と、 該事例データ記憶手段に記憶された前記事例データから
    学習して前記所定の論理規則を生成する論理規則生成手
    段とを備えた文字認識装置であって、 前記事例データは、前記複数の文字認識手段の出力する
    仮の文字認識結果と正解との対として与えられており、 前記認識結果統合手段において適用される前記論理規則
    が前記事例データより学習により獲得される際、事例が
    示す文字認識結果の間に矛盾があった場合、それらの事
    例の正解ごとに計数される事例データの個数により事例
    ごとの頻度を評価することによって事例ごとの重みを計
    算し、それらの重みによって順位づけられた複数の文字
    認識結果を含む1つの事例としてまとめることにより矛
    盾を解決することを特徴とする文字認識装置。
  6. 【請求項6】 前記事例が示す文字認識結果の間に矛盾
    があった場合とは、文字認識手段が出力する仮の文字認
    識結果に対して複数の異なる正解が与えられている場合
    である、請求項5に記載の文字認識装置。
  7. 【請求項7】 前記認識結果統合手段が、前記複数の仮
    の文字認識結果を統合する際に、前記論理規則を用いる
    ことにより、前記統合した文字認識結果として、単一の
    文字認識結果を含んだ、確信度を付与されて順位づけら
    れた複数の文字認識結果の文字コードを出力することを
    特徴とする請求項1乃至6のいずれかに記載の文字認識
    装置。
  8. 【請求項8】 文字画像を入力して記憶する画像記憶手
    段と、前記画像記憶手段から得た文字画像を認識するた
    めの異なる複数の文字認識手段と、前記複数の文字認識
    手段から得られる複数の仮の文字認識結果を、当該仮の
    文字認識結果に特定の文字が現れるという条件を論理積
    や論理和で統合した条件式に基づいて統合した文字認識
    結果を決定するような論理規則を用いることによって統
    合して、統合した文字認識結果を出力する認識結果統合
    手段とを備えた文字認識装置における学習方法であっ
    て、 前記認識結果統合手段において適用される論理規則が、
    前記複数の文字認識手段の出力する仮の文字認識結果と
    正解との対として与えられたいくつかの事例データから
    学習によって獲得されるものであり、 前記論理規則が前記事例データから学習により獲得され
    る際、前記個々の文字認識手段の要不要や、個々の文字
    認識手段の出力する個々の仮の文字認識結果の要不要を
    順次判定し、事例データを逐次的に簡略化してゆくこと
    によって単純な論理規則を生成することを特徴とする学
    習方法。
  9. 【請求項9】 文字画像を入力して記憶する画像記憶手
    段と、前記画像記憶手段から得た文字画像を認識するた
    めの異なる複数の文字認識手段と、前記複数の文字認識
    手段から得られる複数の仮の文字認識結果を、当該仮の
    文字認識結果に特定の文字が現れるという条件を論理積
    や論理和で統合した条件式に基づいて統合した文字認識
    結果を決定するような論理規則を用いることによって統
    合して、統合した文字認識結果を出力する認識結果統合
    手段とを備えた文字認識装置における学習方法であっ
    て、 前記認識結果統合手段において適用される論理規則が、
    前記複数の文字認識手段の出力する仮の文字認識結果と
    正解との対として与えられたいくつかの事例データから
    学習によって獲得されるものであり、 前記認識結果統合手段において適用される論理規則が前
    記事例データより学習により獲得される際、前記個々の
    文字認識手段の要不要を判定し、不要な文字認識手段が
    発見された場合にその文字認識手段を除去することによ
    り必要な文字認識手段の選択を行うことを特徴とする学
    習方法。
  10. 【請求項10】 文字画像を入力して記憶する画像記憶
    手段と、前記画像記憶手段から得た文字画像を認識する
    ための異なる複数の文字認識手段と、前記複数の文字認
    識手段から得られる複数の仮の文字認識結果を、当該仮
    の文字認識結果に特定の文字が現れるという条件を論理
    積や論理和で統合した条件式に基づいて統合した文字認
    識結果を決定するような論理規則を用いることによって
    統合して、統合した文字認識結果を出力する認識結果統
    合手段とを備えた文字認識装置における学習方法であっ
    て、 前記認識結果統合手段において適用される論理規則が、
    前記複数の文字認識手段の出力する仮の文字認識結果と
    正解との対として与えられたいくつかの事例データから
    学習によって獲得されるものであり、 前記認識結果統合手段におい適用される前記論理規則が
    前記事例データより学習により獲得される際、いくつか
    の事例データ間で矛盾があった場合、それらの事例の正
    解ごとに計数される事例データの個数により事例ごとの
    頻度を評価し、事例を取捨選択することにより矛盾を解
    決することを特徴とする学習方法。
  11. 【請求項11】 前記いくつかの事例データ間で矛盾が
    あった場合とは、文字認識手段が出力する仮の文字認識
    結果に対して複数の異なる正解が与えられている場合で
    ある、請求項10に記載の学習方法。
  12. 【請求項12】 文字画像を入力して記憶する画像記憶
    手段と、前記画像記憶手段から得た文字画像を認識する
    ための異なる複数の文字認識手段と、前記複数の文字認
    識手段から得られる複数の仮の文字認識結果を、当該仮
    の文字認識結果に特定の文字が現れるという条件を論理
    積や論理和で統合した条件式に基づいて統合した文字認
    識結果を決定するような論理規則を用いることによって
    統合して、統合した文字認識結果を出力する認識結果統
    合手段とを備えた文字認識装置における学習方法であっ
    て、 前記認識結果統合手段において適用される論理規則が、
    前記複数の文字認識手段の出力する仮の文字認識結果と
    正解との対として与えられたいくつかの事例データから
    学習によって獲得されるものであり、 前記認識結果統合手段において適用される前記論理規則
    が前記事例データより学習により獲得される際、事例が
    示す文字認識結果の間に矛盾があった場合、それらの事
    例の正解ごとに計数される事例データの個数により事例
    ごとの頻度を評価することによって事例ごとの重みを計
    算し、それらの重みによって順位づけられた複数の文字
    認識結果を含む1つの事例としてまとめることにより矛
    盾を解決することを特徴とする学習方法。
  13. 【請求項13】 前記事例が示す文字認識結果の間に矛
    盾があった場合とは、文字認識手段が出力する仮の文字
    認識結果に対して複数の異なる正解が与えられている場
    合である、請求項12に記載の学習方法。
  14. 【請求項14】 コンピュータ上で動作する文字認識プ
    ログラムを記憶した記録媒体であって、 文字画像を入力して記憶するステップと、 この記憶した文字画像を認識して、互いに異なる仮の文
    字認識結果を出力する複数のステップと、 該仮の文字認識結果に特定の文字が現れるという条件を
    論理積や論理和で統合した条件式に基づいて統合した文
    字認識結果を決定するような論理規則を用いて前記複数
    の仮の文字認識結果を統合して、統合した文字認識結果
    を出力するステップと、 を備える文字認識プログラムを記録した記録媒体におい
    て、 前記文字認識結果を出力するステップにおいて適用され
    る論理規則が、前記複数の仮の文字認識結果を出力する
    ステップにおける出力である仮の文字認識結果と正解と
    の対として与えられたいくつかの事例データから学習に
    よって獲得されるものであり、 前記論理規則が前記事例データから学習により獲得され
    る際、前記仮の文字認識結果を出力するステップの個々
    の要不要や、夫々の仮の文字認識結果を出力するステッ
    プにおける仮の文字認識結果の要不要を順次判定し、事
    例データを逐次的に簡略化してゆくことによって単純な
    論理規則を生成するステップを有する学習プログラムを
    更に記録したことを特徴とする記録媒体。
  15. 【請求項15】 コンピュータ上で動作する文字認識プ
    ログラムを記憶した記録媒体であって、 文字画像を入力して記憶するステップと、 この記憶した文字画像を認識して、互いに異なる仮の文
    字認識結果を出力する複数のステップと、 該仮の文字認識結果に特定の文字が現れるという条件を
    論理積や論理和で統合した条件式に基づいて統合した文
    字認識結果を決定するような論理規則を用いて前記複数
    の仮の文字認識結果を統合して、統合した文字認識結果
    を出力するステップと、 を備える文字認識プログラムを記録した記録媒体におい
    て、 前記文字認識結果を出力するステップにおいて適用され
    る論理規則が、前記複数の仮の文字認識結果を出力する
    ステップにおける出力である仮の文字認識結果と正解と
    の対として与えられたいくつかの事例データから学習に
    よって獲得されるものであり、 前記論理規則が前記事例データより学習により獲得され
    る際、前記仮の文字認識結果を出力するステップの個々
    の要不要を判定し、不要な前記仮の文字認識結果を出力
    するステップが発見された場合に、その不要な前記仮の
    文字認識結果を出力するステップを除去することにより
    必要な前記仮の文字認識結果を出力するステップの選択
    を行うステップを有する学習プログラムを更に記録した
    ことを特徴とする記録媒体。
  16. 【請求項16】 コンピュータ上で動作する文字認識プ
    ログラムを記憶した記録媒体であって、 文字画像を入力して記憶するステップと、 この記憶した文字画像を認識して、互いに異なる仮の文
    字認識結果を出力する複数のステップと、 該仮の文字認識結果に特定の文字が現れるという条件を
    論理積や論理和で統合した条件式に基づいて統合した文
    字認識結果を決定するような論理規則を用いて前記複数
    の仮の文字認識結果を統合して、統合した文字認識結果
    を出力するステップと、 を備える文字認識プログラムを記録した記録媒体におい
    て、 前記文字認識結果を出力するステップにおいて適用され
    る論理規則が、前記複数の仮の文字認識結果を出力する
    ステップにおける出力である仮の文字認識結果と正解と
    の対として与えられたいくつかの事例データから学習に
    よって獲得されるものであり、 前記論理規則が前記事例データより学習により獲得され
    る際、いくつかの事例データ間で矛盾があった場合、そ
    れらの事例の正解ごとに計数される事例データの個数に
    より事例ごとの頻度を評価し、事例を取捨選択すること
    により矛盾を解決するステップを有する学習プログラム
    を更に記録したことを特徴とする記録媒体。
  17. 【請求項17】 前記いくつかの事例データ間で矛盾が
    あった場合とは、前記仮の文字認識結果を出力するステ
    ップにおいて出力される仮の文字認識結果に対して複数
    の異なる正解が与えられている場合である、請求項16
    に記載の記録媒体。
  18. 【請求項18】 コンピュータ上で動作する文字認識プ
    ログラムを記憶した記録媒体であって、 文字画像を入力して記憶するステップと、 この記憶した文字画像を認識して、互いに異なる仮の文
    字認識結果を出力する複数のステップと、 該仮の文字認識結果に特定の文字が現れるという条件を
    論理積や論理和で統合した条件式に基づいて統合した文
    字認識結果を決定するような論理規則を用いて前記複数
    の仮の文字認識結果を統合して、統合した文字認識結果
    を出力するステップと、 を備える文字認識プログラムを記録した記録媒体におい
    て、 前記文字認識結果を出力するステップにおいて適用され
    る論理規則が、前記複数の仮の文字認識結果を出力する
    ステップにおける出力である仮の文字認識結果と正解と
    の対として与えられたいくつかの事例データから学習に
    よって獲得されるものであり、 前記論理規則が前記事例データより学習により獲得され
    る際、事例が示す文字認識結果の間に矛盾があった場
    合、それらの事例の正解ごとに計数される事例データの
    個数により事例ごとの頻度を評価することによって事例
    ごとの重みを計算し、それらの重みによって順位づけら
    れた複数の文字認識結果を含む1つの事例としてまとめ
    ることにより矛盾を解決するステップを有する学習プロ
    グラムを更に記録したことを特徴とする記録媒体。
  19. 【請求項19】 前記事例が示す文字認識結果の間に矛
    盾があった場合とは、文字認識手段が出力する仮の文字
    認識結果に対して複数の異なる正解が与えられている場
    合である、請求項18に記載の記録媒体。
JP10080022A 1998-03-26 1998-03-26 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体 Expired - Fee Related JP3095069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10080022A JP3095069B2 (ja) 1998-03-26 1998-03-26 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10080022A JP3095069B2 (ja) 1998-03-26 1998-03-26 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JPH11282964A JPH11282964A (ja) 1999-10-15
JP3095069B2 true JP3095069B2 (ja) 2000-10-03

Family

ID=13706674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10080022A Expired - Fee Related JP3095069B2 (ja) 1998-03-26 1998-03-26 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP3095069B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5003051B2 (ja) * 2006-08-01 2012-08-15 日本電気株式会社 郵便自動区分機及び郵便自動区分方法
JP4869365B2 (ja) * 2009-02-06 2012-02-08 株式会社東芝 画像処理装置および画像処理方法
JP5672953B2 (ja) * 2010-10-26 2015-02-18 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
JP2012138009A (ja) * 2010-12-27 2012-07-19 Kawai Musical Instr Mfg Co Ltd 楽譜認識装置、及びコンピュータプログラム
JP5974576B2 (ja) * 2012-03-26 2016-08-23 富士ゼロックス株式会社 文字認識学習装置、文字認識装置、およびプログラム
JP6060134B2 (ja) * 2014-11-13 2017-01-11 株式会社プリマジェスト 情報処理装置及び情報処理方法
JP2018112839A (ja) 2017-01-10 2018-07-19 富士通株式会社 画像処理プログラム、画像認識プログラム、画像処理装置、画像認識装置、画像認識方法、及び画像処理方法
US11961317B2 (en) * 2021-11-24 2024-04-16 Oracle Financial Services Software Limited Extracting textual information from image documents

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5660980A (en) * 1979-10-24 1981-05-26 Mitsubishi Electric Corp Optical character reader
JP2553608B2 (ja) * 1988-01-04 1996-11-13 住友電気工業 株式会社 光学文字読取装置
JPH07271899A (ja) * 1994-03-31 1995-10-20 Toshiba Corp 文字認識装置
JPH09204490A (ja) * 1996-01-24 1997-08-05 Nippon Telegr & Teleph Corp <Ntt> 文字列入力手段選択方法
JP3375819B2 (ja) * 1996-04-16 2003-02-10 株式会社日立製作所 認識方式複合化方法及びその方法を行う装置

Also Published As

Publication number Publication date
JPH11282964A (ja) 1999-10-15

Similar Documents

Publication Publication Date Title
US7623715B2 (en) Holistic-analytical recognition of handwritten text
EP2943911B1 (en) Process of handwriting recognition and related apparatus
Kuo et al. Keyword spotting in poorly printed documents using pseudo 2-D hidden Markov models
US5787194A (en) System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
KR100248917B1 (ko) 패턴인식장치및방법
US7283669B2 (en) Fine segmentation refinement for an optical character recognition system
US20070065003A1 (en) Real-time recognition of mixed source text
JP2001175811A (ja) 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
US20040146200A1 (en) Segmenting touching characters in an optical character recognition system to provide multiple segmentations
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
Behnke et al. Competitive neural trees for pattern classification
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
JP4066507B2 (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
JP4802176B2 (ja) パターン認識装置、パターン認識プログラム及びパターン認識方法
JP2004171316A (ja) Ocr装置及び文書検索システム及び文書検索プログラム
Cecotti et al. Hybrid OCR combination approach complemented by a specialized ICR applied on ancient documents
Nath et al. Improving various offline techniques used for handwritten character recognition: a review
EP0684576A2 (en) Improvements in image processing
JPH0638276B2 (ja) パターン識別装置
Kim Segmentation-free printed character recognition by relaxed nearest neighbor learning of windowed operator
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP3374793B2 (ja) 高速認識検索システム及びそれに用いる認識検索高速化方法並びにその制御プログラムを記録した記録媒体
JP2024039138A (ja) モデル選択装置、モデル選択方法、及びプログラム
JP3109476B2 (ja) 候補数制御機能付き文字認識装置及び方法
Maghrabi An offline Arabic handwritten character recognition system using template matching

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000705

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070804

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100804

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110804

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120804

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130804

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees