JP2002074266A - 文字読取装置および文字読取方法 - Google Patents

文字読取装置および文字読取方法

Info

Publication number
JP2002074266A
JP2002074266A JP2000271515A JP2000271515A JP2002074266A JP 2002074266 A JP2002074266 A JP 2002074266A JP 2000271515 A JP2000271515 A JP 2000271515A JP 2000271515 A JP2000271515 A JP 2000271515A JP 2002074266 A JP2002074266 A JP 2002074266A
Authority
JP
Japan
Prior art keywords
character
boundary
character recognition
editing
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000271515A
Other languages
English (en)
Inventor
Kazuhiro Ishikawa
和弘 石川
Hiroichi Iwashita
博一 岩下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2000271515A priority Critical patent/JP2002074266A/ja
Publication of JP2002074266A publication Critical patent/JP2002074266A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 複数種類の文字が混在しても正確に文字を読
み取ることのできる文字読取装置および文字読取方法の
提供。 【解決手段】 OCR 10は、たとえば紙等に印刷された情
報をスキャナ12で画像データ22としてイメージメモリ14
に採り込み、イメージメモリ14から読み出した画像デー
タ24を行設定部16で各行の領域を切り出した画像データ
26を文字認識処理部18に供給し、文字認識処理部18の第
1〜第N文字認識エンジン18a 〜18nのそれぞれで複数
種類のアルゴリズムに対応した文字位置で文字の切り出
し、切り出した各文字位置に対する文字認識処理を各エ
ンジンの最も一致性の高い最適な文字認識結果30を選択
して複合編集部20に供給し、複合編集部20ではこの供給
される文字認識結果30を区分する境界文字および/また
は文字位置の関係に応じて分けてそれぞれの文字列を選
択して決定し、選択した文字列を複合合成して最終的な
文字認識結果34を出力させている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字読取装置およ
び方法に関し、複数種類の文字種が混在するなかで、そ
れぞれの文字種を認識して複合的に編集するOCR (Optic
al Character Reader )等に用いて好適なものである。
【0002】
【従来の技術】文字読取装置には、2種類の装置があ
る。第1の装置は、たとえば、漢字やかな等の文字列か
ら文字を切り出して、切り出した文字に対して文字認識
処理を施して、特に、自動的に紙等に印刷された文字を
読み取る文字読取装置である。この装置は、上述したよ
うに漢字やかなを読み取ることから文字の切り出す縦幅
および横幅はほぼ等しいという特徴がある。
【0003】また、漢字は、漢字の構成上において漢字
の左部分をなす字形の「偏」と漢字の右部分をなす
「旁」とで一つの字体を表す。これにより、漢字は一つ
の文字が切り出す幅に応じて複数に分離する場合があ
る。これに対して、第2の装置は、この分離する漢字と
異なり、分離しない数字の特徴を利用して文字の切り出
しを行い、数字を認識する文字認識装置である。
【0004】
【発明が解決しようとする課題】ところで、たとえば、
漢字、かなおよび数字が混在した文字列を読み取らなけ
ればならないことがある。漢字と数字またはかなと数字
の文字切出しの幅がそれぞれ異なることから、第1およ
び第2の装置では、特にそれぞれ混在した文字を正確に
切り出すことができないことがある。これにともなっ
て、文字読取りの誤認識が生じ易くなってしまう。
【0005】これらの問題から文字種が混在している文
字列を読み取る装置も提案されている。しかしながら、
この装置が上述した切り出しを誤る可能性は依然として
残り、現在、より正確な文字の切出しが望まれている。
【0006】本発明はこのような従来技術の欠点を解消
し、処理対象パターンに複数種類の文字パターンが混在
しても正確に文字を読み取ることのできる文字読取装置
および文字読取方法を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は上述の課題を解
決するために、処理対象のパターンから文字を切り出す
複数のアルゴリズムを有する文字切出し手段、および/
またはこのアルゴリズムにより文字読取対象の画像デー
タから切り出した文字を認識してこの文字認識結果を出
力する文字認識手段を含む文字読取手段を用い、この文
字読取手段はアルゴリズムに対応させて複数種類の文字
認識結果を出力させ、この複数種類の文字認識結果に対
して文字認識結果の文字列を編集する際の編集境界を検
出し、この検出した編集境界を基に分けられた各区分領
域に対して複数種類の文字認識結果から対応する種類の
最適な認識結果を選択し、選択した最適な文字認識結果
を合成して最終的な文字認識結果として出力する複合編
集手段とを含むことを特徴とする。
【0008】本発明の文字読取装置は、文字読取手段か
ら供給される複数種類の文字認識結果を複合編集手段に
供給し、複合編集手段ではこれら文字認識結果のなかか
ら編集境界を検出して境界の区分を的確に行い、得られ
た編集境界を基に各区分領域に対して複数種類の文字認
識結果から対応する種類の最適な認識結果を選択して、
各区分領域に適した文字列を選び、選択した最適な文字
認識結果の文字列を合成して最終的な文字認識結果を出
力することにより、処理対象パターンに複数種類の文字
パターンが混在しても最終的な文字認識結果を正確に認
識させることができる。
【0009】また、本発明は上述の課題を解決するため
に、複数のアルゴリズムに従って文字を切り出す第1の
工程と、切り出した文字に対して複数種類の文字認識を
行い、この文字認識結果を出力す第2の工程と、この文
字認識で得られた複数種類の文字認識結果に対して文字
位置の関係を考慮して編集する際の境界を示す編集境界
を検出し、この検出した編集境界で文字認識結果を区分
し、複数種類の文字認識結果から区分した文字列のそれ
ぞれに対して異なる種類の最適な文字認識結果を選択し
て決定し、各区分に対して最も一致性の高い最適な文字
認識結果の文字列を複合編集する第3の工程とを含むこ
とを特徴とする。
【0010】本発明の文字読取方法は、複数種類の文字
認識結果のなかから編集境界を検出し、検出した編集境
界で各文字認識結果を文字列に区分し、区分した文字列
のそれぞれに対して異なる種類の最適な文字認識結果を
選んで決定し、選択した文字列を編集境界を境に合成し
て出力することにより、最終的な文字認識結果に含まれ
る誤認識を大幅に抑制することができる。
【0011】
【発明の実施の形態】次に添付図面を参照して本発明に
よる文字読取装置の実施例を詳細に説明する。
【0012】本発明の文字読取装置は、文字読取部から
供給される複数種類の文字認識結果を複合編集部に供給
し、複合編集部ではこれら文字認識結果のなかから編集
境界を検出して境界の区分を的確に行い、得られた編集
境界を基に各区分領域に対して複数種類の文字認識結果
から対応する種類の最適な認識結果を選択して、各区分
に適した文字列を選び、選択した最適な文字認識結果を
合成して最終的な文字認識結果を出力することに特徴が
ある。
【0013】本発明の文字読取装置は、光学的に紙等の
媒体から文字や図形等を読みとって認識処理を行い、対
応するディジタルデータにするOCR (Optical Character
Reader :以下、OCR という)10に適用した場合につい
て説明する。本実施例は、本発明と直接的に関係のない
部分について図面および説明を省略する。また、信号の
参照符号はその現れる接続線の参照番号を表す。OCR 10
には、スキャナ12、イメージメモリ14、行設定部16、文
字認識処理部18、および複合編集部20が備えられてい
る。以降、各部について説明する。
【0014】スキャナ12には、図示しないが、概略的に
媒体(たとえば原稿)に光を照射する光源と、原稿から
のもどり光を受光する光センサと、原稿側または光源お
よび光センサが一体化した光源ユニットを移動・走査す
る機構がある。スキャナ12は、機構を用いて上述したい
ずれか一方の側を移動・走査することにより、原稿に書
かれた文字や図形などを光電変換して画像データとして
OCR 10に入力している。スキャナ12は、画像データ22を
イメージメモリ14に出力する。
【0015】イメージメモリ14には、供給される画像デ
ータ22を記憶するメモリが含まれる。メモリ容量は、原
稿読取り時における解像度および原稿の大きさ等の条件
に応じて組合せがあり、組合せすべての仕様を満足する
ように複数のメモリが配設されている。イメージメモリ
14は、図示しないシステム制御部から供給される書込み
/読出し制御信号に応じて画像データの入出力を行う。
イメージメモリ14は、画像データ24を行設定部16に出力
する。
【0016】行設定部16には、供給される画像データ24
に対して読取対象の行を設定するとともに、設定に応じ
た行の読取処理も行う機能を有している。この設定の
際、図示しないが、画像データ24は表示部に表示させて
確認しながら行うとよい。このような行方向の確認が行
われることによって画像の行方向が既知の場合、行設定
部16は、画像イメージの行方向に応じて分割線で行を横
切る分割部、分割部で分割した領域ごとに文字列方向の
射影分布を作成する射影作成部、作成した射影分布に基
づいて部分文字列を切り出す部分切出し部、部分文字列
の切出し座標の重複を検出し、重複が検出された部分文
字列に同一を示すラベルを付す重複検出部、およびラベ
ルの同一な分割領域を連結して切り出す領域を設定する
切出し領域決定部を備える(より具体的には特開昭64-4
8186号公報を参照)。
【0017】また、行設定部16には、画像の行方向が不
明の場合、行方向確認切替部、第1方向分割領域生成
部、第2方向分割領域生成部、第1方向射影分布作成
部、第2方向射影分布作成部、第1分割行切出し部、第
2分割行切出し部、行方向判定部、切替出力部、第1修
正部、第2修正部、第1分割行接続部、第2分割行接続
部、および制御部が備えられている(具体的には特開平
11-25218号公報を参照)。
【0018】この場合、行設定部16は、第1および第2
方向射影分布作成部での第1および2方向射影分布に基
づいて切り出された第1および第2分割行の情報を用い
て行方向を判定し、判定結果による行方向に対応する分
割行同士の接続を行っている。行設定部16は、画像デー
タ24を判定した行の領域ごとに切り出したデータ26を文
字認識処理部18に出力する。
【0019】なお、前述したスキャナ12、イメージメモ
リ14、および行設定部16は、OCR 10の外部装置とみな
し、文字認識処理部18およびスペース編集部20がOCR 10
の本体とみなしてもよい。
【0020】文字認識処理部18には、複数の文字認識エ
ンジン (180a〜180n:第1〜第N文字認識エンジンまで
のN 個)が含まれている。各エンジンでは、行設定され
た文字領域(複数の文字が記載されている領域であっ
て、読取対象となる領域)から複数の切出しアルゴリズ
ムが有する特徴情報に基づいて文字を切り出し、切り出
した文字に対して文字認識を行うことによって、複数の
文字認識結果(候補)が得られ、これら複数の文字認識
結果のうち最も一致性の高い文字列を選択して、選択し
た文字認識結果がエンジンから出力される。特徴情報に
は、たとえば、左右に分離可能な文字がない、上下に分
離可能な文字がない、通常よりも小さい微小文字がな
い、上付き文字がない、下付き文字がない、および数字
(0 〜9 )のみが存在する等の項目がある。
【0021】具体的な切出しアルゴリズムについては、
特開2000-57261号公報に記載されている。この文字の切
出し処理を各部のアルゴリズムに沿って行うことにより
文字切出しの精度を向上させている。
【0022】第1文字認識エンジン18a には、第1文字
切出し部180aおよび第1文字認識部182aが備えられてい
る。第1文字切出し部180aには行設定部16によって設定
または抽出した文字領域を行とする画像データ26が供給
される。第1文字切出し部180aは、この行から各文字領
域を、たとえば全角サイズに切り出した画像データ28a
を第1文字認識部182aに出力する。
【0023】第1文字認識部182aでは、それぞれ切り出
した文字の位置情報に基づいて画像データ28a から文字
パターンを抽出し、このエンジンの特徴としてたとえ
ば、ひらがなの認識が十分考慮された文字認識処理を施
すことによって文字認識を行う。この文字認識結果30a
が複合編集部20に供給される。
【0024】第2文字認識エンジン18b には、第2文字
切出し部180bおよび第2文字認識部182bが備えられてい
る。第2文字切出し部180bには行設定部16によって設定
または抽出した文字領域を行とする画像データ26が第1
文字認識エンジン18a と同様に供給される。第2文字切
出し部180bは、この行から各文字領域を、たとえば半角
サイズに切り出した画像データ28b を第2文字認識部18
2bに出力する。
【0025】第2文字認識部182bでは、それぞれ切り出
した文字の位置情報に基づいて画像データ28b から文字
パターンを抽出し、このエンジンの特徴としてたとえ
ば、数字の認識が十分が考慮された文字認識処理を施す
ことによって文字認識を行う。この文字認識結果30b が
複合編集部20に供給される。
【0026】第N文字認識エンジン18n には、第N文字
切出し部180nおよび第N文字認識部182nが備えられてい
る。第N文字切出し部180nでも行設定部16によって設定
または抽出した文字領域を行とする画像データ26が第1
文字認識エンジン18a と同様に供給される。第N文字切
出し部180nは、この行から各文字領域を、たとえば半角
サイズに切り出した画像データ28n を第N文字認識部18
2nに出力する。
【0027】第N文字認識部182nでは、それぞれ切り出
した文字の位置情報に基づいて画像データ28n から文字
パターンを抽出し、このエンジンの特徴としてたとえ
ば、英字の認識が十分が考慮された文字認識処理を施す
ことによって文字認識を行う。この文字認識結果30n が
複合編集部20に供給される。これらN 個の文字認識結果
30a 〜30n が文字認識結果30として複合編集部20に供給
される。
【0028】文字認識処理部18の複数の切出しアルゴリ
ズムに対応するように第1ないし第N文字切出し部180
a, 180b, ・・・, 180n にはそれぞれに文字切出しパター
ン固有の特徴情報を記憶する記憶部を有している。第1
ないし第N文字認識部182a, 182b, ・・・, 182n での文字
認識には、前述したひらがな、数字、英字(アルファベ
ット)だけでなく、漢字、特殊文字および特殊記号等の
文字種やたとえばキリル文字、およびハングル文字のよ
うな各国の文字種等々が認識に用いられる。文字認識
は、各部に内蔵する文字認識用テーブルに記憶された情
報とデータ 28a〜28n との、たとえばパターン認識によ
ってマッチングの高い文字を割り当てて、データに対応
する情報をそれぞれ出力する。
【0029】また、文字認識は、上述した文字種の認識
だけに限定されるものでなく、文字パターンから抽出し
たサブパターンについて得られる特徴量を計算して特徴
マトリクス抽出するようにしてもよい(具体的には特公
昭60-38756号公報を参照)。さらに、文字認識は、文字
切出手段で得られる文字画像中の輪郭の方向ベクトルを
抽出手段で抽出し、記憶手段には認識対象となる文字画
像の標準パターンにおける輪郭の方向ベクトルの加算値
をあらかじめ記憶して、第1のマッチング手段で記憶し
た方向ベクトルの加算値を参照して抽出した方向ベクト
ルとの類似度の高い候補文字を得るようにしてもよい
(具体的には特開平8-263591号公報を参照)。
【0030】なお、文字認識処理部18でのアルゴリズム
は前述した切出しに限定されるものでなく、任意に好適
な方法を複数(2個以上)適用するとよい。また、それ
ぞれ別々な文字認識エンジンにおいて同じアルゴリズム
を用いて切出し処理を行い、文字認識処理を異ならせて
文字認識結果をもたらすようにしてもよい。すなわち文
字切出しや文字認識の手法は同じものを用いるようにし
ても構わない。このようなことから、文字認識処理部18
は、数多くの種類の切出しおよび文字認識のアルゴリズ
ムを組み合わせてあらかじめ用意されていると、供給さ
れる画像データ26に各種の文字等が含まれていても多用
な文字認識が行えることがわかる。
【0031】複合編集部20には、スペース検出部200 お
よびスペース対応編集部202 が備えられている。スペー
ス検出部200 は、供給される文字認識結果30の文字位置
から文字の間隔を測定する。スペース検出部200 は、測
定した結果に基づいて得られた文字の間隔のうち、最大
間隔から順次広い間隔を探索する。探索して得られた文
字の間隔は、編集境界として扱う。スペース検出部200
は編集境界の位置情報および編集境界の両側に位置する
文字情報の含む検出信号32をスペース対応編集部202 に
出力する。
【0032】スペース対応編集部202 には、文字認識処
理部18からの文字認識結果30に対する検出信号を含む文
字認識結果32が供給されている。スペース対応編集部20
2 には、検出信号を用いて複数種類の文字認識結果から
最大間隔を編集境界とする境界区分内において出力する
文字を確定し、区分からそれぞれ供給される文字を合成
する機能がある。ここで、最大間隔だけでなく、この最
大間隔から順次広い間隔(間隔の降順)を編集境界とし
てもよい。なお、最大間隔等の文字間隔の検出結果を用
いて最大間隔の位置座標を求める機能はスペース対応編
集部202 で行わせてもよい。
【0033】スペース対応編集部202 には、図示しない
が、左抽出機能部、右抽出機能部、および合成部が備え
られている。スペース対応編集部202 はこの最大間隔を
編集境界の位置にして、上述したように編集境界の右側
と左側の文字とに区分してそれぞれの側の文字種を一つ
割り当てる。また、この位置を含む側の文字とこの位置
を含まない側の文字とに区分し、それぞれの側の文字種
を一つ割り当ててもよい。N=2 のとき、得られた各文字
種の文字はそのまま境界の両側に合成して決定した信号
34を出力する。このようにOCR 10は構成して文字を的確
に読み取って出力している。
【0034】特に、合成部は、編集境界を境に得られた
各区分内の文字認識結果に対して特開平12-36006号公報
に記載の複合文字認識部と同様の機能を有して、文字位
置または対応する文字の認識結果から複合的に判定して
最終的な認識結果を求めている。そして、合成部は求め
た最終的な認識結果の各区分を合成して最終的な文字認
識結果34を出力している。
【0035】ところで、この区分は編集境界を含むかど
うかで行うだけでなく、編集境界に対して両側に位置す
る文字位置の関係を考慮してもよい。この場合も、スペ
ース対応編集部202 は、図示しないが、左抽出機能部、
右抽出機能部、および合成部を用いる。左抽出機能部
は、供給される複数種類の文字認識結果のそれぞれに対
して、検出した最大( または大きな)間隔を隔てている
左側に位置する対象の文字と対峙するこの対象の右隣り
の文字の位置座標に基づいて、この対象の文字を含めて
左側の文字認識結果を抽出する機能を有する。
【0036】また、右抽出機能部は上述した対象の右隣
りの文字を含めて、この対象の右隣りの文字の位置座標
に基づいて、左側の文字認識結果と異なる種類の文字認
識結果を右側の文字認識結果として抽出する機能を有す
る。合成部には、このようにして抽出した左側および右
側のそれぞれの位置の考慮して得られた文字認識結果か
ら一致性の高い文字認識結果を最終結果として選択し、
合成する機能がある。文字位置の関係は上述した対象の
文字に対する関係を用いる。文字の位置は、文字の位置
座標から得られる。上述した関係は横書きの場合であ
る。この他、縦書きの場合、上述した横書きの説明にお
ける「左」・「右」を「上」・「下」に置き換えると縦
書きにおいても的確な抽出ができることは容易に理解で
きる。これらの算出の方法は後述する。
【0037】次にOCR 10の動作について説明する。OCR
10はスキャナ12で媒体から画像データ22を走査して取り
込みイメージメモリ14に出力する。イメージメモリ14か
ら読み出した画像データ24が行設定部16に供給される。
行設定部16では読み取りを行う要求部分の設定が行われ
る。図2(A)には読み込まれた画像データの一例を示す。
この画像データに対して行設定部16では、行の高さを
「L 」に設定する。「L」の値は、上側の破線が示すLU
と下側の破線が示すLDとの差で表される。
【0038】行設定部16の設定に応じて切り出された行
の画像データ26が文字認識処理部18に供給される。画像
データ26はN 個の第1〜第N文字認識エンジン18a 〜18
n にそれぞれ供給される。第1〜第N文字認識エンジン
18a 〜18n は、それぞれ内蔵する第1〜第N文字切出し
部180a〜180nで画像データ26から文字切出しを行う。
【0039】たとえば、第1文字切出し部180aでは、従
来から行われているように文字枠の縦幅および横幅を同
程度、すなわち全角の切出しを行うと本来数字を2桁ず
つまとめて切り出してしまう(図2(B)を参照)。切り出
した画像データ28a を第1文字認識部182aに供給して文
字認識を行うと、第1文字認識部182aでは文字認識結果
30a が「高あいう 12_34_56」となる。ここで、記号_
はたとえば切り出す境界位置を示している。
【0040】また、第2文字切出し部180bで文字枠の縦
幅に比して横幅を半分程度にした、すなわち半角の切り
出しを考慮して行うと、数字は的確に半分ずつ区別して
切り出されるが、漢字の「高」、かなの「あ」、および
「う」が示すように横方向に連続して一文字を表す文字
は分離されていない文字として切り出される。切り出し
た画像データ28b を第2文字認識部182bに供給して文字
認識を行うと、画像データ28a の文字認識は、かなの
「い」が横方向に隙間を形成し離して表現する文字のた
めそれぞれ異なる文字と判定してしまう(図2(C)を参
照)。この切出し結果を第2文字認識部182bに供給して
文字認識処理を行うと、第2文字認識部182bでは文字認
識結果30b が「高あ[分離された“い" ]う 1_2_3_4_
5_6_」となる。第2文字認識部182bはこのように切出し
アルゴリズムのそれぞれで行っても所望の文字に的確に
認識できないことがわかる。
【0041】第N文字認識エンジン18n では、第N文字
切出し部180nで画像データ26を第2文字切出し部180bと
同様に文字の切り出し、切り出した画像データ28n を第
N文字認識部182aに供給して文字認識を行う。このと
き、第N文字認識部182nでは画像データ28n を半角サイ
ズに切り出したなかから、英字に関する認識を行う。こ
の認識により、たとえば「_ _ _ _ 1_2_3_4_5_6
_」という文字認識結果30n を出力する。
【0042】文字認識処理部18は、このようにN 個の文
字認識結果30a 〜30n までの結果をまとめて文字認識結
果30として複合編集部20に送出している。
【0043】複合編集部20のスペース検出部200 では、
各文字の間隔の検出処理(測定)を行う。文字間隔(ス
ペース)の検出は文字認識結果30が有する文字位置のデ
ータを用いる。文字位置のデータとは読み込む画像デー
タの原点(0,0)をあらかじめ設定し、原点に対するたと
えば4点の2次元座標で表される。4点を頂点とする枠
を文字枠として扱う(図3を参照)。スペース検出部20
0 では、図3に示すように横書きの場合、基本的に対象
の文字枠36とこの文字枠36の右隣りに位置する文字枠38
を考える。
【0044】文字枠36は、左上隅の点a を(xa, ya),点
a の対角位置の右下隅の点b を(xb,yb)とする。また、
文字枠38は、左上隅の点c を(xc, yc),点c の対角位置
の点右下隅の点d を(xd, yd)とする。これらの表記を用
いて2つの文字枠の間隔(以後、単に文字間隔という)
を表すと、(xc−xb)の差分で表される。このような位
置関係を用いて画像データから切り出した文字間隔を求
める。スペース検出部200 では、第1文字および第2文
字切出し部180a, 180bの文字間隔がそれぞれ求められ
る。
【0045】図示しないが、縦書きの場合における関係
は、横書きの位置関係を90度回転させた際の関係で表さ
れることは容易に思料される。位置関係を表す記号に上
述した点a 〜点d を用い、文字枠36, 38をそれぞれ90度
回転させることによって文字間隔は、結果的に差分(yc
−yb)で表すことができる。
【0046】スペース検出部200 は、求めた文字間隔の
なかで最大間隔を示す両端に位置する文字および/また
は位置情報を含む信号32をスペース対応編集部202 に出
力する。供給される文字のうち、文字間隔の左側に位置
する文字を注目対象としている。スペース対応編集部20
2 では、検出された文字間隔を挟んで注目対象の文字を
含む文字列と注目文字の右隣りに位置する文字から右側
に位置する文字列とに区分する。区分は左抽出機能部、
および右抽出機能部で行う。注目対象の文字に対する区
分はこの注目対象の文字に対する相対位置から行う手法
に限らず、文字の位置座標に基づいて区分し文字認識結
果を求めるようにしてもよい。この場合、区分は位置座
標に基づいて抽出を行う左抽出機能部、および右抽出機
能部を用いる。
【0047】スペース対応編集部202 の合成部では、各
エンジンの区分した文字認識結果に対して複合的に判定
し、最終的な認識結果を決める。この最終的な認識結果
を決める方法は、各種の方法が提案されている。
【0048】本実施例では、図示しないシステム制御部
は、制御信号(図示せず)を供給して合成部を制御す
る。合成部は第1文字認識部182aが全角切出し、第2文
字認識部182bが半角優先した切出しが行われていること
を考慮し、各区分で読取異常の有無や複合判定に応じた
境界区分の読出しを行って各区分の最終的な認識結果を
合成して最終的な文字認識結果34を出力している。
【0049】この手順はスペース対応編集部202 では間
隔の広い境界を境に左側の注目対象の文字「う」を含む
文字列「高あいう」と、注目対象の文字「う」の右隣り
の文字「1 」を含む右側の文字「123456」を抽出する。
すなわち、左抽出機能部は第1文字認識エンジン18a か
ら供給される文字認識結果30a のうち、図2の「高あい
う」を抽出する。また、右抽出機能部は第2文字認識エ
ンジン18b から供給される文字ン認識結果30b のうち、
図2の「123456」を抽出する。合成部では供給される抽
出した文字列を複合判定して合成し、正確に読み取られ
た「高あいう123456」という最終的な文字認識結果34を
出力する。
【0050】また、あらかじめ境界区分に対してどの文
字種を対応させるか考慮して文字種を固定し、検出した
境界に応じて境界のどちら側にあるかに依存して文字認
識結果を確定させてもよい。これによれば、境界検出を
行いそれぞれ抽出した文字列を合成するだけでよい。
【0051】本実施例でスペース対応編集部202 では注
目対象の文字を含むかどうかで境界区分を行ったが、こ
の区分に限定されるものでなく、注目対象の文字枠の位
置座標を考慮して、この注目対象の位置座標を含むかど
うかにより境界区分を行うことができる。ある一つの文
字種に対して注目対象の文字の位置座標を含めて左側
(または上側)の文字座標を有する文字と注目対象の文
字の位置座標より右側(または下側)の文字座標を有す
る文字として区分が行われる。この区分によって抽出し
た文字との間に注目対象の文字を入れて合成しても正確
な文字読取りを行わせることができる。
【0052】このように動作させることにより、それぞ
れ適した文字読取結果から最終的な認識結果を出力する
ことにより文字の認識率を高めることができる。
【0053】次に、OCR 10における第1の変形例の構成
について説明をする(図4を参照)。OCR 10においてス
キャナ12、イメージメモリ14、行設定部16および文字認
識処理部18は同一の構成である。OCR 10は、複合編集部
20の構成が異なっている。複合編集部20には、中点検出
部204 および中点対応編集部206 が備えられている。中
点とは、文字列を分けたりする記号である。このような
文字種は中点に限定されるものでなく、たとえば、ハイ
フン、ピリオド、スラッシュなどの任意の文字を区分用
の文字種にしてもよい。
【0054】中点検出部204 は、第1文字認識エンジン
18a 〜第N文字認識エンジン18n によってそれぞれ出力
される文字認識結果30に基づき中点の文字を検出する。
検出方法については後述する。中点検出部204 は、中点
検出結果を含む信号40を中点対応編集部206 に出力す
る。
【0055】中点対応編集部206 には、図示しないが、
左抽出機能部、右抽出機能部、および合成部が備えられ
ている。左抽出機能部、および右抽出機能部は、編集境
界の検出をスペース検出部200 から中点検出部204 にし
て、任意の文字または文字位置に基づいて境界区分す
る。任意の文字または文字位置に基づく境界区分につい
ては後段で説明している。各境界区分は、中点検出があ
る場合に中点を含む文字列と中点を含まない文字列に区
分する。
【0056】合成部では、区分した文字認識結果に対し
て前述した複合判定を行って最終的な認識結果を求め
る。合成部ではこのように中点を基に確定した文字列を
合成し、最終的な文字認識結果とする。この文字認識結
果が出力信号42である。
【0057】OCR 10の第1の変形例における動作を説明
する(図5および図6を参照)。この場合もOCR 10にお
けるスキャナ12から文字認識処理部18までは、前述した
実施例とまったく同じ動作で各処理が行われるので説明
を簡略化する。本実施例は前述した実施例と複合編集部
20が異なり、複合編集部20での編集境界の検出対象がス
ペースから所定の文字、たとえば中点になっている。ま
ず、この中点検出について説明する。図5(A)に示すよう
に中点を含んだ画像データを読み込む。
【0058】この画像データに対する行の高さは、行設
定部16で行の高さを「L 」にし、「L 」の値は、上側の
破線が示すLUと下側の破線が示すLDとの差で表す。
【0059】第1文字切出し部180aで全角の切出し(図
5(B)を参照)と第2および第N文字切出し部180b, 180n
で半角の切出し(図5(C)を参照)がそれぞれ行われる。
そして、第1文字認識部182a, 第2文字認識部182b, ・・
・・, 第N文字認識部182nではそれぞれ認識した文字認識
結果30a, 30b, ・・・・, 30n が文字認識結果30として複合
編集部20に供給される。ここで、文字認識結果30には前
述したと同じ問題点がある。
【0060】この問題点を解消して正確な文字読取を行
うため複合編集部20の中点検出部200 では、編集境界を
示す中点検出を行う。この検出では各文字の間隔の検出
処理を行う。この場合も画像データの読み込む原点(0,
0)を設定する。文字位置は、文字を切り出す文字枠の頂
点で表される。各頂点は2次元座標で表される(図6を
参照)。中点検出部204 では、図6に示すように、基本
的に対象の文字枠44を考える。
【0061】文字枠44は、左上隅の点a を(xa, ya),点
a の対角位置の右下隅の点b を(xb,yb)とする。中点検
出方法は、式(1)
【0062】
【数1】 {xb−xa<TH1 }∩{ya >LU+TH2 }∩{yb<LD−TH3 } ・・・(1) の関係を満足するかどうかで中点の有無を検出する。こ
こで、スレッショルド値TH1, TH2, およびTH3 は、いず
れも任意の値である。スレッショルド値TH1 は中点にお
ける限界幅を示す。式(1) の条件を満足するとき、中点
検出が真であり、検出結果を有効にする。これ以外のと
き中点検出は偽である。
【0063】ところで、中点は文字枠における高さを持
つ必要性から、スレッショルド値TH2, TH3は、L >TH2
+TH3 の関係にある。これらの関係のすべて(微小文字
検出条件)を用いて画像データから切り出した文字枠に
中点が含まれるかどうかを求めている。中点検出部204
は、これらの関係を満足するかそれぞれの文字に対して
検出を行う。
【0064】なお、中点を検出する方法は、このような
微小文字検出条件を適用する方法に限定されるわけでは
なく、あらかじめ設定した編集境界の文字、すなわち境
界文字を示すコードを検出するようにしてもよい。ま
た、より正確に検出したいならば、微小文字検出条件お
よび境界文字のコードを合わせた複合条件を用いてもよ
い。微小文字検出条件は横書きの場合であるが縦書きの
場合でも前述したように90度回転させた場合を想定する
と、縦書きにおける微小文字検出条件により容易に中点
検出できることがわかる。
【0065】中点検出部204 では、求めた文字枠内に中
点検出された際にこの中点を挟んで両端に位置する文字
および/または位置情報を含む信号40が中点対応編集部
206に出力される。ここでは供給される中点の左側に位
置する文字を注目対象としている。
【0066】中点対応編集部206 では、検出された中点
を挟んで注目対象の文字を含む文字列と注目文字の右隣
りに位置する文字から右側に位置する文字列とに区分す
る。また、中点対応編集部206 では、中点を境にこの中
点を含まない左右の文字列に区分し、合成時に区分して
得られた文字列の間に中点を入れて合成してもよい。
【0067】説明の簡略化を図るためN =2 とする。ま
た、説明には、図5の例を用いて説明する。境界区分
は、前述したスペース対応編集部202 の場合と同様に中
点対応編集部206 の左抽出機能部と右抽出機能部では、
それぞれ中点を含めない左側の文字列と中点を含めた右
側の文字列とに区分したり、中点の位置座標に基づいて
この中点の位置座標を含まない左側の文字列と中点の位
置座標を含めたその右側の文字列とに区分してもよい。
なお、右抽出機能部は中点の位置座標を含まないその右
側の文字列で区分してもよい。
【0068】区分した文字列に対する最終的な認識処理
は、前述したスペース対応編集部202 の合成部と同様
に、各エンジンの区分した文字認識結果に対して複合的
に判定し、最終的な認識結果を決めている。
【0069】本実施例では、図示しないシステム制御部
は、制御信号(図示せず)を供給して合成部を制御す
る。合成部は第1文字認識部182aが全角切出し、第2文
字認識部182bが半角優先した切出しが行われていること
を考慮し、各区分で読取異常の有無や境界区分ごとに供
給される認識結果に対して複合判定を行って各区分の最
終的な認識結果を合成部で複合編集して最終的な文字認
識結果42を出力している。このように複合編集しても文
字認識率をこれまでよりも高くすることができる。
【0070】なお、中点のような通常の文字と異なる記
号は、この文字(記号)に限定されるものでなく、さら
に位置関係を考慮すると前述したハイフン(- ) 、スラ
ッシュ(/ )、アンド(& )等の他に、フォントサイズ
を通常に比べて大幅に小さくして記述した文字等の場合
にも適用できる。
【0071】次にOCR 10における第2の変形例の構成を
説明する(図7を参照)。構成は、第2の変形例の特徴
をより明確にするため、複合編集部50を図7に示す。複
合編集部50には、最初の実施例に挙げた編集部の構成と
第1の変形例の編集部の構成要素に加えて、検出判定部
208 が含まれている。検出判定部208 は中点検出の結果
に基づいて中点対応編集とスペース検出とのいずれかに
処理を切り換える機能を有している。複合編集部50は、
スペース検出部200 、スペース対応編集部202、中点検
出部204 、中点対応編集部206 、および検出判定部208
を有する。
【0072】検出判定部208 は、供給される検出結果に
基づいてどの動作に移行させるか判定する機能を有して
いる。検出判定部208 は、供給される検出結果40が中点
検出を示す際に中点対応編集部206 をイネーブルにさせ
るとともに、文字認識結果を含む境界文字(中点)およ
び/または境界文字の位置情報を含む信号46を中点対応
編集部206 に出力する。また、検出判定部208 は、検出
結果40が中点検出を示さなかった際にスペース検出部20
0 をイネーブルにさせるとともに、文字認識結果30を含
む信号48をスペース検出部200 に出力する。
【0073】簡単に第2の変形例における複合編集部20
の動作を説明する。文字認識処理部18から供給される文
字認識結果30が複合編集部50に供給される。複合編集部
50は、供給される文字認識結果30のなかに中点が含まれ
ているかどうかを中点検出部204 で検出する。中点検出
部204 は文字認識結果30に中点が含まれているかどうか
検出処理を行って、この検出結果40を検出判定部208 に
出力する。
【0074】検出判定部208 では、検出結果40に対して
上述した機能を発揮してどの処理に進むか判定を行う。
中点が含まれているとき中点対応編集部206 に進み、中
点が含まれていないときスペース検出部200 に進む。
【0075】スペース検出部200 は、供給される文字認
識結果30のうち、文字認識結果30a〜30n のそれぞれに
対して文字間隔を測定するとともに、測定した文字間隔
の最も広いところの検出を行う。検出結果の編集境界
(すなわち最大間隔)を挟んだ両側の文字および/また
はこれらの文字の位置情報が加えられた文字認識結果30
を表す信号32がスペース検出部200 からスペース対応編
集部202 に供給される。スペース対応編集部202 は、供
給される文字認識結果32のうち、区分した文字列をそれ
ぞれ確定し、確定した文字を合成して最終的な認識結果
34を出力する。
【0076】したがって、複合編集部50は、検出結果に
応じてスペース対応編集部202 および中点対応編集部20
6 からいずれか一方の出力信号34, 42しか得られない。
この手順で動作させることにより、2つの検出に対応す
るように複雑な文字が混在していても的確に文字の認識
を行うことができるので、単に一つの境界対応によって
編集するよりも文字の認識率を高めることができる。
【0077】次により一般的な処理を可能にする第3の
変形例の構成を説明する(図8を参照)。第3の変形例
のOCR 10には、供給する文字に関する情報の書式設定や
処理パターンの設定を行う書式設定部52および第2の変
形例の構成要素に加えて、供給される文字認識結果がど
のような書式や処理パターンであるかを解析する書式解
析部210 が備えられている。
【0078】書式設定部52は、各処理対象のパターンに
応じた書式文字列を設定する機能を有している。書式を
表す記号が各種あり、以下に順次示す。書式の記号に
は、 記号():読取対象の文字種 記号[]:境界を示すキーの種類 記号{}:書式文字列(すなわち、処理の単位) 記号| :論理式のOR などが用いられている。これらの記号を用いて書式設定
が行われる。ここで、たとえば図2(A)の「高あいう
123456」や図5(A)の「高あいう・123456」の処理パター
ンに対する書式は、それぞれ、
【0079】
【数2】 {(漢字やかな)[スペース](数字)} ・・・(2a) {(漢字やかな)[中点](数字)} ・・・(2b) の関係に表される。また、式(2a)と式(2b)のいずれかの
処理パターンに対する書式は、
【0080】
【数3】 {(漢字やかな)[スペース](数字)}| {(漢字やかな)[中点](数字)} ・・・(3) になる。書式設定部52は、設定した書式に関するデータ
54を複合編集部50に供給している。
【0081】書式解析部210 は、前述した書式設定部52
にて設定した書式文字列の処理パターン(以後、データ
という)54の供給を受けて、このデータを解析する機能
および解析結果に応じて各部に対して制御信号を供給す
る機能を有する。解析は、読取対象の文字の種類、キー
の種類、処理の単位および論理式について行う。書式解
析部210 は、特に、文字の種類および/またはキーの種
類が指定された場合、供給される文字認識結果30のなか
から文字やキーを検出するそれぞれの検出部に制御信号
を出力する。本実施例で書式解析部210 は、中点検出部
204 および検出判定部208 にそれぞれ制御信号56, 58を
供給している。
【0082】複合編集部50では、文字認識処理部18から
の文字認識結果30と書式解析結果とをまとめて中点検出
部204 とスペース検出部200 とにそれぞれ信号56, 58と
して供給される。複合編集部50は、中点検出に関して信
号54を用いスペース検出に関して信号58を用いる。本実
施例では、第2の変形例の場合に比べて上述した信号線
の接続および信号が新たに加えられている。
【0083】次にOCR 10の第3の変形例における動作を
説明する。OCR 10は、書式設定部52を介して読み取る書
式の処理パターン54を設定する。設定した処理パターン
を示すデータ54は、複合編集部50に供給される。データ
54は、あらわに図示しないが書式解析部210 に供給され
る。書式解析部210 では、供給されたデータ54の前述し
た各書式要素のうち、何が設定されているのか解析処理
を行う。本実施例では式(3) に関する解析を行ってい
る。書式解析部210 で「中点」の含まれることが解析さ
れた際に、書式解析部210 から解析結果を含む信号56が
中点検出部204 に供給される。同様に、書式解析部210
で「スペース」の含まれることが解析された際には、書
式解析部210 から解析結果を含む信号58がスペース検出
部200 に供給される。
【0084】中点検出部204 では、供給される信号56に
含まれる書式解析の他、文字認識結果30のなかに「中
点」が含まれるか検出を行う。この中点検出結果は信号
40として検出判定部208 に供給される。検出判定部208
に供給される信号58が「スペース」を含まないことを示
している場合、検出判定部208 は中点検出結果に応じた
編集を行わせるように、中点の位置情報および文字認識
結果30を含む信号46を中点対応編集部206 に供給する。
一方、検出判定部208 は、スペース検出部200 にスペー
ス検出処理が不要であることを信号48で報知する。
【0085】中点対応編集部206 では中点を境界として
区分するだけでなく、書式解析して得られた結果、たと
えば読取対象の文字の種類の並び等を考慮して文字認識
結果30から抽出した文字を合成して最終的な認識結果と
して出力する(出力信号42を参照)。
【0086】検出判定部208 に中点検出結果が中点を検
出されず、かつ書式文字列の解析結果が編集境界となる
キーの種類に「スペース」が供給された処理パターンに
確認された場合または処理パターンの解析結果に「中
点」が含まれず、「スペース」だけが検出された場合、
検出判定部208 はスペース検出部にスペース検出を開始
する制御信号48を出力する。この場合、検出処理として
はスペース検出部200 でスペース検出が行われることに
なる。この検出結果の信号32がスペース対応編集部202
に供給される。スペース対応編集部202 では、最大文字
間隔を編集境界として区分するだけでなく、書式解析し
て得られた結果、たとえば読取対象の文字の種類の並び
等を考慮して文字認識結果30から抽出した文字列を複合
判定して合成し、最終的な認識結果として出力する(出
力信号34を参照)。
【0087】このように動作させることにより、文字の
種類の文字列の並びが変わった処理対象のパターンが供
給される場合でも書式設定部52でそのパターンの書式を
設定して、書式解析部210 で解析し、解析要素の種類と
してあらかじめ設けられた検出部をこの解析結果に応じ
て動作させて、それぞれの検出結果にともなう区分を行
うとともに、文字認識結果30を確定して、確定した文字
の複合判定後に合成を行う複合編集することができる。
したがって、OCR 10は同一の構成でありながら、並びに
対応した書式を記述するだけでより一般的な処理パター
ンに対応できるようになる。
【0088】なお、前述した実施例はN=2 を想定した場
合について説明してきたが、本発明はN=2 以上の場合で
も適用できることは言うまでもない(図1および図4を
参照)。適用例としては、キーの種類が3つ以上の場合
などがある。たとえば、前述したように第3のキーとし
て「- ( ハイフン)」を挙げることができる。ただし、
文字認識処理部18の各エンジンの文字切出し部は文字の
切出しアルゴリズムをすべて別々にしなくてもよい。文
字の切出しアルゴリズムは、少なくとも2種類あればよ
い。
【0089】また、第N文字認識部182nのように追加し
た文字認識部の認識アルゴリズムは第1文字認識部182a
や第2文字認識部182bの認識アルゴリズムと同じでも異
ならせてもよい。
【0090】ところで、図示していないがスペース対応
編集部202 と中点対応編集部206 とを一つにまとめて中
点・スペース対応編集部にしてもよい。このようにまと
めて構成しておくと、中点検出および/またはスペース
検出処理の複数の条件に対応させることができるととも
に、文字認識処理によって供給される文字の候補の種類
も増やして文字の抽出を行い、それぞれに対応した編集
を行わせることができる。
【0091】たとえば、図2(A)の例に注目してより細か
く見ると、最大の文字間隔の「スペース」を(第1の)
編集境界とし、「高」と「あいう」の間に次に広い間隔
の「スペース」がある。この次に広い間隔を第2の編集
境界とみなして処理することができる。この2つの編集
境界を用いて文字の切出しを行うと、最も左側の文字が
漢字(「高」)、中央の文字列がかな(「あいう」)、
および最も右側の文字列が数字(「123456」)と区分し
て処理することができる。この処理に対応させるため、
第2スペース検出部を設けるとよい。
【0092】図5(A)の例においても、中点だけでなく、
細かく見ると、最大間隔が編集境界として含まれる。こ
れらの中点および最大間隔の2つを境界に用いても文字
の切出しを行うと、最も左側の文字が漢字(「高」)、
中央の文字列がかな(「あいう」)、および最も右側の
文字列が数字(「123456」)と区分して処理することが
できる。
【0093】このように最大間隔だけでなく、次に広い
文字間隔と順次狭い間隔も考慮してスペース検出するよ
うに構成するとともに、対応編集することにより、より
一層文字認識を高めることができる。
【0094】なお、本発明は、前述した実施例に応じて
記述されているが、その実施例に限定されるものでな
く、当業者が本発明の観点を含む組合せ、変更または修
正した実施例も本発明に含まれることは言うまでもな
い。
【0095】以上のように構成することにより、供給さ
れる画像に対して複数種類の文字認識によって切出し・
認識処理を施して得られる複数の文字の候補のなかか
ら、特徴的な文字やキーを検出し、検出結果に応じた区
分を行い、処理パターンに応じた文字の候補を抽出して
文字を確定し、確定した文字(列)を合成することによ
り、的確な編集の施された文字認識を行うことができ
る。この文字認識により、これまでの切出し方の混在し
たような文字(列)の文字認識に比べて大幅に認識率を
高めることができる。これにより、認識後のユーザの訂
正処理も少なくてすませることもできる。
【0096】
【発明の効果】このように本発明の文字読取装置によれ
ば、文字読取手段から供給される複数種類の文字認識結
果を複合編集手段に供給し、複合編集手段ではこれら文
字認識結果のなかから編集境界を検出して境界の区分を
的確に行い、得られた編集境界を基に各区分領域に対し
て複数種類の文字認識結果から対応する種類の最適な認
識結果を選択して、各区分領域に適した文字列を選び、
選択した最適な文字認識結果を合成して最終的な文字認
識結果を出力して、処理対象パターンに複数種類の文字
パターンが混在しても最終的な文字認識結果を正確に認
識させることにより、文字の認識率を高めることがで
き、文字読取処理後のユーザ操作を少なく済ませること
ができる。
【0097】また、本発明の文字読取方法によれば、複
数種類の文字認識結果のなかから編集境界を検出し、検
出した編集境界で各文字認識結果を文字列に区分し、区
分した文字列のそれぞれに対して異なる種類の最適な文
字認識結果を選んで決定し、合成して、最終的な文字認
識結果に含まれる誤認識を大幅に抑制することにより、
複数種類の文字が混在しても文字の認識率をこれまでよ
りも高めることができ、文字読取処理後のユーザ操作を
少なく済ませることができる。
【図面の簡単な説明】
【図1】本発明の文字読取装置を適用したOCR の概略的
な構成を示すブロック図である。
【図2】図1のOCR に供給する画像データの切出しの例
を示す図である。
【図3】図1のスペース検出部にて行われる文字の間隔
の検出原理を説明する模式図である。
【図4】図1のOCR の構成の第1の変形例における概略
的な構成を示すブロック図である。
【図5】図4のOCR に供給する画像データの切出しの例
を示す図である。
【図6】図4の中点検出部にて行われる中点の検出原理
を説明する模式図である。
【図7】図1および図4にて用いた複合編集部の機能を
ともに実現させる第2の変形例であり、複合編集部の構
成を示すブロック図である。
【図8】図7のOCR の構成に書式設定を含んだ第3の変
形例の構成を示すブロック図である。
【符号の説明】
10 OCR 12 スキャナ 14 イメージメモリ 16 行設定部 18 文字認識処理部 20, 50 複合編集部 180a 第1文字切出し部 180b 第2文字切出し部 180n 第N 文字切出し部 182a 第1文字認識部 182b 第2文字認識部 182n 第N 文字認識部 200 スペース検出部 202 スペース対応編集部

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 処理対象のパターンから文字を切り出す
    複数のアルゴリズムを有する文字切出し手段、および/
    または該アルゴリズムにより文字読取対象の画像データ
    から切り出した文字を認識して該文字認識結果を出力す
    る文字認識手段を含む文字読取手段を用い、該文字読取
    手段は前記アルゴリズムに対応させて複数種類の文字認
    識結果を出力させ、 該複数種類の文字認識結果に対して前記文字認識結果の
    文字列を編集する際の編集境界を検出し、該検出した編
    集境界を基に分けられた各区分領域に対して前記複数種
    類の文字認識結果から対応する種類の最適な認識結果を
    選択し、選択した最適な文字認識結果を合成して最終的
    な文字認識結果として出力する複合編集手段とを含むこ
    とを特徴とする文字読取装置。
  2. 【請求項2】 請求項1に記載の装置において、前記複
    合編集手段は、複数種類の文字認識結果に対して前記文
    字を編集する際の編集境界を検出する単一または複数の
    境界検出手段と、 前記処理対象パターンに対して該編集境界が複数種類あ
    っても各編集境界の両側に各文字に対応する前記複数種
    類の文字認識結果のなかから各境界区分で最も一致した
    文字列を前記最適な文字認識結果の文字列として選んで
    複合編集する境界対応編集手段とを含むことを特徴とす
    る文字読取装置。
  3. 【請求項3】 請求項2に記載の装置において、前記境
    界検出手段は、前記文字切出し手段で切り出された文字
    位置に基づいて前記文字の間隔を検出するとともに、該
    検出した文字の間隔の大きい間隔の箇所を編集する際の
    編集境界として探索する文字間隔検出手段であることを
    特徴とする文字読取装置。
  4. 【請求項4】 請求項2に記載の装置において、前記境
    界検出手段は、前記文字認識結果が所定の境界文字に一
    致するかどうかを検出し、該検出結果の一致した文字を
    編集境界とする境界文字検出手段であることを特徴とす
    る文字読取装置。
  5. 【請求項5】 請求項2または3に記載の装置におい
    て、前記境界対応編集手段は、前記文字間隔検出手段で
    得られた編集境界を境に両側の境界区分の各文字列に対
    応する前記複数種類の文字認識結果のなかから選び、該
    選んだ複数種類の文字認識結果を境界区分に対応する位
    置にそれぞれ合成して出力する第1の境界対応編集手段
    を含むことを特徴とする文字読取装置。
  6. 【請求項6】 請求項2または4に記載の装置におい
    て、前記境界対応編集手段は、前記境界文字検出手段で
    得られた編集境界を境に両側の境界区分の各文字列に対
    応する文字認識結果を前記複数種類の文字認識結果のな
    かから選び、該選んだ各文字認識結果を境界区分の対応
    する位置にそれぞれ合成して出力する第2の境界対応編
    集手段を含むことを特徴とする文字読取装置。
  7. 【請求項7】 請求項2に記載の装置において、前記境
    界対応編集手段は、前記文字間隔検出手段で得られた編
    集境界を境に両側の境界区分の各文字列に対応する前記
    複数種類の文字認識結果のなかから選び、該選んだ複数
    種類の文字認識結果を境界区分に対応する位置にそれぞ
    れ合成して出力する第1の境界対応編集手段と、 前記境界文字検出手段で得られた編集境界を境に両側の
    境界区分の各文字列に対応する文字認識結果を前記複数
    種類の文字認識結果のなかから選び、該選んだ各文字認
    識結果を境界区分の対応する位置にそれぞれ合成して出
    力する第2の境界対応編集手段とを含むことを特徴とす
    る文字読取装置。
  8. 【請求項8】 請求項4または6に記載の装置におい
    て、前記所定の境界文字が任意の文字であることを特徴
    とする文字読取装置。
  9. 【請求項9】 請求項8に記載の装置において、前記所
    定の境界文字は中点またはハイフンであることを特徴と
    する文字読取装置。
  10. 【請求項10】 請求項2に記載の装置において、前記
    境界検出手段は、前記文字位置に基づいて前記文字の間
    隔を検出するとともに、該検出した文字の間隔の大きい
    間隔の箇所を編集する際の編集境界として探索する文字
    間隔検出手段と、 前記文字認識結果が所定の境界文字に一致するかどうか
    を検出し、該検出結果の一致した文字を編集境界とする
    境界文字検出手段とのいずれかを含むことを特徴とする
    文字読取装置。
  11. 【請求項11】 請求項2に記載の装置において、前記
    境界検出手段は、前記文字位置に基づいて前記文字の間
    隔を検出するとともに、該検出した文字の間隔の大きい
    間隔の箇所を編集する際の編集境界として探索する文字
    間隔検出手段と、 前記文字認識結果が所定の境界文字に一致するかどうか
    を検出し、該検出結果の一致した文字を編集境界とする
    境界文字検出手段とを含み、 前記境界対応編集手段は、前記文字間隔検出手段で得ら
    れた編集境界を境に両側の境界区分の各文字列に対応す
    る前記複数種類の文字認識結果のなかから選び、該選ん
    だ複数種類の文字認識結果を境界区分に対応する位置に
    それぞれ合成して出力する第1の境界対応編集手段と、 前記境界文字検出手段で得られた編集境界を境に両側の
    境界区分の各文字列に対応する前記複数種類の文字認識
    結果のなかから選び、該選んだ複数種類の文字認識結果
    を境界区分に対応する位置に配してそれぞれ合成して出
    力する第2の境界対応編集手段とを含み、 前記境界検出手段の一方の境界検出結果に基づいて前記
    編集境界での複合編集、または他方の境界検出のいずれ
    かの動作選択を行うとともに、選択した処理を開始させ
    る動作選択手段を含むことを特徴とする文字読取装置。
  12. 【請求項12】 請求項3、5、10または11に記載の装
    置において、前記文字間隔検出手段は、前記画像データ
    における原点を設定し、切り出す文字位置を該原点に対
    する2次元座標で表して、対象の文字の位置に対して右
    隣りの文字位置のうち前記対象の文字に最も近い位置関
    係を示す文字の水平座標と、前記対象の文字のうち前記
    右隣りの文字に最も近い位置関係を示す水平座標との差
    から文字間隔の検出を行い、該文字間隔の検出を切り出
    した文字すべてに対して行い、検出した文字間隔の最大
    の間隔から降順に編集境界に設定することを特徴とする
    文字読取装置。
  13. 【請求項13】 請求項3、5、10または11に記載の装
    置において、前記文字間隔検出手段は、前記画像データ
    における原点を設定し、切り出す文字位置を該原点に対
    する2次元座標で表して、対象の文字の位置に対して下
    隣りの文字位置のうち前記対象の文字に最も近い位置関
    係を示す文字の垂直座標と、前記対象の文字のうち前記
    下隣りの文字に最も近い位置関係を示す垂直座標との差
    から文字間隔の検出を行い、該文字間隔の検出を切り出
    した文字すべてに対して行い、検出した文字間隔の最大
    の間隔から降順に編集境界に設定することを特徴とする
    文字読取装置。
  14. 【請求項14】 請求項3、5、または11に記載の装置
    において、第1の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、検出した大き
    い間隔を隔てている左側に位置する対象の文字と対峙す
    る該対象の右隣りの文字において、該対象の文字を含め
    て左側の文字認識結果を抽出する左抽出機能ブロック
    と、 該対象の右隣りの文字を含めて、所定の間隔を隔てた前
    記左側の文字認識結果と異なる種類の文字認識結果を右
    側の文字認識結果として抽出する右抽出機能ブロック
    と、 抽出した左側および右側のそれぞれの位置の考慮して得
    られた文字認識結果から一致性の高い文字認識結果を選
    択し、該選択した文字認識結果を合成し、最終結果とし
    て出力する合成手段とを含むことを特徴とする文字読取
    装置。
  15. 【請求項15】 請求項3、5、または11に記載の装置
    において、第1の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、検出した大き
    い間隔を隔てている上側に位置する対象の文字と対峙す
    る該対象の下隣りの文字において、該対象の文字を含め
    て上側の文字認識結果を抽出する上抽出機能ブロック
    と、 該対象の下隣りの文字を含めて、所定の間隔を隔てた前
    記上側の文字認識結果と異なる種類の文字認識結果を下
    側の文字認識結果として抽出する下抽出機能ブロック
    と、 抽出した上側および下側のそれぞれの位置の考慮して得
    られた文字認識結果から一致性の高い文字認識結果を選
    択し、該選択した文字認識結果を合成し、最終結果とし
    て出力する合成手段とを含むことを特徴とする文字読取
    装置。
  16. 【請求項16】 請求項3、5、または11に記載の装置
    において、第1の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、検出した大き
    い間隔を隔てている左側に位置する対象の文字と対峙す
    る該対象の右隣りの文字の位置座標に基づいて、該対象
    の文字を含めて左側の文字認識結果を抽出する左抽出機
    能ブロックと、 該対象の右隣りの文字を含めて、該対象の右隣りの文字
    の位置座標に基づいて、前記左側の文字認識結果と異な
    る種類の文字認識結果を右側の文字認識結果として抽出
    する右抽出機能ブロックと、 抽出した左側および右側のそれぞれの位置の考慮して得
    られた文字認識結果から一致性の高い文字認識結果を選
    択し、該選択した文字認識結果を合成し、最終結果とし
    て出力する合成手段とを含むことを特徴とする文字読取
    装置。
  17. 【請求項17】 請求項3、5、または11に記載の装置
    において、第1の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、検出した大き
    い間隔を隔てている上側に位置する対象の文字と対峙す
    る該対象の下隣りの文字の位置座標に基づいて、該対象
    の文字を含めて上側の文字認識結果を抽出する上抽出機
    能ブロックと、 該対象の下隣りの文字を含めて、該対象の下隣りの文字
    の位置座標に基づいて、前記上側の文字認識結果と異な
    る種類の文字認識結果を下側の文字認識結果として抽出
    する下抽出機能ブロックと、 抽出した上側および下側のそれぞれの位置の考慮して得
    られた文字認識結果から一致性の高い文字認識結果を選
    択し、該選択した文字認識結果を合成し、最終結果とし
    て出力する合成手段とを含むことを特徴とする文字読取
    装置。
  18. 【請求項18】 請求項4、10または11に記載の装置に
    おいて、前記境界検出手段は、処理対象の文字の位置座
    標と前記文字の表現可能な高さを示す行高とを該行の上
    限および下限位置で表し、切り出した文字の幅が所定の
    幅より狭く、かつ前記処理対象の文字の位置関係におい
    て前記文字の上側の位置の値が前記行の上限に第1の所
    定の高さを加えた位置の値より大きく、かつ前記文字の
    下側の位置の値から第2の所定の高さを引いた位置の値
    より小さく、かつ第1の所定の高さと第2の所定の高さ
    の和が前記行高より小さい微小文字条件にある文字かを
    検出する中点検出手段であることを特徴とする文字読取
    装置。
  19. 【請求項19】 請求項18に記載の装置において、第2
    の境界対応編集手段は、前記文字認識結果が境界文字を
    示すコードを含む、または前記微小文字枠条件および前
    記コードを含む複合条件を満足するかどうかで、該文字
    認識結果に前記境界文字が含まれるかどうかを判定する
    境界文字判定手段を用いて、得られた判定結果に基づい
    て編集境界の区分領域ごとに前記文字認識結果を抽出
    し、該区分領域のそれぞれで最も一致性の高い文字認識
    結果を複合合成することを特徴とする文字読取装置。
  20. 【請求項20】 請求項4、11、または19に記載の装置
    において、第2の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、前記境界文字
    を示す文字認識結果のうち該境界文字よりも左側の文字
    列を抽出する左抽出機能ブロックと、 前記左側の文字列の文字認識結果と異なる種類の文字認
    識結果のうち該境界文字よりも右側の文字を抽出する右
    抽出機能ブロックと、 抽出した左側および右側の文字をそれぞれの位置を考慮
    して得られた文字認識結果から一致性の高い文字認識結
    果を選択し、該選択した文字認識結果の間に前記境界文
    字を入れて合成し、最終結果として出力する合成手段と
    を含むことを特徴とする文字読取装置。
  21. 【請求項21】 請求項3、5、または11に記載の装置
    において、第2の境界対応編集手段は、供給される複数
    種類の文字認識結果のそれぞれに対して、該境界文字の
    位置座標に基づいて、検出した該境界文字よりも左側に
    位置する文字認識結果を抽出する左抽出機能ブロック
    と、 該境界文字の位置座標に基づいて、該境界文字よりも右
    側の文字認識結果を抽出する右抽出機能ブロックと、 抽出した左側および右側のそれぞれの位置を考慮して得
    られた文字認識結果から一致性の高い文字認識結果を選
    択し、該選択した文字認識結果の間に前記境界文字を入
    れて合成し、最終結果として出力する合成手段とを含む
    ことを特徴とする文字読取装置。
  22. 【請求項22】 請求項1ないし21のいずれか一項に記
    載の装置において、該装置は、前記画像データが含む前
    記処理対象のパターンに対する文字列の書式を設定する
    書式設定手段を含み、 前記編集手段は、前記書式設定手段で設定された書式を
    基に読取対象の文字における情報としての前記文字の種
    類、境界となる文字の種類、処理を施す文字列の大き
    さ、およびこれらの情報の組合せを示す論理式の解析を
    行う書式解析手段を含むことを特徴とする文字読取装
    置。
  23. 【請求項23】 複数のアルゴリズムに従って文字を切
    り出す第1の工程と、 切り出した文字に対して複数種類の文字認識を行い、該
    文字認識結果を出力す第2の工程と、 該文字認識で得られた複数種類の文字認識結果に対して
    前記文字位置の関係を考慮して編集する際の境界を示す
    編集境界を検出し、該検出した編集境界で前記文字認識
    結果を区分し、前記複数種類の文字認識結果から区分し
    た文字列のそれぞれに対して異なる種類の最適な文字認
    識結果を選択して決定し、各区分に対して該最適な文字
    認識結果の文字列を複合編集する第3の工程とを含むこ
    とを特徴とする文字読取方法。
  24. 【請求項24】 請求項23に記載の方法において、第3
    の工程は、該複数種類の文字認識結果および/または前
    記文字位置の関係を考慮した前記編集境界の検出に前記
    文字の間隔を求め、該検出した文字の間隔の最大間隔か
    ら順次狭くなる間隔を第1の編集境界にする文字間隔検
    出工程と、 第1の編集境界を用いて複数種類の文字認識結果に対し
    て境界を区分し、各区分ごとに異なる種類の文字認識結
    果を選択して確定し、該確定した文字認識結果の文字列
    を合成する第1の合成工程とを含むことを特徴とする文
    字読取方法。
  25. 【請求項25】 請求項23に記載の方法において、第3
    の工程は、該複数種類の文字認識結果および/または前
    記文字位置の関係を考慮した前記編集境界の検出に用い
    る所定の境界文字を検出し、該検出した所定の境界文字
    を第2の編集境界にする境界文字検出工程と、 第2の編集境界を用いて複数種類の文字認識結果に対し
    て境界を区分し、各区分ごとに異なる種類の文字認識結
    果を選択して確定し、該確定した文字認識結果の文字列
    を合成する第2の合成工程とを含むことを特徴とする文
    字読取方法。
  26. 【請求項26】 請求項23に記載の方法において、第3
    の工程は、該複数種類の文字認識結果および/または前
    記文字位置の関係を考慮した前記編集境界の検出に用い
    る所定の境界文字を検出し、該検出した所定の境界文字
    を第2の編集境界にする境界文字検出工程と、 該境界文字の検出にともなって判定して該境界文字の検
    出および判定結果が該境界文字の欠如を示す場合と該境
    界文字の検出および判定結果が該境界文字の存在を示す
    場合に応じて処理手順を選択する処理選択工程と、 該境界文字の検出および判定結果が該境界文字の欠如を
    示す際に、複数種類の文字認識結果および/または前記
    文字位置の関係を考慮した前記編集境界の検出に前記文
    字の間隔を求め、該検出した文字の間隔の最大間隔から
    順次狭くなる間隔を第1の編集境界にする文字間隔検出
    工程と、 第1の編集境界を用いて複数種類の文字認識結果に対し
    て境界を区分し、各区分ごとに異なる種類の文字認識結
    果を選択して確定し、該確定した文字認識結果の文字列
    を合成する第1の合成工程と、 前記境界文字の検出および判定結果が該境界文字の存在
    を示す際に、第2の編集境界を用いて複数種類の文字認
    識結果に対して境界を区分し、各区分ごとに異なる種類
    の文字認識結果を選択して確定し、該確定した文字認識
    結果の文字列を合成する第2の合成工程とを含むことを
    特徴とする文字読取方法。
  27. 【請求項27】 請求項23ないし26のいずれか一項に記
    載の方法において、該方法は、前記画像データが含む処
    理対象のパターンに対する文字列の書式を設定する書式
    設定工程を含み、 第3の工程は、前記設定した書式を基に読取対象の文字
    における情報としての前記文字の種類、境界となる文字
    の種類、処理を施す文字列の大きさ、およびこれらの情
    報の組合せを示す論理式の解析を行う書式解析工程を含
    むことを特徴とする文字読取方法。
  28. 【請求項28】 請求項27に記載の方法において、第3
    の工程は、該解析処理の項目に前記編集境界として前記
    文字の間隔の検出または前記境界文字の検出のいずれか
    または両検出が含まれることが確認された際に該検出処
    理をそれぞれ行い、各検出のうち一つの検出結果に応じ
    て次に行う処理手順を文字認識処理または次の検出処理
    への選択を行い、前記文字認識処理を行った際に得られ
    る文字認識のなかから最も一致性の高い最適な文字認識
    結果を決定して、該最適な文字認識結果の文字列を合成
    して複合編集することを特徴とする文字読取方法。
  29. 【請求項29】 請求項27に記載の方法において、前記
    所定の境界文字が任意の文字であることを特徴とする文
    字読取方法。
  30. 【請求項30】 請求項29に記載の方法において、前記
    所定の境界文字は中点またはハイフンであることを特徴
    とする文字読取方法。
JP2000271515A 2000-09-04 2000-09-04 文字読取装置および文字読取方法 Pending JP2002074266A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000271515A JP2002074266A (ja) 2000-09-04 2000-09-04 文字読取装置および文字読取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000271515A JP2002074266A (ja) 2000-09-04 2000-09-04 文字読取装置および文字読取方法

Publications (1)

Publication Number Publication Date
JP2002074266A true JP2002074266A (ja) 2002-03-15

Family

ID=18757796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000271515A Pending JP2002074266A (ja) 2000-09-04 2000-09-04 文字読取装置および文字読取方法

Country Status (1)

Country Link
JP (1) JP2002074266A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815958A (zh) * 2019-02-01 2019-05-28 杭州睿琪软件有限公司 一种化验单识别方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815958A (zh) * 2019-02-01 2019-05-28 杭州睿琪软件有限公司 一种化验单识别方法、装置、电子设备和存储介质
CN109815958B (zh) * 2019-02-01 2022-02-15 杭州睿琪软件有限公司 一种化验单识别方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US7627148B2 (en) Image data processing apparatus and method, and image data processing program
JP3445394B2 (ja) 少なくとも二つのイメージセクションの比較方法
US5572602A (en) Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
KR20130029430A (ko) 문자 인식 장치, 문자 인식 방법, 문자 인식 시스템, 및 문자 인식 프로그램
US5265171A (en) Optical character reading apparatus for performing spelling check
KR20100099154A (ko) 이미지 분석방법, 특히 이동 단말기용 이미지 분석방법
Casey et al. Optical recognition of chemical graphics
US6005976A (en) Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
CN112241730A (zh) 一种基于机器学习的表格提取方法和系统
US20070041643A1 (en) Character recognition apparatus and character recognition method
IL98293A (en) A method for distinguishing between text and graphics
JP2008108114A (ja) 文書処理装置および文書処理方法
US5119441A (en) Optical character recognition apparatus and method using masks operation
JP2002074266A (ja) 文字読取装置および文字読取方法
JP3319203B2 (ja) 文書ファイリング方法及び装置
JP2003196592A (ja) 画像処理プログラム及び画像処理装置
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JP3157530B2 (ja) 文字切り出し方法
JPH0830725A (ja) 画像処理装置及び方法
JPH10154207A (ja) 文字切出し方法および文字切出し装置
KR100292352B1 (ko) 형태소 분석을 이용한 인식기의 편집방법
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JPH05174185A (ja) 日本語文字認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090710

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090818