JP3606218B2 - 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法 - Google Patents

文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法 Download PDF

Info

Publication number
JP3606218B2
JP3606218B2 JP2001101803A JP2001101803A JP3606218B2 JP 3606218 B2 JP3606218 B2 JP 3606218B2 JP 2001101803 A JP2001101803 A JP 2001101803A JP 2001101803 A JP2001101803 A JP 2001101803A JP 3606218 B2 JP3606218 B2 JP 3606218B2
Authority
JP
Japan
Prior art keywords
character
character string
coordinates
document
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001101803A
Other languages
English (en)
Other versions
JP2001312696A (ja
Inventor
直哉 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001101803A priority Critical patent/JP3606218B2/ja
Publication of JP2001312696A publication Critical patent/JP2001312696A/ja
Application granted granted Critical
Publication of JP3606218B2 publication Critical patent/JP3606218B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字列照合を利用した文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法に関する。
【0002】
【従来の技術】
近年、情報処理のコンピュータ化が進んでおり、例えば、帳票の画像をイメージスキャナによって読み取り、読み取った画像中の文字列をコード情報に変換したデータをデータベースなどに投入することが行われている。この場合、データの投入を正確に行うためには、コンピュータとしては帳票の構造を知る必要があり、所定の書式の帳票であるかどうかを判別し、書式毎に分類する必要がある。
【0003】
このような帳票の分類の方法として、読み取った帳票上の特定の位置に記載されている帳票名などの文字列のパターンを予め記憶されているパターン(テンプレートなど)と照合するものがある。しかしながら、帳票上の文字列は、一般に印刷ずれや読み取りの際に生じる歪みによって位置ずれや、読み取りの際に生じる画像濃度の局所的な変動が生じるため、正確に切り出すことができない。このように不正確に切り出された文字列のパターンを予め記憶されているパターンと照合しても文字列の有無を判定することは困難であり、帳票の分類を行うことができない。
【0004】
そこで、従来の文字列照合方法(以下、従来例1という)として、次のようなものがあった。この方法では、画像の濃度情報に基づいて文字部分と背景部分とを分離する閾値を求め、この閾値によって画像を2値化して階調が同じ画素が連結した連結成分を検出する。そして、物理的な距離が近い連結成分を矩形で囲んで得られる文字単位の図形成分を検出し、検出した文字単位の図形成分を予め登録された文字テンプレートと照合していた。
【0005】
また、特開平7−239912号公報に示されている技術(以下、従来例2という)では、サンプル画像であるテンプレートの位置を、読み取った画像中の各文字の近傍の領域内で変更しながら、各位置で文字とテンプレートとの相互相関値を計算し、この相互相関値に従って文字照合を行っていた。
【0006】
【発明が解決しようとする課題】
しかしながら、上記従来例1では、1つの文字領域内で背景部分の濃度が変化する場合には、文字部分と背景部分とを分離するための適切に閾値を設定できないという問題点があった。すなわち、いずれの閾値に設定しても、文字の一部を背景部分と誤ってしまうか、背景の一部を文字部分と誤ってしまうという場合が生じ、文字単位の図形成文を予め登録されたテンプレートと正しく照合することができなかった。
【0007】
また、上記従来例2では、テンプレートの位置を変更する度に、その前の位置での相互相関値と比較しなければならない。そのため、必要となる演算コストが非常に大きく、文字列の照合を高速に実行することが困難であるという問題点があった。
【0008】
本発明は、上記従来例の問題点を解消するためになされたものであり、印刷ずれや画像入力時に生じた歪みによる位置ずれなどを高速、高精度に補正する文字列照合を利用することによって、高速かつ正確に帳票等の文書を分類する文書分類装置及び方法を提供することを目的とする。
【0009】
本発明は、また、上記の文字列照合を利用することによって、高速かつ正確に文書上の文字列をコード情報に変換する文字読み取り装置及び方法を提供することを目的とする。
【0010】
本発明は、さらに、上記の文字列照合を利用することによって、高速かつ正確に有価証券等の真贋を判定する真贋判定装置及び方法を提供することを目的とする。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明の第1の観点にかかる文書分類装置は、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列を含む文書の書式を識別するための識別情報とを対応付けて記憶する辞書記憶手段と、
前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
前記図形照合手段による照合結果に従って、前記辞書記憶手段に記憶されている識別情報を出力する出力手段と、を備え
前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0012】
上記目的を達成するため、本発明の第2の観点にかかる文字読み取り装置は、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列に対応する文字コードとを対応付けて記憶する辞書記憶手段と、
前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
前記図形照合手段による照合結果に従って、前記辞書記憶手段に記憶されている文字コードを出力する出力手段と、を備え
前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0013】
上記目的を達成するため、本発明の第3の観点にかかる真贋判定装置は、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記特徴量の許容域とを対応付けて記憶する辞書記憶手段と、
前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
前記図形照合手段の照合した特徴量の違いが前記辞書記憶手段に記憶されている許容域の範囲にあるかどうかを判定する真贋判定手段と、を備え
前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0014】
上記の第1〜第3の観点にかかる文書分類装置、文字読み取り装置及び真贋判定装置では、文字列照合を利用して、それぞれ文書の分類、文字読み取り、或いは有価証券などの真贋の判定を高速、かつ正確に行うことができる。
【0015】
上記目的を達成するため、本発明の第4の観点にかかる文書分類方法は、
文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列を含む文書の書式を識別するための識別情報とを対応付けて記憶した辞書を有するコンピュータシステムにおいて文書を分類する方法であって、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、
前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
検出した前記文書の位置に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
前記照合結果に従って、前記辞書に記憶されている識別情報を出力するステップと、を含み、
前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0016】
上記目的を達成するため、本発明の第5の観点にかかる文読み取り方法は、
文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列に対応する文字コードとを対応付けて記憶した辞書を有するコンピュータシステムにおいて文字を読み取る方法であって、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
検出した前記文書の位置に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
前記照合結果に従って、前記辞書に記憶されている文字コードを出力するステップと、を含み、
前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0017】
上記目的を達成するため、本発明の第6の観点にかかる真贋判定方法は、
前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記特徴量の許容域とを対応付けて記憶した辞書を有するコンピュータシステムにおいて文書の真贋を判定する方法であって、
文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、
前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
検出した前記文書の位置に従って、メモリに予め記憶されている前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
照合した特徴量の違いが前記辞書に記憶されている許容域の範囲にあるかどうかを判定するステップと、を含み、
前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
ことを特徴とする。
【0018】
【発明の実施の形態】
以下、添付図面を参照して、本発明の実施の形態について説明する。
この実施の形態では、帳票上の文字列を読み取り、読み取った文字列をもとに帳票を分類する帳票分類装置に適用した場合を例として説明する。
【0019】
図1は、この実施の形態にかかる帳票分類装置の機能構成を示す機能ブロック図である。
図示するように、この帳票分類装置は、画像入力装置1と、記憶装置2と、データ処理装置3と、出力装置4とを備える。
【0020】
画像入力装置1は、イメージスキャナ等によって構成され、帳票の画像を読み取って、多階調を有する2次元のディジタル画像として取り込む。画像入力装置1による帳票の画像の取り込みに際して、±5°程度の傾きは許容されるものとする。また、この実施の形態において、画像入力装置1は、少なくとも帳票中の帳票名が記載されている領域の画像を読み取ることができればよいものとする。
【0021】
記憶装置2は、半導体メモリ或いは磁気ディスク等によって構成され、画像記憶部21と、辞書記憶部22とを含む。画像記憶部21は、画像入力装置1によって帳票から読み取られたディジタル画像を記憶する。画像記憶部21に記憶されるディジタル画像は、画像の左上隅を原点とし、原点からそれぞれ水平方向及び垂直方向にとられたx軸とy軸とからなる座標系(以下、画像座標系という)によって各画素の位置が参照される。
【0022】
辞書記憶部22は、文字列の照合用のデータを記憶するもので、座標記憶域22aと、照合用特徴記憶域22bと、分類記憶域22cとがある。
座標記憶域22aには、照合用文字列の帳票上での座標が記憶されている。ここで、照合用文字列の座標は、帳票の左上隅を原点とし、上辺をu軸、左辺をv軸とする座標系(以下、帳票座標系という)によって表されている。
【0023】
照合用特徴記憶域22bには、照合用となる文字列の各文字図形領域を格子状の部分画像に分割し、各部分画像の階調値を平均化した特徴量が文字毎に記憶されている。分類記憶域22cには、分類対象となる帳票を識別するための識別情報が記憶されている。なお、座標記憶域22aに記憶されている照合用文字列の座標、照合用特徴記憶域22bに記憶されている特徴量及び分類記憶域22cに記憶されている識別情報は、例えば、ポインタによって関連付けられて記憶されている。
【0024】
データ処理装置3は、プログラムを記憶するメモリと、プログラム制御されるCPU(Central Processing Unit)とから構成され、CPUがプログラムを実行することによって実現される機能として帳票位置検出手段31、座標変換手段32、文字列座標値補正手段33、文字座標値補正手段34及び図形照合手段35を含む。
【0025】
帳票位置検出手段31は、画像記憶部21からディジタル画像を読み出し、読み出した画像中の帳票の位置を検出する。座標変換手段32は、帳票位置検出手段31が検出した帳票の位置に関する情報を受け取り、受け取った帳票の位置に関する情報に従って、座標記憶域22aに記憶されている照合用文字列の帳票上での座標系を帳票座標系から画像座標系に変換する。
【0026】
文字列座標値補正手段33は、主として印刷ずれなどの文字列の位置のずれを補正するもので、座標変換手段32で座標を変換した照合用文字列の座標値と画像入力手段で読み取った帳票上の文字列の座標値のずれを、画素投影プロファイルを用いて文字列単位で補正する。
【0027】
文字座標値補正手段34は、主として帳票の反り等によって生じる個々の文字毎の位置のずれを補正するもので、画素投影プロファイルを用いて座標値のずれをさらに文字毎に詳細に補正する。
【0028】
図形照合手段35は、文字列座標値補正手段33及び文字座標値補正手段34で座標値が補正された文字列を部分画像に切り出して特徴量を抽出し、抽出した特徴量を照合用特徴記憶域22bに記憶されている濃淡特徴量と照合する。図形照合手段35は、照合結果を出力装置4に出力する。
なお、データ処理装置3に含まれる各手段31〜35の機能については、さらに詳しく後述する。
【0029】
出力装置4は、例えば、表示装置などによって構成され、図形照合手段35の照合結果に基づいて分類記憶域22cに記憶されている帳票の分類を示す識別コードを出力する。出力装置4は、また、画像入力装置1で読み取られた帳票が図形照合手段35の照合結果により予め記憶されている分類に属する帳票でないと判断されるときは、その旨を出力する。
【0030】
以下、データ処理装置3において実現されている各機能について、詳しく説明する。
【0031】
帳票位置検出手段31は、画像記憶部21に記憶されている帳票の画像を読み出し、まず、x軸方向に上端から下端に向かって画像を順に走査し、走査線上で階調が大きく変化する点を検出する。このような走査で階調が大きく変化する点を2点以上検出し、検出した点群を回帰分析して、帳票の上辺の直線L1を求める。
【0032】
帳票位置検出手段31は、次に、y軸方向に左端から右端に向かって画像を順に走査し、走査線上で階調が大きく変化する点を検出する。このような走査で階調が大きく変化する点を2点以上検出し、検出した点群を回帰分析して、帳票の左辺の直線L2を求める。帳票位置検出手段31は、求めた上辺と左辺との直線L1、L2の交点(x0,y0)を求め、帳票の左上隅の点の位置として検出する。
【0033】
帳票位置検出手段31は、さらに、直線L1とx軸がなす角の大きさ、または直線L2のy軸がなす角の大きさ、もしくはこれらの平均値を、帳票の回転角θ0として求める。
【0034】
座標変換手段32は、辞書記憶部22の座標記憶域22aに記憶されている照合用文字列の各文字の帳票座標系による座標値を読み出し、読み出した帳票座標系による座標値を、数式1の計算を行って画像座標系の座標値に変換する。
【0035】
【数1】
x=ucosθ0+vsinθ0+x0
y=−usinθ0+vcosθ0+y0
但し、u、vは、帳票座標系での座標値、x、yは、画像座標系での座標値である。
【0036】
文字列座標値補正手段33は、座標記憶部22aに記憶されている文字列がIの文字からなる場合、文字列中のi番目の文字の外接矩形の左上隅の座標変換後の座標値を(xs(i),ys(i))、高さと幅をそれぞれH(i)、W(i)とする。また、画像中に含まれる文字の左上隅の座標を(xs2(i),ys2(i))、高さと幅をそれぞれH2(i)、W2(i)とする。
【0037】
ここで、文字列全体に一様に生じているずれ成をΔx、Δy、ΔHとし、残りのずれ成をdx(i)、dy(i)、dH(i)、dW(i)とすると、xs2(i)、ys2(i)、H2(i)、W2(i)は、それぞれ数式2によって表すことができる。
【0038】
【数2】
xs2(i)=xs(i)+Δx+dx(i)
ys2(i)=ys(i)+Δy+dy(i)
H2(i)=H(i)+ΔH+dH(i)
W2(i)=W(i)+dW(i)
【0039】
文字列座標値補正手段33は、画像上でxs(i)、ys(i)、H(i)、W(i)の4つのデータで表される文字の外接矩形を周囲にLだけ拡大した矩形領域B(i)を求める。文字列座標値補正手段33は、各文字の上端のy座標値であるys(i)が一致するようにy座標を揃え、この領域B(i)内においてx軸方向に画素投影(画素毎の階調値を加算することをいう。以下、同じ)を行って、I個の文字それぞれの水平方向画素投影プロファイルPY(i,y)を生成する。
【0040】
文字列座標値補正手段33は、次に、文字列中のI個の文字すべての水平方向画素投影プロファイルPY(i,y)について、y座標毎に加算し、文字列を単位とする水平方向画素投影プロファイルPYA(y)を求める。
【0041】
文字列座標値補正手段33は、こうして求めた水平方向画素投影プロファイルPYA(y)から、下記の数式3を用いて、Δy=[−TY,+TY]、ΔH=[−TH,+TH]の範囲で評価値VYを最小化するΔyとΔHの値の組を見つける。
【数3】
VY=PYA(Δy)+PYA(Δy+H+ΔH)
但し、TYは、文字列中の文字の高さの平均値の2分の1程度の値、THは微少な値であり、予め設定されている。
【0042】
文字列座標値補正手段33は、次に、y軸方向にも領域B(i)内の画素を投影し、各文字の左端のx座標値であるxs(i)が一致するようにx座標を揃え、I個の文字それぞれの垂直方向画素投影プロファイルPX(i,x)を生成する。文字列座標値補正手段33は、次に、文字列中のI個の文字すべての垂直方向画素投影プロファイルPX(i,x)について、x座標毎に加算し、文字列を単位とする垂直方向画素投影プロファイルPXA(x)を求める。
【0043】
文字列座標値補正手段33は、こうして求めた垂直方向画素投影プロファイルPXA(x)から、下記の数式4を用いて、Δx=[−TX,+TX]の範囲で評価値VXを最大とするΔxを見つける。
【数4】
VX=PXA(Δx)−PXA(Δx−1)
但し、TXは、文字列中の文字の幅の2分の1程度の値である。
【0044】
文字列座標値補正手段33は、以上のようにして求めたΔx、Δy、ΔHの値を用いて、例えば、印刷ずれなどによる帳票上の文字列のずれを補正する。
【0045】
文字座標値補正手段34は、文字列中のI個の文字のそれぞれについて、順次次のような処理を行う。なお、以下の説明では、処理対象となる文字が文字列中のi番目のものであるとする。
【0046】
文字座標値補正手段34は、文字単位の水平方向画素投影プロファイルPY(i,y)から、下記の数式5を用いて、dy(i)=[−TY2,+TY2]、dH(i)=[−TH2,+TH2]の範囲でVY2を最小化するdy(i)とdH(i)の組を見つける。
【0047】
【数5】
VY2=PY(i,Δy+dy(i))+PY(i,Δy+H(i)+ΔH+dy(i)+dH(i))
但し、TY2及びTH2はそれぞれ、予め与えれた値であり、例えば、TY=5、TH=5に設定されている。
【0048】
文字座標値補正手段34は、文字単位の垂直方向画素投影プロファイルPX(i,y)から、下記の数式6を用いて、dx(i)=[−TX2,+TX2]、dW(i)=[−TW2,+TW2]の範囲でVX2を最小化するdx(i)とdW(i)の組を見つける。
【0049】
【数6】
VX2=PX(i,Δx+dx(i))+PX(i,Δx+dx(i)+W(i)+dW(i))
但し、TX2及びTW2はそれぞれ、予め与えれた値であり、例えば、TX=5、TW=5に設定されている。
【0050】
図形照合手段35は、文字列座標値補正手段33及び文字座標値補正手段34によって座標値が補正された画像中の文字列の各文字の外接矩形領域に従って、各文字を切り出す。図形照合手段35は、切り出した各文字を部分画像に分割し、各文字の特徴量を抽出する。
【0051】
図形照合手段35は、さらに、抽出した各文字の特徴量を照合用特徴量記憶域22bに記憶されている各文字の照合用特徴量と、照合し、それぞれの類似度s(i)を求める。
【0052】
図形照合手段35は、さらに、求めた類似度s(i)の平均値smを求め、これを照合結果として出力装置4に出力する。
【0053】
以下、この実施の形態にかかる帳票分類装置の動作について、図2〜図4のフローチャートを参照して説明する。
【0054】
なお、動作についての理解を容易にするために、具体例として図5〜図7を挙げて説明する。ここでは、分類対象となる帳票には、「出」、「金」、「伝」、「票」の4文字からなる文字列が記載されているものとし、標準的な帳票(照合用帳票)での帳票座標系の座標が座標記憶域22aに記憶されているものとする。各文字の座標は、外接矩形の左上隅の座標値が(us(i),vs(i))、高さがH(i)、幅がW(i)である(但し、i=1,2,3,4)。また、これらの文字の特徴量が照合用特徴記憶域22bに記憶されているものとする。
【0055】
図2のフローチャートの処理では、最初に、画像入力装置1は、階調有する2次元のディジタル画像として帳票の画像を取り込む。画像入力装置1は、取り込んだディジタル画像を記憶装置2の画像記憶部21に記憶させる(ステップS1)。この画像記憶部21に記憶されている画像を、図5に示す。
【0056】
画像の入力が完了すると、次に、帳票位置検出手段31は、画像記憶部21に記憶されている画像を読み出し、読み出した画像中の帳票の上辺と左辺とを検出する。帳票位置検出手段31は、検出した帳票の上辺と左辺とから、帳票の左上隅の座標値(x0,y0)及び傾き角θ0を求める(ステップS2)。求められた座標値(x0,y0)及び傾き角θ0は、座標変換手段32に供給される。
【0057】
座標変換手段32は、辞書記憶部22の座標記憶域22aに記憶されている文字列の各文字の外接矩形の座標に関する情報を読み出す(ステップS3)。座標変換手段32は、読み出した情報の内、各文字の外接矩形の左上隅の座標値(us(i),vs(i))を、上記した数式1に従って画像座標系の座標値(xs(I),ys(i))に変換する(ステップS4)。図5に、これらの外接矩形を、一点鎖線で示す。この画像座標系に座標変換された外接矩形の座標は、文字列座標値補正手段33に供給される。
【0058】
次に、文字列座標値補正手段33は、文字列単位の位置合わせ(文字列単位での座標のずれの補正)の処理を行う(ステップS5)。
図3は、ステップS5の文字列単位の位置合わせの処理を詳細に示すフローチャートである。
【0059】
文字列座標値補正手段33は、まず、座標変換手段32によって座標変換した照合用文字列の外接矩形を、上下左右にそれぞれLだけ拡大した部分領域B(i)を求める。これらの部分領域B(i)を、図5に破線で示す。
【0060】
文字列座標値補正手段33は、これらの部分領域B(i)のそれぞれについて、x軸方向に画素投影し、文字毎の水平方向画素投影プロファイルPY(i)を生成する(ステップS501)。ここで、「出」、「金」、「伝」、「票」の各文字の部分領域B(i)を図6(a)〜(d)に、それぞれに対応する水平方向画素投影プロファイルを図6(e)〜(h)に示す。
【0061】
文字列座標値補正手段33は、次に、ステップS501で求めた文字毎の水平方向画素投影プロファイルPY(i、y)を、各文字の上端のy座標値が一致するように重ね合わせ、文字列を単位とする水平方向画素投影プロファイルPYA(y)を生成する(ステップS502)。この文字列を単位とする水平方向画素投影プロファイルPYA(y)の例を、図6(i)に示す。
【0062】
次に、文字列座標値補正手段33は、上記の数式3で求められる評価値VYが取り得ない程大きい値であるMAXINTで、変数VYminを初期化する(ステップS503)。文字列座標値補正手段33は、さらに、Δy2を定数−TYで初期化し(ステップS504)、ΔHを定数−THで初期化する(ステップS505)。
【0063】
文字列座標値補正手段33は、上記の数式3の演算を行って、評価値VYを算出する(ステップS506)。文字列座標値補正手段33は、次に、ステップS506で算出した評価値VYが変数VYminよりも小さいかどうかを判別する(ステップS507)。
【0064】
ステップS507で評価値VYが変数VYminよりも小さくないと判別されたときは、文字列座標値補正手段33は、そのままステップS509の処理に進む。ステップS507で評価値VYが変数VYminよりも小さいと判別されたときは、文字列座標値補正手段33は、評価値VYの値を変数VYminに、Δy2の値をΔyに、ΔH2の値をΔHにそれぞれ代入する(ステップS508)。そして、文字列座標値補正手段33は、ステップS509の処理に進む。
【0065】
ステップS509では、文字列座標値補正手段33は、ΔH2の値を“1”だけインクリメントする。そして、文字列座標値補正手段33は、ΔH2の値が予め設定されている定数THよりも大きいかどうかを判別する(ステップS509)。
【0066】
ステップS509でΔH2の値が定数THよりも大きくないと判別されたときは、文字列座標値補正手段33は、再びステップS506の処理を実行する。
【0067】
ステップS509でΔH2の値が定数THよりも大きいと判別されたときは、文字列座標値補正手段33は、Δy2の値を“1”だけインクリメントする(ステップS511)。そして、文字列座標値補正手段33は、Δy2の値が定数TYよりも大きいかどうかを判別する(ステップS512)。
【0068】
ステップS512でΔy2の値が定数TYよりも大きくないと判別されたときは、文字列座標値補正手段33は、再びステップS505の処理を実行する。
ステップS512でΔy2の値が定数TYよりも大きいと判別されたときは、文字列座標値補正手段33は、各部分領域B(i)においてy座標の値をΔyから(Δy+H+ΔH)の範囲に限定して、y軸方向に画素投影し、文字毎の垂直方向画素投影プロファイルPX(i,x)を生成する(ステップS513)。ここで、「出」、「金」、「伝」、「票」の各文字の部分領域B(i)を図7(a)〜(d)に、それぞれに対応する垂直方向画素投影プロファイルを図7(e)〜(h)に示す。
【0069】
文字列座標値補正手段33は、次に、ステップS513で求めた文字毎の水平方向画素投影プロファイルPY(i、y)を、各文字の左端のx座標値が一致するように重ね合わせ、文字列を単位とする垂直方向画素投影プロファイルPXA(y)を生成する(ステップS514)。この文字列を単位とする垂直方向画素投影プロファイルPXA(x)の例を、図7(i)に示す。
【0070】
次に、文字列座標値補正手段33は、変数VXmaxを値“0”で初期化し(ステップS515)、さらにΔx2を定数−TXで初期化する(ステップS516)。
【0071】
文字列座標値補正手段33は、上記の数式4の演算を行って、評価値VXを算出する(ステップS517)。文字列座標値補正手段33は、次に、ステップS517で算出した評価値VXが変数VXmaxよりも大きいかどうかを判別する(ステップS518)。
【0072】
ステップS518で評価値VXが変数VXmaxよりも大きくないと判別されたときは、文字列座標値補正手段33は、そのままステップS520の処理に進む。ステップS518で評価値VXが変数VXmaxの値よりも大きいと判別されたときは、文字列座標値補正手段33は、評価値VXの値を変数VXmaxに、Δx2の値をΔxにそれぞれ代入する(ステップS519)。そして、文字列座標値補正手段33は、ステップS520の処理に進む。
【0073】
ステップS520では、文字列座標値補正手段33は、Δx2の値を“1”だけインクリメントする。そして、文字列座標値補正手段33は、Δx2の値が定数TXよりも大きいかどうかを判別する(ステップS521)。
【0074】
ステップS521でΔx2の値が定数TXよりも大きくないと判別されたときは、文字列座標値補正手段33は、再びステップS517の処理を実行する。ステップS521でΔx2の値が定数TXよりも大きいと判別されたときは、文字列座標値補正手段33は、このフローチャートの処理、すなわち図2のステップS5の処理を終了する。
【0075】
文字列座標値補正手段33が、ステップS5の処理(図3のフローチャートの処理)を終了すると、次に、文字座標値補正手段34が、文字単位位置あわせ(文字単位での座標のずれの補正)の処理を行う(ステップS6)。
【0076】
図4は、ステップS6の文字単位の位置合わせの処理を詳細に示すフローチャートである。このフローチャートの処理は、各文字について実行されるが、すべて同様の処理によって実行されるため、ここでは、1文字についてのみの処理内容を説明する。
【0077】
文字座標値補正手段34は、まず、上記の数式5で求められる評価値VY2が取り得ない程大きい値であるMAXINTで、変数VY2minを初期化する(ステップS601)。文字座標値補正手段34は、さらに、dy2を定数−TY2で初期化し(ステップS602)、dH2を定数−TH2で初期化する(ステップS603)。
【0078】
文字座標値補正手段34は、上記の数式5の演算を行って、評価値VY2を算出する(ステップS604)。文字座標値補正手段34は、次に、ステップS604で算出した評価値VY2が変数VY2minよりも小さいかどうかを判別する(ステップS605)。
【0079】
ステップS605で評価値VY2が変数VY2minよりも小さくないと判別されたときは、文字座標値補正手段34は、そのままステップS607の処理に進む。ステップS605で評価値VY2が変数VY2minよりも小さいと判別されたときは、文字座標値補正手段34は、評価値VY2の値を変数VY2minに、dy2の値をdy(i)に、dH2の値をdH(i)にそれぞれ代入する(ステップS606)。そして、文字座標値補正手段34は、ステップS607の処理に進む。
【0080】
ステップS607では、文字座標値補正手段34は、dH2の値を“1”だけインクリメントする。そして、文字座標値補正手段34は、dH2の値が予め設定されている定数TH2よりも大きいかどうかを判別する(ステップS608)。
【0081】
ステップS608でdH2の値が定数TH2よりも大きくないと判別されたときは、文字座標値補正手段34は、再びステップS604の処理を実行する。
【0082】
ステップS608でdH2の値が定数TH2よりも大きいと判別されたときは、文字座標値補正手段34は、dy2の値を“1”だけインクリメントする(ステップS609)。そして、文字座標値補正手段34は、dy2の値が定数TY2よりも大きいかどうかを判別する(ステップS610)。
【0083】
ステップS610でdy2の値が定数TY2よりも大きくないと判別されたときは、文字座標値補正手段34は、再びステップS602の処理を実行する。
【0084】
ステップS610でdy2の値が定数TY2よりも大きいと判別されたときは、文字座標値補正手段34は、上記の数式6で求められる評価値VX2が取り得ない程大きい値であるMAXINTで、変数VX2minを初期化する(ステップS611)。文字座標値補正手段34は、さらに、dx2を定数−TX2で初期化し(ステップS612)、dW2を定数−TW2で初期化する(ステップS613)。
【0085】
文字座標値補正手段34は、上記の数式6の演算を行って、評価値VX2を算出する(ステップS614)。文字座標値補正手段34は、次に、ステップS614で算出した評価値VX2が変数VX2minよりも小さいかどうかを判別する(ステップS615)。
【0086】
ステップS615で評価値VX2が変数VX2minよりも小さくないと判別されたときは、文字座標値補正手段34は、そのままステップS617の処理に進む。ステップS615で評価値VX2が変数YX2minよりも小さいと判別されたときは、文字座標値補正手段34は、評価値VX2の値を変数VX2minに、dx2の値をdx(i)に、dW2の値をdW(i)にそれぞれ代入する(ステップS616)。そして、文字座標値補正手段34は、ステップS617の処理に進む。
【0087】
ステップS617では、文字座標値補正手段34は、dW2の値を“1”だけインクリメントする。そして、文字座標値補正手段34は、dW2の値が予め設定されている定数TW2よりも大きいかどうかを判別する(ステップS618)。
【0088】
ステップS618でdW2の値が定数TW2よりも大きくないと判別されたときは、文字座標値補正手段34は、再びステップS604の処理を実行する。
【0089】
ステップS618でdW2の値が定数TW2よりも大きいと判別されたときは、文字座標値補正手段34は、dx2の値を“1”だけインクリメントする(ステップS619)。そして、文字座標値補正手段34は、dx2の値が定数TX2よりも大きいかどうかを判別する(ステップS620)。
【0090】
ステップS620でdx2の値が定数TX2よりも大きくないと判別されたときは、文字座標値補正手段34は、再びステップS613の処理を実行する。
【0091】
ステップS620でdx2の値が定数TX2よりも大きいと判別されたときは、画像記憶部21に記憶された画像中の文字列の各文字の外接矩形に補正を加えた座標(Δx+dx(i),Δy+dy(i))、H(i)+ΔH+dH(i)、W(i)+dW(i)を算出し、図形照合手段35に供給する。そして、文字座標値補正手段34は、このフローチャートの処理、すなわち図2のステップS6の処理を終了する。
【0092】
文字座標値補正手段34が、ステップS6の処理(図4のフローチャートの処理)を終了すると、次に、図形照合手段35は、ステップS5、S6で補正した座標に従って「出」、「金」、「伝」、「票」の各文字から部分画像を切り出す(ステップS7)。
【0093】
図形照合手段35は、切り出した部分画像から各文字の特徴量を抽出し、辞書記憶部22の照合用特徴量記憶域22bに格納されている照合用特徴量と照合する。そして、照合の結果得られた各文字についての類似度の平均値smを算出する(ステップS8)。算出された類似度の平均値smは、出力装置4に供給される。
【0094】
そして、出力装置4は、図形照合手段35から供給された類似度の平均値smに従って、辞書記憶部22の分類記憶域22cに記憶されている「出金伝票」の帳票を識別するための識別情報を出力する(ステップS9)。以上で、帳票の分類が終了し、このフローチャートの処理を終了する。
【0095】
以上説明したように、この実施の形態の帳票分類装置では、画像入力装置1から取り込まれ、画像記憶部21に記憶されている画像に含まれる文字列の位置ずれが、まず、文字列座標値補正手段33によって文字列全体で大まかに補正され、さらに文字座標値補正手段34によって文字単位で細かく補正される。このため、照合用文字列の座標との位置ずれを高速に補正することが可能となる。
【0096】
また、画像入力装置1から多階調の画像が取り込まれ、各文字を多階調で表現した特徴量に従って文字の照合が行われる。このため、画像中の各画素を2値化する場合のように、文字部分を背景部分として誤ったり、背景部分を文字部分として誤ったりすることがない。このため、精度の高い文字照合が可能となる。
【0097】
そして、この実施の形態の帳票分類装置は、上記のような文字照合を利用することによって、高速かつ高精度な帳票の分類が可能となる。
【0098】
本発明は、上記の実施の形態で説明したものに限られず、様々な変形、応用が可能である。以下、本発明において適用可能な上記の実施の形態の変形態様について、説明する。
【0099】
上記の実施の形態では、1文字以上からなる文字列の照合に本発明を適用した場合について説明した。この場合の「文字」の具体例としては、「出」、「金」、「伝」、「票」という4つの漢字を挙げた。しかしながら、本発明において照合対象とする「文字」としては、漢字の他、平仮名、片仮名、アルファベット等の自然言語を記述するためのあらゆる種類の文字や、さらには、数学記号や星形等の図形などを含めて適用することができる。
【0100】
上記の実施の形態では、横書きの文字列の場合についての処理を説明したが、本発明は、縦書きの文字列の場合であっても同様に適用することができる。この場合は、垂直方向画素投影プロファイルと水平方向画素投影プロファイルとの適用が、上記の実施の形態の場合と逆になる。
【0101】
上記の実施の形態では、画像入力装置1によって帳票から階調を有する2次元ディジタル画像を取り込み、画像記憶部21に記憶させていた。しかしながら、処理対象となる画像は、例えば、ディジタルスチルカメラで撮影し、ディジタルスチルカメラ内のメモリから画像記憶部21に転送してもよい。
【0102】
上記の実施の形態では、帳票分類装置は棄却判定の機能を有していないが、この機能を有するものとしてもよい。図8は、棄却判定の機能を有する帳票分類装置の機能構成を示す機能ブロック図である。
この帳票分類装置は、図1の帳票分類装置とほぼ同じであるが、データ処理装置5において文字列座標値補正手段51が第1の実施の形態のものと異なる。
【0103】
文字列座標値補正手段51は、棄却判定部51aを含む。棄却判定部51aは、生成された画素投影プロファイルの値の変動によって画像中に文字列が含まれるかどうかを判定する。文字列座標値補正手段51は、文字列が含まれないと判定したときは、文字列単位での座標値の補正、文字単位での座標値の補正及び特徴量の照合といった以後の処理を中止させる。
【0104】
上記の実施の形態では、データ処理装置3は、メモリとCPUとによって構成され、CPUがメモリに記憶されたプログラムを実行することによって各手段31〜35の機能が実現されていた。これに対し、図9に示すように、データ処理装置7が実行するプログラムをCD−ROM6a等のコンピュータ読み取り可能な記録媒体に格納して配布し、ディスクドライブ6を駆動してCD−ROM6aに格納されたプログラムをデータ処理装置7のメモリに順次読み込ませ、CPUが実行するようにしてもよい。
【0105】
上記の実施の形態では、本発明を帳票分類装置に適用した場合について説明した。しかしながら、本発明は、帳票以外の文書の分類にも適用することができる。また、本発明は、文書の分類以外にも、例えば、光学式文字読み取り装置(OCR:Optical Character Reader)や有価証券等の印刷文書の真贋を判定する真贋判定装置にも適用することができる。
【0106】
図10は、本発明の実施の形態の変形にかかるOCRの機能構成を示す機能ブロック図である。
このOCRでは、記憶装置8が図1の帳票分類装置の記憶装置2と異なり、辞書記憶部81が分類記憶域22cの代わりに、コード情報記憶域81aを有する。また、出力装置9が図1の帳票分類装置のものと異なる。
【0107】
コード情報記憶域81aには、文字に対応するコード情報が記憶されている。また、図形照合手段35は、類似度を、平均値ではなく、それぞれの文字についてのものを出力する。そして、出力装置9は、コード情報記憶域81aに記憶されている各文字のコード情報を出力する。
【0108】
このような構成により、文字列の書かれた文書の画像を読み取って、これらの文字列中の各文字を文字コードに変換することを、高速かつ正確に行うことができる。
【0109】
図11は、本発明の実施の形態の変形にかかる真贋判定装置の機能構成を示す機能ブロック図である。
この真贋判定装置は、記憶装置10が図1の帳票分類装置の記憶装置と異なり、辞書記憶部101が分類記憶域22cの代わりに許容値記憶域101aを有する。また、出力装置11が警報手段11aを有する点で、図1の帳票分類装置の出力装置4と異なる。
【0110】
許容値記憶域101aは、画像中の文字列の特徴量と照合用文字列の特徴量との差の許容値を記憶する。また、出力装置11は、図形照合手段35から供給された類似度が許容値記憶域101aに記憶された許容値以上である場合に、警報手段11aから警報を発する。
【0111】
このような構成により、所定の文字列が記載されている有価証券などの文書の真贋の判定を、高速かつ正確に行うことができる。
【0112】
【発明の効果】
以上説明したように、本発明によれば、文字列の位置ずれを文字列単位で大まかに補正し、さらに、文字単位で細かく補正するので、文字列の位置ずれの補正を高速に行うことができる。また、多階調の画像データから抽出した特徴量で文字列の照合が可能となるので、高精度の照合が可能となる。このような文字列照合を利用することにより、文書の分類、文字読み取り、或いは有価証券などの真贋の判定を高速、かつ正確に行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかる帳票分類装置の機能構成を示す機能ブロック図である。
【図2】本発明の実施の形態にかかる動作を示すフローチャートである。
【図3】本発明の実施の形態にかかる動作を示すフローチャートである。
【図4】本発明の実施の形態にかかる動作を示すフローチャートである。
【図5】帳票の具体例を示す図である。
【図6】(a)〜(i)は、本発明の実施の形態にかかる動作の具体例を示す図である。
【図7】(a)〜(i)は、本発明の実施の形態にかかる動作の具体例を示す図である。
【図8】本発明の実施の形態の変形にかかる帳票分類装置の機能構成を示す機能ブロック図である。
【図9】本発明の実施の形態の変形にかかる帳票分類装置の機能構成を示す機能ブロック図である。
【図10】本発明の実施の形態の変形にかかる光学式文字読み取り装置の機能構成を示す機能ブロック図である。
【図11】本発明の実施の形態の変形にかかる真贋判定装置の機能構成を示す機能ブロック図である。
【符号の説明】
1 画像入力装置
2 記憶装置
3 データ処理装置
4 出力装置
5 データ処理装置
6 ディスクドライブ
6a CD−ROM
7 データ処理装置
8 記憶装置
9 出力装置
10 記憶装置
11 出力装置
11a 警報手段
21 画像記憶部
22 辞書記憶部
22a 座標記憶域
22b 照合用特徴記憶域
22c 分類記憶域
31 帳票位置検出手段
32 座標変換手段
33 文字列座標値補正手段
34 文字座標値補正手段
35 図形照合手段
51 文字列座標値補正手段
51a 棄却判定部
81 辞書記憶部
81a コード情報記憶域
101 辞書記憶部
101a 許容値記憶域

Claims (6)

  1. 文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
    前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列を含む文書の書式を識別するための識別情報とを対応付けて記憶する辞書記憶手段と、
    前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
    前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
    前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
    前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
    前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
    前記図形照合手段による照合結果に従って、前記辞書記憶手段に記憶されている識別情報を出力する出力手段と、を備え
    前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする文書分類装置。
  2. 文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
    前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列に対応する文字コードとを対応付けて記憶する辞書記憶手段と、
    前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
    前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
    前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
    前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
    前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
    前記図形照合手段による照合結果に従って、前記辞書記憶手段に記憶されている文字コードを出力する出力手段と、を備え
    前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする文字読み取り装置。
  3. 文字列を含む所定の書式の文書から取り込んだ多階調の画像データを記憶する画像記憶手段と、
    前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記特徴量の許容域とを対応付けて記憶する辞書記憶手段と、
    前記画像記憶手段に記憶されている画像データ中での前記文書の位置を検出する位置検出手段と、
    前記位置検出手段の検出結果に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換する座標変換手段と、
    前記画像記憶手段に記憶された画像データに含まれる文字列全体の座標と前記座標変換手段によって座標系が変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正手段と、
    前記文字列座標補正手段で文字列を単位として座標が補正された文字列中に含まれる各文字の座標と前記座標変換手段によって座標系が変換された前記文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正手段と、
    前記文字座標補正手段で各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書記憶手段に記憶されている前記文字列が有するべき特徴量と照合する図形照合手段と、
    前記図形照合手段の照合した特徴量の違いが前記辞書記憶手段に記憶されている許容域の範囲にあるかどうかを判定する真贋判定手段と、を備え
    前記文字列座標補正手段は、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正手段は、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする真贋判定装置。
  4. 文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列を含む文書の書式を識別するための識別情報とを対応付けて記憶した辞書を有するコンピュータシステムにおいて文書を分類する方法であって、
    文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、
    前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
    検出した前記文書の位置に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
    前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
    文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
    各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
    前記照合結果に従って、前記辞書に記憶されている識別情報を出力するステップと、を含み、
    前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする文書分類方法。
  5. 文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記文字列に対応する文字コードとを対応付けて記憶した辞書を有するコンピュータシステムにおいて文字を読み取る方法であって、
    文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
    検出した前記文書の位置に従って、前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
    前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
    文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
    各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
    前記照合結果に従って、前記辞書に記憶されている文字コードを出力するステップと、を含み、
    前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする文字読み取り方法。
  6. 前記文書中で文字列の各文字が位置すべき座標と、前記文字列が有するべき特徴量と、前記特徴量の許容域とを対応付けて記憶した辞書を有するコンピュータシステムにおいて文書の真贋を判定する方法であって、
    文字列を含む所定の書式の文書から取り込んだ多階調の画像データをメモリに記憶させるステップと、
    前記メモリに記憶された画像データ中での前記文書の位置を検出するステップと、
    検出した前記文書の位置に従って、メモリに予め記憶されている前記文書中で文字列中の各文字が位置すべき座標の座標系を前記文書を元にした文書座標系から前記画像データの取り込み状態を元にした画像座標系に変換するステップと、
    前記メモリに記憶された画像データに含まれる文字列全体の座標と画像座標系に変換された前記文書中で文字列が位置すべき座標とのずれを文字列単位で補正する文字列座標補正ステップと、
    文字列単位で座標が補正された文字列中に含まれる各文字の座標と画像座標系に変換された前記文書中で文字列の各文字が位置すべき座標とのずれを文字単位で補正する文字座標補正ステップと、
    各文字の座標が補正された前記文書から取り込まれた画像データ中の文字列の特徴量を抽出し、抽出した特徴量を前記辞書に記憶されている前記文字列が有するべき特徴量と照合するステップと、
    照合した特徴量の違いが前記辞書に記憶されている許容域の範囲にあるかどうかを判定するステップと、を含み、
    前記文字列座標補正ステップは、前記画像データ中の文字列の各文字の画素投影プロファイルを前記文字列の並び方向で加算したものと、前記各文字の画素投影プロファイルを前記文字列の並び方向と垂直方向で加算したものとを用いて、文字列単位での座標のずれを補正し、
    前記文字座標補正ステップは、前記画像データ中の各文字の文字列の並び方向の画素投影プロファイルと、前記文字列の並び方向と垂直方向の画素投影プロファイルとを用いて、文字単位での座標のずれを補正する、
    ことを特徴とする真贋判定方法。
JP2001101803A 2001-03-30 2001-03-30 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法 Expired - Fee Related JP3606218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001101803A JP3606218B2 (ja) 2001-03-30 2001-03-30 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001101803A JP3606218B2 (ja) 2001-03-30 2001-03-30 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP08190798A Division JP3223878B2 (ja) 1998-03-27 1998-03-27 文字列照合装置、方法及び記録媒体

Publications (2)

Publication Number Publication Date
JP2001312696A JP2001312696A (ja) 2001-11-09
JP3606218B2 true JP3606218B2 (ja) 2005-01-05

Family

ID=18955071

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001101803A Expired - Fee Related JP3606218B2 (ja) 2001-03-30 2001-03-30 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法

Country Status (1)

Country Link
JP (1) JP3606218B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4614320B2 (ja) * 2004-10-25 2011-01-19 株式会社リコー 位置合わせ装置、位置合わせ方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2001312696A (ja) 2001-11-09

Similar Documents

Publication Publication Date Title
EP0063454B1 (en) Method for recognizing machine encoded characters
JP5934762B2 (ja) 文字の形状特徴を使用した文字比較による文書改変検知方法、コンピュータプログラム、記録媒体および情報処理装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
US20050271275A1 (en) Text character identification system and method thereof
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6975761B1 (en) Image processing for clustering related text objects
JP3223878B2 (ja) 文字列照合装置、方法及び記録媒体
US11983864B2 (en) Object matching device
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
US5408540A (en) Character slant recognition in a word image
CN113537216B (zh) 一种点阵字体文本行倾斜校正方法及装置
JP4635845B2 (ja) Ocr装置、フォームアウト方法及びフォームアウトプログラム
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
JP6039944B2 (ja) 帳票種類判別装置および帳票種類判別方法
JP3998439B2 (ja) 画像処理装置、画像処理方法およびこれらの方法をコンピュータに実行させるプログラム
JP2923004B2 (ja) 画像生成装置
JP2708604B2 (ja) 文字認識方法
JP3277977B2 (ja) 文字認識方法
JP3381803B2 (ja) 傾き角検出装置
CN114495142A (zh) 文档段落位置提取装置
JPH0660220A (ja) 文書画像の領域抽出方法
JP3578247B2 (ja) 文字認識方法および装置
CN115578729A (zh) 数字员工ai智能流程编排方法
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JPH05274472A (ja) 画像認識装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040927

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071015

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081015

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091015

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101015

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111015

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121015

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees