JP2014153820A - 文字切り出し装置及び文字切り出し方法 - Google Patents

文字切り出し装置及び文字切り出し方法 Download PDF

Info

Publication number
JP2014153820A
JP2014153820A JP2013021483A JP2013021483A JP2014153820A JP 2014153820 A JP2014153820 A JP 2014153820A JP 2013021483 A JP2013021483 A JP 2013021483A JP 2013021483 A JP2013021483 A JP 2013021483A JP 2014153820 A JP2014153820 A JP 2014153820A
Authority
JP
Japan
Prior art keywords
character
pixel value
minimum pixel
image data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013021483A
Other languages
English (en)
Other versions
JP6080259B2 (ja
Inventor
Hiroshi Nakamura
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Sankyo Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2013021483A priority Critical patent/JP6080259B2/ja
Priority to US14/174,424 priority patent/US9158986B2/en
Publication of JP2014153820A publication Critical patent/JP2014153820A/ja
Application granted granted Critical
Publication of JP6080259B2 publication Critical patent/JP6080259B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

【課題】証明書等に記載された文字を読み取る際に、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になり、実時間性を満足する文字切り出し装置及び文字切り出し方法を提供する。
【解決手段】文字切り出し装置は、線図形等が存在する文字列を撮像して得られた多値画像データを処理して、文字列を形成する文字を切り出す文字切り出し部82を有し、文字切り出し部82は、多値画像データにおいて、文字列方向と直交する方向の画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部821と、最小画素値曲線に基づき、文字の区切り位置を決定する文字区切り位置決定部822と、最小画素値曲線から線図形等を示す最小画素値を検出して二値化しきい値を求め、多値画像データの二値化処理を行う二値化処理部823と、各文字の画像データを抽出する文字切り出し実行部と、を備えている。
【選択図】図1

Description

本発明は、紙やプラスチック等の情報記録媒体上に記載された文字列を撮像して得られた画像データを処理することによって文字列を認識する文字列認識技術に係り、特に、撮像された画像内の文字列の区切り位置を検索して文字を認識する文字切り出し装置及び文字切り出し方法に関する。
従来から、キャッシュカード、従業者証、社員証、会員証、学生証、外国人登録証及び運転免許証等の各種証明書において、情報記録媒体(以下、「媒体」という)、上に記載された記載事項(例えば、文字列)をOCR(Optical Character Recognition)等により画像データとして読み取り、記載事項の文字認識を行う技術が知られている。一般に、OCR処理では、スキャナにより媒体上の文字が光学的に読み取られ、読み取った文字画像を切り出し、この文字画像と予め用意されている文字パターンとを比較するパターンマッチングを行い、パターン同士の適合する割合が高く、よくマッチする文字パターンを抽出することにより1文字1文字の画像が認識される。
OCR処理において文字認識を行う場合には、一般に、行区切り位置(文字列の切り出し位置)の特定を行い、位置決定された文字列において、文字間の区切り位置を特定して、文字列から各文字を切り出す必要がある。一方、各種証明書には、媒体上に記載される文字の記入領域に線図形等(媒体上に書かれた文字を強調するために、アンダーラインや文字の背景に点、線、網掛け等を規則正しく並べた模様)を装飾された文字列が存在するものがある。一般的なOCR処理では、文字領域に線図形等が存在すると、文字の切り出し位置を間違えることにより、文字の認識ができない場合がある。また、文字を認識できたとしても、一般的なOCR処理では、文字領域に存在する線図形等の影響を受けて、文字の正確な認識率が著しく低下してしまう。そのため、従来より、認識対象となる文字を含む画像が線図形等を含む画像の場合に、その線図形等を除去することが行われている。
従来、このような文字領域に線図形等が存在する文字列から各文字を切り出す文字切り出し装置としては、例えば、文字列の背景に斜線を有する運転免許証の免許証番号において文字認識をする際に、背景に斜線が入った5つ目から8つ目の文字列を正確かつ効率的に読み取る技術が開示されている(特許文献1参照)。特許文献1に示す文字切り出し装置は、スキャナにより取得された免許証番号部分の画像において、背景に斜線が入った5つ目から8つ目の文字画像について、斜線がほぼ水平になる角度に文字画像を回転し、回転した文字画像より、水平方向に線を構成する黒画素成分(斜線成分)を除去し、その文字画像の特徴ベクトルを抽出し、回転文字画像専用に設定された第2辞書を用いて文字認識を行う。
特開2008−234291号公報
しかしながら、特許文献1に示す文字切り出し装置では、背景に斜線が入った文字画像を回転する操作すなわち座標変換を行う処理時間の増大につながる。また、特許文献1に示す文字切り出し装置では、標準の文字辞書とは別に回転文字用の辞書(第2辞書)を備えなくてはならないため、記憶域が余分に必要となる。さらに斜線部分の文字を45度回転して斜線部分が水平となるようにし、この水平線の部分を特徴ベクトルから除去することで斜線の影響を排除しようとしているが、斜線や文字印刷位置の状態によっては、完全にマスクすることができず、辞書との照合が安定的に行えない恐れがある。
上述した文字切り出し装置は、複雑な演算を行うため構成が複雑になり、処理時間も増大する。その結果、特許文献1に示す文字切り出し装置では、従来より性能のよい(大型の)コンピュータを用いないと充分な処理速度を実現できず、たとえば、従来の(パーソナルコンピュータ程度の比較的小型の)コンピュータでは充分な処理速度の実現が困難であるという問題がある。
そこで、本発明の目的は、証明書等の媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在する場合でも、簡単な構成で正確な文字切り出しが可能になり、実時間性を満足する文字切り出し装置及び文字切り出し方法を提供することにある。
以上のような課題を解決するために、本発明は、以下のものを提供する。
(1)情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し部を有する文字切り出し装置であって、前記文字切り出し部は、前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部と、前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り位置決定部と、前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理部と、各文字の画像データを抽出する文字切り出し実行部と、を備えたことを特徴とする文字切り出し装置。
本発明によれば、線図形等が存在する文字列を撮像して得られた多値画像データにおいて、最小画素値曲線作成部が文字列方向と直交する方向に配置された画素列を構成する画素の中で最小画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線に基づき、文字区切り位置決定部が文字の区切り位置を決定すると共に、二値化処理部が線図形等を示す最小画素値を検出して該最小画素値に基づく二値化しきい値を用いて前記多値画像データの二値化処理を行い、文字切り出し実行部が各文字の画像データを抽出するから、証明書等の情報記録媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になる。
本発明の文字切り出し装置は、文字の記入領域に線図形等が存在していても、座標変換などの計算負荷が大きい処理をすることなく確実に文字を切り出すことができるから、パーソナルコンピュータ程度の比較的小型のコンピュータを用いても実時間性を満足することが可能になる。
(2)前記二値化処理部が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする。
本発明によれば、二値化処理部が文字と文字との間に形成された空白区間における最小画素値曲線の最小画素値を検出するから、空白区間に斜線や模様などの線図形等が描かれていても、線図形等の存在する部分の最小画素値を求めることができ、この最小画素値を二値化しきい値として多値画像データの二値化処理を行うことにより、線図形等を構成する画素は確実に二値化しきい値を上回り、線図形等を構成する画素が黒領域にマップされることはない。従がって、二値化によって背景に描かれた線図形等を確実に排除することができ、文字認識にとって望ましい二値化を行うことが可能になる。
(3)前記文字区切り位置決定部が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする。
本発明によれば、文字区切り位置決定部が仮の二値化しきい値を算出して多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定するから、文字の記入領域に線図形等が存在していても、確実に文字区間と空白区間の境界を決定することが可能になる。
(4)情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し方法であって、前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成工程と、前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り処理工程と、前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理工程と、各文字の画像データを抽出する文字切り出し処理工程と、を備えたことを特徴とする文字切り出し方法。
本発明によれば、線図形等が存在する文字列を撮像して得られた多値画像データにおいて、最小画素値曲線作成工程で文字列方向と直交する方向に配置された画素列を構成する画素の中で最小画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線に基づき、文字区切り処理工程で文字の区切り位置を決定すると共に、二値化処理工程で線図形等を示す最小画素値を検出して該最小画素値に基づく二値化しきい値を用いて前記多値画像データの二値化処理を行い、文字切り出し処理工程で各文字の画像データを抽出するから、証明書等の情報記録媒体上に記載された文字を読み取る際に、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になる。
本発明の文字切り出し方法は、文字の記入領域に線図形等が存在していても、座標変換などの計算負荷が大きい処理をすることなく確実に文字を切り出すことができるから、パーソナルコンピュータ程度の比較的小型のコンピュータを用いても実時間性を満足することが可能になる。
(5)前記二値化処理工程が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする。
本発明によれば、二値化処理工程が文字と文字との間に形成された空白区間における最小画素値曲線の最小画素値を検出するから、空白区間に斜線や模様などの線図形等が描かれていても、線図形等の存在する部分の最小画素値を求めることができ、この最小画素値を二値化しきい値として多値画像データの二値化処理を行うことにより、線図形等を構成する画素は確実に二値化しきい値を上回り、線図形等を構成する画素が黒領域にマップされることはない。従がって、二値化によって背景に描かれた線図形等を確実に排除することができ、文字認識にとって望ましい二値化を行うことが可能になる。
(6)前記文字区切り処理工程が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする。
本発明によれば、文字区切り処理工程で仮の二値化しきい値を算出して多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定するから、文字の記入領域に線図形等が存在していても、確実に文字区間と空白区間の境界を決定することが可能になる。
本発明によれば、運転免許証などの証明書等に記載された線図形等が存在する文字列を多値画像データとして読み取って文字認識する際に、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成し、この最小画素値曲線から線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求めて多値画像データの二値化処理を行うから、文字の記入領域に線図形等が存在していても、簡単な構成で正確な文字切り出しが可能になり、実時間性を満足することが可能となる。
本実施形態に係る文字切り出し装置としての文字認識装置の全体構成を示すブロック図である。 運転免許証の画像の一例を示す図である。 文字認識装置における文字認識部の機能構成を示すブロック図である。 文字認識装置における文字列切り出し部の機能構成を示すブロック図である。 文字認識装置における文字切り出し部の機能構成を示すブロック図である。 本実施形態に係る文字切り出し装置としての文字認識装置の動作を説明するためのフローチャートである。 本実施形態に係る文字列切り出し処理を示すフローチャートである。 本実施形態に係る文字切り出し処理を示すフローチャートである。 本実施形態に係る文字区切り処理を示すフローチャートである。 本実施形態に係る二値化処理を示すフローチャートである。 運転免許証番号の画像の一例を説明する説明図である。 運転免許証番号の文字列の画像から計算される射影パターンの一例を示す図である。 斜線除去処理が施された運転免許証番号の画像の一例を示す図である。
以下、本発明を実施するための最良の形態について、図面を参照しながら説明する。
図1は、本実施形態に係る文字切り出し装置としての文字認識装置の全体構成を示すブロック図である。
図1において、100は文字認識装置であり、画像の文字認識処理などを行うデータ処理部1と、画像を入力するスキャナ等の画像入力部2と、処理後の画像を表示する画像表示部3と、から構成されている。
データ処理部1において、4は画像メモリであり、画像入力部2から入力される画像データを記憶する。5はCPU等からなる制御部であり、画像入力部2から供給される信号に従って画像データを生成する。6は画像データ等を記憶する記憶部であり、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)等で構成される。記憶部6には、氏名、住所、運転免許証番号等の項目毎に各領域の画像を抽出するための各領域を示す情報(以下「画像情報抽出情報」という)が格納されている。また、記憶部6には、どの項目の画像情報(画像データ)を抽出するかを選択するための情報(以下「項目選択情報」という)が格納されている。
8は文字認識部であり、文字領域として抽出された領域に対し、文字認識処理を行う。10は、画像表示部3とのインターフェースとなる出力インターフェース(I/F)部である。なお、文字認識部8における処理は、制御部5が記憶部6に記憶されているコンピュータプログラムを実行することによって実現されてもよい。
画像入力部2は、運転免許証40に対して照射される光の反射光に基づいて画像読取を行う。画像入力部2は、光電変換して、反射した光量をアナログ電気信号に変換するCCDラインセンサ等の密着型の1次元撮像素子(図示略)と、アナログ電気信号を256階調の多値(デジタル)画像データに変換するA/D変換器(図示略)と、ノイズ除去、画像の平滑化(画素ごとの濃度値の細かい変動を取り除き、滑らかな画像とする処理)、画像の鮮鋭化(画像の濃度値の変化を強調する処理)などの前処理を行う前処理部(図示略)とを有する。画像表示部3は、ディスプレー等の表示パネルを備える。なお、画像表示部3は、表示パネルに代えてプリンタ等を備える構成であってもよい。
図2は、運転免許証40の画像の一例を示す図である。図示のように、運転免許証40には、利用者の氏名や住所、生年月日等の各種情報が枠線f内に記載されているとともに、識別番号(識別文字列)である運転免許証番号(図2中の「第 123456789001 号」)が記載されている。
識別文字は、文字の大きさ(幅や高さ)がほぼ同じであり、文字と文字との間にはスペース(空白区間)が形成されている。例えば、運転免許証40の運転免許証番号等がある。識別文字には、文字、数字、記号等も含まれる。また、本実施の形態では、図2及び図11に示すように、実際の運転免許証番号の5桁目の数字c(5)=「8」から8桁目の数字c(8)=「5」には、文字に赤色の斜線がかかっている。そのため、この斜線がかかった箇所は反射光の強度が低いため、多値画像データにした場合、黒を示す0よりは明るい値を示している。
[文字認識部]
図3は、文字認識装置における文字認識部8の機能構成を示すブロック図である。
文字認識部8は、文字列切り出し部81と、文字切り出し部82と、特徴抽出部83と、特徴比較部84と、特徴辞書格納部85と、類似文字認識部86と、を有し、画像入力部2によって読み取られた画像から文字を認識する。なお、これらの各部は、運転免許証40上の文字列を認識する文字列認識手段の一例として機能する。
文字列切り出し部81は、記憶部6に記憶された項目選択情報(免許証番号領域P1)に従って項目を選択するとともに、記憶部6に記憶された画像情報抽出情報に従って、選択した項目に対応する領域を特定する。文字列切り出し部81は、特定した領域に対応する画像データを画像メモリ4から読み出す。また、本実施の形態では、多階調(256階調)の濃淡画像である。なお、この画像メモリ4は、RAM、SDRAM、DDRSDRAM、RDRAMなど、画像データを記憶しうるものであれば如何なるものであってもよい。文字列切り出し部81は、画像入力部2により読み取られた画像において、識別文字列が記されているべき領域からの反射光の分布を検出することによって文字列の画像データを検出する。文字列切り出し部81は文字切り出し装置の検出部の一例である。
図4は、文字認識装置における文字列切り出し部の機能構成を示すブロック図である。
図4に示すように、文字列切り出し部81は、射影ヒストグラム作成部811と、原点位置検出部812と、文字列切り出し実行部813と、を備えている。さらに、射影ヒストグラム作成部811は、X軸射影ヒストグラム作成部及びY軸射影ヒストグラム作成部を有する。また、原点位置検出部812は、運転免許証40の枠線f(X軸方向に延びる線分fxとY軸方向に延びる線分fy)を検出する枠線検出部と、線分fxと線分fyとの延長線上の交点(原点位置)foを示す画素を検出する原点位置検出部と、を有する。たとえば、1画素は"0"(黒画素)から"255"(白画素)までの256階調(8ビット)の輝度値を持つ。画像データの図に対して最も左上の画素を原点(0,0)とする。この原点位置となる画素からX軸方向、Y軸方向の座標を用いて、免許証番号が記載されているP1の領域を示す四隅の画素位置(座標)が設定されている。
文字列切り出し部81の射影ヒストグラム作成部811は、運転免許証40における情報記録領域を示す枠線fを、水平方向及び垂直方向における濃度ヒストグラムを算出して検出する。なお、文字列切り出し部81は、運転免許証40に枠線fが存在しない場合には運転免許証40の端を検出してもよい。また、搬送時の搬送手段のガイド面(運転免許証40を搭載する面)に色等をつけて運転免許証との境界位置を明確にしてもよい。なお、射影ヒストグラム作成部811は、外形矩形領域を設定して、高さ方向の位置を切り出すようにしてもよい。
文字列切り出し実行部813は、予め設定されている免許証番号領域P1の多値画像データを画像メモリ4から抽出する。画像情報抽出部(図示略)は、射影計算部(図示略)によって検出された枠線fの画素位置を基準として、免許証番号領域P1の四隅の画素の位置等を指定する。文字列切り出し実行部813は、運転免許証40の外形と情報記録領域を示す枠線f及びその近傍までの範囲を算出する。なお、本実施の形態では、図11に示す矩形画像は、免許証番号領域P1において、「第」と「号」との文字の間に記載されている免許証番号「123456789001」を用いて説明している。
図5は、文字認識装置における文字切り出し部の機能構成を示すブロック図である。
文字切り出し部82は、文字列切り出し部81によって検出された文字列の画像データについて、垂直方向に射影計算を行う。そして、求められた垂直射影プロファイルを用いて、文字と文字との間のスペース(空白区間)を識別し、文字の切り出しを行う。なお、詳細については後述する。この処理により、認識対象となっている文字の外接矩形領域(上下左右の座標値)が求められる。
文字切り出し部82は、最小画素値曲線作成部821と、文字区切り位置決定部822と、二値化処理部823と、文字切り出し実行部824と、を備えている。
最小画素値曲線作成部821は、図11に示すように、切り出された免許証番号領域P1の画像データを用いて、文字列方向(X軸方向)と直交する垂直方向(Y軸方向)に配置された画素列の中で、最も小さい画素値を抽出して、図12に示すような最小画素値曲線を作成する。文字切り出し部82は、最小画素値曲線作成部821によって算出された曲線を用いて、免許証番号領域P1から免許証番号(文字列)を構成する各番号(文字)の両端の位置を切り出す。
最小画素値曲線作成部821は、水平方向(X軸方向)と直交する垂直方向(Y軸方向)に配列した画素列の中で最小画素値から、文字列の両端の位置を検出する。すなわち、X軸のある位置XaにおけるY軸方向(垂直方向)に配列された画素(画素列)の中で、最小画素値を検出し、その最小画素値を、ある位置Xaおける最小画素値として求める。より具体的には、文字が形成されている画素列では画素列の中で1画素でも黒を示す0があれば、その位置における最小画素値は0となり、文字が形成されていない画素列における最小画素値は白(255)となる。これらをX軸方向に画素列ごとに最小画素値をもとめたのが、図12に示す最小画素値曲線である。
文字区切り位置決定部822は、文字列を構成する各文字の位置を検出して各文字を抽出する。具体的には、文字列を構成する文字の中で、最両端に位置する文字を抽出する。抽出した両端の各文字の中心位置を検出し、左端文字の中心位置と右端文字の中心位置との差を求め、その差を「文字列の文字数」から1を引いた数で等分する。実施例では、文字列が免許証番号であり、免許証番号は12文字であるため、11等分して各文字の中心位置を検出する。本実施の形態では、文字区切り位置決定部822は、項目選択情報(免許証番号領域P1)内の多値画像データに基づき、仮の二値化しきい値を計算する仮二値化しきい値計算部と、項目選択情報(免許証番号領域P1)内の免許証番号の両端に位置する文字を抽出する両端文字抽出部と、項目選択情報(免許証番号領域P1)内に記載されている文字列を構成する各文字(免許証番号)の中心位置を検出する文字中心位置検出部と、各文字の両端位置を検出する文字両端位置検出部と、項目選択情報(免許証番号領域P1)内に記載されている文字列の全文字数を計数する文字数計数部と、を有している。
また、文字区切り位置決定部822には、各文字両端位置検出部(図示略)と、文字数計数部(図示略)と、を備えている。
各文字両端位置検出部は、左から2番目の文字から右端の1つ手前の文字までの各文字について、各文字の両端位置を検出する。文字数計数部は、各文字の両端位置が所定の範囲(文字幅)に入っているか否かを判定する。実施例では、文字数計数部は、切り出された文字に従って、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致するか否かを判定している。文字数計数部は、識別文字列が記されているべき領域内にある文字の数が予め定められた数と一致すると判定された場合には、運転免許証40の画像の方向が正立方向であると判定する。
二値化処理部823は、媒体上に記載される文字の記入領域に線図形等(媒体上に書かれた文字を強調するために、アンダーラインや文字の背景に点、線、網掛け等を規則正しく並べた模様)を装飾された文字列の中で、線図形等を示す多値画像データを検出する。本実施の形態では、二値化処理部823は、最小画素値検出部と、二値化しきい値計算部と、を有している。このような二値化処理部823は、切り出された項目選択情報(免許証番号領域P1)の多値画像データを用いて、文字列方向(X軸方向)と直交する垂直方向(Y軸方向)に配置された画素列の中で、最も小さい画素値を抽出して最小画素値曲線を作成する。最小画素値曲線中で、線図形等が形成されている領域の中で、最小画素値を検出して、この最小画素値を二値化閾値として、二値化処理する。
図3において、特徴抽出部83は、上述した切り出された1文字の領域を任意のサブ領域に分割(例えば、切り出された1文字の領域を5×5の領域に分割し、そのうち1個の領域をサブ領域とする)し、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。
特徴比較部84は、特徴抽出部83で求められた特徴ベクトルを、予めこの媒体で使用される全文字について求めておいた基準特徴ベクトルと比較して、類似度(例えば正規化相関係数)が最も高いものをその文字が該当する候補文字に設定する。なお、基準特徴ベクトルは、予め特徴辞書格納部85に格納されているものであって、特徴比較が行われる際に、特徴辞書格納部85から類似度が高い文字のデータが読み出され、特徴比較が行われる。
類似文字認識部86は、特徴比較部84によって設定された候補文字を、媒体に用いられた文字として認識する。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部86において、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別を行う。例えば、任意に分割したサブ領域を左側半分と右側半分との2領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との2領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対称と同様に点対称で類似性を調べてもよい。
[文字認識装置の全体の動作]
次に、本実施形態に係る文字認識装置の全体的な動作について図6に関連付けて説明する。図6は、本実施形態に係る文字切り出し装置としての文字認識装置の動作を説明するためのフローチャートである。
文字認識装置100は、運転免許証40に記載されている12文字の運転免許証番号を読み取って文字コードに変換し、文字認識を行うことを主な処理内容としている。この処理は、図1に示す画像入力部2に運転免許証40が差し込まれることを契機として開始される。画像入力部2は、運転免許証40が差し込まれる差込口(図示略)を有しており、利用者によって運転免許証40が画像入力部2に差し込まれると、差し込まれた運転免許証40を媒体搬送機構(図示略)の搬送ガイドに沿って搬送し、撮像素子(図示略)を通過するときの反射光が光電変換され、A(analog)/D(digital)変換された後、画素ごとに多階調(例えば、256階調)の輝度値が画像メモリ4に取り込まれる。
運転免許証40の運転免許証番号(OCR文字記録)領域P1に印刷された運転免許証番号(OCR文字列)は、画像入力部2の媒体搬送機構の搬送ガイドに沿って運転免許証40が動かされると、1次元撮像素子によってその文字パターンが読み取られて光電変換さる(ステップST1)。
文字認識装置100のデータ処理部1は、画像入力部2で読み取られた画像に含まれる各画素の輝度値(画像データ)を画像メモリ4に記憶する(ステップS2)。
次に、文字認識部8において、画像入力部2によって読み取られ、画像メモリ4に記憶された画像から文字を認識する。先ず、文字列切り出し部81において、文字列の切り出し(行切り出し)が行われる(ステップST3)。具体的には、本実施形態に係る文字列切り出し部81において、後述で詳細に説明するが、文字列切り出し処理について図7に関連付けて説明する。
次いで、文字切り出し部82において、文字切り出しが行われる(ステップST4)。具体的には、後述で詳細に説明するが、文字切り出し処理について図8に関連付けて説明する。
また、後述で詳細に説明するが、図8の文字区切り処理の詳細について、図9に関連付けて説明する。
次に、文字切り出し部82の二値化処理部823において、文字区切り処理が実行された後、文字切り出し処理のための二値化処理を実行する。切り出された項目選択情報(免許証番号領域P1)の多値画像データを用いて、文字列方向(X軸方向)と直交する垂直方向(Y軸方向)に配置された画素列の中で、最も小さい画素値を抽出して最小画素値曲線を作成する。最小画素値曲線に基づき、文字列の中で装飾された線図形等が形成されている領域内で、最小画素値を検出して、この最小画素値を二値化閾値として、二値化処理する。
次いで、特徴抽出部83において、特徴抽出が行われる(ステップST5)。具体的には、特徴抽出部83において、上述した切り出された1文字の領域が任意のサブ領域に分割(例えば、切り出された1文字の領域を5×5の領域に分割され、そのうち1個の領域がサブ領域とされる)され、各サブ領域において、サブ領域内の全画素数に占める黒画素数の割合が求められ、それらを要素とする特徴ベクトルが生成される。
次いで、特徴比較部84において、特徴比較が行われる(ステップST6)。具体的には、特徴比較部84において、ステップST5で求めた特徴ベクトルが、予めこの媒体で使用される全文字について求められて予め特徴辞書格納部85に格納されている基準特徴ベクトルと比較されて、類似度(例えば、正規化相関係数)が最も高いものをその文字が該当する候補文字に設定される。
最後に、文字認識が行われる(ステップST7)。具体的には、ステップST6の特徴比較によって設定された候補文字が、媒体に用いられた文字として認識される。なお、類似度が一定値を超える候補文字が複数個存在する場合には、文字認識を行うことができないので、類似文字認識部86において、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別が行われる。
たとえば、任意に分割したサブ領域を左側半分と右側半分との2領域の左右線対称に分けて、部分特徴ベクトルを構成してそれらの間の類似性を調べたり、同様に上半分と下半分との2領域の上下線対称に分けて、類似性を調べたりしてもよい。また、左右線対称や上下線対象と同様に点対称で類似性を調べてもよい。
また、本実施形態の文字認識装置100は、運転免許証のみならず、カード、パスポート、あらゆる媒体への適用が可能である。
なお、以上詳細に説明した方法は、上記手順に応じたプログラムとして形成し、CPU等のコンピュータで実行するように構成することも可能である。また、このようなプログラムは、半導体メモリ、磁気ディスク、光ディスク、フロッピー(登録商標)ディスク等の記録媒体、この記録媒体をセットしたコンピュータによりアクセスし上記プログラムを実行するように構成可能である。
[文字列切り出し処理]
次に、文字列切り出し処理について図7に関連付けて説明する。図7は、本実施形態に係る文字列切り出し処理を示すフローチャートである。
文字列切り出し部81は、射影ヒストグラム作成部811が、画像入力部2によって読み取られた運転免許証40全体の多値画像データについて全体の射影を検出し、X方向(水平方向)射影、Y方向(垂直方向)射影を求める(ステップST31)。
射影ヒストグラム作成部811は、X軸射影ヒストグラム作成部及びY軸射影ヒストグラム作成部を有し、運転免許証40における情報記録領域を示す枠線fを、水平方向及び垂直方向における濃度ヒストグラムを算出して検出する。なお、文字列切り出し部81は、運転免許証40に枠線fが存在しない場合には運転免許証40の端を検出してもよい。また、搬送時の搬送手段のガイド面(運転免許証40を搭載する面)に色等をつけて運転免許証との境界位置を明確にしてもよい。
次に、文字列切り出し部81は、原点位置検出部812が、X方向射影及びY方向射影から運転免許証40の枠線fを検出して運転免許証40の画像の領域を特定する(ステップST32)。原点位置検出部812は、枠線fを構成する線分fxと線分fyとの延長線上の交点を求め、画像データの原点位置foを検出する(ステップST33)。
具体的には、原点位置検出部812は、運転免許証40の枠線f(X軸方向に延びる線分fxとY軸方向に延びる線分fy)を検出する枠線検出部と、線分fxと線分fyとの延長線上の交点(原点位置)foを示す画素を検出する原点位置検出部と、を有する。たとえば、1画素は"0"(黒画素)から"255"(白画素)までの256階調(8ビット)の輝度値を持つ。画像データの図に対して最も左上の画素を原点(0,0)とする。この原点位置となる画素からX軸方向、Y軸方向の座標を用いて、免許証番号が記載されているP1の領域を示す四隅の画素位置(座標)が設定されている。
次いで、文字列切り出し部81は、文字列切り出し実行部813が、運転免許証40の画像データから運転免許証番号が記載されている免許証番号領域P1を決定し、その領域P1の画像データを抽出する(ステップST34)。運転免許証番号は、図2に示すように、0〜9までの数字の組み合わせによる12文字(12桁数)で構成されている。例えば、図2に示す運転免許証40では、「第 123456789001 号」で運転免許証番号が表されている。なお、説明する上で、最右端の数字「1」を1桁目の数字として、c(1)とし、最左端の数字「1」を12桁目の数字として、c(12)とし、その間の数字を、右側から、c(2)、c(3)・・・・・c(11)とする。
[文字切り出し処理]
次に、文字切り出し処理について図8に関連付けて説明する。図8は、本実施形態に係る文字切り出し処理を示すフローチャートである。
文字切り出し部82は、最小画素値曲線作成部821が、免許証番号領域P1において、文字列方向(X軸方向)と直交する垂直方向(Y軸方向)に配置された画素列を構成する画素の中で、最も小さい画素値を抽出して、図12に示すような最小画素値曲線を作成する(ステップST41)。
すなわち、X軸のある位置XaにおけるY軸方向(垂直方向)に配列された画素(画素列)の中で、最小画素値を検出し、その最小画素値を、ある位置Xaおける最小画素値として求める。より具体的には、文字が形成されている画素列では画素列の中で1画素でも黒を示す0があれば、その位置における最小画素値は0となり、文字が形成されていない画素列における最小画素値は白(255)となる。これらをX軸方向に画素列ごとに最小画素値をもとめたのが、図12に示す最小画素値曲線である。また、本実施の形態では、図2及び図11に示すように、運転免許証番号の5桁目の数字c(5)=「8」から8桁目の数字c(8)=「5」には、文字に赤色の斜線がかかっており、この斜線がかかった箇所は反射光の強度が低いため、多値画像データにした場合、黒を示す0よりは明るい値を示している。
文字切り出し部82は、文字区切り位置決定部822が最小画素値曲線に基づいて仮の二値化しきい値を算出し、文字列の両端文字を抽出し、両端文字から各文字の中心位置を算出し、各文字の中心位置から各文字の両端位置を検出した後、文字数の計数を行う。そして、免許証番号領域P1内の文字の数が予め定められた数と一致するか否かを判定する(ステップST42)。この文字区切り処理についての詳細は後述する。
文字区切り位置決定部822において文字区切り処理が実行された後、二値化処理部823において文字切り出し処理のための二値化処理を実行する(ステップST43)。そして、文字切り出し実行部824は、二値化処理によって背景の線図形等が除去された各文字の外接矩形領域の画像データを抽出する(ステップST44)。この二値化処理の詳細についても後述する。
[文字区切り処理]
図8の文字区切り処理(ステップS42)の詳細について、図9に示すフローチャートを参照しつつ説明する。図9は、本実施形態に係る文字区切り処理を示すフローチャートである。
先ず、文字区切り位置決定部822は、仮二値化しきい値計算部が、切り出された免許証番号領域P1の矩形画像(図11を参照)に含まれる各画素の画素値を用いて、仮の二値化しきい値を計算する(ステップST4211)。なお、本実施の形態では、図11に示す矩形画像は、免許証番号領域P1において、「第」と「号」との文字の間に記載されている免許証番号「123456789001」を用いて説明している。
二値化処理は、具体的には文字区切り位置決定部822が画像メモリ4の多値画像データ全体を走査し、二値化のための輝度のしきい値を設定した後に、しきい値以上の輝度を持つ画素を白画素("1"のデータ)、しきい値未満の輝度を持つ画素を黒画素("0"のデータ)とすることにより行なわれる。ここにしきい値の設定方法として、たとえば田村秀行監修、日本工業技術センター編、「コンピュータ画像処理入門」,総研出版,1988年,p.66〜p.69に述べられている方法(判別分析法、p−タイル法、モード法など)を用いることができる。本実施例においてはその中の判別分析法が用いられる。一般的に、判別分析法は異なる輝度値を持つ画素の集合をしきい値(th)により2つのクラス(th以上とth未満)に分割したと仮定したとき、各々のクラス間の分散が最大になるようにしきい値(th)を設定する方法である。本実施例では、仮の二値化しきい値bth=50と計算で求められている。
図12は、このようにして生成されたヒストグラムの一例を示している。図12において、横軸はX軸方向の(画像メモリ上の画素)位置を示し、縦軸はX軸方向に配列されている画素の中での最小画素値を示す。この例では、黒色の画素値を「0」とし、白色の画素値を「255」としている。
両端文字抽出部は、射影P(x)を左方からスキャンして、運転免許証番号の左端位置Xsを求める(ステップST4212)。実施例では、両端文字抽出部は、射影P(x)を左方からスキャンしていき、最小画素値が仮の二値化しきい値(bth=50)より小さくなる位置であって左方から2番面の位置を検出している。
図2に示す運転免許証の実施例では、左方からスキャンした場合に、運転免許証番号の左側に「第」の文字が記載されているが、文字列切り出し実行部813で処理され、この文字の位置でも度数が閾値よりも低くなるため、両端文字抽出部は、最小画素値が仮の二値化しきい値(bth=50)よりも小さくなる位置であって、左方から2番目の位置を運転免許証番号の左端位置として検出する。両端文字抽出部は、図11における最左端の数字c(12)=「1」の左端位置をXsとしている。
ステップST4212の処理を終えると、両端文字抽出部は、位置Xsを開始点として射影P(x)をスキャンし、最上位桁数字の右端位置Xsを求める(ステップST4213)。最上位桁数字は、図11に示す運転免許証番号の中で最左端の数字c(12)=「1」を示している。具体的には、例えば、両端文字抽出部は、位置Xsを開始点として射影P(x)をスキャンし、最小画素値が仮の二値化しきい値(bth=50)以上となる位置を右端位置Xsとする。
次いで、各文字の文字中心位置検出部は、以下の式(1)を用いて、最上位桁数字の中央位置Xc(12)を求める(ステップST4214)。
Xc(12)=(Xs+Xs)/2 …(1)
次いで、両端文字抽出部は、以下の式(2)を用いて、運転免許証番号の概略右端位置Xeを求める(ステップST4215)。式(2)において、Dxは運転免許証番号の12桁の文字列のX軸方向の幅を表す値であり、予め設定された値である。
Xe=Xs+Dx …(2)
次いで、両端文字抽出部は、位置Xeを開始点として射影P(x)を右方からスキャンして最下位桁数字の左端位置Xeを求める(ステップST4216)。最下位桁数字は、図11に示す運転免許証番号の中で最右端の数字c(1)=「1」を示している。この処理は、具体的には、例えば、両端文字抽出部が、Xeを開始点として射影P(x)を右方からスキャンし、最小画素値が仮の二値化しきい値(bth=50)以上となる位置を左端位置Xeとする。
次いで、各文字の文字中心位置検出部は、以下の式(3)を用いて、最下位桁数字の中央位置Xcを求める(ステップST4217)。
Xc(1)=(Xe+Xe)/2 …(3)
さらに、各文字の文字中心位置検出部は、以下の式(4)を用いて、文字間隔の現実値Dcを求める(ステップST4218)。
Dc=(Xc(1)−Xc(12))/11 …(4)
次いで、文字中心位置検出部は、2桁から11桁までのk桁における各文字の中央位置Xc(k)を、以下の式(5)を用いて算出する(ステップST4219)。ただし、以下の式(5)において、k=2,…11とする。
Xc(k)=Xc(1)−(k−1)*Dc …(5)
次いで、文字中心位置検出部は、各文字のそれぞれについて、文字の中央位置Xc(k)から文字の端の位置までの最大許容距離を設定する(ステップST4220)。本実施形態では、文字中心位置検出部は、最大許容距離として文字間隔の現実値Dcを設定する。
次いで、文字両端位置検出部及び文字数計数部はステップST4221からステップST4228の処理を行うことによって、免許証番号領域P1に存在する文字の数が12であるか否かを判定する。ステップST4221からステップST4228において、カウンタは、左から何番目の文字かを示すカウンタであり、エラーカウンタは、エラーの回数を示すカウンタである。また、最大許容距離は、文字の中央位置から文字の右端位置までの許容される最大の距離を示す。先ず、文字数計数部は、カウンタに1を設定するとともに、エラーカウンタにゼロを設定する(ステップST4221)。
次いで、文字両端位置検出部は、カウンタによって示される文字の中央位置Xc(カウンタ)から射影P(x)を右方向に最大許容距離までスキャンし、輝度値が仮の二値化しきい値以上となる位置を検出することによって、カウンタによって示される文字の右端位置を検出する(ステップST4222)。
ステップST4222の処理において、最大許容距離の範囲内に文字の右端位置が検出されなかった場合は、ステップST4223において「NO」と判断し、文字数計数部はエラーカウンタをインクリメントする(ステップST4224)。
また、文字両端位置検出部は、カウンタによって示される文字の中央位置Xc(カウンタ)から射影P(x)を左方向に最大許容距離までスキャンし、輝度値が仮の二値化しきい値以上となる位置を検出することによって、カウンタによって示される文字の左端位置を検出する(ステップST4225)。ステップST4225の処理において、最大許容距離の範囲内に文字の左端位置が検出されなかった場合は、ステップST4226において「NO」と判断し、文字数計数部はエラーカウンタをインクリメントする(ステップST4227)。
次いで、文字数計数部は、カウンタの値が12であるか否かを判定し(ステップST4228)、判定結果が否定的である場合には(ステップST4228;NO)、カウンタをインクリメントし(ステップST4229)、ステップST4222の処理に戻る。
一方、ステップST4228において判定結果が肯定的である場合には(ステップST4228;YES)、文字数計数部は、エラーカウンタがゼロであるか否かを判定し(ステップST4230)、エラーカウンタがゼロである場合には(ステップST4230;YES)、文字数は12であると判定する(ステップST4231)。一方、エラーカウンタがゼロでない場合には(ステップST4230;NO)、文字数は12でないと判定する(ステップST4232)。
[二値化処理]
文字区切り位置決定部822において文字区切り処理が実行された後、二値化処理部823において文字切り出し処理のための二値化処理を実行する。
図2及び図11に示すように、運転免許証番号の5桁目の数字c(5)=「8」から8桁目の数字c(8)=「5」には、文字に赤色の斜線がかかっており、この斜線がかかった箇所は反射光の強度が低いため、仮の二値化しきい値によっては斜線の箇所も文字として検出されてしまい、文字の検出が適切になされない場合がある。そのため、文字の検出を適切に行うべく、二値化処理部823が以下の処理を行って、斜線部分の画素値の中で最小画素値を検出して、その画素値を正式な二値化しきい値として決定している。
先ず、二値化処理部823は、上述した仮の二値化しきい値(bth=50)を定め、射影P(x)がこの仮の二値化しきい値bthよりも高い区間を空白区間と判定する。この空白区間は、文字(数字)と文字(数字)の間の区間と考えられる。すなわち、この空白区間には、文字を示す画素はなく、斜線部分を示す画素値と斜線がない画素値とのいずれかであると考えられる。
次いで、二値化処理部823は、各空白区間における射影P(x)の最小画素値を求める。図12において、S1からS12は免許証番号の数字が形成された文字区間であり、たとえばS1とS2との間は、文字が形成されていない空白区間となっている。そこで、本実施例では、5桁目の数字c(5)=「8」から8桁目の数字c(8)=「5」までの文字に斜線がかかっている区間において、S4とS5との間、S5とS6との間、S6とS7との間、S7とS8との間について、各区間の最小画素値を検出する。この各区間での最小画素値が検出された後、二値化処理部823は、これら全区間の中で、最小となる画素値を検出する。そして、二値化処理部823は、この最小画素値を二値化しきい値として用いる。
この態様によれば、斜線がかけられている箇所を含む区間における射影P(x)の最小画素値を二値化しきい値として用いるため、斜線がかけられている箇所は確実に二値化しきい値を上回る。そのため、斜線がかけられている箇所が文字区間として検出されることがない。
上述の実施形態において、文字区切り位置決定部822に係る処理を実行した後に、運転免許証番号の文字にかかった斜線部分を取り除く処理を行うようにしてもよい。この場合の処理方法について、図10乃至図13を参照しつつ説明する。
図11は、運転免許証番号の画像の一例を説明する説明図である。図2及び図11に示すように、免許証番号は5桁目の数字c(5)=「8」から8桁目の数字c(8)=「5」までの文字に赤色の斜線が施されている。この斜線を除去して文字を取り出す二値化処理について以下に説明する。
図10は、本実施形態に係る二値化処理を示すフローチャートである。最小画素値検出工程は、図12において、空白区間(特に、斜線がかけられているS4とS5の間・・・S7とS8の間)における最小画素値を検出する。ここで、X射影は通常のX射影ではなく、特別な射影計算を行う。すなわち、射影算出部は、文字領域画像をS(i,j)と表すとき、Smin(X)=min(S(i,X))を求める。これは直線x=iにおける最小画素値である。このSmin(X)を図12に示す(ステップST431)。
二値化しきい値検出工程は、Smin(X)に基づいて、二値化しきい値を求める。二値化しきい値検出工程は、先ず、仮の二値化しきい値bthを定める。例えば、bth=50とする(図12参照)。二値化しきい値検出工程は、Smin(X)において、関数値がbthを下回ればその区間を文字区間Bと判定し、上回ればその区間を空白区間Wと判定する。ここで、斜線とSmin(X)との関係に注目すると、斜線は5文字目から8文字目にかけて施されており、これは図12における空白区間のうち、斜線がかかる部分の関数値はそうでない部分よりも小さいことがわかる。この斜線がかかる5個の連続する空白区間(図12の影をつけた部分;S4とS5の間・・・S7とS8の間)について、Smin(X)の最小画素値を求め、これを二値化しきい値BinThreshとする。図12の例では、BinThresh=52となる(ステップST432)。
二値化処理工程は、この二値化しきい値BinThreshを用いて文字領域画像の二値化を行う(ステップST433)。その結果、図13に示す画像が得られる。図13に示すように、二値化によってもとの文字領域画像の斜線が除去されていることがわかる。この方式では、斜線の存在する部分の最小画素値を求め、これを二値化の閾値としているため、斜線の部分は確実に閾値を上回ることが保証されている。したがって二値化によって斜線画素が黒領域にマップされることはないので、文字認識にとって望ましい二値化を行うことができる(ステップST434)。
(本実施例の主な効果)
本発明の文字切り出し装置及び文字切り出し方法は、運転免許証に記載された文字領域に斜線が存在する文字列を画像データとして読み取って文字認識する際に、画像データを回転する操作、すなわち座標変換を伴わないため計算負荷が軽く、装置のコストを低く抑えつつ、処理時間の短縮につなげることができる。また、本装置は、回転文字用の辞書を備えなくてよいので、余分な記憶域が不要となる。さらに、本発明は、文字と文字との間に形成された空白区間における斜線部分の最小画素値を求めてこれを閾値とするため、斜線画素が黒領域にマップされることが確実に排除されるため、文字認識にとって望ましい二値化画像を得ることができる。
(他の実施形態)
上述した実施形態は、本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した実施形態及び以下に示す変形例は、必要に応じて組み合わせて実施してもよい。
上述の実施形態では、図2に示すような、免許証番号領域P1に運転免許証番号が存在するような画像の方向を「正立方向」と呼び、一方、画像が180度回転した状態で運転免許証番号が領域P2に位置するような画像の方向を「倒立方向」と呼ぶ。なお、本実施の形態では、免許証が正しい方向で挿入されることを前提としているが、例えば、方向を間違えた場合には、免許証番号領域P1に運転免許証番号が存在しないので、運転免許証の方向が誤っていると判定するように設定してもよい。
上述の実施形態において、文字認識部8は、制御部5が記憶部6等の記憶媒体に記憶されたコンピュータプログラムを読み出して実行することによって実現されてもよい。この場合、このコンピュータプログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読取可能な記録媒体に記憶した状態で提供し得る。また、インターネット等の通信回線を介して文字切り出し装置としての文字認識装置にダウンロードさせてもよい。
1…データ処理部、2…画像入力部、3…画像表示部、4…画像メモリ、5…制御部、6…記憶部、8…文字認識部、10…出力インターフェース部、40…運転免許証、81…文字列切り出し部、82…文字切り出し部、83…特徴抽出部、84…特徴比較部、85…特徴辞書格納部、86…類似文字認識部、100…文字認識装置、811…射影ヒストグラム作成部、812…原点位置検出部、813…文字列切り出し実行部、821…最小画素値曲線作成部、822…文字区切り位置決定部、823…二値化処理部、824…文字切り出し実行部

Claims (6)

  1. 情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し部を有する文字切り出し装置であって、
    前記文字切り出し部は、
    前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成部と、
    前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り位置決定部と、
    前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理部と、
    各文字の画像データを抽出する文字切り出し実行部と、を備えたことを特徴とする文字切り出し装置。
  2. 前記二値化処理部が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項1記載の文字切り出し装置。
  3. 前記文字区切り位置決定部が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項1又は2記載の文字切り出し装置。
  4. 情報記録媒体上の線図形等が存在する文字列を撮像して得られた多値画像データを処理して、前記文字列を形成する文字を切り出す文字切り出し方法であって、
    前記多値画像データにおいて、文字列方向と直交する方向に配置された画素列を構成する画素の中で最も小さい画素値を抽出して最小画素値曲線を作成する最小画素値曲線作成工程と、
    前記最小画素値曲線に基づき、前記文字の区切り位置を決定する文字区切り処理工程と、
    前記最小画素値曲線から前記線図形等を示す最小画素値を検出し、この最小画素値に基づき二値化しきい値を求め、この二値化しきい値を用いて前記多値画像データの二値化処理を行う二値化処理工程と、
    各文字の画像データを抽出する文字切り出し処理工程と、を備えたことを特徴とする文字切り出し方法。
  5. 前記二値化処理工程が、文字と文字との間に形成された空白区間における前記最小画素値曲線の最小画素値を検出し、該最小画素値を二値化しきい値として前記多値画像データの二値化処理を行うことを特徴とする請求項4記載の文字切り出し方法。
  6. 前記文字区切り処理工程が、仮の二値化しきい値を算出して前記多値画像データの二値化処理を行い、この二値化画像データに基づいて文字が形成された文字区間と文字と文字との間に形成された空白区間の境界を決定することを特徴とする請求項4又は5記載の文字切り出し方法。
JP2013021483A 2013-02-06 2013-02-06 文字切り出し装置及び文字切り出し方法 Expired - Fee Related JP6080259B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013021483A JP6080259B2 (ja) 2013-02-06 2013-02-06 文字切り出し装置及び文字切り出し方法
US14/174,424 US9158986B2 (en) 2013-02-06 2014-02-06 Character segmentation device and character segmentation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013021483A JP6080259B2 (ja) 2013-02-06 2013-02-06 文字切り出し装置及び文字切り出し方法

Publications (2)

Publication Number Publication Date
JP2014153820A true JP2014153820A (ja) 2014-08-25
JP6080259B2 JP6080259B2 (ja) 2017-02-15

Family

ID=51259263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013021483A Expired - Fee Related JP6080259B2 (ja) 2013-02-06 2013-02-06 文字切り出し装置及び文字切り出し方法

Country Status (2)

Country Link
US (1) US9158986B2 (ja)
JP (1) JP6080259B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392838A (zh) * 2021-08-16 2021-09-14 智道网联科技(北京)有限公司 字符分割方法、装置及字符识别方法、装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014098248A1 (ja) * 2012-12-21 2014-06-26 株式会社 東芝 超音波診断装置及び医用画像処理装置
US9256795B1 (en) 2013-03-15 2016-02-09 A9.Com, Inc. Text entity recognition
US8908021B2 (en) * 2013-03-15 2014-12-09 Orcam Technologies Ltd. Systems and methods for automatic control of a continuous action
US9934526B1 (en) 2013-06-27 2018-04-03 A9.Com, Inc. Text recognition for search results
US20150379502A1 (en) * 2014-06-26 2015-12-31 Wipro Limited Image processing method of enabling financial transaction and an image processing system thereof
EP3167408B1 (en) * 2014-07-10 2023-12-13 Sanofi-Aventis Deutschland GmbH A device and method for performing optical character recognition
US9430766B1 (en) * 2014-12-09 2016-08-30 A9.Com, Inc. Gift card recognition using a camera
US9646202B2 (en) * 2015-01-16 2017-05-09 Sony Corporation Image processing system for cluttered scenes and method of operation thereof
US9798948B2 (en) * 2015-07-31 2017-10-24 Datalogic IP Tech, S.r.l. Optical character recognition localization tool
CN105426818B (zh) * 2015-10-30 2019-07-02 小米科技有限责任公司 区域提取方法及装置
CN105528606B (zh) * 2015-10-30 2019-08-06 小米科技有限责任公司 区域识别方法及装置
CN106156767A (zh) * 2016-03-02 2016-11-23 平安科技(深圳)有限公司 行驶证有效期自动提取方法、服务器及终端
JP6969164B2 (ja) * 2017-05-31 2021-11-24 株式会社リコー 評価装置、評価プログラム及び評価方法
CN108171239A (zh) * 2018-02-02 2018-06-15 杭州清本科技有限公司 证书图像文字的提取方法、装置及系统、计算机存储介质
WO2020041448A1 (en) * 2018-08-22 2020-02-27 Leverton Holding Llc Text line image splitting with different font sizes
JP7224856B2 (ja) * 2018-11-02 2023-02-20 キヤノン株式会社 画像生成装置、画像生成方法、及びプログラム
CN109582946B (zh) * 2018-11-28 2019-10-25 龙马智芯(珠海横琴)科技有限公司 文字区域排版方向的确定方法及装置
FR3106428B1 (fr) * 2020-01-16 2022-07-29 Surys Procédé de traitement d’une image candidate

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652357A (ja) * 1992-07-31 1994-02-25 Sumitomo Metal Ind Ltd 文字認識方法及びそのための装置
JPH09326009A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd ナンバープレートの一連指定番号切り出し装置
JP2008097590A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0807297B1 (en) * 1995-01-31 1999-09-29 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
JP2974061B2 (ja) * 1996-11-13 1999-11-08 日本電気株式会社 パタン抽出装置
US6549658B1 (en) * 1998-01-21 2003-04-15 Xerox Corporation Method and system for classifying and processing of pixels of image data
JP2000341501A (ja) * 1999-03-23 2000-12-08 Minolta Co Ltd 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体
JP3849385B2 (ja) * 2000-02-03 2006-11-22 コニカミノルタホールディングス株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
US6941013B1 (en) * 2002-04-22 2005-09-06 The United States Of America As Represented By The National Security Agency Method of image binarization using histogram modeling
US7787711B2 (en) * 2006-03-09 2010-08-31 Illinois Institute Of Technology Image-based indexing and classification in image databases
JP4851353B2 (ja) * 2007-01-31 2012-01-11 株式会社リコー 画像処理装置及び画像処理方法
JP4594952B2 (ja) 2007-03-20 2010-12-08 株式会社東芝 文字認識装置及び文字認識方法
US9292759B2 (en) * 2012-05-07 2016-03-22 Xerox Corporation Methods and systems for optimized parameter selection in automated license plate recognition
JP6171167B2 (ja) * 2012-12-28 2017-08-02 日本電産サンキョー株式会社 文字認識装置、文字認識方法、及び文字認識プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0652357A (ja) * 1992-07-31 1994-02-25 Sumitomo Metal Ind Ltd 文字認識方法及びそのための装置
JPH09326009A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd ナンバープレートの一連指定番号切り出し装置
JP2008097590A (ja) * 2006-09-13 2008-04-24 Keyence Corp 文字切り出し装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113392838A (zh) * 2021-08-16 2021-09-14 智道网联科技(北京)有限公司 字符分割方法、装置及字符识别方法、装置
CN113392838B (zh) * 2021-08-16 2021-11-19 智道网联科技(北京)有限公司 字符分割方法、装置及字符识别方法、装置

Also Published As

Publication number Publication date
US20140219561A1 (en) 2014-08-07
JP6080259B2 (ja) 2017-02-15
US9158986B2 (en) 2015-10-13

Similar Documents

Publication Publication Date Title
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US5410611A (en) Method for identifying word bounding boxes in text
US8200012B2 (en) Image determination apparatus, image search apparatus and computer readable recording medium storing an image search program
US5539841A (en) Method for comparing image sections to determine similarity therebetween
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
US9349237B2 (en) Method of authenticating a printed document
EP2553626A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
CN113011426A (zh) 一种识别证件的方法和装置
JP2006338578A (ja) 文字認識装置
JP2010026805A (ja) 文字認識装置及び文字認識方法
JP5630689B2 (ja) 文字認識方法及び文字認識装置
CN109460763B (zh) 一种基于多层次文本组件定位与生长的文本区域提取方法
CN111488870A (zh) 文字识别方法和文字识别装置
JPH08190690A (ja) ナンバープレート決定方法
JP6144892B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN109086766B (zh) 一种基于积分图的多阈值融合冠字号提取方法
JP2871590B2 (ja) 画像抽出方式
CN115995080B (zh) 基于ocr识别的档案智能管理系统
Ali et al. Detection and extraction of pantograph region from bank cheque images
KR101437286B1 (ko) 디지털 컨텐츠 식별 방법 및 장치
JP4732626B2 (ja) 帳票処理方法および装置並びにプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20150609

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20150622

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170113

R150 Certificate of patent or registration of utility model

Ref document number: 6080259

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees