JP6401806B2 - 日付識別装置、日付識別方法及び日付識別プログラム - Google Patents

日付識別装置、日付識別方法及び日付識別プログラム Download PDF

Info

Publication number
JP6401806B2
JP6401806B2 JP2017025261A JP2017025261A JP6401806B2 JP 6401806 B2 JP6401806 B2 JP 6401806B2 JP 2017025261 A JP2017025261 A JP 2017025261A JP 2017025261 A JP2017025261 A JP 2017025261A JP 6401806 B2 JP6401806 B2 JP 6401806B2
Authority
JP
Japan
Prior art keywords
identification
date
unit
label
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017025261A
Other languages
English (en)
Other versions
JP2018132894A (ja
Inventor
正義 林
正義 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2017025261A priority Critical patent/JP6401806B2/ja
Priority to US15/606,250 priority patent/US10380416B2/en
Priority to CN201710819188.6A priority patent/CN108427952A/zh
Publication of JP2018132894A publication Critical patent/JP2018132894A/ja
Application granted granted Critical
Publication of JP6401806B2 publication Critical patent/JP6401806B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/293Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of characters other than Kanji, Hiragana or Katakana

Description

本発明は、日付識別装置、日付識別方法及び日付識別プログラムに関する。
写真の中には、写真が撮影された日付がその写真上に付けられているものがあり、例えば、昔に撮影された古い銀塩写真では、その写真上に日付が焼き付けられているものが多い。
一方で、近年、電子データが存在しない古い銀塩写真をデジタルカメラ等を用いて撮影することにより、その古い銀塩写真を電子データ化するケースが増えている。
特開2013−084071号公報 特開平8−221512号公報 特開2000−339472号公報
日付が焼き付けられている古い銀塩写真では、その日付が不鮮明なことがあるため、その古い銀塩写真が電子データ化される際に日付に対してOCR(Optical Character Recognition)等の文字認識が施されても、日付の識別精度が低いことがある。
開示の技術は、上記に鑑みてなされたものであって、写真等の媒体に付与されている日付の識別を高精度で行うことを目的とする。
開示の態様では、日付識別装置は、切出部と、2値化部と、識別部と、補正部と、付与部とを有する。前記切出部は、日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出す。前記2値化部は、前記日付領域データを2値化して2値化データを生成する2値化処理を行う。前記識別部は、前記2値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行う。前記補正部は、前記識別処理での識別結果に対して前記文字列のフォント種類に合わせた補正処理を行う。前記付与部は、補正された前記識別結果に含まれる前記文字列に基づく日付データを前記画像データに付与する。
開示の態様によれば、写真等の媒体に付与されている日付の識別を高精度で行うことができる。
図1は、実施例1の日付識別装置の構成例を示す図である。 図2は、実施例1の日付識別装置の処理例の説明に供するフローチャートである。 図3は、実施例1の指定範囲切出処理の一例を示す図である。 図4は、実施例1のライン切出処理の一例の説明に供するフローチャートである。 図5は、実施例1のフォント種類の一例を示す図である。 図6は、実施例1のフォント種類の一例を示す図である。 図7は、実施例1のフォント種類の一例を示す図である。 図8は、実施例1のフォント種類の一例を示す図である。 図9は、実施例1のフォント種類の一例を示す図である。 図10は、実施例1のフォント種類の一例を示す図である。 図11は、実施例1の第一2値化処理の一例の説明に供するフローチャートである。 図12は、実施例1の色相のヒストグラム抽出の一例を示す図である。 図13は、実施例1の第一ラベル処理の一例を示す図である。 図14は、実施例1の第一ラベル処理の一例を示す図である。 図15は、実施例1の第一ラベル処理の一例を示す図である。 図16は、実施例1の第一ラベル処理の一例を示す図である。 図17は、実施例1の第一ラベル処理の一例を示す図である。 図18は、実施例1の第一ラベル処理の一例を示す図である。 図19は、実施例1の第一ラベル処理の一例を示す図である。 図20は、実施例1のラベル探索の一例を示す図である。 図21は、実施例1の識別処理の一例の説明に供するフローチャートである。 図22は、実施例1の紛らわしいデータの一例を示す図である。 図23は、実施例1の補正処理一例の説明に供するフローチャートである。 図24は、実施例1の第一補正処理の一例を示す図である。 図25は、実施例1の第一補正処理の一例を示す図である。 図26は、実施例1の第一補正処理の一例を示す図である。 図27は、実施例1の第二補正処理の一例を示す図である。 図28は、実施例1の第二補正処理の一例を示す図である。 図29は、実施例1の第二補正処理の一例を示す図である。 図30は、実施例1の第二補正処理の一例を示す図である。 図31は、実施例1の第二補正処理の一例を示す図である。 図32は、実施例1の第二補正処理の一例を示す図である。 図33は、実施例2の携帯端末の構成例を示す図である。
以下に、本願の開示する日付識別装置、日付識別方法及び日付識別プログラムの実施例を図面に基づいて説明する。なお、この実施例により本願の開示する日付識別装置、日付識別方法及び日付識別プログラムが限定されるものではない。また、実施例において同一の機能を有する構成、及び、同一の処理を行うステップには同一の符号を付す。
[実施例1]
[日付識別装置の構成]
図1は、実施例1の日付識別装置の構成例を示す図である。図1において、日付識別装置1は、記憶部11と、切出部12と、2値化部13と、識別部14と、補正部15と、付与部16と、制御部17とを有する。
記憶部11は、ハードウェアとして、例えば、メモリにより実現される。メモリの一例として、SDRAM(Synchronous Dynamic Random Access Memory)等のRAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等が挙げられる。
切出部12、2値化部13、識別部14、補正部15、付与部16、及び、制御部17は、ハードウェアとして、例えばプロセッサにより実現することができる。プロセッサの一例として、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)等が挙げられる。また、切出部12、2値化部13、識別部14、補正部15、付与部16、及び、制御部17は、プロセッサと周辺回路とを含むLSI(Large Scale Integrated circuit)によって実現されても良い。さらに、切出部12、2値化部13、識別部14、補正部15、付与部16、及び、制御部17は、GPU(Graphics Processing Unit)、ASIC(Application Specific Integrated Circuit)等を用いて実現されても良い。
日付識別装置1に入力された画像データ(以下では「入力画像データ」と呼ぶことがある)は記憶部11に記憶される。記憶部11に記憶された入力画像データを元にして、切出部12、2値化部13、識別部14、補正部15、付与部16、及び、制御部17により以下に説明する各処理が行われることにより、日付識別装置1から出力される画像データ(以下では「出力画像データ」と呼ぶことがある)が生成される。制御部17は、切出部12、2値化部13、識別部14、補正部15、及び、付与部16を制御する。
入力画像データは、例えば、日付識別装置1を有する携帯端末が搭載するカメラによって、撮影対象の媒体としての銀塩写真が撮影されることにより生成された写真データである。また、銀塩写真の中でも、特に、日付が焼き付けられている銀塩写真が撮影対象の媒体となる。なお、撮影対象の媒体は、銀塩写真に限定されず、例えば、印刷写真や、紙面に印刷された画像等であっても良い。特に、日付が印字されている印刷写真や、日付が印字されている画像が撮影対象の媒体となる。つまり、入力画像データは、日付が付与されている媒体を撮影することにより生成された画像データである。
<日付識別装置の処理>
図2は、実施例1の日付識別装置の処理例の説明に供するフローチャートである。
図2において、まず、ステップS201では、制御部17は、切出部12に矩形切出処理を行わせる。切出部12は、入力画像データから所定の矩形領域のデータ(以下では「矩形領域データ」と呼ぶことがある)を切り出す。所定の矩形領域の大きさは、撮影対象の媒体としての写真のサイズに基づいて規定され、切出部12は、写真の輪郭に沿って、入力画像データから矩形領域データを切り出す。
次いで、ステップS203では、切出部12は、矩形領域データの切出に成功したか否かを判断する。切出部12が矩形領域データの切出に成功したときは(ステップS203:Yes)、処理はステップS205へ進む。一方で、切出部12が矩形領域データの切出に失敗したときは(ステップS203:No)、処理は「エンド」へ進んで、制御部17は日付の識別処理を強制的に終了させる。
ステップS205では、切出部12は、ステップS201で切り出した矩形領域データから指定範囲を切り出す。
図3は、実施例1の指定範囲切出処理の一例を示す図である。日付が付与されている写真では、長方形の写真を横長になる向きにして見た場合において、日付は、一般的に、写真の左上箇所または右下箇所に付与されることが多い。また、一般的に日付は、年月日を示す各数字が横方向に並ぶことにより表されるため、写真上において日付を表す範囲は横長の矩形の範囲になる。そこで、切出部12は、図3に示すように、矩形領域データ100の中における左上の指定範囲と右下の指定範囲とを横長の矩形の形状で矩形領域データ100から切り出すことにより、日付が付与されていると推定される領域のデータ(以下では「日付領域データ」と呼ぶことがある)101−1,101−2を矩形領域データ100から切り出す。以下では、日付領域データ101−1,101−2を区別しない場合には日付領域データ101と総称することがある。
図2に戻り、次いで、ステップS207では、制御部17は、フォント種類カウンタnを“0”にセットする。
次いで、ステップS209では、制御部17は、切出部12及び2値化部13にライン切出処理を行わせる。
図4は、実施例1のライン切出処理の一例の説明に供するフローチャートである。また、図5〜図10は、実施例1のフォント種類の一例を示す図である。
ここで、図5〜図10に示すように、写真に付与されている日付のフォント種類は、第一種〜第三種の3種類に大別される。
フォント種類の「第一種」としてDSEGフォントが挙げられる(図5,図6)。DSEGフォントを用いて写真に付与された日付の色は、一般的に、日付CS1(図5)のように赤色、または、日付CS2(図6)のように黄色であることが多い。また、DSEGフォントで表された日付は、一般的に、図5及び図6に示すように、「年」を表す数字と、「月」を表す数字と、「日」を表す数字とが、ブランクを用いて区切られていることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタn=0」は、第一種のフォント種類である「色付きDSEGフォント」に対応する。なお、図5及び図6では、DSEGフォントの一例として7セグメントフォントを挙げているが、開示の技術が適用可能なDSEGフォントは7セグメントフォントに限定されない。例えば、開示の技術は、14セグメントフォントにも適用可能である。
フォント種類の「第二種」として、DSEGフォント以外の白色のフォント(以下では「白色非DSEGフォント」と呼ぶことがある)が挙げられる(図7,図8)。白色非DSEGフォントを用いて写真に付与された日付では、一般的に、日付CS3(図7)及び日付CS4(図8)のように、一文字がDSEGフォントのようにセグメントに分割されていない。また、白色非DSEGフォントで表された日付は、一般的に、図7及び図8に示すように、「年」を表す数字と、「月」を表す数字と、「日」を表す数字とが、“.”(ドット)や“/”(スラッシュ)の「区切り文字」を用いて区切られていることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタn=1」は、第二種のフォント種類である「白色非DSEGフォント」に対応する。
フォント種類の「第三種」として、DSEGフォント以外の色付きのフォント(以下では「色付き非DSEGフォント」と呼ぶことがある)が挙げられる(図9,図10)。色付き非DSEGフォントを用いて写真に付与された日付では、一般的に、日付CS5(図9)及び日付CS6(図10)のように、一文字がDSEGフォントのようにセグメントに分割されていない。また、色付き非DSEGフォントで表された日付は、図10に示すように、「年」,「月」,「日」の漢字が含まれることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタn=2」は、第三種のフォント種類である「色付き非DSEGフォント」に対応する。
図4に戻り、まず、ステップS301では、制御部17は、フォント種類カウンタnが“2”以下か否かを判断する。フォント種類カウンタnが“3”以上である場合、つまり、第一種〜第三種の全てのフォント種類に対する日付の識別が失敗した場合は(ステップS301:No)、処理は「エンド」へ進んで、制御部17は、日付の識別処理を強制的に終了させる。一方で、フォント種類カウンタnが“2”以下である場合は(ステップS301:Yes)、処理はステップS303へ進む。
ステップS303では、制御部17は、フォント種類カウンタnの値を判断する。フォント種類カウンタnが“0”である場合はステップS305〜S309の処理が行われ、フォント種類カウンタnが“1”である場合はステップS311〜S315の処理が行われ、フォント種類カウンタnが“2”である場合はステップS317〜S321の処理が行われる。つまり、ステップS305〜S309の処理は、色付きDSEGフォントを識別対象とする処理であり、ステップS311〜S315の処理は、白色非DSEGフォントを識別対象とする処理であり、ステップS317〜S321の処理は、色付き非DSEGフォントを識別対象とする処理である。
制御部17は、ステップS303においてフォント種類カウンタnが“0”であると判断する場合は、ステップS305において、2値化部13に「第一2値化処理」を行わせる。ステップS305では、例えば、2値化部13は、ヒストグラム解析を用いて日付領域データ101に対する第一2値化処理を行うことにより、日付領域データ101を2値化して2値化データを生成する。図11は、実施例1の第一2値化処理の一例の説明に供するフローチャートである。
図11に示す第一2値化処理おいて、まず、ステップS601では、2値化部13は、色空間変換を行う。例えば、2値化部13は、赤(Red)と緑(Green)と青(Blue)との3つの原色を用いて示されるRGBカラーモデルとしてデータ化されている日付領域データ101を、色相(Hue)と彩度(Saturation)と輝度(Value)との3つの成分からなるHSV色空間で示されるデータに変換する。
次いで、ステップS603では、2値化部13は、HSV色空間のデータに変換後の日付領域データ101のヒストグラム解析を行う。このヒストグラム解析は、HSV色空間のデータに変換後の日付領域データ101のうち、色相(Hue)と輝度(Value)とに対して行われる。2値化部13は、色相のヒストグラム解析を行う際には、色相のヒストグラム抽出を行う。
図12は、実施例1の色相のヒストグラム抽出の一例を示す図である。図12に示すように、色相では色の種類が0〜360度の範囲で表されるため、2値化部13は、色相のヒストグラム抽出を行う際には、色相における所望の色を0度とし、この0度を中心とする所望の範囲の色を抽出する。例えば、写真に付与される日付のフォント種類がDSEGフォントである場合は、日付の色は、一般的に、赤色または黄色のようなオレンジ系の色であることが多い。このため、2値化部13は、0〜360度で示される色のうち、日付の色として最も多いと想定されるオレンジ系の色の部分を0度とし、この0度を中心とする所定の範囲の色を抽出する。例えば、色相の条件として条件H1と条件H2とが設定され、条件H1が±40度、条件H2が±80度とされた場合は、2値化部13は、日付領域データ101を形成する画素のうち、条件H1に含まれる色の画素と、条件H2に含まれる色の画素とをそれぞれ抽出する。このようにして、2値化部13は、色相のヒストグラム抽出を行う。また、2値化部13は、抽出した色相のヒストグラムをlog化することでデータの扱いを容易にする。
図11に戻り、ステップS603において、次いで、2値化部13は、2値化のスライスを、輝度のヒストグラムより算出する。つまり、2値化部13は、2値化を行う際に各画素を“1”にするか“0”にするかの閾値を、輝度のヒストグラムより算出する。例えば、2値化部13は、輝度の条件として条件V1と条件V2とを設定するとともに、日付領域データ101全体の輝度のヒストグラムにおける80%の値である第一閾値を条件V1として算出し、日付領域データ101全体の輝度のヒストグラムにおける40%の値である第二閾値を条件V2として算出する。2値化部13は、このようにして設定した輝度の条件と、色相の条件とを用いて、日付領域データ101を形成する各画素について、双方の条件に当てはまるか否かのヒストグラム解析を行う。
すなわち、2値化部13は、色相及び輝度が色相の条件及び輝度の条件の双方の条件に当てはまるか否かのヒストグラム解析を行う際には、色相の条件H1と輝度の条件V1とを用いる閾値であるsliceH1_VLと、色相の条件H1と輝度の条件V2とを用いる閾値であるsliceH1_VHと、色相の条件H2と輝度の条件V1とを用いる閾値であるsliceH2_VLと、色相の条件H2と輝度の条件V2とを用いる閾値であるsliceH2_VHとを、まず算出する。そして、2値化部13は、日付領域データ101を形成する各画素の色相と輝度とが、算出した各閾値を満たしているか否かを判断することにより、日付領域データ101のヒストグラム解析を行う。
次いで、ステップS605では、2値化部13は、日付領域データ101を2値化して2値化データを生成する。例えば、2値化部13は、日付領域データ101を形成する各画素が、算出した閾値を満たしている場合は“1”とし、算出した閾値を満たしていない場合は“0”とすることにより、日付領域データ101を2値化して2値化データを生成する。2値化される日付領域データ101は、2値化部13によって、例えば、“1”の画素は黒に変換され、“0”の画素は白に変換されることにより、黒と白とのみからなるデータに変換される。このように、図4のステップS305では、2値化部13は、色付きDSEGフォントを識別対象として、色相及び輝度に基づいた閾値により日付領域データ101を2値化する第一2値化処理を行う。
図4に戻り、次いで、ステップS307では、制御部17は、切出部12に「第一ラベル処理」を行わせる。図13〜19は、実施例1の第一ラベル処理の一例を示す図である。
第一ラベル処理では、切出部12は、まず、図13に示すように、縦方向と横方向とに複数が並べられることにより日付領域データ101を形成する各画素110をラスタスキャンする。例えば、切出部12は、2値化されることにより黒と白の画素110からなる日付領域データ101における最も左上に位置する画素110から右方向に走査し、右端の画素110まで到達したら、一つ下の行の左端の画素110に走査を移し、この画素110から再び右方向に走査する。切出部12は、これらの走査を日付領域データ101を形成する全ての画素110に対して繰り返す。
そして、切出部12は、日付領域データ101をラスタスキャンする際に、図14に示すように、黒の画素110を検出したら、その検出した黒の画素110を注目画素111として、注目画素111の左の画素110と上の画素110とに、ラベル番号が有るか否かを確認する。図13,図15〜図19において、“0”が付されている画素110はラベル番号が無い画素であり、“0”以外の数字が付されている画素110はラベル番号が有る画素である。切出部12は、注目画素111の左の画素110か上の画素110にラベル番号があれば、左の画素110のラベル番号及び上の画素110のラベル番号のうちで最小のラベル番号を注目画素111に付与する。つまり、切出部12は、注目画素111の左の画素110と上の画素110との間でラベル番号が異なっている場合には、より小さい方のラベル番号を注目画素111に付与する。よって、例えば、図15に示す注目画素111−1にはラベル番号として“1”が付与される。一方で、注目画素111の左の画素110と上の画素110との双方にラベル番号が無い場合は、切出部12は、新しいラベル番号を注目画素111に付与する。つまり、切出部12は、注目画素111の左の画素110と上の画素110との双方にラベル番号が無い場合は、「最後に付与したラベル番号の値+1」のラベル番号を、注目画素111に付与する。よって、例えば、図15に示す注目画素111−2にはラベル番号として“2”が付与される。
また、切出部12は、図16に示すように、ラベル番号が有る画素110が互いに隣接して複数存在する場合は、ラベル番号が有る一連の複数の画素110の全てのラベル番号を同じ値に統一する。例えば、図16に示すように、ラベル番号が有る互いに隣接する一連の画素110−1,110−2,112が存在する場合は、切出部12は、それら一連の画素110−1,110−2,112のラベル番号を、それら一連の画素110−1,110−2,112に付されたラベル番号のうちで最小のラベル番号に統一する。よって、例えば、図16における画素112のラベル番号“3”は、切出部12によって、図17に示すように“2”に変更される。これにより、ラベル番号が有る互いに隣接する一連の画素110−1,110−2,112のラベル番号は“2”に統一される。
そして、切出部12は、付与されたラベル番号が同一の一連の複数の画素110を1つのラベル115として扱う。よって、例えば、図17に示すように、ラベル番号が“1”で同一の一連の画素110−5,110−6,110−7は、1つのラベル115−1として扱われ、ラベル番号が“2”で同一の一連の画素110−1,110−2,112は、別の1つのラベル115−2として扱われる。以下では、ラベル115−1,115−2を区別しない場合にはラベル115と総称することがある。
第一ラベル処理(ステップS307)では、切出部12は、次いで、比較的近い距離で互いに離間している複数のラベル115同士を1つのラベル115に統合する処理である「近接統合」を行う。近接統合は、「第一近接統合」と「第二近接統合」との2種類に大別される。図18は、実施例1の第一近接統合の一例を示す図であり、図19は、実施例1の第二近接統合の一例を示す図である。
図18において、ラベル番号“1”が付与されたラベル115−1とラベル番号“2”が付与されたラベル115−2とは互いに離間している。第一近接統合では、切出部12は、ラベル115−1が形成する矩形の領域であるラベル領域116−1と、ラベル115−2が形成する矩形の領域であるラベル領域116−2とがオーバラップしている場合に、ラベル115−1とラベル115−2とを統合して1つのラベル115として扱う。ここで、ラベル115−1については、図18に示すように、縦方向と横方向とに延びる1つのラベル115−1において、縦方向の端部に位置する画素110と同じ高さの位置における、横方向の端部に位置する画素110までの矩形の領域を、ラベル115−1のラベル領域116−1とする。同様に、ラベル115−2については、図18に示すように、縦方向と横方向とに延びる1つのラベル115−2において、縦方向の端部に位置する画素110と同じ高さの位置における、横方向の端部に位置する画素110までの矩形の領域を、ラベル115−2のラベル領域116−2とする。よって、図18では、ラベル領域116−1の一部とラベル領域116−2の一部とが互いにオーバラップする。そこで、切出部12は、ラベル115−1とラベル115−2とを近接統合して、ラベル115−1,115−2を同一の1つのラベル115として扱う。このように、第一近接統合は、複数のラベル領域の一部が互いにオーバラップするときに行われる近接統合である。
一方で、図19において、ラベル番号“1”が付与されたラベル115−1とラベル番号“2”が付与されたラベル115−2とは、図18と同様に、互いに離間している。但し、図19では、ラベル115−1が形成するラベル領域116−1とラベル115−2が形成するラベル領域116−2とは互いにオーバラップしておらず、ラベル領域116−2はラベル領域116−1から距離dだけ離れた位置に存在する。そこで、第二近接統合では、切出部12は、ラベル領域116−1とラベル領域116−2との間の距離dが閾値THD未満である場合に、ラベル115−1とラベル115−2とを統合して1つのラベル115として扱う。図19においてラベル領域116−1とラベル領域116−2との間の距離dは2画素であるため、例えば閾値THDが5画素に設定されている場合は、切出部12は、ラベル115−1とラベル115−2とを統合して1つのラベル115として扱う。このように、第二近接統合は、複数のラベル領域同士が閾値THD未満の距離に存在するときに行われる近接統合である。
以上のように、第一ラベル処理(ステップS307)では、第一近接統合及び第二近接統合の双方が行われる。以下では、ラベル領域116−1,116−2を区別しない場合には、ラベル領域116と総称することがある。
図4に戻って、次いで、ステップS309では、切出部12は「第一除去処理」を行う。ステップS309では、切出部12は、第一ラベル処理(ステップS307)を施した2値化データに対して第一除去処理を施して2値化データからノイズを除去することにより、複数のラベル115の中から、文字としての識別可能性があるラベル(以下では「識別可能性ラベル」と呼ぶことがある)を抽出する。つまり、識別可能性ラベルは、第一ラベル処理を施された2値化データからノイズとなるラベル115を形成する2値化データが除去された後の残りの2値化データにより形成されるラベルである。第一除去処理におけるノイズの除去は、ラベル領域116のサイズに基づいて行われる。切出部12は、ラベル領域116のサイズに基づいて、数字の「1」を表している可能性のあるラベル115と、数字の「1」以外の文字を表している可能性のあるラベル115と、文字を表している可能性がないラベル115(つまり、ノイズ)とを判定し、ノイズであると判定したラベル115を2値化データから除去する。よって、数字の「1」を表している可能性のあるラベル115と、数字の「1」以外の文字を表している可能性のあるラベル115とが識別可能性ラベルとして抽出される。
ラベル115がノイズであるか否かの判定が行われる際にはラベル領域116の「基準サイズ」が設定され、この基準サイズに当てはまらないサイズのラベル領域116であって、かつ、横の長さと縦の長さとのアスペクト比が1:3未満であるラベル領域116を有するラベル115がノイズとし除去される。第一除去処理では、例えば、長方形の写真を横長になる向きにして見た場合において、写真の横の長さの0.3%以上かつ2.2%未満の長さが基準サイズの横の長さとして設定され、写真の縦の長さの2.0%以上かつ4.0%未満の長さが基準サイズの縦の長さとして設定される。
以上、色付きDSEGフォントを識別対象とするステップS305〜S309の処理について説明した。
一方で、制御部17は、ステップS303においてフォント種類カウンタnが“1”であると判断する場合は、ステップS311において、2値化部13に「第二2値化処理」を行わせる。例えば、2値化部13は、「大津の2値化」を用いて日付領域データ101に対する第二2値化処理を行うことにより、日付領域データ101を2値化して2値化データを生成する。
次いで、ステップS313では、制御部17は、切出部12に「第二ラベル処理」を行わせる。第二ラベル処理は、上述した第一ラベル処理(ステップS307)に含まれる処理のうち、第二近接統合だけを除外した処理である。つまり、第二ラベル処理では、上記の図13〜図18に例示した処理は行われるが、上記の図19に例示した処理は行われない。
次いで、ステップS315では、切出部12は「第二除去処理」を行う。ステップS315では、切出部12は、第二ラベル処理(ステップS313)を施した2値化データに対して第二除去処理を施して2値化データからノイズを除去することにより、複数のラベル115の中から識別可能性ラベルを抽出する。第二除去処理におけるノイズの除去は、第一除去処理と同様に、ラベル領域116のサイズに基づいて行われる。但し、第二除去処理では、例えば、長方形の写真を横長になる向きにして見た場合において、写真の横の長さの0.4%以上かつ4.0%未満の長さが基準サイズの横の長さとして設定され、写真の縦の長さの2.0%以上かつ5.0%未満の長さが基準サイズの縦の長さとして設定される。
以上、白色非DSEGフォントを識別対象とするステップS311〜S315の処理について説明した。
また、制御部17は、ステップS303においてフォント種類カウンタnが“2”であると判断する場合は、ステップS317において、ステップS305と同様に、2値化部13に第一2値化処理を行わせる。
次いで、ステップS319では、制御部17は、ステップS313と同様に、切出部12に第二ラベル処理を行わせる。
次いで、ステップS321では、ステップS315と同様に、切出部12は第二除去処理を行う。
以上、色付き非DSEGフォントを識別対象とするステップS317〜S321の処理について説明した。
ステップS309、S315またはS321の処理後、処理はステップS323へ進む。
ステップS323では、切出部12はラベル探索を行う。図20は、実施例1のラベル探索の一例を示す図である。図20に示す全てのラベル115は、識別可能性ラベルである。
図20において、切出部12は、日付領域データ101内の複数の識別可能性ラベル115のうち、最も上側に位置する識別可能性ラベル115を基準とし、その最も上側に位置するラベル115の上端の位置で、横方向に延びる検出ライン125を設定する。以下では、検出ライン125の設定の基準となったラベル115を「基準ラベル」と呼ぶことがある。
次いで、切出部12は、設定した検出ライン125から上下に所定の範囲を探索範囲126として設定する。例えば、切出部12は、検出ライン125から上に5画素と下に5画素の範囲、つまり、上下に10画素の幅で横方向の延びる範囲を探索範囲126として設定する。
次いで、切出部12は、基準ラベル115以外の他の識別可能性ラベル115の中で、探索範囲126とラベル領域116の一部がオーバラップする他の識別可能性ラベル115を探索するラベル探索を行う。
探索範囲126とラベル領域116の一部がオーバラップする他の識別可能性ラベル115が2つ以上検出された場合は、切出部12は、基準ラベル115、及び、検出された複数の他の識別可能性ラベル115のうち、最も上側に位置する識別可能性ラベル115の上端の位置で横方向に延びるラインを「上端ライン」として設定し、最も下側に位置する識別可能性ラベル115の下端の位置で横方向に延びるラインを「下端ライン」として設定する。
一方で、探索範囲126とラベル領域116の一部がオーバラップする他の識別可能性ラベル115が2つ以上検出されない場合は、切出部12は、日付領域データ101内の複数の識別可能性ラベル115のうち、今回の探索での基準ラベルの1つ下側に位置する識別可能性ラベル115を新たな基準ラベルとして新たな検出ライン125及び新たな探索範囲126を設定する。そして、切出部12は、その新たな探索範囲126に基づいて上記と同様のラベル探索を行って上端ライン及び下端ラインの設定を試みる。
そして、切出部12は、上記のラベル探索を、日付領域データ101内の複数の識別可能性ラベル115のうちで最も下側に位置する識別可能性ラベル115が基準ラベルとなるまで繰り返して上端ライン及び下端ラインの設定を試みる。
図4に戻り、次いで、ステップS325では、制御部17は、ステップS323でのラベル探索が成功したか否かを判断する。ステップS323でのラベル探索により切出部12が上端ライン及び下端ラインの双方を設定できた場合には、制御部17は、ラベル探索が成功したと判断する。ラベル探索が成功した場合は(ステップS325:Yes)、処理はステップS327へ進む。一方で、ステップS323でのラベル探索により切出部12が上端ラインまたは下端ラインを設定できなかった場合には、制御部17は、ラベル探索が失敗したと判断する。ラベル探索が失敗した場合は(ステップS325:No)、処理はステップS329へ進む。
ここで、例えば、図3に示す矩形領域データ100において、右下の指定範囲に日付が含まれている一方で、左上の指定範囲に日付が含まれていない場合は、日付領域データ101−2に対して行われたラベル探索は成功する一方で、日付領域データ101−1に対して行われたラベル探索は失敗する。
ステップS329では、制御部17は、フォント種類カウンタnをインクリメントする。ステップS329の処理後、処理はステップS301へ戻る。
一方で、ステップS327では、切出部12は切出処理を行う。ステップS327では、切出部12は、ステップS323で設定した上端ライン及び下端ラインに基づいて、日付領域データ101から、上端ラインと下端ラインとの間の領域にあるデータ(以下では「対象領域データ」と呼ぶことがある)を切り出す。
ステップS327の処理後、処理は、図2のステップS211へ進む。
図2に戻り、ステップS211では、制御部17は、識別部14に識別処理を行わせる。図21は、実施例1の識別処理の一例の説明に供するフローチャートである。
図21において、ステップS401では、まず、制御部17は、指定処理回数a及び処理回数カウンタiを“0”にセットする。
次いで、ステップS403では、制御部17は、フォント種類カウンタnの値を判断する。フォント種類カウンタnが“0”である場合はステップS405〜S411の処理が行われ、フォント種類カウンタnが“1”である場合はステップS413〜S419の処理が行われ、フォント種類カウンタnが“2”である場合はステップS421〜S427の処理が行われる。つまり、ステップS405〜S411の処理は、色付きDSEGフォントを識別対象とする処理であり、ステップS413〜S419の処理は、白色非DSEGフォントを識別対象とする処理であり、ステップS421〜S427の処理は、色付き非DSEGフォントを識別対象とする処理である。
制御部17は、ステップS403においてフォント種類カウンタnが“0”であると判断する場合は、ステップS405において、指定処理回数aを“56”に設定する。ステップS405で指定処理回数aが“56”に設定されることにより、階調値26〜246の範囲において、階調値“4”毎の56個の2値化スライスを用いて、ステップS407〜S411,S431の処理が56回繰り返される。すなわち、1回目の処理では2値化スライスが“26”に設定されてステップS407〜S411,S431の処理が行われ、2回目の処理では2値化スライスが“30”に設定されてステップS407〜S411,S431の処理が行われ、3回目の処理では2値化スライスが“34”に設定されてステップS407〜S411,S431の処理が行われる。以降、同様に、2値化スライスが“4”ずつ増加されながら“246”になるまで、階調値26〜246の範囲において56個の2値化スライスが設定されて、各2値化スライスを用いてS407〜S411,S431の処理が繰り返し行われる。
ステップS407では、制御部17は、2値化部13に「第三2値化処理」を行わせる。第三2値化処理では、2値化部13は、処理回数カウンタiが“0”のときは、2値化スライスを“26”に設定して対象領域データのR成分及びR−G成分のそれぞれを2値化することにより2値化データを生成する。よって、第三2値化処理が1回行われる毎に、R成分の2値化データとR−G成分の2値化データとの2つの2値化データが生成される。また、第三2値化処理では、2値化部13は、処理回数カウンタiが“1”のときは、2値化スライスを“30”に設定して対象領域データのR成分及びR−G成分のそれぞれを2値化することにより2値化データを生成し、処理回数カウンタiが“2”のときは、2値化スライスを“34”に設定して対象領域データのR成分及びR−G成分のそれぞれを2値化することにより2値化データを生成する。よって、ステップS429での処理回数カウンタiのインクリメントに伴ってステップS407の処理が56回繰り返されると、R成分の56個の2値化データとR−G成分の56個の2値化データとが生成される。
次いで、ステップS409では、制御部17は、切出部12に第一ラベル処理を行わせる。ステップS409では、切出部12は、第三2値化処理で生成された2値化データに対して第一ラベル処理を行う。
次いで、ステップS411では、切出部12は第一除去処理を行う。ステップS411では、切出部12は、第一ラベル処理(ステップS409)を施した2値化データに対して第一除去処理を施す。
以上、色付きDSEGフォントを識別対象とするステップS405〜S411の処理について説明した。
一方で、制御部17は、ステップS403においてフォント種類カウンタnが“1”であると判断する場合は、ステップS413において、指定処理回数aを“1”に設定する。ステップS413で指定処理回数aが“1”に設定されることにより、ステップS413〜S419の処理が1回だけ行われる。
次いで、ステップS415では、制御部17は、2値化部13に第二2値化処理を行わせる。
次いで、ステップS417では、制御部17は、切出部12に第二ラベル処理を行わせる。
次いで、ステップS419では、切出部12は第二除去処理を行う。
以上、白色非DSEGフォントを識別対象とするステップS413〜S419の処理について説明した。
また、制御部17は、ステップS403においてフォント種類カウンタnが“2”であると判断する場合は、ステップS421において、ステップS405と同様に、指定処理回数aを“56”に設定する。
次いで、ステップS423では、制御部17は、ステップS407と同様に、2値化部13に第三2値化処理を行わせる。
次いで、ステップS425では、制御部17は、ステップS417と同様に、切出部12に第二ラベル処理を行わせる。
次いで、ステップS427では、ステップS419と同様に、切出部12は第二除去処理を行う。
以上、色付き非DSEGフォントを識別対象とするステップS421〜S427の処理について説明した。
ここで、ステップS411では、第一ラベル処理(ステップS409)が施された2値化データに対して第一除去処理が施されて2値化データからノイズが除去されることにより、複数のラベル115の中から、文字としての識別対象となるラベル(以下では「識別対象ラベル」と呼ぶことがある)が抽出される。また、ステップS419,S427では、第二ラベル処理(ステップS417,S425)が施された2値化データに対して第二除去処理が施されて2値化データからノイズが除去されることにより、複数のラベル115の中から識別対象ラベルが抽出される。
ステップS411,S419またはS427の処理後、処理はステップS429へ進む。
ステップS429では、制御部17は、処理回数カウンタiをインクリメントする。
次いで、ステップS431では、制御部17は、識別対象ラベルに対する文字認識を識別部14に行わせる。識別部14は、例えばディープラーニング(Deep Learning)の一種であるCNN(Convolutional Neural Network)を用いて、識別対象ラベルに対する文字認識を行う。以下では、CNNを用いて識別部14が認識可能な文字の種類は、例えば、数字の“0”〜“9”、及び、日付の区切り文字と使用される“/”,“年”,“月”,“日”の合計14種類とする。すなわち、日付領域データ101には、これら14種類の文字の何れかを用いて形成される文字列としての日付が含まれている。
ここで、一般的に、CNNでは多様な学習データを用いることで、モデルの表現力が高まるため、文字認識の精度を高めることができる。一方で、表現力が高いモデルほど、CNNの層が深くなるため、文字認識に要する計算量が多くなる。つまり、CNNでは、学習データの量を多くするほど、文字認識に要する計算量が多くなる。そこで、本実施例では、文字認識における紛らわしいデータを学習データから除外することで層が浅いモデルを作成し、識別部14は、層が浅いモデルを適用したCNNを用いて、識別対象ラベルに対する文字認識を行う。
図22は、実施例1の紛らわしいデータの一例を示す図である。図22において、例えば、データD1は、“/”であるか、数字の“1”であるか紛らわしい。また例えば、データ群D2における各データは、数字の“1”であるか、数字の“7”であるか紛らわしい。また例えば、データ群D3における各データは、数字の“3”であるか、数字の“8”であるか紛らわしい。また例えば、データ群D4における各データは、数字の“8”であるか、数字の“9”であるか紛らわしい。そこで、本実施例では、図22に示すような紛らわしいデータを学習データから除外することで層が浅いモデルを作成した。例えば、本実施例では、CNNの層を、畳み込み2層及び全結合2層の合計4層とした。
ステップS431では、識別部14は、以下のようにして、識別対象ラベルに対して、CNNを用いた文字認識を行う。すなわち、識別部14は、ステップS411,S419またはS427で抽出された識別対象ラベルを1つずつCNNに入力し、CNNの出力として、上記14種類の文字種類毎の確度[%]を算出する。但し、上記14種類の文字種類の合計の確度を100%とする。そして、識別部14は、上記14種類の文字種類の中で、確度が50%超となる文字を認識結果として採用する。例えば、CNNに入力された識別対象ラベルに対してCNNの出力が、数字の“1”については確度70%、数字の“7”については確度10%、区切り文字の“/”については確度20%、その他の文字については確度0%となる場合には、識別部14は、CNNに入力された識別対象ラベルに対する文字認識の結果として数字の“1”を採用し、数字の“1”の認識回数をインクリメントする。また例えば、CNNに入力された識別対象ラベルに対してCNNの出力が、数字の“3”については確度60%、数字の“8”については確度5%、数字の“9”については確度35%、その他の文字については確度0%となる場合には、識別部14は、CNNに入力された識別対象ラベルに対する文字認識の結果として数字の“3”を採用し、数字の“3”の認識回数をインクリメントする。このような各文字についての認識回数のインクリメントは、対象領域データ内で互いに異なる位置に存在する複数の識別対象ラベルのそれぞれについて、識別対象ラベル毎に行われる。
図21に戻り、次いで、ステップS433では、制御部17は、処理回数カウンタiの値が指定処理回数aを超えたか否かを判断する。処理回数カウンタiの値が指定処理回数a以下である場合は(ステップS433:No)、処理はステップS403へ戻る。よって、フォント種類カウンタnが“0”である場合は、ステップS407〜S411及びS431の処理が56回繰り返し実行される。また、フォント種類カウンタnが“2”である場合は、ステップS423〜S427及びS431の処理が56回繰り返し実行される。つまり、フォント種類が色付きDSEGフォント及び色付き非DSEGフォントの「色付きフォント」である場合は、2値化部13による2値化処理(ステップS407,S423)、及び、識別部14による除去処理(ステップS411,S427)が繰り返し複数回実行される。
一方で、処理回数カウンタiの値が指定処理回数aを超えた場合は(ステップS433:Yes)、処理はステップS435へ進む。
ステップS435では、識別部14は「一括識別」を行う。識別部14は、ステップS431での認識結果に基づいて、以下のようにして、一括識別を行う。
すなわち、例えば、対象領域データに第一〜第五の5つの識別対象ラベルが含まれるとする。フォント種類カウンタnが“0”または“2”である場合は、識別部14は、56個の各2値化スライス毎に第一〜第五の識別対象ラベルの認識結果の組合せを判定し、認識結果の組合せの判定回数を56回の文字認識に渡って組合せ毎に集計することにより一括識別を行う。すなわち、識別部14は、56回の文字認識に渡って組合せ毎に集計した判定回数のうちで最も多い判定回数を有する組合せを第一〜第五の識別対象ラベルに対する識別結果として採用する。最も多い判定回数を有する組合せは、最も確度が高い組合せであるからである。ここで、識別部14は、各2値化スライスにおいて対象領域データに4つ以上の識別対象ラベルが含まれる場合にだけ、識別対象ラベルの認識結果の組合せを判定する。
例えば、2値化スライスが“38”、“138”及び“210”のときに、ステップS431の文字認識において、第一識別対象ラベルが“8”、第二識別対象ラベルが“8”、第三識別対象ラベルが“6”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライスが“86”及び“178”のときに、ステップS431の文字認識において、第一識別対象ラベルが“9”、第二識別対象ラベルが“8”、第三識別対象ラベルが“6”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライス=98のときに、ステップS431の文字認識において、第一識別対象ラベルが“8”、第二識別対象ラベルが“8”、第三識別対象ラベルが“5”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライス=222のときに、ステップS431の文字認識において、第一識別対象ラベルが“3”、第二識別対象ラベルが“8”、第三識別対象ラベルが“5”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。よって、第一〜第五の識別対象ラベルの認識結果の組合せの判定回数は、第一の組合せである“88630”について3回、第二の組合せである“98630”について2回、第三の組合せである“88530”について1回、第四の組合せである“38530”について1回となる。そこで、識別部14は、一括識別の最終的な識別結果として、判定回数が最も多い第一の組合せである文字列“88630”を採用する。一括識別によるこの“88630”の識別結果は、図5に示すDSEGフォントの日付の識別結果として妥当である。
また例えば、2値化スライスが“38”、“138”及び“210”のときに、ステップS431の文字認識において、第一識別対象ラベルが“3”、第二識別対象ラベルが“8”、第三識別対象ラベルが“6”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライスが“86”及び“178”のときに、ステップS431の文字認識において、第一識別対象ラベルが“9”、第二識別対象ラベルが“8”、第三識別対象ラベルが“6”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライス=98のときに、ステップS431の文字認識において、第一識別対象ラベルが“8”、第二識別対象ラベルが“8”、第三識別対象ラベルが“5”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。また、2値化スライス=222のときに、ステップS431の文字認識において、第一識別対象ラベルが“8”、第二識別対象ラベルが“8”、第三識別対象ラベルが“6”、第四識別対象ラベルが“3”、第五識別対象ラベルが“0”と認識されたとする。よって、第一〜第五の識別対象ラベルの認識結果の組合せの判定回数は、第一の組合せである“38630”について3回、第二の組合せである“98630”について2回、第三の組合せである“88530”について1回、第四の組合せである“88630”について1回となる。そこで、識別部14は、一括識別の最終的な識別結果として、判定回数が最も多い第一の組合せである文字列“38630”を採用する。一括識別によるこの“38630”の識別結果は、図5に示すDSEGフォントの日付の識別結果として妥当でない。
なお、フォント種類カウンタnが“1”である場合は、識別部14は、ステップS431で第一〜第五の識別対象ラベルの各々に対して1回だけ行われる文字認識において認識された識別対象ラベルの組合せを一括識別の最終的な識別結果として採用する。
以上、ステップS435の一括識別について説明した。このように、ステップS435では、識別部14は、対象領域データに含まれる全ての識別対象ラベルを一括して識別する。換言すれば、識別部14は、以上のようにして、日付領域データに含まれる文字列を一括して識別する。
次いで、ステップS437では、識別部14は、ステップS435の一括識別が成功したか否かを判断する。ステップS437では、識別部14は、一括識別によって、全ての2値化スライスの何れにおいても4桁以上の文字列が識別されない場合は、一括識別が失敗したと判断する一方で、一括識別によって、何れかの2値化スライスにおいて4桁以上の文字列が識別された場合は、一括識別が成功したと判断する。フォント種類カウンタnが“0”または“2”である場合は、全ての2値化スライスの個数は56個であり、フォント種類カウンタnが“1”である場合は、全ての2値化スライスの個数は1個である。
一括識別が成功した場合は(ステップS437:Yes)、処理は図2のステップS213へ進み、一括識別が失敗した場合は(ステップS437:No)、処理はステップS439へ進む。つまり、識別部14は、ステップS435の一括識別によって文字列を識別することが困難な場合に(ステップS437:No)、ステップS439の個別識別を行う。
ステップS439では、識別部14は「個別識別」を行う。識別部14は、ステップS431での認識結果に基づいて、以下のようにして、個別識別を行う。
すなわち、例えば、対象領域データに第一〜第五の5つの識別対象ラベルが含まれるとする。フォント種類カウンタnが“0”または“2”である場合は、識別部14は、56回の文字認識に渡って、第一〜第五の各識別対象ラベル毎に個別に認識回数を集計することにより個別識別を行う。すなわち、識別部14は、第一〜第五の識別対象ラベルの各々について個別に、56回の文字認識に渡って認識回数が最も多い文字を識別結果として採用する。認識回数が最も多い文字は、最も確度が高い文字だからである。ここで、識別部14は、各2値化スライスにおいて対象領域データに4つ以上の識別対象ラベルが含まれる場合にだけ、各識別対象ラベルに対する個別識別を行う。
例えば、第一〜第五の識別対象ラベルのうち第一識別対象ラベルについては、56回の文字認識において、6回“8”と認識され、1回“9”と認識され、1回“3”と認識されたとする。そこで、識別部14は、個別識別での第一識別対象ラベルに対する識別結果として“8”を採用する。また、第二識別対象ラベルについては、56回の文字認識において、9回“8”と認識され、2回“3”と認識されたとする。そこで、識別部14は、個別識別での第二識別対象ラベルに対する識別結果として“8”を採用する。また、第三識別対象ラベルについては、56回の文字認識において、7回“6”と認識され、2回“5”と認識されたとする。そこで、識別部14は、個別識別での第三識別対象ラベルに対する識別結果として“6”を採用する。また、第四識別対象ラベルについては、56回の文字認識において、9回“3”と認識されたとする。そこで、識別部14は、個別識別での第四識別対象ラベルに対する識別結果として“3”を採用する。また、第五識別対象ラベルについては、56回の文字認識において、9回“0”と認識され、4回“8”と認識されたとする。そこで、識別部14は、個別識別での第五識別対象ラベルに対する識別結果として“0”を採用する。よって、識別部14は、個別識別の最終的な識別結果として、各個別識別の識別結果である“8”,“8”,“6”,“3”,“0”の組合せである文字列“88630”を採用する。個別識別によるこの“88630”の識別結果は、図5に示すDSEGフォントの日付の識別結果として妥当である。
また例えば、第一〜第五の識別対象ラベルのうち第一識別対象ラベルについては、56回の文字認識において、6回“3”と認識され、1回“9”と認識され、1回“8”と認識されたとする。そこで、識別部14は、個別識別での第一識別対象ラベルに対する識別結果として“3”を採用する。また、第二識別対象ラベルについては、56回の文字認識において、9回“8”と認識され、2回“3”と認識されたとする。そこで、識別部14は、個別識別での第二識別対象ラベルに対する識別結果として“8”を採用する。また、第三識別対象ラベルについては、56回の文字認識において、7回“6”と認識され、2回“5”と認識されたとする。そこで、識別部14は、個別識別での第三識別対象ラベルに対する識別結果として“6”を採用する。また、第四識別対象ラベルについては、56回の文字認識において、9回“3”と認識されたとする。そこで、識別部14は、個別識別での第四識別対象ラベルに対する識別結果として“3”を採用する。また、第五識別対象ラベルについては、56回の文字認識において、9回“0”と認識され、4回“8”と認識されたとする。そこで、識別部14は、個別識別での第五識別対象ラベルに対する識別結果として“0”を採用する。よって、識別部14は、個別識別の最終的な識別結果として、各個別識別の識別結果である“3”,“8”,“6”,“3”,“0”の組合せである文字列“38630”を採用する。個別識別によるこの“38630”の識別結果は、図5に示すDSEGフォントの日付の識別結果として妥当でない。
なお、フォント種類カウンタnが“1”である場合は、識別部14は、ステップS431で第一〜第五の識別対象ラベルの各々に対して1回だけ行われる文字認識の認識結果を個別識別の最終的な識別結果として採用する。
以上、ステップS439の個別識別について説明した。このように、ステップS439では、識別部14は、対象領域データに含まれるそれぞれの識別対象ラベルを個別に識別する。換言すれば、識別部14は、以上のようにして、日付領域データに含まれる文字列の各文字を個別に識別する。
次いで、ステップS441では、識別部14は、ステップS439の個別識別が成功したか否かを判断する。ステップS439では、識別部14は、個別識別によって、全ての2値化スライスの何れにおいても4桁以上の文字列が識別されない場合は、個別識別が失敗したと判断する一方で、個別識別によって、何れかの2値化スライスにおいて4桁以上の文字列が識別された場合は、個別識別が成功したと判断する。フォント種類カウンタnが“0”または“2”である場合は、全ての2値化スライスの個数は56個であり、フォント種類カウンタnが“1”である場合は、全ての2値化スライスの個数は1個である。
個別識別が成功した場合は(ステップS441:Yes)、処理は図2のステップS213へ進み、個別識別が失敗した場合は(ステップS441:No)、処理はステップS443へ進む。
ステップS443では、制御部17は、フォント種類カウンタnをインクリメントする。ステップS443の処理後、処理は図2のステップS209へ戻る。
以上、ステップS211の識別処理について説明した。
図2に戻り、次いで、ステップS213では、制御部17は、補正部15に補正処理を行わせる。ステップS213では、補正部15は、ステップS435での一括識別の最終的な識別結果、または、ステップS439での個別識別の最終的な識別結果に対して補正処理を行う。図23は、実施例1の補正処理一例の説明に供するフローチャートである。
図23において、ステップS500では、まず、制御部17は、識別結果に含まれる文字列によって表される日付が所定の日付条件を満足するか否かを判断する。例えば、所定の日付条件は「1950年1月1日〜現在の日付」であり、識別結果に含まれる文字列によって表される日付が1950年1月1日〜現在の日付の何れかの日付に該当する場合は、制御部17は、その日付が所定の日付条件を満足すると判断する。一方で、識別結果に含まれる文字列によって表される日付が1950年1月1日〜現在の日付の何れの日付にも該当しなければ、制御部17は、その日付が所定の日付条件を満足しないと判断する。つまり、制御部17は、識別結果に含まれる文字列によって表される日付が日付として妥当であるか否かを判断する。補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足する場合は(ステップS500:Yes)、処理は図2のステップS215へ進む。一方で、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足しない場合は(ステップS500:No)、処理はステップS501へ進む。
よって、例えば、図5に示すDSEGフォントの日付について、一括識別または個別識別によって、“88630”と識別された場合はステップS500での判断が“Yes”となる一方で、“38630”と識別された場合はステップS500での判断が“No”となる。
次いで、ステップS501では、制御部17は、フォント種類カウンタnの値を判断する。
フォント種類カウンタnが“0”である場合は、ステップS503において、制御部17は、補正部15に「第一補正処理」を行わせる。一方で、フォント種類カウンタnが“1”または“2”である場合は、ステップS505において、制御部17は、補正部15に「第二補正処理」を行わせる。つまり、ステップS503の第一補正処理は、色付きDSEGフォントに対する識別結果を対象とする補正処理であり、ステップS505の第二補正処理は、白色非DSEGフォント及び色付き非DSEGフォント、つまり、非DSEGフォントに対する識別結果を対象とする補正処理である。つまり、補正部15は、フォント種類がDSEGフォントである場合と、フォント種類がDSEGフォント以外のフォントである場合とで、識別結果に対する補正処理を異ならせる。
図24〜図26は、実施例1の第一補正処理の一例を示す図である。DSEGフォントが7セグメントフォントである場合、“0”〜“9”の各数字は、図24に示すように、seg1〜seg7の7つのセグメントを用いて形成される。そこで、ステップS503では、補正部15は、例えば、識別部14で行われた識別処理での最終的な識別結果に数字の“3”が含まれている場合には、図25に示すように、その“3”を数字の“8”に補正する。また例えば、ステップS503では、補正部15は、識別部14で行われた識別処理での最終的な識別結果に数字の“5”が含まれている場合には、図26に示すように、その“5”を数字の“6”に補正する。図25に示すように、数字の“3”を形成するセグメントの数は5つであるのに対し、数字の“8”を形成するセグメントの数は7つである。また、図26に示すように、数字の“5”を形成するセグメントの数は5つであるのに対し、数字の“6”を形成するセグメントの数は6つである。つまり、フォント種類がDSEGフォントである場合に実行される第一補正処理(ステップS503)では、補正部15は、識別処理での識別結果に含まれる各数字を形成するセグメントの数に基づいて、識別結果に対する補正処理を行う。
一方で、図27〜図32は、実施例1の第二補正処理の一例を示す図である。
例えば、図27に示すように、識別部14で行われた識別処理での最終的な識別結果が“2002/08112”である場合、補正部15は、まず、最も左から5桁目の位置P5に区切り文字である“/”を検出する。そして、補正部15は、最も左から5桁目の位置P5に区切り文字である“/”を検出した場合、図27に示すように、最も左から8桁目の位置P8に数字“1”があればその数字“1”を、区切り文字である“/”に補正する。
また例えば、図28に示すように、識別部14で行われた識別処理での最終的な識別結果が“2002/08712”である場合、補正部15は、まず、最も左から5桁目の位置P5に区切り文字である“/”を検出する。そして、補正部15は、最も左から5桁目の位置P5に区切り文字である“/”を検出した場合、図28に示すように、最も左から8桁目の位置P8に数字“7”があればその数字“7”を、区切り文字である“/”に補正する。
また例えば、図29に示すように、識別部14で行われた識別処理での最終的な識別結果が“2002108112”である場合、補正部15は、まず、最も左から5桁目の位置P5と8桁目の位置P8に数字“1”を検出する。そして、補正部15は、最も左から5桁目の位置P5と8桁目の位置P8に数字“1”を検出した場合、図29に示すように、最も左から5桁目の位置P5と8桁目の位置P8にある数字“1”をそれぞれ、区切り文字である“/”に補正する。
また例えば、図30に示すように、識別部14で行われた識別処理での最終的な識別結果が“0045月248”である場合、補正部15は、まず、最も左から5桁目の位置P5に区切り文字である“月”を検出する。そして、補正部15は、最も左から5桁目の位置P5に区切り文字である“月”を検出した場合、図30に示すように、最も左から3桁目の位置P3に数字“4”があればその数字“4”を、区切り文字である“年”に補正し、最も左から8桁目の位置P8に数字“8”があればその数字“8”を、区切り文字である“日”に補正する。
また例えば、図31に示すように、識別部14で行われた識別処理での最終的な識別結果が“00年58248”である場合、補正部15は、まず、最も左から3桁目の位置P3に区切り文字である“年”を検出する。そして、補正部15は、最も左から3桁目の位置P3に区切り文字である“年”を検出した場合、図31に示すように、最も左から5桁目の位置P5に数字“8”があればその数字“8”を、区切り文字である“月”に補正し、最も左から8桁目の位置P8に数字“8”があればその数字“8”を、区切り文字である“日”に補正する。
また例えば、図32に示すように、識別部14で行われた識別処理での最終的な識別結果が“0045824日”である場合、補正部15は、まず、最も左から8桁目の位置P8に区切り文字である“日”を検出する。そして、補正部15は、最も左から8桁目の位置P8に区切り文字である“日”を検出した場合、図32に示すように、最も左から3桁目の位置P3に数字“4”があればその数字“4”を、区切り文字である“年”に補正し、最も左から5桁目の位置P5に数字“8”があればその数字“8”を、区切り文字である“月”に補正する。
つまり、フォント種類がDSEGフォント以外のフォント(つまり、非DSEGフォント)である場合に実行される第二補正処理(ステップS505)では、補正部15は、識別処理での識別結果に含まれる各文字の位置関係に基づいて、識別結果に対する補正処理を行う。
以上、第一補正処理と第二補正処理とについて説明した。
図23に戻り、ステップS503またはステップS505の処理後、処理はステップS507へ進む。
ステップS507では、制御部17は、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足するか否かを判断する。判断手法は、ステップS500と同様である。補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足する場合は(ステップS507:Yes)、処理は図2のステップS215へ進む。一方で、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足しない場合は(ステップS507:No)、処理はステップS509へ進む。
ステップS509では、制御部17は、フォント種類カウンタnが“2”以下か否かを判断する。フォント種類カウンタnが“3”以上である場合、つまり、第一種〜第三種の全てのフォント種類に対する日付の識別処理が完了した場合は(ステップS509:No)、処理は図2のステップS215へ進む。一方で、フォント種類カウンタnが“2”以下である場合、つまり、第一種〜第三種のうち第三種までのフォント種類に対する日付の識別処理が未完了の場合は(ステップS509:Yes)、処理はステップS511へ進む。
ステップS511では、制御部17は、フォント種類カウンタnをインクリメントする。ステップS511の処理後、処理は図2のステップS209に戻る。
図2に戻り、ステップS215では、制御部17は、付与部16に日付データ付与処理を行わせる。ステップS215では、付与部16は、記憶部11から入力画像データを取得し、補正後の識別結果に含まれる文字列によって表される日付を形成する日付データを、記憶部11から取得した入力画像データに付与する。そして、付与部16は、日付データを付与された入力画像データを出力画像データとして日付識別装置1から出力する。
以上のように、実施例1では、日付識別装置1は、切出部12と、2値化部13と、識別部14と、補正部15と、付与部16とを有する。切出部12は、入力画像データから日付領域データを切り出す。2値化部13は、日付領域データを2値化して2値化データを生成する2値化処理を行う。識別部14は、2値化データに対してディープラーニングを用いた認識処理を施して日付領域データに含まれる文字列を識別する識別処理を行う。補正部15は、識別処理での識別結果に対して、日付領域データに含まれる文字列のフォント種類に合わせた補正処理を行う。付与部16は、補正された識別結果に含まれる文字列に基づく日付データを画像データに付与する。
こうすることで、たとえディープラーニングの学習度合が低くて文字列の認識精度が低い場合であっても、フォント種類に合わせた補正処理により日付の識別精度を高めることができる。換言すれば、フォント種類に合わせた補正処理により日付の識別精度を高めることができるので、ディープラーニングの一種であるCNNの層を浅くすることが可能になって計算量を削減することができる。よって、写真等の媒体に付与されている日付の識別を、少ない処理量で高精度に行うことができる。
また、補正部15は、フォント種類がDSEGフォントである場合と、フォント種類がDSEGフォント以外のフォント(つまり、非DSEGフォント)である場合とで、補正処理を異ならせる。
こうすることで、DSEGフォント及び非DESGフォントのそれぞれの特徴に合わせた補正処理を行うことができるため、補正の精度を高めることができる。
また、補正部15は、フォント種類がDSEGフォントである場合は、識別処理での識別結果に含まれる各数字を形成するセグメントの数に基づいて補正処理を行う。
こうすることで、DSEGフォントにおいて認識誤りが発生しやすい数字を優先的に補正することができる。
また、補正部15は、フォント種類が非DSEGフォントである場合は、識別結果に含まれる各文字の位置関係に基づいて補正処理を行う。
こうすることで、非DSEGフォントにおいて認識誤りが発生しやすい文字を優先的に補正することができる。
また、2値化部13及び識別部14は、2値化処理及び認識処理を繰り返し複数回実行し、識別部14は、最も確度が高い識別結果に基づいて文字列を識別する。
こうすることで、さらに、日付の識別精度を高めることができる。
また、識別部14は、一括識別により、文字列に含まれる複数の文字を一括して識別することが困難な場合に、個別識別により、複数の文字のそれぞれを個別に識別する。
こうすることで、一括識別で識別困難な場合にはじめて、一括識別に比べて処理量が多い一方で識別精度が高い個別識別が実行されるため、処理量を最小限に抑えつつ識別精度を高めることができる。
[実施例2]
図33は、実施例2の携帯端末の構成例を示す図である。図33において、携帯端末10は、日付識別装置1と、撮影部10aと、操作部10bと、表示部10cと、通信部10dとを有する。携帯端末10は、例えば、スマートフォンやタブレット端末等のスマートデバイスである。撮影部10aは、ハードウェアとして、例えば、カメラにより実現される。操作部10b及び表示部10cは、ハードウェアとして、例えば、タッチパネルにより実現される。通信部10dは、ハードウェアとして、例えば、無線通信モジュールまたはネットワークインタフェースモジュールにより実現される。
携帯端末10では、例えば、撮影部10aより撮影された画像のデータ、通信部10dにより受信された画像のデータが日付識別装置1への入力画像データとなる。
[他の実施例]
[1]識別部14は、ステップS431の文字認識において、識別対象ラベルのラベル領域116の横の長さと縦の長さとのアスペクト比が1:3以上である場合には、CNNによる文字認識を行わずに、識別対象ラベルに対する文字認識の結果として数字の“1”を採用しても良い。
[2]補正部15は、一括識別による識別結果に対する第一補正処理を、判定回数が同一の組合せが複数存在する場合にだけ行っても良い。例えば、一括識別において、上記の第一〜第五の識別対象ラベルの認識結果の組合せの判定回数が、第一の組合せの“88613”について4回、第二の組合せの“88618”について4回、第三の組合せの“88530”について2回、第四の組合せの“88630”について1回となった場合には、補正部15は、判定回数が4回で同一である第一の組合せと第二の組合せとの間において第一補正処理を行うことにより、一括識別の識別結果として“88618”を採用しても良い。
[3]補正部15は、個別識別による識別結果に対する第一補正処理を、1つの識別対象ラベルに対して認識回数が同一となる複数の数字が存在する場合にだけ行っても良い。例えば、上記の第一〜第五の識別対象ラベルのうち第一識別対象ラベルについて、56回の文字認識において、5回“3”と認識され、5回“8”と認識され、1回“9”と認識された場合には、補正部15は、認識回数が5回で同一である“3”と“8” との間において第一補正処理を行うことにより、第一識別対象ラベルおける個別識別の識別結果として“8”を採用しても良い。
[4]実施例1の第二ラベル処理(ステップS313,S319)では、第二近接統合を行わなかった。しかし、第二ラベル処理においても第二近接統合を行っても良い。第二ラベル処理において第二近接統合を行う際には、第二近接統合に用いられる閾値THDを、第二ラベル処理での第二近接統合の場合よりも小さな値とするのが好ましい。
[5]日付領域データ101における背景の色に基づいて指定処理回数aの値を設定しても良い。例えば、背景に絵柄等が写り込んでいて背景の色が複雑である場合には、指定処理回数aの値を増加させると良い。
[6]S431の文字認識に用いるディープラーニングはCNNに限定されない。例えば、RNN(Recurrent Neural Network)やLSTM(Long Short-Term Memory)のディープラーニングを用いてS431の文字認識に行っても良い。
[7]日付識別装置1での上記説明における各処理の全部または一部は、各処理に対応するプログラムを日付識別装置1が有するプロセッサに実行させることによって実現してもよい。例えば、上記説明における各処理に対応するプログラムがメモリに記憶され、プログラムがプロセッサによってメモリから読み出されて実行されても良い。また、プログラムは、任意のネットワークを介して携帯端末10に接続されたプログラムサーバに記憶され、そのプログラムサーバから携帯端末10にダウンロードされて実行されたり、携帯端末10が読み取り可能な記録媒体に記憶され、その記録媒体から読み出されて実行されても良い。携帯端末10が読み取り可能な記録媒体には、例えば、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、CD−ROM、DVD、及び、Blu−ray(登録商標)ディスク等の可搬の記憶媒体が含まれる。また、プログラムは、任意の言語や任意の記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。また、プログラムは必ずしも単一的に構成されるものに限られず、複数のモジュールや複数のライブラリとして分散構成されるものや、OSに代表される別個のプログラムと協働してその機能を達成するものも含む。
[8]日付識別装置1の分散・統合の具体的形態は図示するものに限られず、日付識別装置1の全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
1 日付識別装置
11 記憶部
12 切出部
13 2値化部
14 識別部
15 補正部
16 付与部
17 制御部
10 携帯端末

Claims (7)

  1. 日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出す切出部と、
    前記日付領域データを2値化して2値化データを生成する2値化処理を行う2値化部と、
    前記2値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行う識別部と、
    前記識別処理での識別結果に対して前記文字列のフォント種類がDSEGフォントである場合と、前記DSEGフォント以外のフォントである場合とで異なる補正処理を行う補正部と、
    補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する付与部と、
    を具備する日付識別装置。
  2. 前記補正部は、前記フォント種類が前記DSEGフォントである場合は、前記識別結果に含まれる各数字を形成するセグメントの数に基づいて前記補正処理を行う、
    請求項に記載の日付識別装置。
  3. 前記補正部は、前記フォント種類が前記DSEGフォント以外のフォントである場合は、前記識別結果に含まれる各文字の位置関係に基づいて前記補正処理を行う、
    請求項に記載の日付識別装置。
  4. 前記2値化部及び前記識別部は、前記2値化処理及び前記認識処理を繰り返し複数回実行し、
    前記識別部は、最も確度が高い前記識別結果に基づいて前記文字列を識別する、
    請求項1からの何れか一つに記載の日付識別装置。
  5. 前記識別部は、前記文字列に含まれる複数の文字を一括して識別することが困難な場合に、前記複数の文字のそれぞれを個別に識別する、
    請求項1からの何れか一つに記載の日付識別装置。
  6. 日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出し、
    前記日付領域データを2値化して2値化データを生成し、
    前記2値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行い、
    前記識別処理での識別結果に対して、前記文字列のフォント種類がDSEGフォントである場合と、前記DSEGフォント以外のフォントである場合とで異なる補正を行い
    補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する、
    日付識別方法。
  7. 日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出し、
    前記日付領域データを2値化して2値化データを生成し、
    前記2値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別して識別結果を獲得し、
    前記識別結果に対して、前記文字列のフォント種類がDSEGフォントである場合と、前記DSEGフォント以外のフォントである場合とで異なる補正を行い
    補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する、
    処理をプロセッサに実行させるための日付識別プログラム。
JP2017025261A 2017-02-14 2017-02-14 日付識別装置、日付識別方法及び日付識別プログラム Active JP6401806B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017025261A JP6401806B2 (ja) 2017-02-14 2017-02-14 日付識別装置、日付識別方法及び日付識別プログラム
US15/606,250 US10380416B2 (en) 2017-02-14 2017-05-26 Date identifying apparatus, date identifying method, and computer-readable recording medium
CN201710819188.6A CN108427952A (zh) 2017-02-14 2017-09-12 日期识别装置、日期识别方法及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017025261A JP6401806B2 (ja) 2017-02-14 2017-02-14 日付識別装置、日付識別方法及び日付識別プログラム

Publications (2)

Publication Number Publication Date
JP2018132894A JP2018132894A (ja) 2018-08-23
JP6401806B2 true JP6401806B2 (ja) 2018-10-10

Family

ID=63104751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017025261A Active JP6401806B2 (ja) 2017-02-14 2017-02-14 日付識別装置、日付識別方法及び日付識別プログラム

Country Status (3)

Country Link
US (1) US10380416B2 (ja)
JP (1) JP6401806B2 (ja)
CN (1) CN108427952A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107220648B (zh) * 2017-04-11 2018-06-22 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
JP7353366B2 (ja) * 2018-11-07 2023-09-29 サービスナウ・カナダ・インコーポレイテッド トレーニングセットとして用いる文書からの機密データの除去
CN111353511B (zh) 2018-12-20 2024-03-08 富士通株式会社 号码识别装置及方法
JP6868057B2 (ja) * 2019-05-27 2021-05-12 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221512A (ja) 1995-02-10 1996-08-30 Canon Inc 画像処理装置及びその方法
JP3422896B2 (ja) * 1996-05-10 2003-06-30 株式会社神戸製鋼所 画像認識方法及びその装置
JPH09326012A (ja) * 1996-06-05 1997-12-16 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
US6029144A (en) * 1997-08-29 2000-02-22 International Business Machines Corporation Compliance-to-policy detection method and system
JP2000339472A (ja) 1999-05-31 2000-12-08 Hitachi Eng Co Ltd セグメント文字パターンの印字判定方法及び装置
JP2001331781A (ja) * 2000-05-19 2001-11-30 Konica Corp 画像データ保存方法、画像処理方法及びコンピュータ読み取り可能な記憶媒体
US8569142B2 (en) * 2003-11-28 2013-10-29 Blackberry Limited Multi-level thin film capacitor on a ceramic substrate and method of manufacturing the same
FR2864664B1 (fr) * 2003-12-24 2008-08-15 Solystic Procede de traitement d'envois postaux avec prise en compte d'un surcroit d'erreur de distribution
US9769354B2 (en) * 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US7895157B2 (en) * 2007-11-19 2011-02-22 At&T Intellectual Property I, Lp Methods, systems and computer program products for playing back previously published content
US8001237B2 (en) * 2008-03-21 2011-08-16 Young Yee Remote monitoring of user input devices
EP2327080A4 (en) * 2008-08-25 2011-12-28 Nanosteel Co Inc BENDING METAL GLASS IN BAND FORM
KR101468231B1 (ko) * 2009-09-11 2014-12-04 삼성전자주식회사 라벨 검색 방법 및 장치
US9152883B2 (en) * 2009-11-02 2015-10-06 Harry Urbschat System and method for increasing the accuracy of optical character recognition (OCR)
US20110249905A1 (en) * 2010-01-15 2011-10-13 Copanion, Inc. Systems and methods for automatically extracting data from electronic documents including tables
JP5418386B2 (ja) * 2010-04-19 2014-02-19 ソニー株式会社 画像処理装置、画像処理方法及びプログラム
EP2666123A4 (en) * 2011-01-18 2017-03-08 RTC Vision Ltd. System and method for improved character recognition in distorted images
JP5075997B2 (ja) * 2011-03-30 2012-11-21 株式会社東芝 電子機器、プログラムおよび文字列認識方法
JP5830338B2 (ja) * 2011-10-07 2015-12-09 株式会社日立情報通信エンジニアリング 帳票認識方法および帳票認識装置
US9355312B2 (en) * 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
WO2014160426A1 (en) 2013-03-13 2014-10-02 Kofax, Inc. Classifying objects in digital images captured using mobile devices
JP6344389B2 (ja) * 2013-07-16 2018-06-20 株式会社湯山製作所 光学文字認識装置
JP6467151B2 (ja) * 2014-07-09 2019-02-06 株式会社ビデオリサーチ コンテンツ接触状況検出装置及びシステム及び方法及びプログラム、端末
JP2016177383A (ja) * 2015-03-18 2016-10-06 グローリー株式会社 識別番号検索システム及び識別番号検索方法
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
JP5997808B1 (ja) * 2015-06-18 2016-09-28 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム
US10242285B2 (en) * 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
CN106156768B (zh) * 2016-07-01 2019-03-12 屈桢深 基于视觉的机动车行驶证检测方法

Also Published As

Publication number Publication date
CN108427952A (zh) 2018-08-21
US10380416B2 (en) 2019-08-13
JP2018132894A (ja) 2018-08-23
US20180232884A1 (en) 2018-08-16

Similar Documents

Publication Publication Date Title
JP6401806B2 (ja) 日付識別装置、日付識別方法及び日付識別プログラム
US11164027B2 (en) Deep learning based license plate identification method, device, equipment, and storage medium
EP3425563B1 (en) Automatic extraction method, device and system for driving licence expiration date, and storage medium
WO2017140233A1 (zh) 文字检测方法及系统、设备、存储介质
CN110008944A (zh) 基于模板匹配的ocr识别方法及装置、存储介质
US8908975B2 (en) Apparatus and method for automatically recognizing a QR code
CN109409377B (zh) 图像中文字的检测方法及装置
JP4694613B2 (ja) 原稿方向判定装置、原稿方向判定方法、プログラムおよびその記録媒体
US9171224B2 (en) Method of improving contrast for text extraction and recognition applications
US11341739B2 (en) Image processing device, image processing method, and program recording medium
CN110728277B (zh) 一种印章智能检测与识别的方法及系统
RU2014137297A (ru) Система и способ считывания серийного номера бумажного листа
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
JP6115388B2 (ja) ナンバープレート認識装置およびナンバープレート認識方法
CN107403179B (zh) 一种物品包装信息的注册方法及装置
CN108304836A (zh) 一种基于图像的图书排序检测方法
CN102831428A (zh) 图像内快速响应矩阵码区域的提取方法
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
RU2626656C2 (ru) Способ и система определения ориентации изображения текста
US9384391B2 (en) Methods and systems for processing documents
JP2016038821A (ja) 画像処理装置
JP2021196451A (ja) 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム
CN109348084B (zh) 图像形成方法、装置、电子设备和可读存储介质
CN115731550A (zh) 一种基于深度学习的药品说明书自动识别方法、系统及存储介质
EP2919149A2 (en) Image processing apparatus and image processing method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180904

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180907

R150 Certificate of patent or registration of utility model

Ref document number: 6401806

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150