JP6401806B2

JP6401806B2 - 日付識別装置、日付識別方法及び日付識別プログラム

Info

Publication number: JP6401806B2
Application number: JP2017025261A
Authority: JP
Inventors: 正義林
Original assignee: PFU Ltd
Current assignee: PFU Ltd
Priority date: 2017-02-14
Filing date: 2017-02-14
Publication date: 2018-10-10
Anticipated expiration: 2037-02-14
Also published as: CN108427952A; US10380416B2; JP2018132894A; US20180232884A1

Description

本発明は、日付識別装置、日付識別方法及び日付識別プログラムに関する。

写真の中には、写真が撮影された日付がその写真上に付けられているものがあり、例えば、昔に撮影された古い銀塩写真では、その写真上に日付が焼き付けられているものが多い。

一方で、近年、電子データが存在しない古い銀塩写真をデジタルカメラ等を用いて撮影することにより、その古い銀塩写真を電子データ化するケースが増えている。

特開２０１３−０８４０７１号公報特開平８−２２１５１２号公報特開２０００−３３９４７２号公報

日付が焼き付けられている古い銀塩写真では、その日付が不鮮明なことがあるため、その古い銀塩写真が電子データ化される際に日付に対してＯＣＲ（Optical Character Recognition）等の文字認識が施されても、日付の識別精度が低いことがある。

開示の技術は、上記に鑑みてなされたものであって、写真等の媒体に付与されている日付の識別を高精度で行うことを目的とする。

開示の態様では、日付識別装置は、切出部と、２値化部と、識別部と、補正部と、付与部とを有する。前記切出部は、日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出す。前記２値化部は、前記日付領域データを２値化して２値化データを生成する２値化処理を行う。前記識別部は、前記２値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行う。前記補正部は、前記識別処理での識別結果に対して前記文字列のフォント種類に合わせた補正処理を行う。前記付与部は、補正された前記識別結果に含まれる前記文字列に基づく日付データを前記画像データに付与する。

開示の態様によれば、写真等の媒体に付与されている日付の識別を高精度で行うことができる。

図１は、実施例１の日付識別装置の構成例を示す図である。図２は、実施例１の日付識別装置の処理例の説明に供するフローチャートである。図３は、実施例１の指定範囲切出処理の一例を示す図である。図４は、実施例１のライン切出処理の一例の説明に供するフローチャートである。図５は、実施例１のフォント種類の一例を示す図である。図６は、実施例１のフォント種類の一例を示す図である。図７は、実施例１のフォント種類の一例を示す図である。図８は、実施例１のフォント種類の一例を示す図である。図９は、実施例１のフォント種類の一例を示す図である。図１０は、実施例１のフォント種類の一例を示す図である。図１１は、実施例１の第一２値化処理の一例の説明に供するフローチャートである。図１２は、実施例１の色相のヒストグラム抽出の一例を示す図である。図１３は、実施例１の第一ラベル処理の一例を示す図である。図１４は、実施例１の第一ラベル処理の一例を示す図である。図１５は、実施例１の第一ラベル処理の一例を示す図である。図１６は、実施例１の第一ラベル処理の一例を示す図である。図１７は、実施例１の第一ラベル処理の一例を示す図である。図１８は、実施例１の第一ラベル処理の一例を示す図である。図１９は、実施例１の第一ラベル処理の一例を示す図である。図２０は、実施例１のラベル探索の一例を示す図である。図２１は、実施例１の識別処理の一例の説明に供するフローチャートである。図２２は、実施例１の紛らわしいデータの一例を示す図である。図２３は、実施例１の補正処理一例の説明に供するフローチャートである。図２４は、実施例１の第一補正処理の一例を示す図である。図２５は、実施例１の第一補正処理の一例を示す図である。図２６は、実施例１の第一補正処理の一例を示す図である。図２７は、実施例１の第二補正処理の一例を示す図である。図２８は、実施例１の第二補正処理の一例を示す図である。図２９は、実施例１の第二補正処理の一例を示す図である。図３０は、実施例１の第二補正処理の一例を示す図である。図３１は、実施例１の第二補正処理の一例を示す図である。図３２は、実施例１の第二補正処理の一例を示す図である。図３３は、実施例２の携帯端末の構成例を示す図である。

以下に、本願の開示する日付識別装置、日付識別方法及び日付識別プログラムの実施例を図面に基づいて説明する。なお、この実施例により本願の開示する日付識別装置、日付識別方法及び日付識別プログラムが限定されるものではない。また、実施例において同一の機能を有する構成、及び、同一の処理を行うステップには同一の符号を付す。

［実施例１］
［日付識別装置の構成］
図１は、実施例１の日付識別装置の構成例を示す図である。図１において、日付識別装置１は、記憶部１１と、切出部１２と、２値化部１３と、識別部１４と、補正部１５と、付与部１６と、制御部１７とを有する。

記憶部１１は、ハードウェアとして、例えば、メモリにより実現される。メモリの一例として、ＳＤＲＡＭ（Synchronous Dynamic Random Access Memory）等のＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等が挙げられる。

切出部１２、２値化部１３、識別部１４、補正部１５、付与部１６、及び、制御部１７は、ハードウェアとして、例えばプロセッサにより実現することができる。プロセッサの一例として、ＣＰＵ（Central Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＦＰＧＡ（Field Programmable Gate Array）等が挙げられる。また、切出部１２、２値化部１３、識別部１４、補正部１５、付与部１６、及び、制御部１７は、プロセッサと周辺回路とを含むＬＳＩ（Large Scale Integrated circuit）によって実現されても良い。さらに、切出部１２、２値化部１３、識別部１４、補正部１５、付与部１６、及び、制御部１７は、ＧＰＵ（Graphics Processing Unit）、ＡＳＩＣ（Application Specific Integrated Circuit）等を用いて実現されても良い。

日付識別装置１に入力された画像データ（以下では「入力画像データ」と呼ぶことがある）は記憶部１１に記憶される。記憶部１１に記憶された入力画像データを元にして、切出部１２、２値化部１３、識別部１４、補正部１５、付与部１６、及び、制御部１７により以下に説明する各処理が行われることにより、日付識別装置１から出力される画像データ（以下では「出力画像データ」と呼ぶことがある）が生成される。制御部１７は、切出部１２、２値化部１３、識別部１４、補正部１５、及び、付与部１６を制御する。

入力画像データは、例えば、日付識別装置１を有する携帯端末が搭載するカメラによって、撮影対象の媒体としての銀塩写真が撮影されることにより生成された写真データである。また、銀塩写真の中でも、特に、日付が焼き付けられている銀塩写真が撮影対象の媒体となる。なお、撮影対象の媒体は、銀塩写真に限定されず、例えば、印刷写真や、紙面に印刷された画像等であっても良い。特に、日付が印字されている印刷写真や、日付が印字されている画像が撮影対象の媒体となる。つまり、入力画像データは、日付が付与されている媒体を撮影することにより生成された画像データである。

＜日付識別装置の処理＞
図２は、実施例１の日付識別装置の処理例の説明に供するフローチャートである。

図２において、まず、ステップＳ２０１では、制御部１７は、切出部１２に矩形切出処理を行わせる。切出部１２は、入力画像データから所定の矩形領域のデータ（以下では「矩形領域データ」と呼ぶことがある）を切り出す。所定の矩形領域の大きさは、撮影対象の媒体としての写真のサイズに基づいて規定され、切出部１２は、写真の輪郭に沿って、入力画像データから矩形領域データを切り出す。

次いで、ステップＳ２０３では、切出部１２は、矩形領域データの切出に成功したか否かを判断する。切出部１２が矩形領域データの切出に成功したときは（ステップＳ２０３：Ｙｅｓ）、処理はステップＳ２０５へ進む。一方で、切出部１２が矩形領域データの切出に失敗したときは（ステップＳ２０３：Ｎｏ）、処理は「エンド」へ進んで、制御部１７は日付の識別処理を強制的に終了させる。

ステップＳ２０５では、切出部１２は、ステップＳ２０１で切り出した矩形領域データから指定範囲を切り出す。

図３は、実施例１の指定範囲切出処理の一例を示す図である。日付が付与されている写真では、長方形の写真を横長になる向きにして見た場合において、日付は、一般的に、写真の左上箇所または右下箇所に付与されることが多い。また、一般的に日付は、年月日を示す各数字が横方向に並ぶことにより表されるため、写真上において日付を表す範囲は横長の矩形の範囲になる。そこで、切出部１２は、図３に示すように、矩形領域データ１００の中における左上の指定範囲と右下の指定範囲とを横長の矩形の形状で矩形領域データ１００から切り出すことにより、日付が付与されていると推定される領域のデータ（以下では「日付領域データ」と呼ぶことがある）１０１−１，１０１−２を矩形領域データ１００から切り出す。以下では、日付領域データ１０１−１，１０１−２を区別しない場合には日付領域データ１０１と総称することがある。

図２に戻り、次いで、ステップＳ２０７では、制御部１７は、フォント種類カウンタｎを“０”にセットする。

次いで、ステップＳ２０９では、制御部１７は、切出部１２及び２値化部１３にライン切出処理を行わせる。

図４は、実施例１のライン切出処理の一例の説明に供するフローチャートである。また、図５〜図１０は、実施例１のフォント種類の一例を示す図である。

ここで、図５〜図１０に示すように、写真に付与されている日付のフォント種類は、第一種〜第三種の３種類に大別される。

フォント種類の「第一種」としてＤＳＥＧフォントが挙げられる（図５，図６）。ＤＳＥＧフォントを用いて写真に付与された日付の色は、一般的に、日付ＣＳ１（図５）のように赤色、または、日付ＣＳ２（図６）のように黄色であることが多い。また、ＤＳＥＧフォントで表された日付は、一般的に、図５及び図６に示すように、「年」を表す数字と、「月」を表す数字と、「日」を表す数字とが、ブランクを用いて区切られていることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタｎ＝０」は、第一種のフォント種類である「色付きＤＳＥＧフォント」に対応する。なお、図５及び図６では、ＤＳＥＧフォントの一例として７セグメントフォントを挙げているが、開示の技術が適用可能なＤＳＥＧフォントは７セグメントフォントに限定されない。例えば、開示の技術は、１４セグメントフォントにも適用可能である。

フォント種類の「第二種」として、ＤＳＥＧフォント以外の白色のフォント（以下では「白色非ＤＳＥＧフォント」と呼ぶことがある）が挙げられる（図７，図８）。白色非ＤＳＥＧフォントを用いて写真に付与された日付では、一般的に、日付ＣＳ３（図７）及び日付ＣＳ４（図８）のように、一文字がＤＳＥＧフォントのようにセグメントに分割されていない。また、白色非ＤＳＥＧフォントで表された日付は、一般的に、図７及び図８に示すように、「年」を表す数字と、「月」を表す数字と、「日」を表す数字とが、“.”（ドット）や“／”（スラッシュ）の「区切り文字」を用いて区切られていることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタｎ＝１」は、第二種のフォント種類である「白色非ＤＳＥＧフォント」に対応する。

フォント種類の「第三種」として、ＤＳＥＧフォント以外の色付きのフォント（以下では「色付き非ＤＳＥＧフォント」と呼ぶことがある）が挙げられる（図９，図１０）。色付き非ＤＳＥＧフォントを用いて写真に付与された日付では、一般的に、日付ＣＳ５（図９）及び日付ＣＳ６（図１０）のように、一文字がＤＳＥＧフォントのようにセグメントに分割されていない。また、色付き非ＤＳＥＧフォントで表された日付は、図１０に示すように、「年」，「月」，「日」の漢字が含まれることが多いという特徴を有する。そこで、以下では、「フォント種類カウンタｎ＝２」は、第三種のフォント種類である「色付き非ＤＳＥＧフォント」に対応する。

図４に戻り、まず、ステップＳ３０１では、制御部１７は、フォント種類カウンタｎが“２”以下か否かを判断する。フォント種類カウンタｎが“３”以上である場合、つまり、第一種〜第三種の全てのフォント種類に対する日付の識別が失敗した場合は（ステップＳ３０１：Ｎｏ）、処理は「エンド」へ進んで、制御部１７は、日付の識別処理を強制的に終了させる。一方で、フォント種類カウンタｎが“２”以下である場合は（ステップＳ３０１：Ｙｅｓ）、処理はステップＳ３０３へ進む。

ステップＳ３０３では、制御部１７は、フォント種類カウンタｎの値を判断する。フォント種類カウンタｎが“０”である場合はステップＳ３０５〜Ｓ３０９の処理が行われ、フォント種類カウンタｎが“１”である場合はステップＳ３１１〜Ｓ３１５の処理が行われ、フォント種類カウンタｎが“２”である場合はステップＳ３１７〜Ｓ３２１の処理が行われる。つまり、ステップＳ３０５〜Ｓ３０９の処理は、色付きＤＳＥＧフォントを識別対象とする処理であり、ステップＳ３１１〜Ｓ３１５の処理は、白色非ＤＳＥＧフォントを識別対象とする処理であり、ステップＳ３１７〜Ｓ３２１の処理は、色付き非ＤＳＥＧフォントを識別対象とする処理である。

制御部１７は、ステップＳ３０３においてフォント種類カウンタｎが“０”であると判断する場合は、ステップＳ３０５において、２値化部１３に「第一２値化処理」を行わせる。ステップＳ３０５では、例えば、２値化部１３は、ヒストグラム解析を用いて日付領域データ１０１に対する第一２値化処理を行うことにより、日付領域データ１０１を２値化して２値化データを生成する。図１１は、実施例１の第一２値化処理の一例の説明に供するフローチャートである。

図１１に示す第一２値化処理おいて、まず、ステップＳ６０１では、２値化部１３は、色空間変換を行う。例えば、２値化部１３は、赤（Red）と緑（Green）と青（Blue）との３つの原色を用いて示されるＲＧＢカラーモデルとしてデータ化されている日付領域データ１０１を、色相（Hue）と彩度（Saturation）と輝度（Value）との３つの成分からなるＨＳＶ色空間で示されるデータに変換する。

次いで、ステップＳ６０３では、２値化部１３は、ＨＳＶ色空間のデータに変換後の日付領域データ１０１のヒストグラム解析を行う。このヒストグラム解析は、ＨＳＶ色空間のデータに変換後の日付領域データ１０１のうち、色相（Hue）と輝度（Value）とに対して行われる。２値化部１３は、色相のヒストグラム解析を行う際には、色相のヒストグラム抽出を行う。

図１２は、実施例１の色相のヒストグラム抽出の一例を示す図である。図１２に示すように、色相では色の種類が０〜３６０度の範囲で表されるため、２値化部１３は、色相のヒストグラム抽出を行う際には、色相における所望の色を０度とし、この０度を中心とする所望の範囲の色を抽出する。例えば、写真に付与される日付のフォント種類がＤＳＥＧフォントである場合は、日付の色は、一般的に、赤色または黄色のようなオレンジ系の色であることが多い。このため、２値化部１３は、０〜３６０度で示される色のうち、日付の色として最も多いと想定されるオレンジ系の色の部分を０度とし、この０度を中心とする所定の範囲の色を抽出する。例えば、色相の条件として条件Ｈ１と条件Ｈ２とが設定され、条件Ｈ１が±４０度、条件Ｈ２が±８０度とされた場合は、２値化部１３は、日付領域データ１０１を形成する画素のうち、条件Ｈ１に含まれる色の画素と、条件Ｈ２に含まれる色の画素とをそれぞれ抽出する。このようにして、２値化部１３は、色相のヒストグラム抽出を行う。また、２値化部１３は、抽出した色相のヒストグラムをｌｏｇ化することでデータの扱いを容易にする。

図１１に戻り、ステップＳ６０３において、次いで、２値化部１３は、２値化のスライスを、輝度のヒストグラムより算出する。つまり、２値化部１３は、２値化を行う際に各画素を“１”にするか“０”にするかの閾値を、輝度のヒストグラムより算出する。例えば、２値化部１３は、輝度の条件として条件Ｖ１と条件Ｖ２とを設定するとともに、日付領域データ１０１全体の輝度のヒストグラムにおける８０％の値である第一閾値を条件Ｖ１として算出し、日付領域データ１０１全体の輝度のヒストグラムにおける４０％の値である第二閾値を条件Ｖ２として算出する。２値化部１３は、このようにして設定した輝度の条件と、色相の条件とを用いて、日付領域データ１０１を形成する各画素について、双方の条件に当てはまるか否かのヒストグラム解析を行う。

すなわち、２値化部１３は、色相及び輝度が色相の条件及び輝度の条件の双方の条件に当てはまるか否かのヒストグラム解析を行う際には、色相の条件Ｈ１と輝度の条件Ｖ１とを用いる閾値であるsliceH1_VLと、色相の条件Ｈ１と輝度の条件Ｖ２とを用いる閾値であるsliceH1_VHと、色相の条件Ｈ２と輝度の条件Ｖ１とを用いる閾値であるsliceH2_VLと、色相の条件Ｈ２と輝度の条件Ｖ２とを用いる閾値であるsliceH2_VHとを、まず算出する。そして、２値化部１３は、日付領域データ１０１を形成する各画素の色相と輝度とが、算出した各閾値を満たしているか否かを判断することにより、日付領域データ１０１のヒストグラム解析を行う。

次いで、ステップＳ６０５では、２値化部１３は、日付領域データ１０１を２値化して２値化データを生成する。例えば、２値化部１３は、日付領域データ１０１を形成する各画素が、算出した閾値を満たしている場合は“１”とし、算出した閾値を満たしていない場合は“０”とすることにより、日付領域データ１０１を２値化して２値化データを生成する。２値化される日付領域データ１０１は、２値化部１３によって、例えば、“１”の画素は黒に変換され、“０”の画素は白に変換されることにより、黒と白とのみからなるデータに変換される。このように、図４のステップＳ３０５では、２値化部１３は、色付きＤＳＥＧフォントを識別対象として、色相及び輝度に基づいた閾値により日付領域データ１０１を２値化する第一２値化処理を行う。

図４に戻り、次いで、ステップＳ３０７では、制御部１７は、切出部１２に「第一ラベル処理」を行わせる。図１３〜１９は、実施例１の第一ラベル処理の一例を示す図である。

第一ラベル処理では、切出部１２は、まず、図１３に示すように、縦方向と横方向とに複数が並べられることにより日付領域データ１０１を形成する各画素１１０をラスタスキャンする。例えば、切出部１２は、２値化されることにより黒と白の画素１１０からなる日付領域データ１０１における最も左上に位置する画素１１０から右方向に走査し、右端の画素１１０まで到達したら、一つ下の行の左端の画素１１０に走査を移し、この画素１１０から再び右方向に走査する。切出部１２は、これらの走査を日付領域データ１０１を形成する全ての画素１１０に対して繰り返す。

そして、切出部１２は、日付領域データ１０１をラスタスキャンする際に、図１４に示すように、黒の画素１１０を検出したら、その検出した黒の画素１１０を注目画素１１１として、注目画素１１１の左の画素１１０と上の画素１１０とに、ラベル番号が有るか否かを確認する。図１３，図１５〜図１９において、“０”が付されている画素１１０はラベル番号が無い画素であり、“０”以外の数字が付されている画素１１０はラベル番号が有る画素である。切出部１２は、注目画素１１１の左の画素１１０か上の画素１１０にラベル番号があれば、左の画素１１０のラベル番号及び上の画素１１０のラベル番号のうちで最小のラベル番号を注目画素１１１に付与する。つまり、切出部１２は、注目画素１１１の左の画素１１０と上の画素１１０との間でラベル番号が異なっている場合には、より小さい方のラベル番号を注目画素１１１に付与する。よって、例えば、図１５に示す注目画素１１１−１にはラベル番号として“１”が付与される。一方で、注目画素１１１の左の画素１１０と上の画素１１０との双方にラベル番号が無い場合は、切出部１２は、新しいラベル番号を注目画素１１１に付与する。つまり、切出部１２は、注目画素１１１の左の画素１１０と上の画素１１０との双方にラベル番号が無い場合は、「最後に付与したラベル番号の値＋１」のラベル番号を、注目画素１１１に付与する。よって、例えば、図１５に示す注目画素１１１−２にはラベル番号として“２”が付与される。

また、切出部１２は、図１６に示すように、ラベル番号が有る画素１１０が互いに隣接して複数存在する場合は、ラベル番号が有る一連の複数の画素１１０の全てのラベル番号を同じ値に統一する。例えば、図１６に示すように、ラベル番号が有る互いに隣接する一連の画素１１０−１，１１０−２，１１２が存在する場合は、切出部１２は、それら一連の画素１１０−１，１１０−２，１１２のラベル番号を、それら一連の画素１１０−１，１１０−２，１１２に付されたラベル番号のうちで最小のラベル番号に統一する。よって、例えば、図１６における画素１１２のラベル番号“３”は、切出部１２によって、図１７に示すように“２”に変更される。これにより、ラベル番号が有る互いに隣接する一連の画素１１０−１，１１０−２，１１２のラベル番号は“２”に統一される。

そして、切出部１２は、付与されたラベル番号が同一の一連の複数の画素１１０を１つのラベル１１５として扱う。よって、例えば、図１７に示すように、ラベル番号が“１”で同一の一連の画素１１０−５，１１０−６，１１０−７は、１つのラベル１１５−１として扱われ、ラベル番号が“２”で同一の一連の画素１１０−１，１１０−２，１１２は、別の１つのラベル１１５−２として扱われる。以下では、ラベル１１５−１，１１５−２を区別しない場合にはラベル１１５と総称することがある。

第一ラベル処理（ステップＳ３０７）では、切出部１２は、次いで、比較的近い距離で互いに離間している複数のラベル１１５同士を１つのラベル１１５に統合する処理である「近接統合」を行う。近接統合は、「第一近接統合」と「第二近接統合」との２種類に大別される。図１８は、実施例１の第一近接統合の一例を示す図であり、図１９は、実施例１の第二近接統合の一例を示す図である。

図１８において、ラベル番号“１”が付与されたラベル１１５−１とラベル番号“２”が付与されたラベル１１５−２とは互いに離間している。第一近接統合では、切出部１２は、ラベル１１５−１が形成する矩形の領域であるラベル領域１１６−１と、ラベル１１５−２が形成する矩形の領域であるラベル領域１１６−２とがオーバラップしている場合に、ラベル１１５−１とラベル１１５−２とを統合して１つのラベル１１５として扱う。ここで、ラベル１１５−１については、図１８に示すように、縦方向と横方向とに延びる１つのラベル１１５−１において、縦方向の端部に位置する画素１１０と同じ高さの位置における、横方向の端部に位置する画素１１０までの矩形の領域を、ラベル１１５−１のラベル領域１１６−１とする。同様に、ラベル１１５−２については、図１８に示すように、縦方向と横方向とに延びる１つのラベル１１５−２において、縦方向の端部に位置する画素１１０と同じ高さの位置における、横方向の端部に位置する画素１１０までの矩形の領域を、ラベル１１５−２のラベル領域１１６−２とする。よって、図１８では、ラベル領域１１６−１の一部とラベル領域１１６−２の一部とが互いにオーバラップする。そこで、切出部１２は、ラベル１１５−１とラベル１１５−２とを近接統合して、ラベル１１５−１，１１５−２を同一の１つのラベル１１５として扱う。このように、第一近接統合は、複数のラベル領域の一部が互いにオーバラップするときに行われる近接統合である。

一方で、図１９において、ラベル番号“１”が付与されたラベル１１５−１とラベル番号“２”が付与されたラベル１１５−２とは、図１８と同様に、互いに離間している。但し、図１９では、ラベル１１５−１が形成するラベル領域１１６−１とラベル１１５−２が形成するラベル領域１１６−２とは互いにオーバラップしておらず、ラベル領域１１６−２はラベル領域１１６−１から距離ｄだけ離れた位置に存在する。そこで、第二近接統合では、切出部１２は、ラベル領域１１６−１とラベル領域１１６−２との間の距離ｄが閾値ＴＨＤ未満である場合に、ラベル１１５−１とラベル１１５−２とを統合して１つのラベル１１５として扱う。図１９においてラベル領域１１６−１とラベル領域１１６−２との間の距離ｄは２画素であるため、例えば閾値ＴＨＤが５画素に設定されている場合は、切出部１２は、ラベル１１５−１とラベル１１５−２とを統合して１つのラベル１１５として扱う。このように、第二近接統合は、複数のラベル領域同士が閾値ＴＨＤ未満の距離に存在するときに行われる近接統合である。

以上のように、第一ラベル処理（ステップＳ３０７）では、第一近接統合及び第二近接統合の双方が行われる。以下では、ラベル領域１１６−１，１１６−２を区別しない場合には、ラベル領域１１６と総称することがある。

図４に戻って、次いで、ステップＳ３０９では、切出部１２は「第一除去処理」を行う。ステップＳ３０９では、切出部１２は、第一ラベル処理（ステップＳ３０７）を施した２値化データに対して第一除去処理を施して２値化データからノイズを除去することにより、複数のラベル１１５の中から、文字としての識別可能性があるラベル（以下では「識別可能性ラベル」と呼ぶことがある）を抽出する。つまり、識別可能性ラベルは、第一ラベル処理を施された２値化データからノイズとなるラベル１１５を形成する２値化データが除去された後の残りの２値化データにより形成されるラベルである。第一除去処理におけるノイズの除去は、ラベル領域１１６のサイズに基づいて行われる。切出部１２は、ラベル領域１１６のサイズに基づいて、数字の「１」を表している可能性のあるラベル１１５と、数字の「１」以外の文字を表している可能性のあるラベル１１５と、文字を表している可能性がないラベル１１５（つまり、ノイズ）とを判定し、ノイズであると判定したラベル１１５を２値化データから除去する。よって、数字の「１」を表している可能性のあるラベル１１５と、数字の「１」以外の文字を表している可能性のあるラベル１１５とが識別可能性ラベルとして抽出される。

ラベル１１５がノイズであるか否かの判定が行われる際にはラベル領域１１６の「基準サイズ」が設定され、この基準サイズに当てはまらないサイズのラベル領域１１６であって、かつ、横の長さと縦の長さとのアスペクト比が１：３未満であるラベル領域１１６を有するラベル１１５がノイズとし除去される。第一除去処理では、例えば、長方形の写真を横長になる向きにして見た場合において、写真の横の長さの０.３％以上かつ２.２％未満の長さが基準サイズの横の長さとして設定され、写真の縦の長さの２.０％以上かつ４.０％未満の長さが基準サイズの縦の長さとして設定される。

以上、色付きＤＳＥＧフォントを識別対象とするステップＳ３０５〜Ｓ３０９の処理について説明した。

一方で、制御部１７は、ステップＳ３０３においてフォント種類カウンタｎが“１”であると判断する場合は、ステップＳ３１１において、２値化部１３に「第二２値化処理」を行わせる。例えば、２値化部１３は、「大津の２値化」を用いて日付領域データ１０１に対する第二２値化処理を行うことにより、日付領域データ１０１を２値化して２値化データを生成する。

次いで、ステップＳ３１３では、制御部１７は、切出部１２に「第二ラベル処理」を行わせる。第二ラベル処理は、上述した第一ラベル処理（ステップＳ３０７）に含まれる処理のうち、第二近接統合だけを除外した処理である。つまり、第二ラベル処理では、上記の図１３〜図１８に例示した処理は行われるが、上記の図１９に例示した処理は行われない。

次いで、ステップＳ３１５では、切出部１２は「第二除去処理」を行う。ステップＳ３１５では、切出部１２は、第二ラベル処理（ステップＳ３１３）を施した２値化データに対して第二除去処理を施して２値化データからノイズを除去することにより、複数のラベル１１５の中から識別可能性ラベルを抽出する。第二除去処理におけるノイズの除去は、第一除去処理と同様に、ラベル領域１１６のサイズに基づいて行われる。但し、第二除去処理では、例えば、長方形の写真を横長になる向きにして見た場合において、写真の横の長さの０.４％以上かつ４.０％未満の長さが基準サイズの横の長さとして設定され、写真の縦の長さの２.０％以上かつ５.０％未満の長さが基準サイズの縦の長さとして設定される。

以上、白色非ＤＳＥＧフォントを識別対象とするステップＳ３１１〜Ｓ３１５の処理について説明した。

また、制御部１７は、ステップＳ３０３においてフォント種類カウンタｎが“２”であると判断する場合は、ステップＳ３１７において、ステップＳ３０５と同様に、２値化部１３に第一２値化処理を行わせる。

次いで、ステップＳ３１９では、制御部１７は、ステップＳ３１３と同様に、切出部１２に第二ラベル処理を行わせる。

次いで、ステップＳ３２１では、ステップＳ３１５と同様に、切出部１２は第二除去処理を行う。

以上、色付き非ＤＳＥＧフォントを識別対象とするステップＳ３１７〜Ｓ３２１の処理について説明した。

ステップＳ３０９、Ｓ３１５またはＳ３２１の処理後、処理はステップＳ３２３へ進む。

ステップＳ３２３では、切出部１２はラベル探索を行う。図２０は、実施例１のラベル探索の一例を示す図である。図２０に示す全てのラベル１１５は、識別可能性ラベルである。

図２０において、切出部１２は、日付領域データ１０１内の複数の識別可能性ラベル１１５のうち、最も上側に位置する識別可能性ラベル１１５を基準とし、その最も上側に位置するラベル１１５の上端の位置で、横方向に延びる検出ライン１２５を設定する。以下では、検出ライン１２５の設定の基準となったラベル１１５を「基準ラベル」と呼ぶことがある。

次いで、切出部１２は、設定した検出ライン１２５から上下に所定の範囲を探索範囲１２６として設定する。例えば、切出部１２は、検出ライン１２５から上に５画素と下に５画素の範囲、つまり、上下に１０画素の幅で横方向の延びる範囲を探索範囲１２６として設定する。

次いで、切出部１２は、基準ラベル１１５以外の他の識別可能性ラベル１１５の中で、探索範囲１２６とラベル領域１１６の一部がオーバラップする他の識別可能性ラベル１１５を探索するラベル探索を行う。

探索範囲１２６とラベル領域１１６の一部がオーバラップする他の識別可能性ラベル１１５が２つ以上検出された場合は、切出部１２は、基準ラベル１１５、及び、検出された複数の他の識別可能性ラベル１１５のうち、最も上側に位置する識別可能性ラベル１１５の上端の位置で横方向に延びるラインを「上端ライン」として設定し、最も下側に位置する識別可能性ラベル１１５の下端の位置で横方向に延びるラインを「下端ライン」として設定する。

一方で、探索範囲１２６とラベル領域１１６の一部がオーバラップする他の識別可能性ラベル１１５が２つ以上検出されない場合は、切出部１２は、日付領域データ１０１内の複数の識別可能性ラベル１１５のうち、今回の探索での基準ラベルの１つ下側に位置する識別可能性ラベル１１５を新たな基準ラベルとして新たな検出ライン１２５及び新たな探索範囲１２６を設定する。そして、切出部１２は、その新たな探索範囲１２６に基づいて上記と同様のラベル探索を行って上端ライン及び下端ラインの設定を試みる。

そして、切出部１２は、上記のラベル探索を、日付領域データ１０１内の複数の識別可能性ラベル１１５のうちで最も下側に位置する識別可能性ラベル１１５が基準ラベルとなるまで繰り返して上端ライン及び下端ラインの設定を試みる。

図４に戻り、次いで、ステップＳ３２５では、制御部１７は、ステップＳ３２３でのラベル探索が成功したか否かを判断する。ステップＳ３２３でのラベル探索により切出部１２が上端ライン及び下端ラインの双方を設定できた場合には、制御部１７は、ラベル探索が成功したと判断する。ラベル探索が成功した場合は（ステップＳ３２５：Ｙｅｓ）、処理はステップＳ３２７へ進む。一方で、ステップＳ３２３でのラベル探索により切出部１２が上端ラインまたは下端ラインを設定できなかった場合には、制御部１７は、ラベル探索が失敗したと判断する。ラベル探索が失敗した場合は（ステップＳ３２５：Ｎｏ）、処理はステップＳ３２９へ進む。

ここで、例えば、図３に示す矩形領域データ１００において、右下の指定範囲に日付が含まれている一方で、左上の指定範囲に日付が含まれていない場合は、日付領域データ１０１−２に対して行われたラベル探索は成功する一方で、日付領域データ１０１−１に対して行われたラベル探索は失敗する。

ステップＳ３２９では、制御部１７は、フォント種類カウンタｎをインクリメントする。ステップＳ３２９の処理後、処理はステップＳ３０１へ戻る。

一方で、ステップＳ３２７では、切出部１２は切出処理を行う。ステップＳ３２７では、切出部１２は、ステップＳ３２３で設定した上端ライン及び下端ラインに基づいて、日付領域データ１０１から、上端ラインと下端ラインとの間の領域にあるデータ（以下では「対象領域データ」と呼ぶことがある）を切り出す。

ステップＳ３２７の処理後、処理は、図２のステップＳ２１１へ進む。

図２に戻り、ステップＳ２１１では、制御部１７は、識別部１４に識別処理を行わせる。図２１は、実施例１の識別処理の一例の説明に供するフローチャートである。

図２１において、ステップＳ４０１では、まず、制御部１７は、指定処理回数ａ及び処理回数カウンタｉを“０”にセットする。

次いで、ステップＳ４０３では、制御部１７は、フォント種類カウンタｎの値を判断する。フォント種類カウンタｎが“０”である場合はステップＳ４０５〜Ｓ４１１の処理が行われ、フォント種類カウンタｎが“１”である場合はステップＳ４１３〜Ｓ４１９の処理が行われ、フォント種類カウンタｎが“２”である場合はステップＳ４２１〜Ｓ４２７の処理が行われる。つまり、ステップＳ４０５〜Ｓ４１１の処理は、色付きＤＳＥＧフォントを識別対象とする処理であり、ステップＳ４１３〜Ｓ４１９の処理は、白色非ＤＳＥＧフォントを識別対象とする処理であり、ステップＳ４２１〜Ｓ４２７の処理は、色付き非ＤＳＥＧフォントを識別対象とする処理である。

制御部１７は、ステップＳ４０３においてフォント種類カウンタｎが“０”であると判断する場合は、ステップＳ４０５において、指定処理回数ａを“５６”に設定する。ステップＳ４０５で指定処理回数ａが“５６”に設定されることにより、階調値２６〜２４６の範囲において、階調値“４”毎の５６個の２値化スライスを用いて、ステップＳ４０７〜Ｓ４１１，Ｓ４３１の処理が５６回繰り返される。すなわち、１回目の処理では２値化スライスが“２６”に設定されてステップＳ４０７〜Ｓ４１１，Ｓ４３１の処理が行われ、２回目の処理では２値化スライスが“３０”に設定されてステップＳ４０７〜Ｓ４１１，Ｓ４３１の処理が行われ、３回目の処理では２値化スライスが“３４”に設定されてステップＳ４０７〜Ｓ４１１，Ｓ４３１の処理が行われる。以降、同様に、２値化スライスが“４”ずつ増加されながら“２４６”になるまで、階調値２６〜２４６の範囲において５６個の２値化スライスが設定されて、各２値化スライスを用いてＳ４０７〜Ｓ４１１，Ｓ４３１の処理が繰り返し行われる。

ステップＳ４０７では、制御部１７は、２値化部１３に「第三２値化処理」を行わせる。第三２値化処理では、２値化部１３は、処理回数カウンタｉが“０”のときは、２値化スライスを“２６”に設定して対象領域データのＲ成分及びＲ−Ｇ成分のそれぞれを２値化することにより２値化データを生成する。よって、第三２値化処理が１回行われる毎に、Ｒ成分の２値化データとＲ−Ｇ成分の２値化データとの２つの２値化データが生成される。また、第三２値化処理では、２値化部１３は、処理回数カウンタｉが“１”のときは、２値化スライスを“３０”に設定して対象領域データのＲ成分及びＲ−Ｇ成分のそれぞれを２値化することにより２値化データを生成し、処理回数カウンタｉが“２”のときは、２値化スライスを“３４”に設定して対象領域データのＲ成分及びＲ−Ｇ成分のそれぞれを２値化することにより２値化データを生成する。よって、ステップＳ４２９での処理回数カウンタｉのインクリメントに伴ってステップＳ４０７の処理が５６回繰り返されると、Ｒ成分の５６個の２値化データとＲ−Ｇ成分の５６個の２値化データとが生成される。

次いで、ステップＳ４０９では、制御部１７は、切出部１２に第一ラベル処理を行わせる。ステップＳ４０９では、切出部１２は、第三２値化処理で生成された２値化データに対して第一ラベル処理を行う。

次いで、ステップＳ４１１では、切出部１２は第一除去処理を行う。ステップＳ４１１では、切出部１２は、第一ラベル処理（ステップＳ４０９）を施した２値化データに対して第一除去処理を施す。

以上、色付きＤＳＥＧフォントを識別対象とするステップＳ４０５〜Ｓ４１１の処理について説明した。

一方で、制御部１７は、ステップＳ４０３においてフォント種類カウンタｎが“１”であると判断する場合は、ステップＳ４１３において、指定処理回数ａを“１”に設定する。ステップＳ４１３で指定処理回数ａが“１”に設定されることにより、ステップＳ４１３〜Ｓ４１９の処理が１回だけ行われる。

次いで、ステップＳ４１５では、制御部１７は、２値化部１３に第二２値化処理を行わせる。

次いで、ステップＳ４１７では、制御部１７は、切出部１２に第二ラベル処理を行わせる。

次いで、ステップＳ４１９では、切出部１２は第二除去処理を行う。

以上、白色非ＤＳＥＧフォントを識別対象とするステップＳ４１３〜Ｓ４１９の処理について説明した。

また、制御部１７は、ステップＳ４０３においてフォント種類カウンタｎが“２”であると判断する場合は、ステップＳ４２１において、ステップＳ４０５と同様に、指定処理回数ａを“５６”に設定する。

次いで、ステップＳ４２３では、制御部１７は、ステップＳ４０７と同様に、２値化部１３に第三２値化処理を行わせる。

次いで、ステップＳ４２５では、制御部１７は、ステップＳ４１７と同様に、切出部１２に第二ラベル処理を行わせる。

次いで、ステップＳ４２７では、ステップＳ４１９と同様に、切出部１２は第二除去処理を行う。

以上、色付き非ＤＳＥＧフォントを識別対象とするステップＳ４２１〜Ｓ４２７の処理について説明した。

ここで、ステップＳ４１１では、第一ラベル処理（ステップＳ４０９）が施された２値化データに対して第一除去処理が施されて２値化データからノイズが除去されることにより、複数のラベル１１５の中から、文字としての識別対象となるラベル（以下では「識別対象ラベル」と呼ぶことがある）が抽出される。また、ステップＳ４１９，Ｓ４２７では、第二ラベル処理（ステップＳ４１７，Ｓ４２５）が施された２値化データに対して第二除去処理が施されて２値化データからノイズが除去されることにより、複数のラベル１１５の中から識別対象ラベルが抽出される。

ステップＳ４１１，Ｓ４１９またはＳ４２７の処理後、処理はステップＳ４２９へ進む。

ステップＳ４２９では、制御部１７は、処理回数カウンタｉをインクリメントする。

次いで、ステップＳ４３１では、制御部１７は、識別対象ラベルに対する文字認識を識別部１４に行わせる。識別部１４は、例えばディープラーニング（Deep Learning）の一種であるＣＮＮ（Convolutional Neural Network）を用いて、識別対象ラベルに対する文字認識を行う。以下では、ＣＮＮを用いて識別部１４が認識可能な文字の種類は、例えば、数字の“０”〜“９”、及び、日付の区切り文字と使用される“／”，“年”，“月”，“日”の合計１４種類とする。すなわち、日付領域データ１０１には、これら１４種類の文字の何れかを用いて形成される文字列としての日付が含まれている。

ここで、一般的に、ＣＮＮでは多様な学習データを用いることで、モデルの表現力が高まるため、文字認識の精度を高めることができる。一方で、表現力が高いモデルほど、ＣＮＮの層が深くなるため、文字認識に要する計算量が多くなる。つまり、ＣＮＮでは、学習データの量を多くするほど、文字認識に要する計算量が多くなる。そこで、本実施例では、文字認識における紛らわしいデータを学習データから除外することで層が浅いモデルを作成し、識別部１４は、層が浅いモデルを適用したＣＮＮを用いて、識別対象ラベルに対する文字認識を行う。

図２２は、実施例１の紛らわしいデータの一例を示す図である。図２２において、例えば、データＤ１は、“／”であるか、数字の“１”であるか紛らわしい。また例えば、データ群Ｄ２における各データは、数字の“１”であるか、数字の“７”であるか紛らわしい。また例えば、データ群Ｄ３における各データは、数字の“３”であるか、数字の“８”であるか紛らわしい。また例えば、データ群Ｄ４における各データは、数字の“８”であるか、数字の“９”であるか紛らわしい。そこで、本実施例では、図２２に示すような紛らわしいデータを学習データから除外することで層が浅いモデルを作成した。例えば、本実施例では、ＣＮＮの層を、畳み込み２層及び全結合２層の合計４層とした。

ステップＳ４３１では、識別部１４は、以下のようにして、識別対象ラベルに対して、ＣＮＮを用いた文字認識を行う。すなわち、識別部１４は、ステップＳ４１１，Ｓ４１９またはＳ４２７で抽出された識別対象ラベルを１つずつＣＮＮに入力し、ＣＮＮの出力として、上記１４種類の文字種類毎の確度［％］を算出する。但し、上記１４種類の文字種類の合計の確度を１００％とする。そして、識別部１４は、上記１４種類の文字種類の中で、確度が５０％超となる文字を認識結果として採用する。例えば、ＣＮＮに入力された識別対象ラベルに対してＣＮＮの出力が、数字の“１”については確度７０％、数字の“７”については確度１０％、区切り文字の“／”については確度２０％、その他の文字については確度０％となる場合には、識別部１４は、ＣＮＮに入力された識別対象ラベルに対する文字認識の結果として数字の“１”を採用し、数字の“１”の認識回数をインクリメントする。また例えば、ＣＮＮに入力された識別対象ラベルに対してＣＮＮの出力が、数字の“３”については確度６０％、数字の“８”については確度５％、数字の“９”については確度３５％、その他の文字については確度０％となる場合には、識別部１４は、ＣＮＮに入力された識別対象ラベルに対する文字認識の結果として数字の“３”を採用し、数字の“３”の認識回数をインクリメントする。このような各文字についての認識回数のインクリメントは、対象領域データ内で互いに異なる位置に存在する複数の識別対象ラベルのそれぞれについて、識別対象ラベル毎に行われる。

図２１に戻り、次いで、ステップＳ４３３では、制御部１７は、処理回数カウンタｉの値が指定処理回数ａを超えたか否かを判断する。処理回数カウンタｉの値が指定処理回数ａ以下である場合は（ステップＳ４３３：Ｎｏ）、処理はステップＳ４０３へ戻る。よって、フォント種類カウンタｎが“０”である場合は、ステップＳ４０７〜Ｓ４１１及びＳ４３１の処理が５６回繰り返し実行される。また、フォント種類カウンタｎが“２”である場合は、ステップＳ４２３〜Ｓ４２７及びＳ４３１の処理が５６回繰り返し実行される。つまり、フォント種類が色付きＤＳＥＧフォント及び色付き非ＤＳＥＧフォントの「色付きフォント」である場合は、２値化部１３による２値化処理（ステップＳ４０７，Ｓ４２３）、及び、識別部１４による除去処理（ステップＳ４１１，Ｓ４２７）が繰り返し複数回実行される。

一方で、処理回数カウンタｉの値が指定処理回数ａを超えた場合は（ステップＳ４３３：Ｙｅｓ）、処理はステップＳ４３５へ進む。

ステップＳ４３５では、識別部１４は「一括識別」を行う。識別部１４は、ステップＳ４３１での認識結果に基づいて、以下のようにして、一括識別を行う。

すなわち、例えば、対象領域データに第一〜第五の５つの識別対象ラベルが含まれるとする。フォント種類カウンタｎが“０”または“２”である場合は、識別部１４は、５６個の各２値化スライス毎に第一〜第五の識別対象ラベルの認識結果の組合せを判定し、認識結果の組合せの判定回数を５６回の文字認識に渡って組合せ毎に集計することにより一括識別を行う。すなわち、識別部１４は、５６回の文字認識に渡って組合せ毎に集計した判定回数のうちで最も多い判定回数を有する組合せを第一〜第五の識別対象ラベルに対する識別結果として採用する。最も多い判定回数を有する組合せは、最も確度が高い組合せであるからである。ここで、識別部１４は、各２値化スライスにおいて対象領域データに４つ以上の識別対象ラベルが含まれる場合にだけ、識別対象ラベルの認識結果の組合せを判定する。

例えば、２値化スライスが“３８”、“１３８”及び“２１０”のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“８”、第二識別対象ラベルが“８”、第三識別対象ラベルが“６”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライスが“８６”及び“１７８”のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“９”、第二識別対象ラベルが“８”、第三識別対象ラベルが“６”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライス＝９８のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“８”、第二識別対象ラベルが“８”、第三識別対象ラベルが“５”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライス＝２２２のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“３”、第二識別対象ラベルが“８”、第三識別対象ラベルが“５”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。よって、第一〜第五の識別対象ラベルの認識結果の組合せの判定回数は、第一の組合せである“８８６３０”について３回、第二の組合せである“９８６３０”について２回、第三の組合せである“８８５３０”について１回、第四の組合せである“３８５３０”について１回となる。そこで、識別部１４は、一括識別の最終的な識別結果として、判定回数が最も多い第一の組合せである文字列“８８６３０”を採用する。一括識別によるこの“８８６３０”の識別結果は、図５に示すＤＳＥＧフォントの日付の識別結果として妥当である。

また例えば、２値化スライスが“３８”、“１３８”及び“２１０”のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“３”、第二識別対象ラベルが“８”、第三識別対象ラベルが“６”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライスが“８６”及び“１７８”のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“９”、第二識別対象ラベルが“８”、第三識別対象ラベルが“６”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライス＝９８のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“８”、第二識別対象ラベルが“８”、第三識別対象ラベルが“５”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。また、２値化スライス＝２２２のときに、ステップＳ４３１の文字認識において、第一識別対象ラベルが“８”、第二識別対象ラベルが“８”、第三識別対象ラベルが“６”、第四識別対象ラベルが“３”、第五識別対象ラベルが“０”と認識されたとする。よって、第一〜第五の識別対象ラベルの認識結果の組合せの判定回数は、第一の組合せである“３８６３０”について３回、第二の組合せである“９８６３０”について２回、第三の組合せである“８８５３０”について１回、第四の組合せである“８８６３０”について１回となる。そこで、識別部１４は、一括識別の最終的な識別結果として、判定回数が最も多い第一の組合せである文字列“３８６３０”を採用する。一括識別によるこの“３８６３０”の識別結果は、図５に示すＤＳＥＧフォントの日付の識別結果として妥当でない。

なお、フォント種類カウンタｎが“１”である場合は、識別部１４は、ステップＳ４３１で第一〜第五の識別対象ラベルの各々に対して１回だけ行われる文字認識において認識された識別対象ラベルの組合せを一括識別の最終的な識別結果として採用する。

以上、ステップＳ４３５の一括識別について説明した。このように、ステップＳ４３５では、識別部１４は、対象領域データに含まれる全ての識別対象ラベルを一括して識別する。換言すれば、識別部１４は、以上のようにして、日付領域データに含まれる文字列を一括して識別する。

次いで、ステップＳ４３７では、識別部１４は、ステップＳ４３５の一括識別が成功したか否かを判断する。ステップＳ４３７では、識別部１４は、一括識別によって、全ての２値化スライスの何れにおいても４桁以上の文字列が識別されない場合は、一括識別が失敗したと判断する一方で、一括識別によって、何れかの２値化スライスにおいて４桁以上の文字列が識別された場合は、一括識別が成功したと判断する。フォント種類カウンタｎが“０”または“２”である場合は、全ての２値化スライスの個数は５６個であり、フォント種類カウンタｎが“１”である場合は、全ての２値化スライスの個数は１個である。

一括識別が成功した場合は（ステップＳ４３７：Ｙｅｓ）、処理は図２のステップＳ２１３へ進み、一括識別が失敗した場合は（ステップＳ４３７：Ｎｏ）、処理はステップＳ４３９へ進む。つまり、識別部１４は、ステップＳ４３５の一括識別によって文字列を識別することが困難な場合に（ステップＳ４３７：Ｎｏ）、ステップＳ４３９の個別識別を行う。

ステップＳ４３９では、識別部１４は「個別識別」を行う。識別部１４は、ステップＳ４３１での認識結果に基づいて、以下のようにして、個別識別を行う。

すなわち、例えば、対象領域データに第一〜第五の５つの識別対象ラベルが含まれるとする。フォント種類カウンタｎが“０”または“２”である場合は、識別部１４は、５６回の文字認識に渡って、第一〜第五の各識別対象ラベル毎に個別に認識回数を集計することにより個別識別を行う。すなわち、識別部１４は、第一〜第五の識別対象ラベルの各々について個別に、５６回の文字認識に渡って認識回数が最も多い文字を識別結果として採用する。認識回数が最も多い文字は、最も確度が高い文字だからである。ここで、識別部１４は、各２値化スライスにおいて対象領域データに４つ以上の識別対象ラベルが含まれる場合にだけ、各識別対象ラベルに対する個別識別を行う。

例えば、第一〜第五の識別対象ラベルのうち第一識別対象ラベルについては、５６回の文字認識において、６回“８”と認識され、１回“９”と認識され、１回“３”と認識されたとする。そこで、識別部１４は、個別識別での第一識別対象ラベルに対する識別結果として“８”を採用する。また、第二識別対象ラベルについては、５６回の文字認識において、９回“８”と認識され、２回“３”と認識されたとする。そこで、識別部１４は、個別識別での第二識別対象ラベルに対する識別結果として“８”を採用する。また、第三識別対象ラベルについては、５６回の文字認識において、７回“６”と認識され、２回“５”と認識されたとする。そこで、識別部１４は、個別識別での第三識別対象ラベルに対する識別結果として“６”を採用する。また、第四識別対象ラベルについては、５６回の文字認識において、９回“３”と認識されたとする。そこで、識別部１４は、個別識別での第四識別対象ラベルに対する識別結果として“３”を採用する。また、第五識別対象ラベルについては、５６回の文字認識において、９回“０”と認識され、４回“８”と認識されたとする。そこで、識別部１４は、個別識別での第五識別対象ラベルに対する識別結果として“０”を採用する。よって、識別部１４は、個別識別の最終的な識別結果として、各個別識別の識別結果である“８”，“８”，“６”，“３”，“０”の組合せである文字列“８８６３０”を採用する。個別識別によるこの“８８６３０”の識別結果は、図５に示すＤＳＥＧフォントの日付の識別結果として妥当である。

また例えば、第一〜第五の識別対象ラベルのうち第一識別対象ラベルについては、５６回の文字認識において、６回“３”と認識され、１回“９”と認識され、１回“８”と認識されたとする。そこで、識別部１４は、個別識別での第一識別対象ラベルに対する識別結果として“３”を採用する。また、第二識別対象ラベルについては、５６回の文字認識において、９回“８”と認識され、２回“３”と認識されたとする。そこで、識別部１４は、個別識別での第二識別対象ラベルに対する識別結果として“８”を採用する。また、第三識別対象ラベルについては、５６回の文字認識において、７回“６”と認識され、２回“５”と認識されたとする。そこで、識別部１４は、個別識別での第三識別対象ラベルに対する識別結果として“６”を採用する。また、第四識別対象ラベルについては、５６回の文字認識において、９回“３”と認識されたとする。そこで、識別部１４は、個別識別での第四識別対象ラベルに対する識別結果として“３”を採用する。また、第五識別対象ラベルについては、５６回の文字認識において、９回“０”と認識され、４回“８”と認識されたとする。そこで、識別部１４は、個別識別での第五識別対象ラベルに対する識別結果として“０”を採用する。よって、識別部１４は、個別識別の最終的な識別結果として、各個別識別の識別結果である“３”，“８”，“６”，“３”，“０”の組合せである文字列“３８６３０”を採用する。個別識別によるこの“３８６３０”の識別結果は、図５に示すＤＳＥＧフォントの日付の識別結果として妥当でない。

なお、フォント種類カウンタｎが“１”である場合は、識別部１４は、ステップＳ４３１で第一〜第五の識別対象ラベルの各々に対して１回だけ行われる文字認識の認識結果を個別識別の最終的な識別結果として採用する。

以上、ステップＳ４３９の個別識別について説明した。このように、ステップＳ４３９では、識別部１４は、対象領域データに含まれるそれぞれの識別対象ラベルを個別に識別する。換言すれば、識別部１４は、以上のようにして、日付領域データに含まれる文字列の各文字を個別に識別する。

次いで、ステップＳ４４１では、識別部１４は、ステップＳ４３９の個別識別が成功したか否かを判断する。ステップＳ４３９では、識別部１４は、個別識別によって、全ての２値化スライスの何れにおいても４桁以上の文字列が識別されない場合は、個別識別が失敗したと判断する一方で、個別識別によって、何れかの２値化スライスにおいて４桁以上の文字列が識別された場合は、個別識別が成功したと判断する。フォント種類カウンタｎが“０”または“２”である場合は、全ての２値化スライスの個数は５６個であり、フォント種類カウンタｎが“１”である場合は、全ての２値化スライスの個数は１個である。

個別識別が成功した場合は（ステップＳ４４１：Ｙｅｓ）、処理は図２のステップＳ２１３へ進み、個別識別が失敗した場合は（ステップＳ４４１：Ｎｏ）、処理はステップＳ４４３へ進む。

ステップＳ４４３では、制御部１７は、フォント種類カウンタｎをインクリメントする。ステップＳ４４３の処理後、処理は図２のステップＳ２０９へ戻る。

以上、ステップＳ２１１の識別処理について説明した。

図２に戻り、次いで、ステップＳ２１３では、制御部１７は、補正部１５に補正処理を行わせる。ステップＳ２１３では、補正部１５は、ステップＳ４３５での一括識別の最終的な識別結果、または、ステップＳ４３９での個別識別の最終的な識別結果に対して補正処理を行う。図２３は、実施例１の補正処理一例の説明に供するフローチャートである。

図２３において、ステップＳ５００では、まず、制御部１７は、識別結果に含まれる文字列によって表される日付が所定の日付条件を満足するか否かを判断する。例えば、所定の日付条件は「１９５０年１月１日〜現在の日付」であり、識別結果に含まれる文字列によって表される日付が１９５０年１月１日〜現在の日付の何れかの日付に該当する場合は、制御部１７は、その日付が所定の日付条件を満足すると判断する。一方で、識別結果に含まれる文字列によって表される日付が１９５０年１月１日〜現在の日付の何れの日付にも該当しなければ、制御部１７は、その日付が所定の日付条件を満足しないと判断する。つまり、制御部１７は、識別結果に含まれる文字列によって表される日付が日付として妥当であるか否かを判断する。補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足する場合は（ステップＳ５００：Ｙｅｓ）、処理は図２のステップＳ２１５へ進む。一方で、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足しない場合は（ステップＳ５００：Ｎｏ）、処理はステップＳ５０１へ進む。

よって、例えば、図５に示すＤＳＥＧフォントの日付について、一括識別または個別識別によって、“８８６３０”と識別された場合はステップＳ５００での判断が“Ｙｅｓ”となる一方で、“３８６３０”と識別された場合はステップＳ５００での判断が“Ｎｏ”となる。

次いで、ステップＳ５０１では、制御部１７は、フォント種類カウンタｎの値を判断する。

フォント種類カウンタｎが“０”である場合は、ステップＳ５０３において、制御部１７は、補正部１５に「第一補正処理」を行わせる。一方で、フォント種類カウンタｎが“１”または“２”である場合は、ステップＳ５０５において、制御部１７は、補正部１５に「第二補正処理」を行わせる。つまり、ステップＳ５０３の第一補正処理は、色付きＤＳＥＧフォントに対する識別結果を対象とする補正処理であり、ステップＳ５０５の第二補正処理は、白色非ＤＳＥＧフォント及び色付き非ＤＳＥＧフォント、つまり、非ＤＳＥＧフォントに対する識別結果を対象とする補正処理である。つまり、補正部１５は、フォント種類がＤＳＥＧフォントである場合と、フォント種類がＤＳＥＧフォント以外のフォントである場合とで、識別結果に対する補正処理を異ならせる。

図２４〜図２６は、実施例１の第一補正処理の一例を示す図である。ＤＳＥＧフォントが７セグメントフォントである場合、“０”〜“９”の各数字は、図２４に示すように、ｓｅｇ１〜ｓｅｇ７の７つのセグメントを用いて形成される。そこで、ステップＳ５０３では、補正部１５は、例えば、識別部１４で行われた識別処理での最終的な識別結果に数字の“３”が含まれている場合には、図２５に示すように、その“３”を数字の“８”に補正する。また例えば、ステップＳ５０３では、補正部１５は、識別部１４で行われた識別処理での最終的な識別結果に数字の“５”が含まれている場合には、図２６に示すように、その“５”を数字の“６”に補正する。図２５に示すように、数字の“３”を形成するセグメントの数は５つであるのに対し、数字の“８”を形成するセグメントの数は７つである。また、図２６に示すように、数字の“５”を形成するセグメントの数は５つであるのに対し、数字の“６”を形成するセグメントの数は６つである。つまり、フォント種類がＤＳＥＧフォントである場合に実行される第一補正処理（ステップＳ５０３）では、補正部１５は、識別処理での識別結果に含まれる各数字を形成するセグメントの数に基づいて、識別結果に対する補正処理を行う。

一方で、図２７〜図３２は、実施例１の第二補正処理の一例を示す図である。

例えば、図２７に示すように、識別部１４で行われた識別処理での最終的な識別結果が“２００２／０８１１２”である場合、補正部１５は、まず、最も左から５桁目の位置Ｐ５に区切り文字である“／”を検出する。そして、補正部１５は、最も左から５桁目の位置Ｐ５に区切り文字である“／”を検出した場合、図２７に示すように、最も左から８桁目の位置Ｐ８に数字“１”があればその数字“１”を、区切り文字である“／”に補正する。

また例えば、図２８に示すように、識別部１４で行われた識別処理での最終的な識別結果が“２００２／０８７１２”である場合、補正部１５は、まず、最も左から５桁目の位置Ｐ５に区切り文字である“／”を検出する。そして、補正部１５は、最も左から５桁目の位置Ｐ５に区切り文字である“／”を検出した場合、図２８に示すように、最も左から８桁目の位置Ｐ８に数字“７”があればその数字“７”を、区切り文字である“／”に補正する。

また例えば、図２９に示すように、識別部１４で行われた識別処理での最終的な識別結果が“２００２１０８１１２”である場合、補正部１５は、まず、最も左から５桁目の位置Ｐ５と８桁目の位置Ｐ８に数字“１”を検出する。そして、補正部１５は、最も左から５桁目の位置Ｐ５と８桁目の位置Ｐ８に数字“１”を検出した場合、図２９に示すように、最も左から５桁目の位置Ｐ５と８桁目の位置Ｐ８にある数字“１”をそれぞれ、区切り文字である“／”に補正する。

また例えば、図３０に示すように、識別部１４で行われた識別処理での最終的な識別結果が“００４５月２４８”である場合、補正部１５は、まず、最も左から５桁目の位置Ｐ５に区切り文字である“月”を検出する。そして、補正部１５は、最も左から５桁目の位置Ｐ５に区切り文字である“月”を検出した場合、図３０に示すように、最も左から３桁目の位置Ｐ３に数字“４”があればその数字“４”を、区切り文字である“年”に補正し、最も左から８桁目の位置Ｐ８に数字“８”があればその数字“８”を、区切り文字である“日”に補正する。

また例えば、図３１に示すように、識別部１４で行われた識別処理での最終的な識別結果が“００年５８２４８”である場合、補正部１５は、まず、最も左から３桁目の位置Ｐ３に区切り文字である“年”を検出する。そして、補正部１５は、最も左から３桁目の位置Ｐ３に区切り文字である“年”を検出した場合、図３１に示すように、最も左から５桁目の位置Ｐ５に数字“８”があればその数字“８”を、区切り文字である“月”に補正し、最も左から８桁目の位置Ｐ８に数字“８”があればその数字“８”を、区切り文字である“日”に補正する。

また例えば、図３２に示すように、識別部１４で行われた識別処理での最終的な識別結果が“００４５８２４日”である場合、補正部１５は、まず、最も左から８桁目の位置Ｐ８に区切り文字である“日”を検出する。そして、補正部１５は、最も左から８桁目の位置Ｐ８に区切り文字である“日”を検出した場合、図３２に示すように、最も左から３桁目の位置Ｐ３に数字“４”があればその数字“４”を、区切り文字である“年”に補正し、最も左から５桁目の位置Ｐ５に数字“８”があればその数字“８”を、区切り文字である“月”に補正する。

つまり、フォント種類がＤＳＥＧフォント以外のフォント（つまり、非ＤＳＥＧフォント）である場合に実行される第二補正処理（ステップＳ５０５）では、補正部１５は、識別処理での識別結果に含まれる各文字の位置関係に基づいて、識別結果に対する補正処理を行う。

以上、第一補正処理と第二補正処理とについて説明した。

図２３に戻り、ステップＳ５０３またはステップＳ５０５の処理後、処理はステップＳ５０７へ進む。

ステップＳ５０７では、制御部１７は、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足するか否かを判断する。判断手法は、ステップＳ５００と同様である。補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足する場合は（ステップＳ５０７：Ｙｅｓ）、処理は図２のステップＳ２１５へ進む。一方で、補正後の識別結果に含まれる文字列によって表される日付が所定の日付条件を満足しない場合は（ステップＳ５０７：Ｎｏ）、処理はステップＳ５０９へ進む。

ステップＳ５０９では、制御部１７は、フォント種類カウンタｎが“２”以下か否かを判断する。フォント種類カウンタｎが“３”以上である場合、つまり、第一種〜第三種の全てのフォント種類に対する日付の識別処理が完了した場合は（ステップＳ５０９：Ｎｏ）、処理は図２のステップＳ２１５へ進む。一方で、フォント種類カウンタｎが“２”以下である場合、つまり、第一種〜第三種のうち第三種までのフォント種類に対する日付の識別処理が未完了の場合は（ステップＳ５０９：Ｙｅｓ）、処理はステップＳ５１１へ進む。

ステップＳ５１１では、制御部１７は、フォント種類カウンタｎをインクリメントする。ステップＳ５１１の処理後、処理は図２のステップＳ２０９に戻る。

図２に戻り、ステップＳ２１５では、制御部１７は、付与部１６に日付データ付与処理を行わせる。ステップＳ２１５では、付与部１６は、記憶部１１から入力画像データを取得し、補正後の識別結果に含まれる文字列によって表される日付を形成する日付データを、記憶部１１から取得した入力画像データに付与する。そして、付与部１６は、日付データを付与された入力画像データを出力画像データとして日付識別装置１から出力する。

以上のように、実施例１では、日付識別装置１は、切出部１２と、２値化部１３と、識別部１４と、補正部１５と、付与部１６とを有する。切出部１２は、入力画像データから日付領域データを切り出す。２値化部１３は、日付領域データを２値化して２値化データを生成する２値化処理を行う。識別部１４は、２値化データに対してディープラーニングを用いた認識処理を施して日付領域データに含まれる文字列を識別する識別処理を行う。補正部１５は、識別処理での識別結果に対して、日付領域データに含まれる文字列のフォント種類に合わせた補正処理を行う。付与部１６は、補正された識別結果に含まれる文字列に基づく日付データを画像データに付与する。

こうすることで、たとえディープラーニングの学習度合が低くて文字列の認識精度が低い場合であっても、フォント種類に合わせた補正処理により日付の識別精度を高めることができる。換言すれば、フォント種類に合わせた補正処理により日付の識別精度を高めることができるので、ディープラーニングの一種であるＣＮＮの層を浅くすることが可能になって計算量を削減することができる。よって、写真等の媒体に付与されている日付の識別を、少ない処理量で高精度に行うことができる。

また、補正部１５は、フォント種類がＤＳＥＧフォントである場合と、フォント種類がＤＳＥＧフォント以外のフォント（つまり、非ＤＳＥＧフォント）である場合とで、補正処理を異ならせる。

こうすることで、ＤＳＥＧフォント及び非ＤＥＳＧフォントのそれぞれの特徴に合わせた補正処理を行うことができるため、補正の精度を高めることができる。

また、補正部１５は、フォント種類がＤＳＥＧフォントである場合は、識別処理での識別結果に含まれる各数字を形成するセグメントの数に基づいて補正処理を行う。

こうすることで、ＤＳＥＧフォントにおいて認識誤りが発生しやすい数字を優先的に補正することができる。

また、補正部１５は、フォント種類が非ＤＳＥＧフォントである場合は、識別結果に含まれる各文字の位置関係に基づいて補正処理を行う。

こうすることで、非ＤＳＥＧフォントにおいて認識誤りが発生しやすい文字を優先的に補正することができる。

また、２値化部１３及び識別部１４は、２値化処理及び認識処理を繰り返し複数回実行し、識別部１４は、最も確度が高い識別結果に基づいて文字列を識別する。

こうすることで、さらに、日付の識別精度を高めることができる。

また、識別部１４は、一括識別により、文字列に含まれる複数の文字を一括して識別することが困難な場合に、個別識別により、複数の文字のそれぞれを個別に識別する。

こうすることで、一括識別で識別困難な場合にはじめて、一括識別に比べて処理量が多い一方で識別精度が高い個別識別が実行されるため、処理量を最小限に抑えつつ識別精度を高めることができる。

［実施例２］
図３３は、実施例２の携帯端末の構成例を示す図である。図３３において、携帯端末１０は、日付識別装置１と、撮影部１０ａと、操作部１０ｂと、表示部１０ｃと、通信部１０ｄとを有する。携帯端末１０は、例えば、スマートフォンやタブレット端末等のスマートデバイスである。撮影部１０ａは、ハードウェアとして、例えば、カメラにより実現される。操作部１０ｂ及び表示部１０ｃは、ハードウェアとして、例えば、タッチパネルにより実現される。通信部１０ｄは、ハードウェアとして、例えば、無線通信モジュールまたはネットワークインタフェースモジュールにより実現される。

携帯端末１０では、例えば、撮影部１０ａより撮影された画像のデータ、通信部１０ｄにより受信された画像のデータが日付識別装置１への入力画像データとなる。

［他の実施例］
［１］識別部１４は、ステップＳ４３１の文字認識において、識別対象ラベルのラベル領域１１６の横の長さと縦の長さとのアスペクト比が１：３以上である場合には、ＣＮＮによる文字認識を行わずに、識別対象ラベルに対する文字認識の結果として数字の“１”を採用しても良い。

［２］補正部１５は、一括識別による識別結果に対する第一補正処理を、判定回数が同一の組合せが複数存在する場合にだけ行っても良い。例えば、一括識別において、上記の第一〜第五の識別対象ラベルの認識結果の組合せの判定回数が、第一の組合せの“８８６１３”について４回、第二の組合せの“８８６１８”について４回、第三の組合せの“８８５３０”について２回、第四の組合せの“８８６３０”について１回となった場合には、補正部１５は、判定回数が４回で同一である第一の組合せと第二の組合せとの間において第一補正処理を行うことにより、一括識別の識別結果として“８８６１８”を採用しても良い。

［３］補正部１５は、個別識別による識別結果に対する第一補正処理を、１つの識別対象ラベルに対して認識回数が同一となる複数の数字が存在する場合にだけ行っても良い。例えば、上記の第一〜第五の識別対象ラベルのうち第一識別対象ラベルについて、５６回の文字認識において、５回“３”と認識され、５回“８”と認識され、１回“９”と認識された場合には、補正部１５は、認識回数が５回で同一である“３”と“８” との間において第一補正処理を行うことにより、第一識別対象ラベルおける個別識別の識別結果として“８”を採用しても良い。

［４］実施例１の第二ラベル処理（ステップＳ３１３，Ｓ３１９）では、第二近接統合を行わなかった。しかし、第二ラベル処理においても第二近接統合を行っても良い。第二ラベル処理において第二近接統合を行う際には、第二近接統合に用いられる閾値ＴＨＤを、第二ラベル処理での第二近接統合の場合よりも小さな値とするのが好ましい。

［５］日付領域データ１０１における背景の色に基づいて指定処理回数ａの値を設定しても良い。例えば、背景に絵柄等が写り込んでいて背景の色が複雑である場合には、指定処理回数ａの値を増加させると良い。

［６］Ｓ４３１の文字認識に用いるディープラーニングはＣＮＮに限定されない。例えば、ＲＮＮ（Recurrent Neural Network）やＬＳＴＭ（Long Short-Term Memory）のディープラーニングを用いてＳ４３１の文字認識に行っても良い。

［７］日付識別装置１での上記説明における各処理の全部または一部は、各処理に対応するプログラムを日付識別装置１が有するプロセッサに実行させることによって実現してもよい。例えば、上記説明における各処理に対応するプログラムがメモリに記憶され、プログラムがプロセッサによってメモリから読み出されて実行されても良い。また、プログラムは、任意のネットワークを介して携帯端末１０に接続されたプログラムサーバに記憶され、そのプログラムサーバから携帯端末１０にダウンロードされて実行されたり、携帯端末１０が読み取り可能な記録媒体に記憶され、その記録媒体から読み出されて実行されても良い。携帯端末１０が読み取り可能な記録媒体には、例えば、メモリーカード、ＵＳＢメモリ、ＳＤカード、フレキシブルディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＤＶＤ、及び、Ｂｌｕ−ｒａｙ（登録商標）ディスク等の可搬の記憶媒体が含まれる。また、プログラムは、任意の言語や任意の記述方法にて記述されたデータ処理方法であり、ソースコードやバイナリコード等の形式を問わない。また、プログラムは必ずしも単一的に構成されるものに限られず、複数のモジュールや複数のライブラリとして分散構成されるものや、ＯＳに代表される別個のプログラムと協働してその機能を達成するものも含む。

［８］日付識別装置１の分散・統合の具体的形態は図示するものに限られず、日付識別装置１の全部または一部を、各種の付加等に応じて、または、機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

１日付識別装置
１１記憶部
１２切出部
１３２値化部
１４識別部
１５補正部
１６付与部
１７制御部
１０携帯端末

Claims

日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出す切出部と、
前記日付領域データを２値化して２値化データを生成する２値化処理を行う２値化部と、
前記２値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行う識別部と、
前記識別処理での識別結果に対して、前記文字列のフォント種類がＤＳＥＧフォントである場合と、前記ＤＳＥＧフォント以外のフォントである場合とで異なる補正処理を行う補正部と、
補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する付与部と、
を具備する日付識別装置。
前記補正部は、前記フォント種類が前記ＤＳＥＧフォントである場合は、前記識別結果に含まれる各数字を形成するセグメントの数に基づいて前記補正処理を行う、
請求項１に記載の日付識別装置。
前記補正部は、前記フォント種類が前記ＤＳＥＧフォント以外のフォントである場合は、前記識別結果に含まれる各文字の位置関係に基づいて前記補正処理を行う、
請求項１に記載の日付識別装置。
前記２値化部及び前記識別部は、前記２値化処理及び前記認識処理を繰り返し複数回実行し、
前記識別部は、最も確度が高い前記識別結果に基づいて前記文字列を識別する、
請求項１から３の何れか一つに記載の日付識別装置。
前記識別部は、前記文字列に含まれる複数の文字を一括して識別することが困難な場合に、前記複数の文字のそれぞれを個別に識別する、
請求項１から４の何れか一つに記載の日付識別装置。
日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出し、
前記日付領域データを２値化して２値化データを生成し、
前記２値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別する識別処理を行い、
前記識別処理での識別結果に対して、前記文字列のフォント種類がＤＳＥＧフォントである場合と、前記ＤＳＥＧフォント以外のフォントである場合とで異なる補正を行い、
補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する、
日付識別方法。
日付が付与されている媒体を撮影することにより生成された画像データから、前記日付が付与されていると推定される領域のデータである日付領域データを切り出し、
前記日付領域データを２値化して２値化データを生成し、
前記２値化データに対してディープラーニングを用いた認識処理を施して前記日付領域データに含まれる文字列を識別して識別結果を獲得し、
前記識別結果に対して、前記文字列のフォント種類がＤＳＥＧフォントである場合と、前記ＤＳＥＧフォント以外のフォントである場合とで異なる補正を行い、
補正された前記識別結果に含まれる文字列に基づく日付データを前記画像データに付与する、
処理をプロセッサに実行させるための日付識別プログラム。