JP7243981B2 - 紙面領域分類装置及びそのプログラム - Google Patents

紙面領域分類装置及びそのプログラム Download PDF

Info

Publication number
JP7243981B2
JP7243981B2 JP2019042099A JP2019042099A JP7243981B2 JP 7243981 B2 JP7243981 B2 JP 7243981B2 JP 2019042099 A JP2019042099 A JP 2019042099A JP 2019042099 A JP2019042099 A JP 2019042099A JP 7243981 B2 JP7243981 B2 JP 7243981B2
Authority
JP
Japan
Prior art keywords
area
headline
text
classification
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019042099A
Other languages
English (en)
Other versions
JP2020144719A (ja
Inventor
陽一 景山
千佳子 石沢
佑芽 越▲高▼
健二 末廣
美紀 高橋
拓也 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Akita University NUC
Original Assignee
Akita University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Akita University NUC filed Critical Akita University NUC
Priority to JP2019042099A priority Critical patent/JP7243981B2/ja
Publication of JP2020144719A publication Critical patent/JP2020144719A/ja
Application granted granted Critical
Publication of JP7243981B2 publication Critical patent/JP7243981B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

特許法第30条第2項適用 (1)平成30年度電気関係学会東北支部連合大会論文集による公開、電気関係学会東北支部連合、平成30年9月6日発行
特許法第30条第2項適用 (2)平成30年度電気関係学会東北支部連合大会における講演、国立大学法人岩手大学 上田キャンパス、平成30年9月6日講演
特許法第30条第2項適用 (3)平成30年度情報処理学会東北支部研究会における講演、放送大学秋田学習センター、平成30年11月29日講演
特許法第30条第2項適用 (4)平成31年電気学会全国大会論文集(DVD-ROM版)による公開、一般社団法人電気学会、平成31年3月1日発行
本発明は、印刷物からデジタル化された紙面画像について領域の分類を行う紙面領域分類装置等に関するものである。
近年、新聞の編集作業のデジタル化が進んでおり、紙媒体に印刷されるだけでなく、インターネットにおいて記事の検索や閲覧が可能になっている。一方、古い新聞に掲載された記事は、紙面単位でデジタル化された紙面画像として保存されているだけであり、記事単位の利用が進んでいないのが現状である。古い新聞に掲載された記事の利用を促進するためには、紙面画像に含まれる見出し、本文、写真、広告等の領域を分類し、見出しと本文や写真の関連付けを行うことが不可欠である。
例えば、特許文献1には、紙面を撮影して得られる紙面画像から該紙面画像の部分をスクラップするための方法が開示されている。特許文献1に記載の方法では、紙面画像に関する複数の仕切りエッジ(=罫線や余白のこと)のうち、水平方向に伸長する上下の水平エッジ及び垂直方向に伸長する左右の垂直エッジから成るエッジのセットに基づいて紙面画像の区分を検出し、それぞれの区分に対応するエッジのセットに基づいてマップ領域を決定することが記載されている。
また、例えば、特許文献2には、文字やイラストをぼかして、膨張及び伸縮を繰り返すことによって、文字やイラストの領域を特定することが記載されている。
特許第6353893号公報(特開2018-97551号公報) 特開2018-5548号公報
しかしながら、特許文献1及び特許文献2のいずれの技術も、古い新聞の紙面画像の特徴について十分に考慮されていないため、古い新聞の紙面画像について精度良く領域を分類することができない。
古い新聞の紙面画像では、インクのシミやかすれ、歪み等が存在するため、特許文献1に記載の技術を適用すると、水平エッジ及び垂直エッジの過剰抽出や抽出漏れが多くなり、精度良く領域を分類できないと推察される。
また、古い新聞では本文の文字と写真の距離が近いため、文字と写真が混在した状態で特許文献2に記載の技術を適用すると、膨張処理によって文字と写真の領域が結合してしまい、両者を区別できなくなり、精度良く領域を分類できないと推察される。
本発明は、前述した問題点に鑑みてなされたものであり、その目的とすることは、古い新聞の紙面画像について精度良く領域の分類を行う紙面領域分類装置等を提供することである。
前述した目的を達成するための第1の発明は、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置であって、前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部と、を備え、前記本文領域分類部は、前記紙面画像から、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域とそれ以外の領域とを区別する本文分類用マスク画像を作成し、前記本文分類用マスク画像に対してラベリング処理を行い、同一のラベルが付されている領域の外接矩形を本文候補領域とし、前記本文候補領域に対して前記書字方向と直交する方向に膨張する書字直交方向膨張処理を行い、前記書字直交方向膨張処理の結果、画素が重複する前記本文候補領域のグループを単一の図形とする場合の外接矩形を前記本文領域とすることを特徴とする紙面領域分類装置である。第1の発明の紙面領域分類装置によって、古い新聞の紙面画像から、見出し領域、写真領域、広告領域及び本文領域を精度良く分類することができ、記事単位のデータ作成が容易となる。また、本文領域と他の領域が近接する古い新聞であっても、精度良く分類できる。また、本文領域が過剰に細切れ状態で分類されることを防ぐことができる。
また、前記本文領域分類部は、前記書字直交方向膨張処理の前に前記本文候補領域を前記書字方向に所定の画素数だけ収縮し、前記書字直交方向膨張処理の後に前記本文候補領域を前記書字方向に所定の画素数だけ膨張するようにしても良い。これによって、上下に隣接する段の本文同士が結合して単一の本文領域として分類されることを防ぐことができる。
第2の発明は、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置であって、前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部と、を備え、前記見出し領域分類部は、前記見出し以外の領域が連結されるように前記基準線領域に基づいて見出し分類用前処理画像を作成し、前記見出し分類用前処理画像に対してラベリング処理を実行し、面積が最大となるラベルの領域及び前記基準線領域に基づいて前記見出しと前記見出し以外を区別する見出し分類用マスク画像を作成し、前記見出し分類用マスク画像に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出することによって、前記見出し領域を検出することを特徴とする紙面領域分類装置である。第2の発明の紙面領域分類装置によって、古い新聞の紙面画像から、見出し領域、写真領域、広告領域及び本文領域を精度良く分類することができ、記事単位のデータ作成が容易となる。また、精度良く見出し領域を検出することができる。
第3の発明は、コンピュータを、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置として機能させるためのプログラムであって、前記コンピュータを、前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部として機能させ、前記本文領域分類部は、前記紙面画像から、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域とそれ以外の領域とを区別する本文分類用マスク画像を作成し、前記本文分類用マスク画像に対してラベリング処理を行い、同一のラベルが付されている領域の外接矩形を本文候補領域とし、前記本文候補領域に対して前記書字方向と直交する方向に膨張する書字直交方向膨張処理を行い、前記書字直交方向膨張処理の結果、画素が重複する前記本文候補領域のグループを単一の図形とする場合の外接矩形を前記本文領域とするためのプログラムである。第3の発明のプログラムを汎用のコンピュータにインストールすることによって、第1の発明の紙面領域分類装置を得ることができる。
の発明は、コンピュータを、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置として機能させるためのプログラムであって、前記コンピュータを、前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部として機能させ、前記見出し領域分類部は、前記見出し以外の領域が連結されるように前記基準線領域に基づいて見出し分類用前処理画像を作成し、前記見出し分類用前処理画像に対してラベリング処理を実行し、面積が最大となるラベルの領域及び前記基準線領域に基づいて前記見出しと前記見出し以外を区別する見出し分類用マスク画像を作成し、前記見出し分類用マスク画像に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出することによって、前記見出し領域を検出するためのプログラムである。第の発明のプログラムを汎用のコンピュータにインストールすることによって、第の発明の紙面領域分類装置を得ることができる。
本発明により、古い新聞の紙面画像について精度良く領域の分類を行う紙面領域分類装置等を提供することができる。
紙面領域分類装置の概要を示す図 紙面画像の一例を示す図 基準線領域分類部の処理の流れを示すフローチャート 基準線領域分類部の処理を説明する図 基準線領域分類部の処理を説明する図 見出し領域分類部の処理の流れを示すフローチャート 見出し領域分類部の処理を説明する図 見出し領域分類部の処理を説明する図 写真領域分類部の処理の流れを示すフローチャート 写真領域分類部の処理を説明する図 写真領域分類部の処理を説明する図 広告領域分類部の処理の流れを示すフローチャート 広告領域分類部の処理を説明する図 本文領域分類部の処理の流れを示すフローチャート 本文領域分類部の処理を説明する図 本文領域分類部の処理を説明する図 本文領域分類部の処理を説明する図
以下図面に基づいて、本発明の実施形態を詳細に説明する。図1は、紙面領域分類装置の概要を示す図である。紙面領域分類装置1は、デスクトップPC(「Personal Computer」の略)やノートPC等のコンピュータであり、制御部としてのCPU(「Central Processing Unit」の略)、主記憶部としてのメモリ、補助記憶部としてのHDD(「Hard Disk Drive」の略)やフラッシュメモリ、表示部としての液晶ディスプレイ、入力部としてのキーボードやマウス、タッチパネルディスプレイ等のハードウエアを有する。補助記憶部には、OS(「Operating System」の略)、アプリケーションプログラム、処理に必要なデータ等が記憶されている。紙面領域分類装置1の制御部は、補助記憶部からOSやアプリケーションプログラムを読み出して主記憶部に格納し、主記憶部にアクセスしながら、その他の機器を制御し、後述する処理を実行する。
紙面領域分類装置1は、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う装置であり、紙面の紙面画像を入力する紙面画像入力部11と、紙面画像の正規化を行う正規化部12と、紙面画像に含まれ、本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部13と、基準線領域に基づいて紙面画像に含まれる見出しを検出し、見出し領域に分類する見出し領域分類部14と、紙面画像に含まれる写真を検出し、写真領域に分類する写真領域分類部15と、紙面画像に含まれる広告を検出し、広告領域に分類する広告領域分類部16と、見出し領域、写真領域及び広告領域に関する重複又は誤検出について再分類を行う領域再分類部17と、基準線領域、見出し領域、写真領域及び広告領域に基づいて紙面画像に含まれる本文の領域を検出し、本文領域に分類する本文領域分類部18と、分類結果を出力する分類結果出力部19と、を備える。
見出し領域分類部14は、基準線領域分類部13の後に処理を実行する。また、領域再分類部17及び本文領域分類部18は、見出し領域分類部14、写真領域分類部15及び広告領域分類部16の後に処理を実行する。一方、見出し領域分類部14、写真領域分類部15及び広告領域分類部16については、互いに順序を変えて処理を実行しても良い。
図2は、紙面画像の一例を示す図である。紙面画像2の紙面は、1938年4月1日に発行された秋田魁新報の朝刊の第1面である。紙面画像2は、印刷された紙面をスキャナーで読み取り、デジタル化したものである。図2に示すように、紙面画像2の紙面は、本文の書字方向が縦書きであり、上下左右に一定の幅で区切って段にする段組によって区切られ、段組に沿って記事が配置されている。更に、紙面全体を囲む枠線が存在する。当時の印刷方法は凸版印刷であり、経年劣化もあるため、紙面画像2には、インクのシミ、かすれ及び歪み等のノイズが存在する。本実施の形態では、このようなノイズによってOCR(Optical Character Recognition:光学的文字認識)技術では本文の文字がほとんど認識できない紙面画像2を対象とし、OCR技術を用いずに各領域を分類する。
記事の利用を促進するためには、見出しと本文や写真の関連付けを行い、記事単位のデータを作成することが不可欠である。そこで、紙面領域分類装置1は、記事単位のデータ作成が容易になるように、紙面画像2に含まれる見出し、本文、写真、広告等の領域を分類する。
紙面には様々な罫線が用いられている。例えば、紙面画像2には、(1)本文の書字方向と直交する方向、すなわち図2の左右方向に伸び、段と段の間を区切る線、(2)本文の書字方向、すなわち図2の上下方向に伸び、記事と記事の間を区切る線、(3)見出しや本文等を囲む線等である。これらの罫線は、太さや色が様々であり、飾り模様が付されていることもある。本実施の形態では、見出し等の領域の分類精度を向上させるため、本文の書字方向に伸び、2以上の段に跨る線を基準線として検出し、見出しの検出等における処理の基準として用いる。
図2では、それぞれ、基準線領域3、見出し領域4、写真領域5、広告領域6及び本文領域7の一つを太線で囲んでいる。尚、記事には、見出しや本文の他に、リード文と呼ばれる記事の概略を説明する文章が存在する場合もある。本実施の形態では、リード文は、見出しとして検出されても良いし、本文として検出されても良い。通常、見出し、リード文及び本文は、文字数、文字サイズ及び書き出しの位置等に違いがあるため、リード文が見出し領域4や本文領域7に含まれていても、これらの特徴の違いによって、後から分けることが可能である。
図1の説明に戻る。紙面画像入力部11は、紙面画像2を入力する。本実施の形態では、PDF形式の元データを、24ビットカラーのBitmap形式(4672×6464画素)に変換し、紙面画像2とする。
正規化部12は、処理時間の短縮を目的としてリサイズ処理を行う。本実施の形態では、正規化部12は、バイリニア補間法(双1次内挿法)を用いてリサイズ処理を行う。また、正規化部12は、紙面全体の歪みの補正を目的として射影変換処理を行う。本実施の形態では、ユーザが入力部を介して4点の座標を指定すると、正規化部12は、ユーザによって指定される4点の座標が長方形の頂点の座標になるように射影変換処理を行う。ユーザは、入力部を介して紙面全体を囲む枠線の4つの角を指定する。
基準線領域分類部13は、書字方向に伸びるエッジの外接矩形を基準線領域3とする。エッジを線として検出するのではなく、エッジの外接矩形、すなわち幅のある領域として検出することによって、飾り模様が付されていたり、ノイズによって歪んでいたりする線についても精度良く検出できる。更に、基準線領域分類部13は、基準線領域3を書字方向に空白以外の画素まで延長する。これによって、後述する見出し領域分類部14の処理において、見出し領域4を精度良く検出できる。
図3は、基準線領域分類部の処理の流れを示すフローチャートである。図3に示すように、基準線領域分類部13は、書字方向に伸びるエッジを検出するための前処理を実行する(ステップS11)。基準線領域分類部13は、ソーベルフィルタを紙面画像2に適用し、書字方向のエッジを検出する。次に、基準線領域分類部13は、反転処理、及び大津の手法を用いた2値化処理を実行する。次に、基準線領域分類部13は、基準線の周囲に隣接する文字やノイズ等を棄却することを目的として、連結画素が3画素以下となる黒画素を除去する。そして、基準線領域分類部13は、黒画素の膨張処理を1回、黒画素の収縮処理を1回、及び反転処理を実行し、基準線分類用前処理画像とする。
次に、基準線領域分類部13は、基準線分類用前処理画像に対してラベリング処理を実行し(ステップS12)、棄却判定処理を実行する(ステップS13)。ステップS11において作成される基準線分類用前処理画像は、基準線に相当する画素のエッジが連結し、強調されるものの、見出しや本文等の文字、写真等の領域も検出される。従って、基準線の領域のみを検出するためには、文字や写真等の領域を棄却する必要がある。
基準線領域分類部13は、基準線分類用前処理画像に対して、例えば、OpenCvBlobs(https://opencv.org/のウェブページ参照)を用いてラベリング処理を実行する。次に、基準線領域分類部13は、ラベリング処理によって得られる各ラベルの領域に対して、外接矩形を算出する。ここで得られる外接矩形の領域は、基準線以外に、文字や写真等のエッジも含まれている。そこで、基準線領域分類部13は、(1)紙面画像2の左右端2%に該当する領域は、紙面全体を囲む枠線と仮定し、棄却する、(2)上下方向の長さが300画素(=紙面の高さ3,232画素に対して約9.28%)以下となる領域は、基準線以外と仮定し、棄却する、(3)左右方向の長さが50画素(=紙面の幅2,336画素に対して約2.14%)以上となる領域は、基準線以外と仮定し、棄却する、という3つの棄却判定条件に従い、基準線以外の領域を棄却する。
次に、基準線領域分類部13は、延長処理用画像を作成し(ステップS14)、基準線延長処理を実行し(ステップS15)、基準線領域3を決定する(ステップS16)。ステップS15の基準線延長処理では、ステップS13において棄却されなかった基準線の領域を書字方向に空白以外の画素まで延長する。ここで、空白と空白以外の画素を明確に区別するため、基準線領域分類部13は、ソーベルフィルタを適用し、左右方向のエッジが強調される画像を作成し、この画像に対して反転処理、及び大津の2値化処理を実行する。そして、基準線領域分類部13は、基準線の周囲に隣接するノイズを棄却することを目的として、連結画素が3画素以下となる黒画素を除去した後、オープニング処理を2回実行し、延長処理用画像とする。
図4、図5は、基準線領域分類部の処理を説明する図である。図4(a)に示す画像31は、延長処理用画像に対して延長前基準線領域3aを重ねたものである。画像31では、左右方向のエッジが強調されており、段同士の境界線が明確に確認できる。基準線領域分類部13は、延長前基準線領域3aを書字方向に空白以外の画素、すなわち境界線32a及び32bの画素まで延長する。この結果が図4(b)に示す画像33であり、延長処理用画像に対して延長後基準線領域3bを重ねたものである。また、図5に示す基準線領域分類結果画像34は、紙面画像2に対して全ての延長後基準線領域3bを明示したものである。尚、基準線領域分類結果画像34は、紙面画像2の原画像に対して明度を変更し、赤色の枠線で延長後基準線領域3bを描画したものをグレースケール画像にしたものである。
図1の説明に戻る。見出し領域分類部14は、見出し以外の領域が連結されるように基準線領域3に基づいて見出し分類用前処理画像を作成し、見出し分類用前処理画像に対してラベリング処理を実行し、面積が最大となるラベルの領域及び基準線領域3に基づいて見出しと見出し以外を区別する見出し分類用マスク画像を作成する。更に、見出し領域分類部14は、見出し分類用マスク画像に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出することによって、見出し領域4を検出する。これによって、精度良く見出し領域4を検出することができる。
図6は、見出し領域分類部の処理の流れを示すフローチャートである。図6に示すように、見出し領域分類部14は、紙面画像2に対して前処理を実行する(ステップS21)。図2を参照すれば、見出しは周囲が空白になっていることから、見出し領域分類部14は、見出し以外の領域を結合し、見出しを独立させることによって、見出しを検出する。具体的には、見出し領域分類部14は、適応的閾値処理の1つであり、近傍領域の重み付け平均値を閾値とし、重みを正規分布となるように計算する2値化処理を紙面画像2に対して実行する。次に、見出し領域分類部14は、2値化処理後の画像に対して反転処理を実行し、白画素の膨張処理を5回、白画素の収縮処理を5回実行する。この状態では、見出しと基準線が膨張処理によって結合される場合がある。そこで、見出し領域分類部14は、基準線領域分類部13によって分類された基準線領域3に相当する画素を棄却し、これを見出し分類用前処理画像とする。尚、膨張処理や収縮処理の実行回数は一例であり、この例に限定されるものではない。以下に示す膨張処理や収縮処理の実行回数についても同様である。
図7、図8は、見出し領域分類部の処理を説明する図である。図7(a)は、ステップS21の処理結果である見出し分類用前処理画像41を示している。見出し分類用前処理画像41を参照すれば、写真や本文といった見出し以外の領域が白画素として結合し、見出しの周囲が黒画素で埋め尽くされ、見出しが写真や本文といった見出し以外の領域から独立していることが分かる。
次に、見出し領域分類部14は、ラベリング処理を実行する(ステップS22)。具体的には、見出し領域分類部14は、例えば、OpenCvBlobsを用いて見出し分類用前処理画像41に対してラベリング処理を実行する。
次に、見出し領域分類部14は、面積が最大となるラベルの領域に基準線領域3を追加した領域を抽出する(ステップS23)。面積が最大となるラベルの領域は、ほぼ見出し以外の領域に相当するものの、ステップS21の処理において基準線領域3に相当する画素を棄却することに起因し、見出しが過剰に検出される場合がある。そこで、本実施の形態では、見出し領域分類部14は、面積が最大となるラベルの領域に基準線領域3を追加した領域を抽出する。図7(b)に示す画像42が、ステップS23の抽出結果である。広告の領域を除けば、概ね白画素が見出し以外の領域に相当する画素であり、黒画素が見出しの領域に相当する画素である。画像42を参照すれば、見出しの領域は、黒画素が矩形状に連結している領域として容易に判別できる。
次に、見出し領域分類部14は、見出しと見出し以外を区別する見出し分類用マスク画像を作成する(ステップS24)。具体的には、見出し領域分類部14は、ステップS23の抽出結果に対して、反転処理、黒画素の膨張処理を20回、及び黒画素の収縮処理を20回実行する。図7(c)は、ステップS22の抽出結果である見出し分類用マスク画像43を示している。見出し分類用マスク画像43を参照すれば、広告の領域を除き、概ね白画素が連結した領域が見出しの領域であり、黒画素が連結した領域が見出し以外の領域である。
ステップS24において作成される見出し分類用マスク画像43は、左右方向に伸びる罫線が、見出し以外の領域から棄却される場合がある。すなわち、見出し分類用マスク画像43において、左右方向に伸びる罫線が白画素(=見出しの領域に相当する画素)になる場合がある。そこで、見出し領域分類部14は、見出し分類用マスク画像43を補正する(ステップS25)。具体的には、見出し領域分類部14は、紙面画像2に対してソーベルフィルタを適用することによって、左右方向に伸びるエッジを検出し、反転処理、大津の手法を用いた2値化処理、及び黒画素の膨張処理を2回実行し、補正用前処理画像とする。図7(d)は、この処理結果である補正用前処理画像44を示している。そして、見出し領域分類部14は、ステップS24において作成される見出し分類用マスク画像43と補正用前処理画像44との論理和を算出し、補正後マスク画像とする。図8(a)は、この処理結果である補正後マスク画像45を示している。
次に、見出し領域分類部14は、ラベリング処理を実行する(ステップS26)。具体的には、見出し領域分類部14は、例えば、OpenCvBlobsを用いて補正後マスク画像45に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出する。
ステップS26において算出される各ラベルの領域の外接矩形は、見出し以外に、写真や広告、及び本文の空白の一部が含まれる場合がある。そこで、見出し領域分類部14は、棄却判定処理を実行し(ステップS27)、見出し領域4を決定する(ステップS28)。本実施の形態では、2以上の段に跨る領域を見出し領域4とする。具体的な棄却判定条件として、見出し領域分類部14は、見出しの右側に基準線が存在する場合を考慮し、外接矩形の高さが300画素以上となる領域を見出し領域4とし、これ以外に該当する領域を棄却する。図8(b)に示す見出し領域分類結果画像46は、紙面画像2に対して全ての見出し領域4を明示したものである。尚、見出し領域分類結果画像46は、紙面画像2の原画像に対して明度を変更し、赤色の枠線で見出し領域4を描画したものをグレースケール画像にしたものである。また、見出し領域分類結果画像46には、広告領域6に含まれるべき領域が見出し領域4として分類されている場合があるが、これについては後述の領域再分類部17によって再分類される。
図1の説明に戻る。写真領域分類部15は、紙面画像2に対して互いに異なる第1前処理及び第2前処理を実行し、第1前処理によって作成される画像と第2前処理によって作成される画像との差分画像を作成し、差分画像に基づいて写真領域5を検出する。写真の領域には明度が低い画素が密集している。そこで、写真領域分類部15は、第1前処理によって写真に相当する画素(=明度が低い画素)を結合させた画像を作成し、第2前処理によって写真以外の領域を強調した画像を作成し、これら2つの画像の差分画像を用いることによって写真領域5を精度良く検出する。特に、写真と本文が近接している古い新聞において有効である。
図9は、写真領域分類部の処理の流れを示すフローチャートである。図9に示すように、写真領域分類部15は、紙面画像2に対して、写真に相当する画素を結合させる第1前処理を実行する(ステップS31)。具体的には、写真領域分類部15は、紙面画像2に8方向ラプラシアンフィルタを適用してエッジを検出した後、反転処理と、Sauvolaの手法による閾値決定処理を用いた2値化処理を実行する。
図10、図11は、写真領域分類部の処理を説明する図である。図10(a)は、ステップS31の処理結果である第1写真分類用前処理画像51を示している。第1写真分類用前処理画像51は、写真の領域に相当する画素が黒画素として出現していることが分かる。
次に、写真領域分類部15は、紙面画像2に対して、写真以外の領域を強調する第2前処理を実行する(ステップS32)。具体的には、写真領域分類部15は、紙面画像2に7×7のメディアンフィルタを適用して平滑化処理を実行した後、8方向ラプラシアンフィルタを適用してエッジを検出し、更に、反復処理と、Sauvolaの手法による閾値決定処理を用いた2値化処理と、黒画素の膨張処理2回を実行する。図10(b)は、ステップS32の処理結果である第2写真分類用前処理画像52を示している。第2写真分類用前処理画像52は、写真の領域に相当する画素がほとんど白画素、写真以外の見出しや本文に相当する画素が黒画素で強調されていることが分かる。
次に、写真領域分類部15は、第1写真分類用前処理画像51と第2写真分類用前処理画像52との差分画像を作成する(ステップS33)。具体的には、写真領域分類部15は、第1写真分類用前処理画像51から第2写真分類用前処理画像52の差分を算出した後、黒画素の膨張処理2回と反転処理を実行する。図11(a)は、ステップS33の処理結果である画像53を示している。写真領域分類部15は、前述の差分を算出する処理において、第1写真分類用前処理画像51及び第2写真分類用前処理画像52の同一画素位置同士の値を確認し、第1写真分類用前処理画像51の値が黒画素、第2写真分類用前処理画像52の値が白画素であった場合、差分画像の同一画素位置の値を黒画素とし、それ以外の場合は白画素とする。尚、第1写真分類用前処理画像51、第2写真分類用前処理画像52及び差分画像の画像サイズは同一である。画像53は、差分画像に対して黒画素の膨張処理と反転処理を実行した後の画像である。画像53は、写真の領域については白画素が密集しており、他の領域についてはほとんど黒画素である。但し、広告に含まれるイラストの領域は、写真の領域と同様、白画素が密集している。
次に、写真領域分類部15は、例えば、OpenCvBlobsを用いて差分画像53に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出する(ステップS34)。
次に、写真領域分類部15は、ステップS34において算出される外接矩形に対して棄却判定処理を実行し、写真候補領域を特定する(ステップS35)。具体的な棄却判定条件として、写真領域分類部15は、横幅100画素以下、高さ100画素以下となる領域を本文やその他のノイズと仮定し、棄却する。尚、棄却判定条件の画素数は一例であり、この例に限定されるものではない。以下の棄却判定条件についても同様である。
次に、写真領域分類部15は、ステップS35において特定される写真候補領域の明度ヒストグラムを作成する(ステップS36)。写真候補領域には、本文の領域が含まれる場合がある。そこで、写真の領域は明度の低い画素が密集しているという特徴に着目し、明度ヒストグラムを用いて写真の領域と本文の領域を区別する。
次に、写真領域分類部15は、ステップS36において作成される明度ヒストグラムを用いて、写真候補領域に対して棄却判定処理を実行する(ステップS37)。具体的な棄却判定条件として、写真領域分類部15は、横幅が紙面画像2の50%以上の写真候補領域を広告領域6に分類するとともに、明度ヒストグラムの尖度を算出し、尖度が閾値より大きい写真候補領域を棄却する。一方、写真領域分類部15は、尖度が閾値以下の写真候補領域を写真領域5に決定する(ステップS38)。本実施の形態では、閾値を4.0としたが、この例に限定されるものではない。図11(b)に示す写真領域分類結果画像54は、紙面画像2に対して全ての写真領域5を明示したものである。尚、写真領域分類結果画像54は、紙面画像2の原画像に対して明度を変更し、赤色の枠線で写真領域5を描画したものをグレースケール画像にしたものである。また、写真領域分類結果画像54には、広告領域6に含まれるべき領域が写真領域5として分類されている場合があるが、これについては後述の領域再分類部17によって再分類される。
図1の説明に戻る。広告領域分類部16は、囲み枠線を強調するように広告分類用前処理画像を作成し、広告分類用前処理画像に対してラベリング処理を実行することによって、広告領域6を検出する。広告は、ほとんどの場合、周囲に囲み枠線が存在するため、囲み枠線に着目することによって広告領域6を精度良く検出することができる。
図12は、広告領域分類部の処理の流れを示すフローチャートである。図12に示すように、広告領域分類部16は、紙面画像2に対して、囲み枠線を強調する前処理を実行する(ステップS41)。具体的には、広告領域分類部16は、紙面画像2に対して7×7のメディアンフィルタを適用し、平滑化処理を実行した後、8方向ラプラシアンフィルタを適用し、エッジを検出する。次に、広告領域分類部16は、反転処理、大津の手法を用いた2値化処理、及び黒画素の膨張処理3回を実行し、広告分類用前処理画像とする。
図13は、広告領域分類部の処理を説明する図である。図13(a)は、ステップS41の処理結果である広告分類用前処理画像61を示している。広告分類用前処理画像61は、広告の囲み枠線が太線として強調されていることが分かる。
次に、広告領域分類部16は、例えば、OpenCvBlobsを用いて広告分類用前処理画像61に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出する(ステップS42)。
次に、広告領域分類部16は、ステップS42において算出される外接矩形に対して、棄却判定処理を実行し(ステップS43)、広告領域を決定する(ステップS44)。広告領域分類部16は、(1)外接矩形が紙面の70%以上の面積を有する場合、記事全体の囲み枠線と仮定し、棄却する、(2)紙面の下部50%部分に存在し、外接矩形が横幅100画素以下、高さ100画素以下の場合、本文やその他のノイズの領域と仮定し、棄却する、という2つの棄却判定条件に従い、広告以外の領域を棄却する。一方、広告領域分類部16は、これらの棄却判定条件に合致しない外接矩形を広告領域6として決定する。図13(b)に示す広告領域分類結果画像62は、紙面画像2に対して全ての広告領域6を明示したものである。尚、広告領域分類結果画像62は、紙面画像2の原画像に対して明度を変更し、赤色の枠線で広告領域6を描画したものをグレースケール画像にしたものである。
図1の説明に戻る。領域再分類部17は、既に分類されている見出し領域4、写真領域5及び広告領域6について、位置情報や重複状態に基づいて再分類を行う。具体的には、領域再分類部17は、(1)紙面画像2の下部30%部分を広告優先領域とし、広告優先領域において広告領域6と交差する見出し領域4を広告領域6として再分類する、(2)見出し領域4及び写真領域5が重複する場合、重複する面積を算出し、見出し領域4の50%以上が重複している場合、見出し領域4の誤検出と仮定し、この見出し領域4を棄却する、という再分類条件に従って再分類を行う。また、領域再分類部17は、大きい矩形に包含される小さい矩形を棄却する処理を行い、広告領域6の調整を行う。これによって、見出し領域4、写真領域5及び広告領域6が一意に分類されるとともに、分類の精度を向上させることができる。
本文領域分類部18は、紙面画像2から、基準線領域3、見出し領域4、写真領域5及び広告領域6とそれ以外の領域とを区別する本文分類用マスク画像を作成し、本文分類用マスク画像に対してラベリング処理を行い、同一のラベルが付されている領域の外接矩形を本文候補領域とし、本文候補領域に対して書字方向と直交する方向に膨張する書字直交方向膨張処理を行い、書字直交方向膨張処理の結果、画素が重複する本文候補領域のグループを単一の図形とする場合の外接矩形を本文領域7とする。これによって、本文領域7と他の領域が近接する古い新聞であっても、精度良く分類できる。また、本文領域7が過剰に細切れ状態で分類されることを防ぐことができる。
また、上下に隣接する段の本文同士は、互いに異なる記事に属する場合があるため、単一の本文領域7として分類されることは望ましくない。そこで、本文領域分類部18は、書字直交方向膨張処理の前に本文候補領域を書字方向に所定の画素数だけ収縮し、膨張処理の後に本文候補領域を書字方向に所定の画素数だけ膨張する。これによって、上下に隣接する段の本文同士が結合して単一の本文領域7として分類されることを防ぐことができる。
図14は、本文領域分類部の処理の流れを示すフローチャートである。図14に示すように、本文領域分類部18は、紙面画像2に対して前処理を実行する(ステップS51)。具体的には、本文領域分類部18は、紙面画像2に対して7×7のメディアンフィルタを適用し、平滑化処理を実行した後、ソーベルフィルタを適用し、エッジを検出する。次に、本文領域分類部18は、反転処理と、大津の手法を用いた2値化処理を実行する。更に、本文領域分類部18は、黒画素の膨張処理3回、黒画素の収縮処理2回、及び反転処理を実行し、本文分類用前処理画像とする。
図15~図17は、本文領域分類部の処理を説明する図である。図15(a)は、ステップS51の処理結果である本文分類用前処理画像81を示している。
次に、本文領域分類部18は、基準線領域3、見出し領域4、写真領域5及び広告領域6を用いて、本文分類用マスク画像を作成する(ステップS52)。図15(b)に示す画像82は、基準線領域3、見出し領域4、写真領域5及び広告領域6の分類結果を示している。尚、画像82は、紙面画像2の原画像に対して、領域ごとに異なる色で着色したものをグレースケール画像にしたものである。本文領域分類部18は、本文分類用前処理画像81に対して、画像82における基準線領域3、見出し領域4、写真領域5及び広告領域6のいずれかの領域に属する画素を黒画素として重畳することによって、本文分類用マスク画像を作成する。図15(c)は、この処理結果である本文分類用マスク画像83を示している。
次に、本文領域分類部18は、例えば、OpenCvBlobsを用いて本文分類用マスク画像83に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出し、本文候補領域とする(ステップS83)。ここで、本文領域分類部18は、本文候補領域からノイズを除去するために、本文の1文字分に相当する高さ15画素(=紙面の高さ3,232画素に対して約0.464%)及び横幅15画素(=紙面の幅2,336画素に対して約0.642%)以下となる領域を棄却する。また、本文領域分類部18は、本文候補領域から枠線を除外するために、高さが2段分(=紙面の高さ3,232画素に対して約14%)以上の領域については枠線と仮定し、棄却する。図15(d)は、この処理結果である本文候補領域検出結果画像84を示している。尚、本文候補領域検出結果画像84は、紙面画像2の原画像に対して、本文候補領域を青色の枠線で示したものをグレースケール画像にしたものである。
次に、本文領域分類部18は、本文候補領域に相当する各矩形を書字方向に4画素だけ収縮する(ステップS54)。これは、上下に隣接する段の本文同士が結合してしまうことを防ぐための処理である。
次に、本文領域分類部18は、各矩形を書字方向と直交する方向にn画素膨張する(ステップS55)。本実施の形態では、ステップS55~ステップS57を3回繰り返す。膨張画素数を示すnは、1回目が8画素、2回目が3画素、3回目が2画素とし、回数を追うごとに減らしていく。図16(a)に示す画像85は、本文候補領域検出結果画像84の一部を切り出したものである。図16(b)に示す画像86は、本文候補領域検出結果画像84に膨張処理を実行した結果の一部を切り出したものである。尚、画像85及び画像86は、紙面画像2の原画像に対して、各矩形を青色の枠線で示したものをグレースケール画像にしたものである。
次に、本文領域分類部18は、ステップS55の処理の結果、画素が重複する矩形同士をグループ化し(ステップS56)、各グループを単一の図形とする場合の外接矩形を算出する(ステップS57)。図17は、ステップS56及びS57の処理を示している。算出される外接矩形は、新たな矩形として後続の処理の対象となる。また、図16(c)に示す画像87は、グループ化及び外接矩形の算出処理を実行した結果の一部を切り出したものである。尚、画像87は、紙面画像2の原画像に対して、各矩形を青色の枠線で示したものをグレースケール画像にしたものである。
次に、本文領域分類部18は、繰り返し回数が所定回数(=本実施の形態では3回)に到達したか否か確認する(ステップS58)。到達していない場合(ステップS58のNo)、本文領域分類部18は、ステップS55から処理を繰り返す。到達している場合(ステップS58のYes)、本文領域分類部18は、ステップS59に進む。
次に、本文領域分類部18は、各矩形を書字方向に4画素だけ膨張する(ステップS59)。これは、ステップS54において収縮した分を元に戻すための処理である。
次に、本文領域分類部18は、他の矩形に包含されている矩形を棄却し、最終的な本文領域7を決定する(ステップS60)。図16(d)に示す本文領域分類結果画像88は、紙面画像2に対して全ての本文領域7を明示したものである。尚、本文領域分類結果画像88は、紙面画像2の原画像に対して明度を変更し、赤色の枠線で本文領域7を描画したものをグレースケール画像にしたものである。
図1の説明に戻る。分類結果出力部19は、分類結果を表示部に表示し、入力部を介してユーザから切り抜きや保存の指示を受け付ける。具体的には、分類結果出力部19は、見出し領域4、写真領域5、広告領域6及び本文領域7の一部又は全部を紙面画像2に重畳して表示部に表示する。次に、分類結果出力部19は、入力部を介して各領域の選択を受け付ける。次に、分類結果出力部19は、領域が選択された状態で、切り抜きや保存の指示を受け付ける。これによって、ユーザは、見出しと本文や写真の関連付けを容易に行うことができ、紙面画像2から記事単位に切り抜いて保存する作業を効率良く行うことができる。尚、分類結果出力部19は、分類結果の修正を受け付けるようにしても良い。
以上の通り、本実施の形態における紙面領域分類装置1によれば、古い新聞の紙面画像2から、見出し領域4、写真領域5、広告領域6及び本文領域7を精度良く分類することができ、記事単位のデータ作成が容易となる。
本実施例では、紙面領域分類装置1によって紙面画像2の領域の分類を行った。対象データは、1938年4月6日~4月30日の間に発行された秋田魁新報の朝刊の紙面とした。最初に、目視によって見出し領域4、写真領域5及び広告領域6の正解マスク画像を作成し、正解となる領域(以下、「正解領域」という。)を取得した。ここで、正解マスク画像は、正解領域が白画素、正解領域ではない領域が黒画素である。次に、紙面領域分類装置1によって検出された領域(以下、「検出領域」という。)と正解領域との比較を行い、後述する評価指標を用いて検出精度を評価した。
本実施例では、検出領域の評価指標として、精度(precision)(%)、再現率(recall)(%)、F値(F-measure)(%)、IoU(Intersection-Over-Union)(%)を用いた。F値(%)とは、画素の分類精度を評価するための指標であり、IoU(%)とは、検出領域と正解領域との重なり度合を評価するための指標である。ここで、「TP」を検出領域が正しく分類された(正解領域に含まれる)画素数、「FP」を検出領域が正解領域に含まれない画素数、「FN」を検出領域が含まれない正解領域の画素数、「Area of overlap」を正解領域と検出領域の論理積の面積(=画素数)、「Area of union」を正解領域と検出領域の論理和の面積(=画素数)とすると、精度(precision)(%)、再現率(recall)(%)、F値(F-measure)(%)及びIoU(Intersection-Over-Union)(%)は以下の式で算出される。
Figure 0007243981000001
また、正解領域と重複しない検出領域(以下、「誤検出領域」という。)においては誤検出率(%)を算出し、検出されない正解領域(以下、「未検出領域」という。)においては未検出率(%)を算出した。ここで、「誤検出領域面積」を正解領域と重複しない領域の合計面積(=合計画素数)、「未検出領域面積」を正解領域の中で検出されなかった領域の合計面積(=合計画素数)、「正解領域外側面積」を正解マスク画像における黒画素(=正解領域ではない画素)の面積(=画素数)とすると、誤検出率(%)及び未検出率(%)は以下の式で算出される。
Figure 0007243981000002
本実施例では、前述の式に基づき、見出し領域4、写真領域5及び広告領域6について評価指標を算出した。算出結果は以下の通りである。
Figure 0007243981000003
Figure 0007243981000004
見出し領域4の検出においては、F値の平均が82.21%、IoUの平均が74.87%という良好な結果となった。また、検出結果を目視で確認したところ、他の領域との重複はあるものの、見出しの全てを検出できていた。更に、未検出率の平均においても0.77%という良好な結果となった。写真領域5の検出においては、F値の平均が81.71%、IoUの平均が76.05%という良好な結果となった。また、検出結果を目視で確認したところ、写真の全てを検出できていた。広告領域6の検出においては、広告領域6同士の重複等に起因して評価指標の数値は良好とは言えないが、検出結果を目視で確認したところ、広告領域6全体を覆うような検出ができていた。以上の通り、紙面領域分類装置1による領域の分類が有用であることが分かった。
以上、添付図面を参照しながら、本発明に係る紙面領域分類装置等の好適な実施形態について説明したが、本発明はかかる例に限定されない。当業者であれば、本願で開示した技術的思想の範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。
1………紙面領域分類装置
2………紙面画像
3………基準線領域
4………見出し領域
5………写真領域
6………広告領域
7………本文領域
11………紙面画像入力部
12………正規化部
13………基準線領域分類部
14………見出し領域分類部
15………写真領域分類部
16………広告領域分類部
17………領域再分類部
18………本文領域分類部
19………分類結果出力部

Claims (5)

  1. 見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置であって、
    前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、
    前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、
    前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、
    前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、
    前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、
    前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部と、
    を備え
    前記本文領域分類部は、前記紙面画像から、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域とそれ以外の領域とを区別する本文分類用マスク画像を作成し、前記本文分類用マスク画像に対してラベリング処理を行い、同一のラベルが付されている領域の外接矩形を本文候補領域とし、前記本文候補領域に対して前記書字方向と直交する方向に膨張する書字直交方向膨張処理を行い、前記書字直交方向膨張処理の結果、画素が重複する前記本文候補領域のグループを単一の図形とする場合の外接矩形を前記本文領域とする
    ことを特徴とする紙面領域分類装置。
  2. 前記本文領域分類部は、前記書字直交方向膨張処理の前に前記本文候補領域を前記書字方向に所定の画素数だけ収縮し、前記書字直交方向膨張処理の後に前記本文候補領域を前記書字方向に所定の画素数だけ膨張する
    ことを特徴とする請求項に記載の紙面領域分類装置。
  3. 見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置であって、
    前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、
    前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、
    前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、
    前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、
    前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、
    前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部と、
    を備え
    前記見出し領域分類部は、前記見出し以外の領域が連結されるように前記基準線領域に基づいて見出し分類用前処理画像を作成し、前記見出し分類用前処理画像に対してラベリング処理を実行し、面積が最大となるラベルの領域及び前記基準線領域に基づいて前記見出しと前記見出し以外を区別する見出し分類用マスク画像を作成し、前記見出し分類用マスク画像に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出することによって、前記見出し領域を検出する
    ことを特徴とする紙面領域分類装置。
  4. コンピュータを、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置として機能させるためのプログラムであって、
    前記コンピュータを、
    前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、
    前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、
    前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、
    前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、
    前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、
    前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部として機能させ
    前記本文領域分類部は、前記紙面画像から、前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域とそれ以外の領域とを区別する本文分類用マスク画像を作成し、前記本文分類用マスク画像に対してラベリング処理を行い、同一のラベルが付されている領域の外接矩形を本文候補領域とし、前記本文候補領域に対して前記書字方向と直交する方向に膨張する書字直交方向膨張処理を行い、前記書字直交方向膨張処理の結果、画素が重複する前記本文候補領域のグループを単一の図形とする場合の外接矩形を前記本文領域とするためのプログラム。
  5. コンピュータを、見出し、本文、写真及び広告を含む紙面の紙面画像の領域の分類を行う紙面領域分類装置として機能させるためのプログラムであって、
    前記コンピュータを、
    前記紙面画像に含まれ、前記本文の書字方向に伸びる線を基準線として検出し、基準線領域に分類する基準線領域分類部と、
    前記基準線領域に基づいて前記紙面画像に含まれる前記見出しを検出し、見出し領域に分類する見出し領域分類部と、
    前記紙面画像に含まれる前記写真を検出し、写真領域に分類する写真領域分類部と、
    前記紙面画像に含まれる前記広告を検出し、広告領域に分類する広告領域分類部と、
    前記見出し領域、前記写真領域及び前記広告領域に関する重複又は誤検出について再分類を行う領域再分類部と、
    前記基準線領域、前記見出し領域、前記写真領域及び前記広告領域に基づいて前記紙面画像に含まれる前記本文の領域を検出し、本文領域に分類する本文領域分類部として機能させ
    前記見出し領域分類部は、前記見出し以外の領域が連結されるように前記基準線領域に基づいて見出し分類用前処理画像を作成し、前記見出し分類用前処理画像に対してラベリング処理を実行し、面積が最大となるラベルの領域及び前記基準線領域に基づいて前記見出しと前記見出し以外を区別する見出し分類用マスク画像を作成し、前記見出し分類用マスク画像に対してラベリング処理を実行し、各ラベルの領域の外接矩形を算出することによって、前記見出し領域を検出するためのプログラム。
JP2019042099A 2019-03-08 2019-03-08 紙面領域分類装置及びそのプログラム Active JP7243981B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019042099A JP7243981B2 (ja) 2019-03-08 2019-03-08 紙面領域分類装置及びそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019042099A JP7243981B2 (ja) 2019-03-08 2019-03-08 紙面領域分類装置及びそのプログラム

Publications (2)

Publication Number Publication Date
JP2020144719A JP2020144719A (ja) 2020-09-10
JP7243981B2 true JP7243981B2 (ja) 2023-03-22

Family

ID=72354336

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019042099A Active JP7243981B2 (ja) 2019-03-08 2019-03-08 紙面領域分類装置及びそのプログラム

Country Status (1)

Country Link
JP (1) JP7243981B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7385075B1 (ja) * 2023-06-28 2023-11-21 株式会社朝日新聞社 情報処理装置、情報処理方法、及びプログラム

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022943A (ja) 1998-06-30 2000-01-21 Minolta Co Ltd 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体
JP2002041401A (ja) 2000-07-31 2002-02-08 Fuji Xerox Co Ltd 情報提示方法
JP2004157818A (ja) 2002-11-07 2004-06-03 Panasonic Communications Co Ltd 画像処理装置及び画像処理方法
JP2007066084A (ja) 2005-08-31 2007-03-15 Ricoh Co Ltd 文書処理装置、文書処理方法、および文書処理用プログラム
JP2007079587A (ja) 2006-10-05 2007-03-29 Sharp Corp 画像処理装置
JP2009268148A (ja) 1999-12-20 2009-11-12 Honda Tadashi イメージデータ圧縮方法及び復元方法
JP2010066981A (ja) 2008-09-10 2010-03-25 Ricoh Co Ltd 画像処理装置、画像処理方法、制御プログラム及び記録媒体
JP2010232795A (ja) 2009-03-26 2010-10-14 Seiko Epson Corp 階調数低減装置、階調数低減方法
JP2013235418A (ja) 2012-05-09 2013-11-21 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
JP2018097551A (ja) 2016-12-13 2018-06-21 株式会社アイエスピー 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57199066A (en) * 1981-06-02 1982-12-06 Toshiyuki Sakai File forming system for cutting of newspaper and magazine
JPH0327471A (ja) * 1989-06-26 1991-02-05 Hitachi Ltd 画像登録方式
JPH09305704A (ja) * 1996-05-20 1997-11-28 Sharp Corp 文書処理装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000022943A (ja) 1998-06-30 2000-01-21 Minolta Co Ltd 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体
JP2009268148A (ja) 1999-12-20 2009-11-12 Honda Tadashi イメージデータ圧縮方法及び復元方法
JP2002041401A (ja) 2000-07-31 2002-02-08 Fuji Xerox Co Ltd 情報提示方法
JP2004157818A (ja) 2002-11-07 2004-06-03 Panasonic Communications Co Ltd 画像処理装置及び画像処理方法
JP2007066084A (ja) 2005-08-31 2007-03-15 Ricoh Co Ltd 文書処理装置、文書処理方法、および文書処理用プログラム
JP2007079587A (ja) 2006-10-05 2007-03-29 Sharp Corp 画像処理装置
JP2010066981A (ja) 2008-09-10 2010-03-25 Ricoh Co Ltd 画像処理装置、画像処理方法、制御プログラム及び記録媒体
JP2010232795A (ja) 2009-03-26 2010-10-14 Seiko Epson Corp 階調数低減装置、階調数低減方法
JP2013235418A (ja) 2012-05-09 2013-11-21 Panasonic Corp 画像処理装置およびこれを備えた原稿読取システム
JP2018097551A (ja) 2016-12-13 2018-06-21 株式会社アイエスピー 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
越高佑芽、外5名,古いアナログ紙面を対象とした記事領域の分割支援システムの検討,第33回ファジィシステムシンポジウム(セッションID: WG3-3)[online],2017年,https://www.jstage.jst.go.jp/article/fss/33/0/33_279/_article/-char/ja

Also Published As

Publication number Publication date
JP2020144719A (ja) 2020-09-10

Similar Documents

Publication Publication Date Title
US8000529B2 (en) System and method for creating an editable template from a document image
JP3576570B2 (ja) 比較方法
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP5492205B2 (ja) 印刷媒体ページの記事へのセグメント化
JP3278471B2 (ja) 領域分割方法
US7715628B2 (en) Precise grayscale character segmentation apparatus and method
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP6353893B2 (ja) 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
JP2019016350A (ja) 電子文書における強調テキストの識別
JP6102417B2 (ja) 画像処理装置、画像処理方法及び画像処理デバイス
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
US8989485B2 (en) Detecting a junction in a text line of CJK characters
JP7243981B2 (ja) 紙面領域分類装置及びそのプログラム
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
JP4847378B2 (ja) 画像処理装置、画像処理方法、プログラム及びコンピュータ読取可能な記録媒体
JPH11265422A (ja) マーク認識方法及び装置並びに記録媒体
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP3091278B2 (ja) 文書認識方式

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20190326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230228

R150 Certificate of patent or registration of utility model

Ref document number: 7243981

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150