JP6353893B2 - 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置 - Google Patents

携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置 Download PDF

Info

Publication number
JP6353893B2
JP6353893B2 JP2016240823A JP2016240823A JP6353893B2 JP 6353893 B2 JP6353893 B2 JP 6353893B2 JP 2016240823 A JP2016240823 A JP 2016240823A JP 2016240823 A JP2016240823 A JP 2016240823A JP 6353893 B2 JP6353893 B2 JP 6353893B2
Authority
JP
Japan
Prior art keywords
map
image
area
scrap
paper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016240823A
Other languages
English (en)
Other versions
JP2018097551A (ja
Inventor
敏郎 松村
敏郎 松村
敬宇 蓑和
敬宇 蓑和
Original Assignee
株式会社アイエスピー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社アイエスピー filed Critical 株式会社アイエスピー
Priority to JP2016240823A priority Critical patent/JP6353893B2/ja
Publication of JP2018097551A publication Critical patent/JP2018097551A/ja
Application granted granted Critical
Publication of JP6353893B2 publication Critical patent/JP6353893B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)

Description

本発明は、新聞、雑誌等の紙面を撮影した画像を用いて記事をスクラップする方法等に関する。特に、複雑なレイアウトを有する紙面を撮影した画像、傾きや歪みのある紙面画像等から所望の記事をスクラップすることができるスクラップロジック、ユーザインターフェース、及びそれらを実装した携帯端末装置に関する。
従来、入力された新聞等の文書画像から区画線や行間スペースを検出し、区画線等により区分される領域毎にヒストグラムを求め、その特徴から見出し、写真、記事本文を検出し、記事本文の繋がり関係を判定しながら不定形に段組された1つの連続した記事本文を抽出することが提案された(特公昭61−32712号公報:特許文献1)。
読み取られた新聞雑誌の原画から横罫線、縦罫線を抽出し、これに基づいて新聞、雑誌等の記事の領域を自動的に抽出することが提案された(特開昭62−76969号公報:特許文献2)。
画像データ上で所望の記事を切り出す際に、縦・横の罫線を認識し端点の位置データとして記憶し、罫線間の接続関係から見出し領域を判定し、認識された罫線に基づいて領域を区画し、区画された領域毎に番号を付加して記憶することを含む文書処理装置が提案された(特開平9−305704号公報:特許文献3)。
印刷媒体画像から水平及び垂直のガター及び線を、フィルタ等を利用して検出し、検出したガター及び線によって印刷媒体画像をチョップして見出し及び本文ブロックとして認識し、規則や機械学習アルゴリズムに基づいて見出し及び本文ブロックを記事にグループ化する方法が提案された(特表2012−500428公報:特許文献4)。
特公昭61−32712号公報 特開昭62−76969号公報 特開平9−305704号公報 特表2012−500428公報
従来技術はモバイルデバイスの使用を前提としておらず、スキューを有する紙面画像について精度よく罫線を抽出することができなかった。また、見出し領域の検出のために一定のパターンの罫線の検出を要するなど、多種多様な罫線や余白が抽出される紙面に十分に対応することができなかった。記事を構成する領域の区分や抽出のために広範囲のOCR(光学式文字認識)等膨大な処理を要するが、最終的に必ずしも単一の記事が抽出されなかった。
さらに、単一の記事が抽出されない場合に、容易に修正するためのインターフェースも提供されなかった。
上記問題に鑑みて、本発明は、モバイルデバイスのカメラ等を使用して撮影した紙面画像から該紙面画像の部分をスクラップ(切抜き)するために、紙面画像を区分する仕切りエッジを適切に検出して単一の記事を精度よく抽出するとともに、多様なレイアウトに網羅的に対応できるように、容易なユーザ操作で切抜き範囲を再構成することができるスクラップロジック、インターフェース、及び装置を提供することを目的とする。
本発明に係る一つの実施形態は、紙面を撮影して得られる紙面画像から該紙面画像の部分をスクラップするための方法であって、紙面画像に関する複数の仕切りエッジのうち、それぞれ水平方向に伸長する上下の水平エッジ及びそれぞれ垂直方向に伸長する左右の垂直エッジから成るエッジのセットに基づいて前記紙面画像の区分を検出するステップと、それぞれの区分に対応するエッジのセットに基づいてマップ領域を決定し、該マップ領域を構成する複数の画素がマップ番号に関連付けられるマップ画像を生成するステップと、紙面画像を、スクラップする領域とスクラップしない領域とに区分して表示させるスクラップマスクであって、スクラップする領域が予め選択されたマップ領域から成るスクラップマスクを生成するステップと、決定されたマップ領域から成るスクラップ画像を生成するステップと、を含む。
本発明によれば、上下の水平エッジと左右の垂直エッジとから成るエッジのセットにより紙面画像を区分してマップ領域とし、マップ領域のセットによりスクラップ領域が形成されるので、適切な検出に基づいて、自動的に切抜き(スクラップ)された紙面画像を得ることができる。スクラップのためにOCRによるテキスト認識も要しないのでCPUの負荷が少なく、モバイルデバイス等での実装に適する。
好適に、スクラップマスクは、ユーザ操作に基づくマップ領域単位の選択入力及び/又は非選択入力を受けつけるように生成される。このようにすることで、自動的な切抜き範囲がユーザの所望の部分でない場合も、マップ領域単位で追加、削除等することができ、所望のスクラップ画像を容易に得ることができる。
紙面画像は一つ以上の記事を含み、スクラップマスクにおいて、予め単一の記事を構成するとみなされる一つ以上のマップ領域がマップ領域単位で非選択可能であり、その他の一つ以上のマップ領域がマップ領域単位で選択可能である。このようにすることで、マップ領域の選択/非選択を反転させるだけで、予め提示されたスクラップ領域を容易に変更することができる。
上記方法において、好適に、スクラップマスクを生成するステップにおいて、記事の見出しとみなされる領域について光学式文字認識(OCR)処理が行われる。
本発明によれば、紙面画像のスクラップ処理自体にOCRを要しないが、スクラップ画像の見出しをテキスト認識することで、スクラップ画像とテキストとを関連付けて、後の検索処理等に役立てることができる。テキスト認識する領域は記事の見出しに限らなくてもよい。本発明によれば、マップ領域単位のOCRが可能であり、必要以上の処理を行うことなく、所望の部分のテキストを取得することができる。
マップ画像において、紙面画像の全ての画素がそれぞれのマップ番号を持つことが好ましい。このようにすることで、紙面画像の全ての部分をマップ領域に区分することができ、選択及び/又は非選択の対象とすることができる。
上記方法において、水平エッジは、紙面画像を解析するための解析画像を所定のブロックサイズで水平方向にブロック化して検出される紙面の横罫線及び/又は水平方向に伸長する余白に基づいて決定され、垂直エッジが、解析画像を所定のブロックサイズで垂直方向にブロック化して検出される紙面の縦罫線及び/又は垂直方向に伸長する余白に基づいて決定されることが好ましい。
また、所定のブロックサイズは、紙面画像の幅方向や高さ方向に対して整列しない罫線及び/又は余白を検出するのに適するように決定されることが好ましい。
本発明に係るスクラップロジックは、モバイルデバイス等の実装に鑑みて、撮影される紙面画像が画像の幅方向や高さ方向に対して傾きや歪みがある場合でも、精度よく紙面を仕切るエッジを検出するものである。このために、適切に設定されたブロックサイズでブロック化した解析を行う。ブロック化により水平又は垂直方向の、例えば、数画素をひとまとまりのブロックとした解析が行われるため、略水平又は略垂直方向へ伸長するエッジ(罫線や余白等)を適切に検出し、後続の処理に資することができる。
所定のブロックサイズは、スクラップ対象(新聞、雑誌等)の解析に適するように、数画素乃至数十画素の範囲において適宜決定されてよい。
解析画像は、所定のブロックサイズに応じて紙面画像をトリミングして生成されてよい。
紙面画像のサイズは撮影するモバイルデバイス等によってさまざまであり、所定のブロックサイズで割り切れない場合がある。適切なブロック化解析のために、紙面画像の幅及び/又は高さについて予め数画素〜数十画素程度トリミングされ得る。
上記方法において、エッジのセットは、一つの水平エッジから成る基準エッジと、該基準エッジの垂直方向の位置に関して少なくとも部分的に上方に位置し、且つ基準エッジの少なくとも部分の水平方向の位置を挟んで左右に隣り合って位置する二つの垂直エッジと、該左右の垂直エッジと基準エッジにより形成される凹型を少なくとも部分的に塞ぐ位置にあるもう一つの水平エッジとから成る。
このようにエッジのセットを決定することで、紙面画像から規則的に区分を検出し得る。
また、マップ領域は、上下の水平エッジを合成した領域と、左右の垂直エッジを合成した領域との重複部分を少なくとも含む。マップ領域は、対向するエッジの位置関係、及び直交するエッジの位置関係に応じて、重複部分に追加される領域を含む場合がある。
エッジのセットにおけるエッジの大小や配置等は様々であり、単に画素の特徴を追跡することでは、エッジのセットに関する領域を必ずしも画成することができない。本発明によれば、対向する上下のエッジを合成しエッジに挟まれる画素を含めた領域を生成し、及び対向する左右のエッジを合成しエッジに挟まれる画素を含めた領域を生成し、生成されたそれぞれの領域を重ね合わせることで、エッジのセットが示す一連の画素を決定することができる。さらに、直交するエッジの位置関係を調べることで、領域を適切に形成することができる。
本発明に係る他の態様は、上記に記載された紙面画像のスクラップ方法をコンピュータに実行させるプログラムである。
本発明のもう一つの態様は、紙面を撮影して得られる紙面画像から該紙面画像の部分をスクラップするように構成される装置であって、紙面画像に関する複数の仕切りエッジのうち、それぞれ水平方向に伸長する二つの水平エッジ及びそれぞれ垂直方向に伸長する二つ垂直エッジから成るエッジのセットに基づいて、紙面画像の区分を検出するための区分検出手段と、それぞれの区分に対応するエッジのセットに基づいてマップ領域を決定し、該マップ領域を構成する複数の画素がマップ番号に関連付けられるマップ画像を生成するためのマップ画像生成手段と、紙面画像を、選択されたマップ領域から成るスクラップする領域と、選択されないマップ領域から成るスクラップしない領域とに区分して表示させるスクラップマスクを生成するためのスクラップマスク生成手段と、を備える。
好適に、スクラップマスク生成手段は、マップ領域単位の選択入力及び/又は非選択入力に応じてスクラップマスクを生成する。
本発明に係るスクラップロジックを実装した携帯端末装置等によれば、紙面をカメラで撮影するだけで、紙面画像のひとまとまりの記事が切抜かれたスクラップ画像を自動的に取得することができる。ひとまとまりの記事は、ブロック化解析により決定された仕切りエッジに基づいて生成されたマップ領域の選択されたセットから成り、マップ領域単位での選択、非選択が容易なスクラップマスクが提供される。ユーザはタッチパネルをタップする等の容易な操作で、スクラップされる画像の範囲をマップ領域単位で付加、削除等が可能であり、実用性、利便性に優れる。
図1は本発明に係るスクラップロジックの機能ブロック図である。 図2は紙面画像を模式的に示す。 図3は解析画像のブロック化を説明する図である。 図4は白地ブランクの検出を説明する図である。 図5は白地レクタングルを説明する図である。 図6Aは実施例の横罫線の検出を示す。 図6Bは実施例の縦罫線の検出を示す。 図7Aは余白検出のための白地レクタングルの水平方向の検出を示す。 図7Bは決定された水平余白を示す。 図8Aは余白検出のための白地レクタングルの垂直方向の検出を示す。 図8Bは決定された垂直余白を示す。 図9はレクタングルの連結データを説明するための図である。 図10(A)は閉域検出のための白地レクタングルの水平方向の検出及び閉域候補の検出を示し、図10(B)は決定された水平閉域を示す。 図11(A)は閉域検出のための白地レクタングルの垂直方向の検出及び閉域候補の検出を示し、図11(B)は決定された垂直閉域を示す。 図12はエリア(閉域)データを説明するための図である。 図13は紙面画像に適用される仕切りエッジ及び閉域を模式的に示す。 図14はエッジに基づく区分の検出を説明する図である。 図15はエッジに基づくマップ領域の検出を説明する図である。 図16はエッジに基づくマップ領域の検出を説明する図である。 図17はエッジに基づくマップ領域の検出を説明する図である。 図18はマップ画像を模式的に示す。 図19はスクラップマスクを模式的に示す。 図20はスクラップマスクを模式的に示す。 図21はスクラップマスクを模式的に示す。
以下、図面を参照しながら、本発明のさまざまな特徴が、本発明の限定を意図しない好適な実施例とともに説明される。図面は説明の目的で単純化され、尺度も必ずしも一致しない。
図1に、本発明に係るスクラップロジック100の機能ブロック図が示される。スクラップロジック100は、モバイルデバイス等で実装され得る。モバイルデバイスはスマートフォン、タブレット型端末等の公知の高機能携帯端末装置であってよく、図示しないCPU等制御手段、RAM、ROM等を含む記憶手段、デジタルカメラ等撮影手段、タッチパネル等入出力手段を備える。スクラップロジック100は、ベース画像生成手段10、白地ブロック解析手段20、仕切りエッジ決定手段30、区分検出手段40、マップ画像生成手段50、及びスクラップマスク生成手段60を備え、カメラにより撮影された紙面画像Iの入力を受けて、選択された紙面画像の部分であるスクラップ画像ISを出力することができる。スクラップロジック100に係る各手段10乃至60は、ソフトウェア、ファームウェア、ハードウェア、又はあらゆるそれらの組み合わせにおいて実装することができる。
図2に、モバイルデバイスのカメラにより撮影される紙面画像Iが模式的に示される。紙面画像Iは概してカラー画像であり、種々のサイズを有し得る。撮影される紙面が新聞、雑誌等である場合、紙面は一つ以上の記事の見出しや、段組みされた記事本文、写真、イラスト、広告等を含む場合がある。モバイルデバイスのカメラで撮影される紙面画像に含まれる罫線は、概して、画像のX方向、Y方向に正しく整列せず、傾いたり歪んだりする場合がある。図2の例示的な紙面画像Iは、主に縦罫線L1、L2等がY方向に対して傾いた台形歪みを示す。
ベース画像生成手段10は上記のような紙面画像Iを、後続の白地ブロック解析手段20による罫線等の検出のために適宜スケーリングし、及び/又は必要に応じて、後述するブロックサイズで割り切れるようにトリミングする。
白地ブロック解析手段20は、ベース画像を二値化し、検出対象に応じたフィルタを適宜実行することにより解析画像を生成し、一定のブロックサイズにブロック化して罫線、余白、及び閉域の検出を行う。
図3(a)、(b)は、解析画像IAのブロック化を示す。図3(a)は、解析画像IAを水平(幅W)方向について所定のブロックサイズΔwでブロック化するものであり、図3(b)は、解析画像IAを垂直(高さH)方向について所定のブロックサイズΔhでブロック化するものである。本発明に係る白地ブロック解析は、上記ブロック化により、傾きを有する罫線等を精度よく検出し得る。
例えば、図4の上図を参照して、多数の画素(格子のひとマスが1画素を表すものとする)から成る解析画像から罫線(白画素で表される)を抽出する場合、幅方向(X方向)又は高さ方向(Y方向)のヒストグラムを調べたり、白画素を単にX方向やY方向に追跡しても、傾いた罫線のため精度よく検出することができない。
本発明に係る白地ブロック解析は、X方向やY方向に必ずしも整列することなく伸長する罫線等の特徴を抽出するように、水平方向及び垂直方向に所定のブロックサイズだけ連続する白画素(以下適宜、「ブランク」という)を検出する。図示の例は、水平方向に伸長する特徴を抽出するために、水平方向に6画素のブロックサイズで(Δw=6画素)ブロック化したものであり、水平方向の6画素(6×1画素)全てが白画素であるとき、当該6画素がブランク(白地)として検出される。ブロックの6画素において一つ以上黒画素があれば、当該ブロックはブランクとみなされない。図4の下図は、本発明に係るブロック解析によるブランクの検出(白抜きの部分)を示すものであり、グレーで色塗りされた部分は、白画素であるが白地ブランクとして検出されない部分を示す。
図5は、ブロックサイズΔw(=6画素)で水平ブロック化された一つのブロックにおいて検出されたブランクとレクタングルの関係を示す。ブランクはΔw×1画素(垂直方向のブロック化では1×Δw画素)のサイズを持ち、レクタングルは、ブロック内で連続するブランクをまとめたものである。図示の例では、レクタングルR1は8つのブランク(6×8画素)から成り、レクタングルR2は4つのブランク(6×4画素)から成る。これらの白地レクタングルは、それぞれ右上及び左下の座標(ラスタデータ)をメモリ等記憶手段(図示せず)に記憶される。本発明に係る罫線や余白、閉域の検出は、このような白地レクタングルの検出に基づく。
白地ブロック解析において、ブロックサイズが1画素に近づくと、水平方向や垂直方向の特徴が表れにくいため好ましくない。ブロックサイズが大きすぎると、罫線等の傾き等によってはブランクが十分に検出されない恐れがあり好ましくない。このためブロックサイズは、ブランクが十分に検出されるように、1画素より大きなサイズに設定されることが好ましい。例えば、公知のモバイルデバイスのカメラの解像度に鑑みて、新聞、雑誌についてブランクを検出する場合、ブロックサイズは、数画素乃至数十画素の範囲にあり得る。適切な検出が行われる限り、ブロックサイズはこれらに限定されなくてもよい。
図6A及び図6Bに、実施例の水平方向/垂直方向ブロック解析により検出される横罫線/縦罫線がそれぞれ白抜きの部分として示される。図中、黒い部分は、解析画像における黒画素であり、グレーの部分は、罫線として検出されない白画素を示す。
罫線の検出では、まず、ベース画像をネガ二値化した解析画像I1についてブロック毎に白地ブランクが検出され、白地レクタングルとして保持される。それぞれのレクタングルの連結等に基づいて、罫線らしい一群のレクタングルが決定される。例えば、互いに連結する一群のレクタングルの長さ(ブロック数)の最小値やアスペクト比等に基づいて、罫線を構成する一群のレクタングルが決定され得る。
ブロック間のレクタングルの連結は、一つのブロックのレクタングルが、隣り合うブロックのレクタングルに接するときに、連結するとみなされ得る。また、罫線の傾き等に鑑みて、ブロック間のレクタングルが接していない場合も、所定の条件を満たせば連結すると見なされ得る。所定の条件は、連結誤差として予め設定されてよい。例えば、水平方向ブロック化による横罫線の検出では、一つのブロックのレクタングルの上端又は下端が、左右(前後)のブロックのレクタングルから上方向又は下方向に数画素(=連結誤差)離隔していても、連結すると見なされ得る。
続いて、図7A及び図8Aに、余白の検出のための水平/垂直方向ブロック解析による白地レクタングルの実施例の検出がそれぞれ示される。図中に示される多数の短冊状の矩形はそれぞれ検出されたレクタングルを示す。解析画像I2は、元の紙面画像のサイズに応じてスケーリングし二値化(ポジ)し、所定のフィルタを実行したものである。検出されたこれらのレクタングルに基づいて、水平余白、垂直余白がそれぞれ決定される(図7B、図8B)。
なお、解析画像I2を生成するためのフィルタは、二値化画像を水平マトリックス(Δx1×Δy1画素)及び垂直マトリックス(Δx2×Δy2画素)でそれぞれスキャンし、すべて白画素だったときのみ白と判定し、水平及び垂直の二つのスキャン結果を水平、垂直いずれも黒のときに黒画素とし、その他を白画素として合成するものであってよい。Δx1、Δy1、Δx2、Δy2の具体的な値等は、紙面のレイアウトに寄与しない文字間や行間の余白の検出を抑制し、レイアウトに寄与する余白を検出するように、任意に設定されてよい。
検出されたレクタングルはレクタングル同士の連結を調べられ、メモリ等記憶手段により記憶される。レクタングル同士の連結は、例えば、各レクタングルの上辺と下辺の範囲、又は左辺と右辺の範囲が、前後のブロックのレクタングルに接する場合に互いに連結するとみなされる。メモリ等記憶手段は、水平方向及び垂直方向の検出のそれぞれについて、ブロック数×1ブロックのレクタングル最大数(設定値)の二次元配列の形で連結データを保持することができる。
図9に、ブロック数=9(ブロックB0〜B8)、レクタングル最大数=10(R0〜R9)として、例示的な連結データが模式的に示される。図9中、各ブロックで検出されたレクタングル(Rm)の前及び/又は後ろのブロックのレクタングルとの連結が黒のラインで表される(黒く塗りつぶされた矩形はレクタングルがないことを表す)。
レクタングルの連結データからスペースデータが得られる。スペースは、ブロック間で互いに連結する、ブロック当たり一つのレクタングルの集合から成る。ブロック当たり一つのレクタングルとすることで、形状が略矩形のスペースが検出しやすくなり、最終的に紙面の仕切りとなるような余白を検出しやすい。紙面の仕切りになりやすいように、スペースとしての検出には、最小ブロック数等が設定されてよい。
図9を参照して、ブロックB0のレクタングルR0の連結を後続のブロックB1〜B8まで追跡することで、ブロックB0〜B8のそれぞれの先頭のレクタングルR0から成るスペースが検出される。また、ブロックB0のレクタングルR1が連結するレクタングルを後続のブロックB1〜B8にかけて追跡することで、他のスペースが検出される。図9の例において、連結する最小ブロック数=5(すなわち、5以上のレクタングルの連結でスペースとみなす)とすると、以下の表1のように、スペースS0〜S4が検出される。
このようにスペースデータは、各ブロックのレクタングルのリストとして保持される。記憶手段は、水平方向及び垂直方向の検出のそれぞれについて、ブロック数×スペース最大数(設定値)の二次元配列の形でスペースデータを保持することができる。
水平方向の検出及び垂直方向の検出のそれぞれのスペースデータに基づいて、水平方向に伸長する余白(水平余白)及び垂直方向に伸長する余白(垂直余白)がそれぞれ決定される。実施例に係る決定された水平余白及び垂直余白(レクタングルの集合で表される)が、図7B及び図8Bにそれぞれ示される。紙面のレイアウトに寄与するという目的のために、余白は罫線に準ずる性質(最小長さ、アスペクト比等)を持つことが好ましい。例えば、水平検出のスぺースを構成する各レクタングルの高さにばらつきがある場合、仕切りとして機能するのは、スペースの部分であり得る。このため余白は、検出されたスペースを適宜補正することで決定され得る。例えば、ブロック毎のレクタングルの高さの平均値を計算し、平均値以下のレクタングルから最大高さのレクタングルを選択して起点のブロックとし、該起点のブロックの辺(上下又は左右)の位置と前/後のブロックのレクタングルの辺の位置を比較し、隣り合うレクタングルの辺の位置の差が一定以下となるように順次補正することで、水平又は垂直方向に細長い特徴を持つ、一連のレクタングルから成る水平余白、垂直余白が決定され得る。
次に、本発明に係る閉域の検出が説明される。新聞等の紙面では概して、記事の見出しは記事本文とは区別されて配置され、そのような区別のために見出しは、その周囲を取り囲む余白を有すると考えられる。このことに鑑みて本発明は、見出しの存在及びその位置を、OCR処理等によることなく、余白で周囲を取り囲まれた領域(閉域)を調べることによって検出する。検出された閉域は、後続の処理においてレイアウト解析等に利用される。
図10に、実施例の水平方向ブロック化による閉域の検出が示される。図10(A)において、検出された白地レクタングルが白抜きの多数の短冊状の矩形で示され、白地レクタングルとして検出されない白画素はグレーで示される。解析画像I3は、ベース画像を二値化し所定のフィルタを実行したものである。所定のフィルタは、余白の検出に用いる解析画像のためのフィルタと異なってよく、同様であってもよい。
閉域の検出においても余白の検出と同様に、レクタングル毎に前後のブロックのレクタングルとの連結が調べられ、保持された連結データに基づいてエリア(閉域)が検出される。エリア(閉域)とは、余白で囲まれた閉じた領域であり、例えば、あるブロックのひとつのレクタングルが、後続のブロックで複数(例えば、二つ)のレクタングルに連結し、それらが後続のブロックにかけて連結が途切れることなく、最終的に一つの共通するレクタングルに連結するとき、それら一連のレクタングルは内部に閉じた領域を持つ。
再び図9を参照して、ブロックB0のレクタングルR0は、後続のブロックB1で複数のレクタングルR0〜R7に連結する。このようなとき、複数のレクタングルR0〜R7それぞれについて、後続のブロックにかけて連結(及び、存在する場合は枝分かれの連結)が追跡される。その結果、図12にグレーの色塗り部分で示されるように、ブロックB8のレクタングルR0を共通の連結レクタングルとする一連のレクタングルが抽出される。このような一連のレクタングルに関して、閉じられた領域(エリア)が決定され、記憶手段に保持される。図12の例で検出されるエリアA0及びA1が以下の表2に示される。
記憶手段はエリアデータを、ブロック数×エリア最大数(設定値)の二次元配列で保持することができる。エリアデータは、各ブロックの一対のレクタングルで表されてよい。エリアデータは、各ブロックの一対のレクタングルによって画成される一つのレクタングルによって表されてもよい。
検出されたエリアデータに基づいて、水平閉域及び垂直閉域が決定される。例えば、水平方向の解析で検出されるエリアのうち、横書きの見出しの検出に適するように、所定のサイズやアスペクト比を持つエリアが、水平閉域に決定される。図10(B)に決定された水平閉域A1(薄いグレーの色塗り部分)が示される。
同様に図11(A)に、垂直方向ブロック化解析により検出される白地レクタングルが示され、図10(B)に、縦書きの見出し領域として決定される垂直閉域A3及びA4(薄いグレーの色塗り部分)が示される。
なお、閉域は、後続のOCR処理で見出しのテキストを認識しやすいように、閉域の周縁(上下又は左右)に多少余裕を持たせることが好ましい。従って閉域データは、エリアを検出したときの余白(レクタングル)の幅も記録することで、後処理で必要な余裕を確保できるようにすることが好ましい。
仕切りエッジ決定手段30(図1)は、上記のように決定された水平/垂直罫線及び水平/垂直余白に基づいて、紙面を仕切るためのエッジを決定する。紙面においては、概して、余白に罫線が描かれるなど余白と罫線とが等しく段落を仕切る場合等も多い。そのような余白や罫線に別々に紙面を仕切らせることは適当でなく、従って仕切りエッジは、紙面のレイアウトに有効に寄与するように決定され得る。仕切りエッジ決定手段30は、検出された横罫線(又は縦罫線)及び水平余白(又は垂直余白)をソートして、互いの位置関係を調べることができる。位置関係に応じて、横罫線同士、水平余白同士、又は横罫線と水平余白とをマージすることができる。例えば、余白と罫線の位置が重なる場合、いずれか一方を仕切りエッジに決定し、他方を除去することができる。決定されたエッジは、エッジを構成するレクタングルの集合として記憶手段に保持される。記憶手段はさらに、エッジの中央平均位置(水平エッジであればY座標、垂直エッジであればX座標)、上辺平均位置、下辺平均位置、先頭位置、末尾位置等を保持することが好ましい。
なお、本発明に係る白地ブロック解析は、紙面画像が画像の幅方向や高さ方向から傾いた罫線や余白を含む場合でも、精度よく検出可能なものであるが、罫線や余白を検出する方法は白地ブロック解析によらなくてもよい。例えば、撮影される紙面の傾きや歪みが少ない場合など、罫線や余白の十分な検出が可能である限り、任意の検出方法を用いることができる。
仕切りエッジ決定手段30により選別されたエッジデータは元の紙面画像に適用するために適宜リスケーリングされる。図13に、紙面画像Iに適用されるエッジデータが模式的に示される。図中、格子のひとマスはそれぞれ1画素を表すものとする。水平方向に伸長する仕切りエッジ(以下適宜、水平エッジという)E1、E2、E3、E4、E5、E6、及びE7が濃いグレーの色塗り部分で示され、垂直方向に伸長する仕切りエッジ(以下適宜、垂直エッジという)E8、E9、E10、及びE11がやや薄いグレーの色塗り部分で示される。また、閉域A1、A2がそれぞれパターンで示される。区分検出手段40(図1)は、これら仕切りエッジに基づいて、紙面画像Iの複数の区分を検出する。検出のために、紙面画像Iの四辺E12、E13、E14、及びE15も仕切りエッジとして使用される。
区分検出手段40は、上下左右の四つのエッジのセットによって区分を表す。そのようなエッジのセットは、所定の規則に基づいて検出され得る。
規則は、例えば、一つの水平エッジを基準エッジとして、該基準エッジのY軸上の位置に関して少なくとも部分的に上方に位置し、且つ基準エッジの少なくとも部分のX軸上の位置を挟んで左右に隣り合って位置する二つの垂直エッジと、該左右の垂直エッジと基準エッジとにより形成される凹型を少なくとも部分的に塞ぐ位置にあるもう一つの水平エッジと、基準エッジとを合わせて一組のエッジとするものである。例えば、図14の水平エッジh2を基準エッジとすると、該基準エッジの位置に対して少なくとも部分的に上方に位置する垂直エッジとしてエッジv1、v2、v3、v4及びv5が挙げられ、基準エッジh2の少なくとも部分のX軸上の位置を挟んで左右に隣り合って位置する左右の垂直エッジの組み合わせは、垂直エッジv1及びv2、垂直エッジv2及びv3、及び垂直エッジv3及びv5となる。水平エッジh2、垂直エッジv1及びv2、及びこれらにより形成される凹型を塞ぐような位置にある水平エッジh3が、区分を表す一組のエッジとなる。同様に、水平エッジh2、垂直エッジv2、v3、及び水平エッジh1が区分を表すもう一組のエッジとなり、水平エッジh2、垂直エッジv3、v5、及び水平エッジh1が区分を表すさらにもう一組のエッジとなる。
区分検出手段40は、区分を表す一組のエッジを検出し、記憶手段に保持させる。図13の例では、水平エッジを上から下へ順に基準エッジとして検出することにより、以下の表3のように区分が検出され得る。
マップ画像生成手段50(図1)は、上記のようなエッジのセットに基づいて、区分を構成する複数の画素を決定し、決定された複数の画素にマップ番号を付与してマップ領域を生成する。マップ番号は区分番号に対応してよく、区分番号に対応しなくてもよい。
図15を参照して、水平エッジe1、e2、及び垂直エッジe3、e4に基づく領域の画成が説明される。マップ画像生成手段50は、上下の水平エッジe1、e2により領域c1を合成する。このとき、マップ画像生成手段50は、領域c1が単純な矩形となるように、各水平エッジの部分を採用することができる。同様に、マップ画像生成手段50は、左右の垂直エッジe3、e4(の部分)により領域c2を合成する。領域c1と領域c2との重複部分が、マップ領域候補MC1となり得る。
他の例として、図16のように、水平エッジe5、e6の位置(X座標)が重ならない場合、マップ画像生成手段50は、領域p1を補って領域c3を合成する。また、垂直エッジe7、e8の位置(Y座標)が重ならない場合、領域p2を補って領域c4を合成する。領域c3と領域c4との重複部分が、マップ領域候補MC2となり得る。
マップ画像生成手段50は、対向するエッジの位置関係だけでなく、直交するエッジの位置関係に応じてマップ領域を決定することができる。図17に、エッジの位置関係に応じて決定されるマップ領域が模式的に示される。図17中、実線はエッジ又はエッジの部分を示す。
マップ画像生成手段50は、水平エッジの中央平均位置(Y座標)が垂直エッジの先頭から末尾にかけての位置(Y座標)に含まれるかどうかを調べ、上下の水平エッジが垂直エッジに対応する位置を持つか否かを判定する。また、垂直エッジの中央平均位置(X座標)が水平エッジの先頭から末尾にかけての位置(X座標)に含まれるかどうかを調べ、左右の垂直エッジが水平エッジに対応する位置を持つか否かを判定する。判定結果に応じてマップ領域(候補)が形成され得る。
例えば、図17(a)のエッジのセットでは、各エッジは直交する少なくとも一方のエッジ上に対応する位置(実線の丸印)を持つ。この場合、水平合成領域、垂直合成領域(それぞれ破線で示される)の重複部分がマップ領域候補(グレーの色塗り部分)に決定され得る。図17(b)のエッジのセットでは、各水平エッジは各垂直エッジ上に対応する位置(実線の丸印)を持つ。このように対応する位置が四つ(重複するものは除く)エッジ上に存在する場合、それらが矩形の頂点となるように、重複部分(及び合成領域の部分)がマップ領域(グレーの色塗り部分)に決定される。
図17(c)では、上水平エッジと右垂直エッジは互いのエッジ上に対応する位置を持たないが、対応する位置(破線の丸印で示される)は合成領域に含まれる。図17(d)でも、それぞれ上水平エッジと右垂直エッジ、及び下水平エッジと左垂直エッジが互いのエッジ上に対応する位置を持たないが、それぞれ対応する位置(破線の丸印で示される)は合成領域(図示の例では、水平合成領域)に含まれる。このように場合も、四つの対応する位置(実線及び破線の丸印で表される)が矩形の頂点となるように、重複部分と合成領域の部分とがマップ領域候補(グレーの色塗り部分)に決定される。
図17(e)、(f)、及び(g)の例では、直交するエッジ間の一つ以上の対応する位置が、エッジ上に存在せず、合成領域(破線で表される)にも含まれない。図中、そのような対応する位置は、ひし形の印で示される。この場合、マップ画像生成手段50は、ひし形の印の頂点を含む小矩形(パターンで塗りつぶした部分)を、重複領域、及び合成領域の部分(グレーの色塗り部分)に追加し、それにより形成される矩形の領域をマップ領域候補に決定することができる。
上記のように対向するエッジの位置関係、及び直交するエッジの位置関係に基づいてマップ領域候補が判定され、マップ領域候補に含まれる複数の画素のそれぞれにマップ番号を順次紐づけることにより、マップ領域が決定される。好適にマップ領域は、所定の順序で決定される。例えば、マップ画像生成手段50は、記憶手段にマップ領域候補のサイズ(画素数)を記憶させ、サイズの大きいマップ領域候補から順次マップ番号を付与することができる。そのようにすることで、大きなマップ領域候補が小さなマップ領域候補を内包する場合でも、マップ番号が上書きされることで内包される小さなマップ領域を画成することができる。エッジが複数のマップ領域のエッジとなる場合でも、エッジの画素にマップ番号を順次上書きすることにより、エッジの画素は最終的にいずれかのマップ領域に振り分けられる。
マップ画像生成手段50は、マップ番号を付与した後、マップ画像全体をスキャンしてチェックすることが好ましい。これは、すべての区分のマップ領域が決定された後でも、紙面画像にマップ番号を持たない画素が残る場合や、単一のマップ領域が部分的にマップ番号を上書きされて不連続に存在する場合等があるためである。マップ画像生成手段50は、スキャンによりマップ番号を持たない画素を発見したときは、当該画素を追跡し、互いに連結する一連の画素を決定して新たなマップ番号を付与して新たなマップ領域とすることができる。また、分断されたマップ領域を発見したときは、別々のマップ領域を形成するように新たにマップ番号を付与することができる。最終的に、紙面画像の全ての画素がいずれかのマップ領域を形成して成るマップ画像が生成される。
図13の例示的なエッジに基づいて形成された、表3の区分0乃至11に対応するマップ領域から成るマップ画像IMが、図18に模式的に示される。順次上書きを行う結果、マップ領域は、必ずしも単純な矩形とはならない。エッジの画素もすべていずれかのマップ領域に振り分けられる。
スクラップマスク生成手段60(図1)は、生成されたマップ画像に基づいて、紙面画像を、選択されたマップ領域から成るスクラップする領域と、選択されないマップ領域から成るスクラップしない領域とに区分する。スクラップする領域はレイアウト解析に基づいて決定され得る。
レイアウト解析において、まずスクラップマスク生成手段60は、保持された閉域データ及びマップ画像を参照し、閉域を含むマップ領域からスクラップする記事の見出し領域を決定する。例えば、図18のマップ画像IMでは、閉域は領域5と領域7とに存在するため(図13参照)、これらのいずれかを見出し領域に決定することができる。見出し領域は、閉域の位置に基づいて、例えば、紙面画像のより上方にある領域に決定されてよい。見出し領域は、閉域のサイズに基づいて、例えば、より大きいサイズの閉域を持つ領域に決定されてよい。あるいはマップ番号に基づいて、例えば、より小さいマップ番号を持つ領域が見出し領域に決定されてよい。見出し領域は上記によらず、任意の方法で決定されてよい。
スクラップマスク生成手段60は、決定された見出し領域の閉域が垂直見出し(垂直閉域)を表すか水平見出し(水平閉域)を表すかに基づいて、そのような見出しを持つ記事の代表的なレイアウトを想定することができる。代表的なレイアウトは、垂直見出しの場合、見出しの左側直近の領域と、下側の全ての領域を見出しに関連する記事本文領域に決定するものであり得る。水平見出しの場合、見出しの上側の全ての領域と、見出しの下側の全ての領域を見出しに関連する記事本文領域に決定するものであり得る。代表的なレイアウトはこれらに限らず、種々のものが想定され得る。図18の例でマップ領域5が見出し領域に決定された場合、閉域は垂直見出しを表すので、スクラップマスク生成手段60は、新聞等縦書きの紙面のレイアウトを想定し、領域5の左側直近の領域1、2及び4と、領域5の下方の領域8を、見出し領域に関連する記事領域に決定することができる。なお、領域11は領域5の下方に位置するが、エッジが紙面画像の縁を含むため、記事本文が途切れていることを想定し、見出し領域5に関連する領域に決定されない場合がある。
レイアウト解析に基づいて形成される例示的なスクラップマスクM1が図19に示される。スクラップマスクM1は、見出しとその記事本文を構成するとみなされる領域1、2、4、5、及び8をスクラップする領域(図中、白抜き部分で表される)とし、その他をスクラップしない領域(図中、濃淡のグレーの色塗り部分で表される)とするものである。このように、スクラップする領域とそれ以外の領域を明示するスクラップマスクM1が、図示しない携帯端末装置の出力手段(タッチパネル等)を介してユーザに提示される。ユーザは、スクラップする範囲を確認し、それが所望の範囲であれば、タッチパネルに表示される決定ボタン(図示せず)をタップする等により、スクラップする範囲を決定することができる。スクラップマスク生成手段60は、ユーザ操作による決定入力を受けて、スクラップする領域(図19の白抜き部分)のみから成るスクラップ画像(IS)を生成し、記憶手段に保持させることができる。
このように、ユーザは、紙面を撮影するだけで紙面画像の所定の部分をスクラップ対象とするスクラップマスクを提供され、新聞等紙面の記事を実際にハサミ等で切り抜くのと似た感覚で、極めて容易に紙面画像の所望の部分を得ることができる。
紙面のレイアウトは多種多様であり、レイアウト解析に基づいて決定されるスクラップ領域が常にユーザの所望の部分とはならない場合もある。例えば、図19において、スクラップしないとされた領域11が実際には見出し領域5に係る記事を構成する場合等、高精度な検出やレイアウト解析をもってしても対応できないケースがあり得る。
このため、本発明に係るスクラップマスクは、予め決定されたスクラップ領域を提示するだけでなく、スクラップ領域のユーザによる変更操作を容易にするものである。スクラップマスク生成手段60は、入力手段(タッチパネル等)を介したユーザによるマップ領域の選択入力、非選択入力に応じて、マップ領域単位でスクラップ領域の追加、削除を実行する。図19のスクラップマスクM1の例では、予め決定されたスクラップ領域(白抜き部分)に含まれるそれぞれのマップ領域が「選択(ON)」となっており、その他の領域に含まれるマップ領域が「非選択(OFF)」となっている。スクラップマスク生成手段60は、マップ領域のいずれかの部分(画素)について、ユーザによるタップ等の入力を受け付けると、マップ領域全体のON/OFFを反転させて、新たなスクラップマスクを生成する。例えば、図20のように、ユーザが領域11のいずれかの画素をタップ等することにより、領域11が「非選択(OFF)」から「選択(ON)」に反転したスクラップマスクM2が生成される。あるいは、図21のように、ユーザが、見出し領域7を選択すると、スクラップマスク生成手段60は、レイアウト解析により、見出し領域7に関連すると見なされる記事本文から成るマップ領域のON/OFFをまとめて反転させて提示し得る。ユーザ操作に応じた反転のパターン等は任意に設定されてよい。
スクラップマスク生成手段60は、スクラップマスクの生成と併せて、任意のマップ領域についてOCR処理を行ってもよい。例えば、スクラップマスク手段60は、見出し領域に決定された領域のOCR読取結果を、スクラップマスクを表示する際に、画面のいずれかの部分に表示させることができる。ユーザの決定入力によりスクラップ画像が生成されると、スクラップ画像とOCR読取結果が共にデータベースに格納され、スクラップ画像の検索等が容易となる。
上記のような各手段を備えた本発明に係るスクラップロジックは、ソフトウェアアプリケーションの形態でモバイルデバイス等コンピュータ装置にインストールされ、コンピュータ装置のメモリ内に格納されてよい。
本発明に係るスクラップロジックによれば、白地ブロック解析等により傾いた紙面画像からも精度よく仕切りエッジの検出を行うことができ、紙面画像全体を複数の領域に区分して、選択された領域から成る部分を切抜くことができる。また、マップ領域単位での選択、非選択が可能なユーザインターフェースにより、多種多様なレイアウトを有する紙面画像について、タッチパネルにおけるタップ等の容易な操作で紙面画像の所望の部分を切抜きすることができる。
本発明の思想及び態様から離れることなく多くのさまざまな修正が可能であることは当業者の知るところである。したがって、言うまでもなく、本発明の態様は例示に過ぎず、本発明の範囲を限定するものではない。
I 紙面画像
Is スクラップ画像
10 ベース画像生成手段
20 白地ブロック解析手段
30 仕切りエッジ決定手段
40 区分検出手段
50 マップ画像生成手段
60 スクラップマスク生成手段
100 スクラップロジック

Claims (14)

  1. 紙面を撮影して得られる紙面画像から該紙面画像の部分をスクラップするための方法であって、
    前記紙面画像を解析するための解析画像を所定のブロックサイズで水平方向にブロック化し水平方向に連結する複数のレクタングルを検出し、内部に閉じた領域を持つ一連のレクタングルにより水平閉域を決定し、及び前記解析画像を所定のブロックサイズで垂直方向にブロック化し垂直方向に連結する複数のレクタングルを検出し、内部に閉じた領域を持つ一連のレクタングルにより垂直閉域を決定するステップと、
    前記紙面画像に関する複数の仕切りエッジのうち、それぞれ水平方向に伸長する上下の水平エッジ及びそれぞれ垂直方向に伸長する左右の垂直エッジから成るエッジのセットに基づいて前記紙面画像の区分を検出するステップと、
    それぞれの区分に対応するエッジのセットに基づいてマップ領域を決定し、該マップ領域を構成する複数の画素がマップ番号に関連付けられるマップ画像を生成するステップと、
    前記紙面画像を、スクラップする領域とスクラップしない領域とに区分して表示させるスクラップマスクであって、前記スクラップする領域が前記水平閉域及び/又は前記垂直閉域を含む一つのマップ領域を見出し領域に決定し、該見出し領域に関連する一つ以上のマップ領域を決定することにより選択されたマップ領域から成るスクラップマスクを生成するステップと、
    決定されたマップ領域から成るスクラップ画像を生成するステップと、を含む紙面画像のスクラップ方法。
  2. 前記スクラップマスクが、ユーザ操作に基づく前記マップ領域単位の選択入力及び/又は非選択入力を受けつけるように生成されることを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  3. 前記紙面画像が一つ以上の記事を含み、
    前記スクラップマスクにおいて、予め単一の記事を構成するとみなされる一つ以上のマップ領域がマップ領域単位で非選択可能であり、その他の一つ以上のマップ領域がマップ領域単位で選択可能であることを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  4. 前記スクラップマスクを生成するステップにおいて、前記見出し領域について光学式文字認識(OCR)処理が行われることを特徴とする請求項3に記載された紙面画像のスクラップ方法。
  5. 前記マップ画像において、前記紙面画像の全ての画素がそれぞれのマップ番号を持つことを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  6. 前記水平エッジが、前記紙面画像を解析するための解析画像を所定のブロックサイズで水平方向にブロック化して検出される前記紙面の横罫線及び/又は水平方向に伸長する余白に基づいて決定され、前記垂直エッジが、前記解析画像を前記所定のブロックサイズで垂直方向にブロック化して検出される前記紙面の縦罫線及び/又は垂直方向に伸長する余白に基づいて決定されることを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  7. 前記所定のブロックサイズが、前記紙面画像の幅方向や高さ方向に対して整列しない罫線及び/又は余白を検出するのに適するように決定されることを特徴とする請求項6に記載された紙面画像のスクラップ方法。
  8. 前記解析画像が、前記所定のブロックサイズに応じて前記紙面画像をトリミングして生成されることを特徴とする請求項6に記載された紙面画像のスクラップ方法。
  9. 前記エッジのセットが、一つの水平エッジから成る基準エッジと、該基準エッジの垂直方向の位置に関して少なくとも部分的に上方に位置し、且つ前記基準エッジの少なくとも部分の水平方向の位置を挟んで左右に隣り合って位置する二つの垂直エッジと、該左右の垂直エッジと前記基準エッジにより形成される凹型を少なくとも部分的に塞ぐ位置にあるもう一つの水平エッジとから成ることを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  10. 前記マップ領域が、前記上下の水平エッジの少なくとも部分を含む矩形の領域と、前記左右の垂直エッジの少なくとも部分を含む矩形の領域との重複部分を少なくとも含むことを特徴とする請求項1に記載された紙面画像のスクラップ方法。
  11. 前記マップ領域が、対向するエッジの位置関係、及び直交するエッジの位置関係に応じて前記重複部分に追加される領域を含むことを特徴とする請求項10に記載された紙面画像のスクラップ方法。
  12. 請求項1ないし11のいずれかに記載の紙面画像のスクラップ方法をコンピュータに実行させるプログラム。
  13. 紙面を撮影して得られる紙面画像から該紙面画像の部分をスクラップするように構成される装置であって、
    前記紙面画像を解析するための解析画像を所定のブロックサイズで水平方向にブロック化し水平方向に連結する複数のレクタングルを検出し、内部に閉じた領域を持つ一連のレクタングルにより水平閉域を決定し、及び前記解析画像を所定のブロックサイズで垂直方向にブロック化し垂直方向に連結する複数のレクタングルを検出し、内部に閉じた領域を持つ一連のレクタングルにより垂直閉域を決定するための解析手段と、
    前記紙面画像に関する複数の仕切りエッジのうち、それぞれ水平方向に伸長する二つの水平エッジ及びそれぞれ垂直方向に伸長する二つ垂直エッジから成るエッジのセットに基づいて、前記紙面画像の区分を検出するための区分検出手段と、
    それぞれの区分に対応するエッジのセットに基づいてマップ領域を決定し、該マップ領域を構成する複数の画素がマップ番号に関連付けられるマップ画像を生成するためのマップ画像生成手段と、
    前記紙面画像を、選択されたマップ領域から成るスクラップする領域と、その他のマップ領域から成るスクラップしない領域とに区分して表示させるスクラップマスクを生成するためのスクラップマスク生成手段であって、前記水平閉域及び/又は前記垂直閉域を含む一つのマップ領域を見出し領域に決定し、該見出し領域に関連する一つ以上のマップ領域を決定することにより前記スクラップする領域を決定するスクラップマスク生成手段と、を備えるスクラップ装置。
  14. 前記スクラップマスク生成手段が、前記マップ領域単位の選択入力及び/又は非選択入力に応じてスクラップマスクを生成することを特徴とする請求項13に記載されたスクラップ装置。
JP2016240823A 2016-12-13 2016-12-13 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置 Active JP6353893B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016240823A JP6353893B2 (ja) 2016-12-13 2016-12-13 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016240823A JP6353893B2 (ja) 2016-12-13 2016-12-13 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置

Publications (2)

Publication Number Publication Date
JP2018097551A JP2018097551A (ja) 2018-06-21
JP6353893B2 true JP6353893B2 (ja) 2018-07-04

Family

ID=62633647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016240823A Active JP6353893B2 (ja) 2016-12-13 2016-12-13 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置

Country Status (1)

Country Link
JP (1) JP6353893B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6598402B1 (ja) * 2018-08-28 2019-10-30 株式会社アイエスピー レシート等帳票画像自動取得・読取方法、プログラム、及び携帯端末装置
CN112639713A (zh) * 2018-12-29 2021-04-09 深圳市柔宇科技股份有限公司 一种笔记局部选取方法、装置、电子终端和可读存储介质
JP7243981B2 (ja) * 2019-03-08 2023-03-22 国立大学法人秋田大学 紙面領域分類装置及びそのプログラム
JP6878739B1 (ja) * 2020-03-16 2021-06-02 株式会社アイエスピー シリアルナンバー等文字列抽出サーバ、方法及びプログラム
CN113033338B (zh) * 2021-03-09 2024-03-29 太极计算机股份有限公司 电子报头版头条新闻位置识别方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57199066A (en) * 1981-06-02 1982-12-06 Toshiyuki Sakai File forming system for cutting of newspaper and magazine
JP3304233B2 (ja) * 1995-04-21 2002-07-22 シャープ株式会社 携帯型画像読取装置
JPH09305704A (ja) * 1996-05-20 1997-11-28 Sharp Corp 文書処理装置
JP2001282784A (ja) * 2000-03-31 2001-10-12 Minolta Co Ltd 電子記事表示装置及び電子記事データ構造
JP2007066084A (ja) * 2005-08-31 2007-03-15 Ricoh Co Ltd 文書処理装置、文書処理方法、および文書処理用プログラム
JP5362052B2 (ja) * 2012-01-24 2013-12-11 Eizo株式会社 表示装置、画像処理装置、画像領域検出方法及びコンピュータプログラム

Also Published As

Publication number Publication date
JP2018097551A (ja) 2018-06-21

Similar Documents

Publication Publication Date Title
JP6353893B2 (ja) 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置
US10958796B2 (en) Image processing apparatus, image processing method, and storage medium
AU2006253155B2 (en) Method, system, digital camera and ASIC for geometric image transformation based on text line searching
JP5854802B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
EP3940589B1 (en) Layout analysis method, electronic device and computer program product
JP3821267B2 (ja) 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
EP1017011A2 (en) Block selection of table features
CN107452035B (zh) 车道线图像分析方法、装置及其计算机可读取式媒体
US6947596B2 (en) Character recognition method, program and recording medium
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
US10984277B2 (en) Image analysis apparatus, image analysis method, and non-transitory computer readable medium
KR101903617B1 (ko) 복수 개의 객체 이미지를 포함한 정적인 디지털 결합 이미지의 편집 방법
JPH1031716A (ja) 文字行抽出方法および装置
US11190684B2 (en) Image processing apparatus, image processing method, and storage medium
JP6434568B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP7243981B2 (ja) 紙面領域分類装置及びそのプログラム
JP2013149210A (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
JP7418158B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP4080157B2 (ja) 画像処理装置、画像処理方法、及び記録媒体
US11158058B2 (en) Information processing apparatus and non-transitory computer readable medium for processing images of punched holes
JPH10222688A (ja) 画像処理方法
JPH05303644A (ja) 画像処理装置の図形認識方法
JP7416571B2 (ja) 物品認識装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180611

R150 Certificate of patent or registration of utility model

Ref document number: 6353893

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250