JP5981876B2 - 情報処理装置、方法およびプログラム - Google Patents

情報処理装置、方法およびプログラム Download PDF

Info

Publication number
JP5981876B2
JP5981876B2 JP2013091647A JP2013091647A JP5981876B2 JP 5981876 B2 JP5981876 B2 JP 5981876B2 JP 2013091647 A JP2013091647 A JP 2013091647A JP 2013091647 A JP2013091647 A JP 2013091647A JP 5981876 B2 JP5981876 B2 JP 5981876B2
Authority
JP
Japan
Prior art keywords
image data
book
length
image
cover
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013091647A
Other languages
English (en)
Other versions
JP2014215766A (ja
Inventor
智恵子 村井
智恵子 村井
光博 岩瀬
光博 岩瀬
真悟 泉
真悟 泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP2013091647A priority Critical patent/JP5981876B2/ja
Priority to US14/158,105 priority patent/US9300831B2/en
Priority to CN201410148361.0A priority patent/CN104125368B/zh
Publication of JP2014215766A publication Critical patent/JP2014215766A/ja
Application granted granted Critical
Publication of JP5981876B2 publication Critical patent/JP5981876B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/04Scanning arrangements
    • H04N2201/0402Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207
    • H04N2201/0434Arrangements not specific to a particular one of the scanning methods covered by groups H04N1/04 - H04N1/207 specially adapted for scanning pages of a book

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本開示は、書籍の画像データを処理するための技術に関する。
従来、一連の画像読取処理で読み取られた複数の画像データの形状又は大きさを互いに比較して、読み取られた画像データそれぞれを、背表紙、インデックスシート又は書類に割り当てることや、画像データの縦横比率に基づいて背表紙の画像データを判別することが提案されている(特許文献1を参照)。
また、棚やロッカーなどのファイル収納機器内のファイルのイメージもしくはファイルの外観イメージのみの集合からなるファイルのイメージにおける、ファイルの表示位置と関連づけて書類データの表紙集ファイルを記憶し、その表紙集ファイルから必要とする書類を選択可能とする技術が提案されており(特許文献2を参照)、原稿台に背表紙面をセットして撮像を行い、画像から媒体厚みを測定して、保管量を、画像から実測した媒体厚みの値とする技術が提案されている(特許文献3を参照)。
その他、背表紙を撮像するための装置や(非特許文献1を参照)、画像中の領域を手動で指定して背表紙の画像を切り出すためのソフトウェアが用いられている(非特許文献2および3を参照)。
特開2010−224698号公報 特開2002−157274号公報 特開2011−130266号公報
宮川 拓也、外2名、"仮想書架における背表紙画像生成の自動化"、[online]、2006年03月16日、ディジタル図書館、[2013年4月11日検索]、インターネット(http://www.dl.slis.tsukuba.ac.jp/DLjournal/No_30/3-miyagawa/3-miyagawa.html) "ScanSwapの「表紙切り出し機能」の使い方"、[online]、[2013年4月11日検索]、インターネット(http://www.geocities.jp/payaneco/usr/scanswap/howtotrim.html) 美崎薫、"画像ファイルから背表紙と表紙を作る『backMaker』(SimpleStyle第110回)"、[online]、2012年6月26日、lifehacker、[2013年4月11日検索]、インターネット(http://www.lifehacker.jp/2012/06/120626simplestyle110.html)
従来、電子化された書籍を管理する際に、管理されている書籍が本棚やキャビネットに並べられたイメージを情報処理装置のディスプレイ等に表示することが行われている。しかし、このようなイメージを実際の本棚やキャビネットの外観に近づけるには、書籍の背表紙画像を取得して表示する必要があり、背表紙画像の取得は、ユーザーに煩雑な作業を強いるものであった。
本開示は、上記した問題に鑑み、書籍の背表紙画像を取得するための作業を簡便にする
ことを課題とする。
本開示に係る情報処理装置の一例は、書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する書籍データ取得手段と、前記書籍データに含まれる前記複数の画像データの2辺の長さに基づいて、前記書籍の縦長および横長を取得する長さ取得手段と、前記書籍の縦長および横長と各画像データの2辺の長さとを比較することで、単ページでも見開きページでもないと判定された画像データを、背表紙画像を含む画像データと判定する画像データ判定手段と、を備える情報処理装置である。
また、本開示は、コンピュータによって実行される方法、またはコンピュータに実行させるプログラムとしても把握することが可能である。また、本開示は、そのようなプログラムをコンピュータその他の装置、機械等が読み取り可能な記録媒体に記録したものとしても把握できる。ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。
本開示によれば、書籍の背表紙画像を取得するための作業を簡便にすることが可能となる。
実施形態に係るシステムの構成の概略を示す図である。 実施形態に係る情報処理装置の機能構成の概略を示す図である。 実施形態に係る書籍データに含まれ得る、書籍の1ページについての画像データを示す図である。 実施形態に係る書籍データに含まれ得る、書籍の見開き2ページについての画像データを示す図である。 実施形態に係る書籍データに含まれ得る、書籍の背表紙の画像データを示す図である。 実施形態に係る書籍データに含まれ得る、書籍の表表紙、背表紙並びに裏表紙を含む画像データを示す図である。 実施形態に係る書籍データに含まれ得る、書籍の表表紙または裏表紙と背表紙とを含む画像データを示す図である。 実施形態に係る、画像データ判定処理の流れを示すフローチャートである。 実施形態に係る、背表紙画像取得処理の流れを示すフローチャートである。 実施形態に係る、背表紙画像の領域のユーザー確認画面を示す図である。 実施形態に係る、配置特定処理の流れを示すフローチャートである。 実施形態に係るドキュメント管理システムによる、複数の書籍データの表示画面を示す図である。
以下、本開示に係る情報処理装置、方法およびプログラムの実施の形態を、図面に基づいて説明する。但し、以下に説明する実施の形態は、実施形態を例示するものであって、本開示に係る情報処理装置、方法およびプログラムを以下に説明する具体的構成に限定するものではない。実施にあたっては、実施形態に応じた具体的構成が適宜採用され、また、種々の改良や変形が行われてよい。
本実施形態では、本開示に係る情報処理装置、方法およびプログラムを、ドキュメント管理のためのシステムにおいて実施した場合の実施の形態について説明する。但し、本開
示に係る情報処理装置、方法およびプログラムは、画像データを処理する技術に対して広く用いることが可能であり、本開示の適用対象は、本実施形態において示した例に限定されない。
<システムの構成>
図1は、本実施形態に係るシステムの構成の概略を示す図である。本実施形態に係るシステムは、情報処理装置1と、スキャナ3と、を備える。スキャナ3は情報処理装置1に通信可能に接続される。ここで、情報処理装置1とスキャナ3との接続には、周辺装置の接続用インターフェースが用いられてもよいし、ネットワーク接続用のインターフェースが用いられてもよい。例えば、情報処理装置1とスキャナ3との接続には、USB(Universal Serial Bus)やIEEE1394、LAN(Local Area Network)、インターネット等を用いることが出来る。
情報処理装置1は、CPU(Central Processing Unit)11、RAM(Random Access Memory)12およびROM(Read Only Memory)13等からなる制御部10と、補助記憶装置14と、通信インターフェース15と、キーボードやマウス、タッチパネル等の入力装置16と、ディスプレイ等の出力装置17と、を備える情報処理装置である。但し、情報処理装置1の具体的なハードウェア構成に関しては、実施の形態に応じて適宜省略や置換、追加が可能である。
本実施形態に係る情報処理装置1には、電子ドキュメントを管理するためのドキュメント管理用プログラムがインストールされており、情報処理装置1は、制御部10によってドキュメント管理用プログラムが実行されることで、ドキュメント管理システムとして動作する。情報処理装置1によって管理される書籍データ等の電子ドキュメントは、例えば、スキャナ3を用いて取得することが出来る。
スキャナ3は、書籍等の対象を撮像(スキャン)することで画像データ等のデータを得、得られたデータを情報処理装置1に対して送信する装置である。スキャナ3としては、様々な種類のスキャナが用いられてよい。書籍データの取得のために用いられるスキャナの方式は、本実施形態において例示したものに限定されないが、例えば、所謂オーバーヘッドスキャナや、シートフィードスキャナ、フラットベッドスキャナ等を用いる事ができる。
オーバーヘッドスキャナは、原稿台に載置した撮像対象を、原稿台の上方に支持された撮像装置を用いて撮像する方式を採用するスキャナである。シートフィードスキャナは、撮像対象となる複数のシート状媒体を重ねて原稿台に載置し、これを1枚ずつ搬送しながら撮像する方式を採用するスキャナである。そして、フラットベッドスキャナは、撮像装置が配された読取面に接するように撮像対象を設置し、読取面から撮像する方式を採用するスキャナである。オーバーヘッドスキャナやフラットベッドスキャナであれば、書籍を裁断することなく撮像を行うことができる。また、シートフィードスキャナであれば、書籍を裁断して原稿台に設置することで、ページめくりの作業を行うことなく自動的に複数ページの撮像を行うことが出来る。様々なタイプのスキャナを用いて取得可能な画像データのバリエーションについては、図3から図7を用いて後述する。
図2は、本実施形態に係る情報処理装置1の機能構成の概略を示す図である。本実施形態に係る情報処理装置1は、CPU11が、RAM12に展開された各種プログラムを解釈および実行して、情報処理装置1に備えられた各種ハードウェアを制御することで、書籍データ取得部21、長さ取得部22、画像データ判定部23、配置特定部24、領域特定部25および背表紙画像取得部26を備える情報処理装置として機能する。また、本実
施形態では、これらの機能がいずれも汎用のCPU11によって実行される例について説明しているが、これらの機能は、その一部または全部が、1または複数の専用のプロセッサによって実現されてもよい。
書籍データ取得部21は、書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する。なお、本実施形態では、スキャナ3の出力から書籍データを取得する例について説明するが、書籍データは、スキャナ3以外から得られてもよい。例えば、インターネット等のネットワークを介してサーバ等の装置からダウンロードすることで取得されてもよいし、コンピュータ読取可能な可搬記録媒体から読み出すことで取得されてもよい。取得された書籍データは、補助記憶装置14に記憶される。
なお、本実施形態において、書籍データ取得部21またはスキャナ3は、スキャンによる出力に対して、自動原稿範囲検知および自動トリミングを行う。自動原稿範囲検知は、撮像(スキャン)によって得られた出力において書籍等の原稿が撮像されている範囲を特定する処理であり、例えば、エッジの検出や焦点の判定等によって原稿が撮像されている範囲と原稿以外のもの(例えば、オーバーヘッドスキャナの原稿台やフラットベッドスキャナの原稿押さえ)が撮像されている範囲とが特定される。そして、自動トリミングは、撮像によって得られた出力から、原稿以外のものが撮像されている範囲を除く処理であり、自動トリミングによって、端部まで原稿の画像が撮像されている画像データが生成される。また、裁断せずに書籍が撮像される場合、見開きページの中央部分などに歪が生じることがある。本実施形態において、書籍データ取得部21またはスキャナ3は、このような歪についても、自動補正し、補正された画像データを生成してよい。
なお、本実施形態では、書籍データは、書籍データに含まれる画像データ毎に、画像の縦長(高さ)および横長(幅)を含む。画像の縦長および横長は、画像データの元となった撮像対象の実際のサイズを示すものであり、例えば、スキャナ3によるスキャンの際に取得することが出来る。
また、書籍データは、当該書籍データに係る書籍をユーザーが読む場合のページめくりの方向を示す情報(以下、「めくり方向情報」と称する)を含んでもよい。めくり方向情報は、ユーザーによって手動で設定されてもよいし、スキャナ3または情報処理装置1によって自動的に設定されてもよい。例えば、スキャナ3がオーバーヘッドスキャナである場合、スキャナ3は原稿台に載置された書籍をユーザーがめくる方向を検知して自動的にめくり方向を取得することが可能である。この際、めくり方向の検知にはスキャナ3の撮像装置が用いられてもよいし、その他のセンサーが用いられてもよい。また、情報処理装置1またはスキャナ3は、見開きで2ページ分取得された画像データから、OCR(Optical Character Recognition)の技術を用いてページ番号を取得し、左右のページ夫々に付されたページ番号を比較することで、当該書籍のめくり方向を自動的に取得することが出来る。見開きページの左ページのページ番号が右ページのページ番号よりも小さい場合、ページのめくり方向が右から左である(書籍が左綴じ/左開きである)と判断出来る。一方、見開きページの左ページのページ番号が右ページのページ番号よりも大きい場合、ページのめくり方向が左から右である(書籍が右綴じ/右開きである)と判断出来る。
長さ取得部22は、書籍データに含まれる複数の画像データの2辺の長さに基づいて、書籍の縦長(高さ)および横長(幅)を取得する。より具体的には、長さ取得部22は、書籍データに含まれる各画像データの2辺の長さの情報を取得し、複数の画像データの2辺の長さのうち、所定の基準以上(例えば、全て)の画像データにおいて近似する長さを、書籍の縦長(高さ)として取得する。
図3から図7は、本実施形態に係る書籍データに含まれ得る、書籍の1ページについての画像データ(図3を参照)、見開き2ページについての画像データ(図4を参照)、背表紙の画像データ(図5を参照)、表表紙、背表紙並びに裏表紙を含む画像データ(図6を参照)、及び、表表紙または裏表紙と背表紙とを含む画像データ(図7を参照)を示す図である。長さ取得部22は、これらの画像データの2辺の長さの情報を取得し、所定の基準以上(ここでは、全て)の画像データにおいて近似する長さを、書籍の縦長hとして取得する。なお、この際、各画像データの長さにはスキャンの際に生じる誤差や、表紙が内部のページよりも若干大きい事による差が生じ得る。このため、長さ取得部22は、各画像データの長さを比較する際に、近似する長さを書籍の同じ辺に係るものであると判定可能なように、所定の許容範囲(例えば、7%)を設ける。また、ここでは、「所定の基準以上」との条件が「全て」である場合について説明したが、「所定の基準以上」との条件には、その他の条件が用いられてもよい。例えば、「所定の基準以上」との条件として、「最も多くの」との条件が採用されてもよい。最も多くの画像データが近似する長さを有している場合、この長さは、書籍の縦長である可能性が高い。通常の書籍では、表紙、背表紙、書籍中のページを通して一定である長さは縦長であるからである。
更に、長さ取得部22は、複数の画像データの2辺の長さのうち、縦長として取得されなかった方の長さ、または縦長として取得されなかった方の長さの半分の長さを、書籍の横長wとして取得する。より具体的には、長さ取得部22は、各画像データの2辺の長さのうち、縦長として取得されなかった方の長さを、当該画像データの横長とする(例えば、図3のw、図4の2w、図5のD、図6の2w+D、図7のw+D)。そして、長さ取得部22は、書籍データに含まれる複数の画像データの横長を比較し、複数の画像データにおいて等倍または2倍した場合に近似する長さがある場合、この長さを、書籍の横長wとして取得する。
画像データ判定部23は、書籍の縦長および横長と各画像データの2辺の長さとを比較することで、単ページでも見開きページでもないと判定された画像データを、背表紙画像を含む画像データと判定する。より具体的には、画像データ判定部23は、一辺の長さが書籍の縦長と近似するが、他辺の長さが書籍の横長とも当該横長の2倍とも近似しない画像データを、背表紙画像を含む画像データと判定する。例えば、図3から図7に示された画像データの例では、図5から図7に示された画像データが、一辺の長さが書籍の縦長hと近似するが他辺の長さが書籍の横長wとも当該横長の2倍(2w)とも近似しないため、背表紙画像を含む画像データと判定される。
配置特定部24は、書籍のめくり方向を示すめくり方向情報に基づいて、背表紙画像を含む画像データのうち表表紙または裏表紙が配置された側を特定する。より具体的には、配置特定部24は、書籍データに含まれるめくり方向情報を取得し、めくり方向が右から左である(書籍が左綴じ/左開きである)場合、表表紙が背表紙の右側に、裏表紙が背表紙の左側に配置されていると特定する。一方、めくり方向が左から右である(書籍が右綴じ/右開きである)場合、表表紙が背表紙の左側に、裏表紙が背表紙の右側に配置されていると特定する。但し、スキャンされた画像データによっては、画像の上下が入れ替わっている可能性もある。このため、配置特定部24による判定処理は、画像の上下判定処理や、書籍データに含まれる画像データの順序に基づく表紙データの推定処理(書籍データにおいて先に登場した画像データを、表表紙を含む画像データと推定する)等と組み合わせて行われることが好ましい。画像の上下判定は、例えば、画像の方向を変えながらOCR処理を行い、OCR処理の成功/不成功を判定する方法等で行うことが可能である。
領域特定部25は、背表紙画像を含む画像データのうち、背表紙画像の領域(以下、「背表紙領域」とも称する)を、書籍の横長等の情報に基づいて特定する。具体的には、領域特定部25は、背表紙画像を含む画像データの横長が書籍の横長未満である場合、当該
画像データ全体を、背表紙画像の領域として特定する。例えば、図5に示された画像データは、横長(書籍の深さ)Dが書籍の横長w未満であるため、当該画像データ全体が、背表紙画像の領域として特定される。
また、領域特定部25は、背表紙画像を含む画像データの横長が書籍の横長の2倍を超える場合、書籍の横長分の画像を当該画像データの両側から除いた領域を、背表紙画像の領域として特定する。例えば、図6に示された画像データは、横長w+D+wが書籍の横長wの2倍を超えるため、書籍の横長w分の画像が当該画像データの両側から除かれた領域(図中に斜線で示された領域)が、背表紙画像の領域として特定される。
また、領域特定部25は、背表紙画像を含む画像データの横長が書籍の横長を超え且つ書籍の横長の2倍未満である場合、当該画像データの、配置特定部24によって特定された側から書籍の横長分の画像を除いた領域を、背表紙画像の領域として特定する。例えば、図7に示された画像データは、横長D+wが書籍の横長wを超え且つ書籍の横長の2倍未満であるため、配置特定部24によって特定された側から書籍の横長w分の画像が除かれた領域(図中に斜線で示された領域)が、背表紙画像の領域として特定される。なお、本実施形態に係る処理は、書籍の厚さ(深さ)Dは書籍の幅wを超えない(即ち、D<w)との前提で行われる。
ここで、「配置特定部24によって特定された側」とは、当該画像データが左綴じ/左開き書籍の表表紙を含む画像データである場合、画像データの右側であり、当該画像データが左綴じ/左開き書籍の裏表紙を含む画像データである場合、画像データの左側である。一方、当該画像データが右綴じ/右開き書籍の表表紙を含む画像データである場合、画像データの左側であり、当該画像データが右綴じ/右開き書籍の裏表紙を含む画像データである場合、画像データの右側である。
なお、領域特定部25は、背表紙画像の領域をより正確に特定するために、上記説明した書籍の横長wを用いた処理と併せて、画像解析による表表紙または裏表紙と背表紙との境界検出を行ってもよい。例えば、領域特定部25は、上記説明した処理によって特定された領域およびその周辺を画像解析し、背景色の境界や線等を検出し、検出結果に応じて領域を修正することで、背表紙画像の領域をより正確に特定することが出来る。
背表紙画像取得部26は、背表紙画像を含む画像データから、領域特定部25によって特定された領域を切り出すことで、背表紙の画像データを取得する。図5から図7に示された例では、斜線部分が背表紙画像の領域として特定されているため、この斜線部分が切り出され、背表紙の画像データが取得される。
<処理の流れ>
次に、本実施形態に係る処理の詳細を説明する。なお、本実施形態において説明される処理の具体的な内容および順序等は、実施する上での一例である。具体的な処理内容および順序等は、実施の形態に応じて適宜選択されてよい。
図8は、本実施形態に係る、画像データ判定処理の流れを示すフローチャートである。本フローチャートに示された画像データ判定処理は、スキャナ3によってスキャンされた書籍データが情報処理装置1宛に出力されたことを契機として開始される。
ステップS101では、書籍データが取得される。ユーザーがスキャナ3を用いて書籍をスキャンし、スキャナ3によってスキャンされた書籍データが情報処理装置1宛に出力されると、書籍データ取得部21は、スキャナ3の出力から、書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する。その後、処理はステップS102
へ進む。
ステップS102およびステップS103では、書籍データに含まれる画像データの各辺の長さが取得され、所定の基準以上の画像データにおいて長さが近似する辺が特定される。長さ取得部22は、書籍データに含まれる画像データ毎に、画像データの各辺の長さを取得する(ステップS102)。そして、長さ取得部22は、取得された画像データの各辺の長さを、複数の画像データ間で比較することで、所定の基準以上(例えば、全て)の画像データにおいて長さが近似する辺を特定する(ステップS103)。その後、処理はステップS104へ進む。
ステップS104では、「所定の基準以上の画像データにおいて長さが近似する辺」を有さない画像データが、「その他の画像データ」に分類される。画像データ判定部23は、ステップS103において特定された、「所定の基準以上の画像データにおいて長さが近似する辺」を有さない画像データを、表紙の画像データでも書籍内のページの画像データでもない「その他の画像データ」に分類する。これは、「所定の基準以上の画像データにおいて長さが近似する辺」が、書籍の縦長であると推定され、このような辺を有さない画像データは、表紙の画像データでも書籍内のページの画像データでもないと推定できるからである。その後、処理はステップS105へ進む。
ステップS105では、画像データの縦長および横長が設定される。具体的には、長さ取得部22は、夫々の画像データについて、ステップS103において特定された「所定の基準以上の画像データにおいて長さが近似する辺」の長さを、画像データの縦長として設定し、各画像データの2辺の長さのうち、縦長として取得されなかった方の長さを、画像データの横長として設定する。その後、処理はステップS106へ進む。
ステップS106では、書籍の縦長および横長が設定される。長さ取得部22は、ステップS105において夫々の画像データの縦長として設定された互いに近似する長さに基づいて、書籍の縦長を決定する。ここで、書籍の縦長は、夫々の画像データの縦長に近似する長さに決定されればよい。例えば、複数の画像データの縦長のうちの何れかが書籍の縦長として決定されてもよいし、複数の画像データの縦長を平均することで算出された長さが書籍の縦長として決定されてもよいし、標準的な書籍の縦長(以下、「標準縦長」という)を予め複数保持しておき、これら複数の標準縦長の中から、複数の画像データの縦長に最も近似する標準縦長が、当該書籍の縦長として決定されてもよい。
また、長さ取得部22は、書籍データに含まれる複数の画像データの横長を比較し、複数の画像データにおいて等倍または2倍した場合に近似する長さがある場合、この長さを、書籍の横長wとして取得する。その後、処理はステップS107へ進む。
ステップS107からステップS108では、書籍の横長の等倍または2倍に近似する横長を有する画像データが抽出され、背表紙画像を含まない画像データに分類される。画像データ判定部23は、一辺の長さが書籍の縦長と近似し、且つ他辺の長さが書籍の横長または当該横長の2倍と近似する画像データを、背表紙画像を含まない画像データ(書籍内のページに係る画像データ、表表紙のみまたは裏表紙のみに係る画像データ)として抽出し(ステップS107)、これらの画像データを、「背表紙画像を含まない画像データ」に分類する(ステップS108)。
ステップS109では、書籍の横長の等倍にも2倍に近似しない横長を有する画像データが、書籍の背表紙画像を含む画像データに分類される。画像データ判定部23は、一辺の長さが書籍の縦長と近似するが、他辺の長さが書籍の横長とも当該横長の2倍とも近似しない画像データを、背表紙画像を含む画像データと判定し、これらの画像データを、「
背表紙画像を含む画像データ」に分類する。その後、本フローチャートに示された処理は終了する。
図9は、本実施形態に係る、背表紙画像取得処理の流れを示すフローチャートである。本フローチャートに示された背表紙画像取得処理は、図8に示された画像データ判定処理が終了したことを契機として開始される。
ステップS201では、背表紙画像を含む画像データが取得される。具体的には、背表紙画像取得部26は、ステップS109において特定された、背表紙画像を含む画像データを、書籍データから取得する。
ステップS202からステップS204では、背表紙画像を含む画像データの構成が判定される。具体的には、領域特定部25は、当該画像データの横長yと、上述したステップS106で決定された書籍の横長wとを比較し、「y<w」である場合、当該画像データが、背表紙のみの画像データ(図5を参照)であると判定する(ステップS202)。ここで、画像データが、背表紙のみの画像データであると判定された場合、処理はステップS206へ進む。なお、本実施形態では、確認画面の出力のため、画像データが背表紙のみの画像データであると判定された場合であっても処理をステップS206へ進めることとしたが、この場合、背表紙画像の切出処理は不要であるため、処理をステップS209へ進めることとしてもよい。
また、領域特定部25は、当該画像データの横長yと、書籍の横長wおよび横長の2倍の長さ2wとを比較し、「w<y<2w」である場合、当該画像データが、表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データ(図7を参照)であると判定する(ステップS203)。ここで、画像データが、表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データであると判定された場合、背表紙が画像の何れの側に位置しているかの判定が必要となるため、処理はステップS205の配置特定処理へ進む。
更に、領域特定部25は、当該画像データの横長yと、書籍の横長の2倍の長さ2wとを比較し、「2w<y」である場合、当該画像データが、背表紙、表表紙および裏表紙が組合わされた画像データ(図6を参照)であると判定する(ステップS204)。ここで、画像データが、表表紙と背表紙と裏表紙とが組合わされた画像データであると判定された場合、処理はステップS206へ進む。
なお、ステップS202からステップS204の判定順序は、本実施形態に示した順序に限定されない。また、ステップS202からステップS204の処理において、画像データが、背表紙のみの画像データ、表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データ、および表表紙と背表紙と裏表紙とが組合わされた画像データの何れでもないと判定された場合、本フローチャートに示された処理は終了する。
ステップS205では、背表紙画像の配置が特定される。配置特定部24は、画像データが表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データであると判定された場合(ステップS203を参照)、書籍のめくり方向を示すめくり方向情報に基づいて、背表紙画像を含む画像データのうち表表紙または裏表紙が配置された側を特定する。なお、本ステップにおいて実行される配置特定処理については、図11を用いて詳述する。背表紙画像の配置が特定されると、処理はステップS206へ進む。
なお、書籍データにめくり方向情報が含まれていない場合、ステップS205に示された処理は行われなくてもよい。この場合、背表紙画像を含む画像データのうちの表表紙または裏表紙が配置された側は、画像解析(例えば、上述した背景色の境界や線等の検出)
やOCR(例えば、後述する販売用情報の検出)、ユーザーによる入力、等に基づいて特定されてよい。
ステップS206では、背表紙画像の領域が特定される。領域特定部25は、背表紙画像を含む画像データのうち、背表紙画像の領域を、書籍の横長に基づいて特定する。ここで、ステップS202において、画像データが、背表紙のみの画像データ(図5を参照)であると判定されている場合、領域特定部25は、当該画像データの全体(斜線部分)を、背表紙画像の領域として特定する。また、ステップS203において、画像データが、表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データ(図7を参照)であると判定されている場合、領域特定部25は、当該画像データの、配置特定部24によって特定された側から書籍の横長分の画像を除いた領域(斜線部分)を、背表紙画像の領域として特定する。一方、ステップS204において、当該画像データが、背表紙、表表紙および裏表紙が組合わされた画像データ(図6を参照)であると判定されている場合、領域特定部25は、書籍の横長分の画像を当該画像データの両側から除いた領域(斜線部分)を、背表紙画像の領域として特定する。その後、処理はステップS207へ進む。
ステップS207では、切出処理の実行前のユーザー確認処理が行われる。情報処理装置1の制御部10は、ステップS206において特定された背表紙画像の領域を、ディスプレイ等の出力装置17を介してユーザーから確認可能に出力し、ユーザーに背表紙画像の領域の確認を促す。
図10は、本実施形態に係る、背表紙画像の領域(背表紙領域)のユーザー確認画面を示す図である。図10では、背表紙画像を含む画像データ全体に重ねて、ステップS206において特定された背表紙領域が示される。図10に示した例では、背表紙領域は、破線の枠で示されている。なお、情報処理装置1は、入力装置16を用いてユーザーにこの破線領域を編集させることで、背表紙領域をユーザーによって調整可能としてもよい。入力装置16を介したユーザーによる確認入力が受け付けられると、処理はステップS208へ進む。
ステップS208では、背表紙画像の切出処理が行われる。背表紙画像取得部26は、背表紙画像を含む画像データから、ステップS206において特定され、ステップS207において必要に応じて調整された領域を切り出すことで、背表紙の画像データを取得する。この際、制御部10は、背表紙画像のサイズを算出してもよい。背表紙画像のサイズは、切出処理が行われる前の「背表紙画像を含む画像データ」のサイズ(縦長および横長)と、「背表紙画像を含む画像データ」に対して領域特定部25が特定した「背表紙画像の領域」が占める広さと、に基づいて算出することが出来る。例えば、図6および図7に示された例では、「背表紙画像を含む画像データ」のサイズ(図6では縦長h*横長2w+D、図7では縦長h*横長w+D)と、背表紙画像の領域が占める広さ(図6では両側から夫々幅wの領域を除いた広さ、図7では片側から幅wの領域を除いた広さ)と、に基づいて、背表紙画像のサイズ(縦長h*横長D)が算出される。その後、処理はステップS209へ進む。
ステップS209では、取得された画像が、書籍データの背表紙の画像データに設定される。背表紙画像取得部26は、ステップS208で取得された画像データ、またはステップS202において背表紙のみの画像データ(図5を参照)であると判定された画像データを、書籍データの背表紙の画像データに設定する。また、制御部10は、ステップS208で背表紙画像のサイズが算出されている場合、背表紙画像のサイズを書籍データに設定してもよい。その後、本フローチャートに示された処理は終了する。
図11は、本実施形態に係る、配置特定処理の流れを示すフローチャートである。本フ
ローチャートに示された配置特定処理は、上述したステップS205の処理を詳述したものであり、ステップS203において、画像データが表表紙または裏表紙の何れか一方と背表紙とが組合わされた画像データであると判定されたことを契機として開始される。
ステップS301からステップS304では、書籍のめくり方向が判定され、更に、対象画像データが、表表紙と背表紙との組み合わせであるか否かが判定される。配置特定部24は、処理に係る書籍データから、めくり方向情報を取得する(ステップS301)。そして、配置特定部24は、取得されためくり方向情報を参照することで、当該書籍データに係る書籍のページのめくり方向が右から左である(書籍が左綴じ/左開きである)か、左から右である(書籍が右綴じ/右開きである)か、を判定する(ステップS302)。
そして、配置特定部24は、対象画像データが、表表紙と背表紙との組み合わせであるか否かを判定する(ステップS303およびステップS304)。この判定には、様々な方法が採用可能であるが、例えば、配置特定部24は、表紙に係る画像データが書籍データ中に2つある場合に、書籍データ中の画像データの順序において先に登場する画像データを、表表紙を含む画像データと推定し、後に登場する画像データを、裏表紙を含む画像データと推定する事が出来る。また、配置特定部24は、表紙に係る画像データが書籍データ中に2つある場合に、バーコード等の販売用情報9(図6および図7を参照)の検出を行い、販売用情報が付されている方の画像データを、裏表紙を含む画像データと推定し、販売用情報が付されていない方の画像データを、表表紙を含む画像データと推定することが出来る。
ステップS302からステップS304の判定処理において、対象画像データが、左綴じ/左開き書籍の表表紙+背表紙の画像データであると判定された場合、処理はステップS305へ進む。また、対象画像データが、左綴じ/左開き書籍の裏表紙+背表紙の画像データであると判定された場合、処理はステップS306へ進む。一方、対象画像データが、右綴じ/右開き書籍の表表紙+背表紙の画像データであると判定された場合、処理はステップS307へ進む。そして、対象画像データが、右綴じ/右開き書籍の裏表紙+背表紙の画像データであると判定された場合、処理はステップS308へ進む。
ステップS305およびステップS308では、背表紙画像の配置が特定される。具体的には、配置特定部24は、表表紙または裏表紙が、画像データの右側に配置されていると特定する。その後、本フローチャートに示された処理は終了し、処理は図9のステップS206へ進む。
ステップS306およびステップS307では、背表紙画像の配置が特定される。具体的には、配置特定部24は、表表紙または裏表紙が、画像データの左側に配置されていると特定する。その後、本フローチャートに示された処理は終了し、処理は図9のステップS206へ進む。
図12は、本実施形態に係るドキュメント管理システムによる、複数の書籍データの表示画面を示す図である。本実施形態に係る情報処理装置、方法およびプログラムによれば、簡便な作業で書籍の背表紙画像を取得し、書籍データに含めることが出来る。このため、複数の書籍データを、本棚を模した表示画面に表示する際に、書籍データ中の背表紙画像を並べて表示することが出来る。
本実施形態に示されたドキュメント管理システムによれば、書籍データ中の複数の画像データの2辺の長さに基づいて書籍の縦横長を取得し、この縦横長に合致しない画像データを、背表紙画像を含む画像データと判定するため、背表紙画像を含む画像データがどの
ような画像データであるかに拘らず、背表紙の領域を特定することが出来る。
更に、本実施形態では、背表紙画像が取得される際に、背表紙画像のサイズ情報も算出され、書籍データに追加されてよい(図9のステップS208およびステップS209を参照)。このため、本実施形態に係るドキュメント管理システムによれば、複数の書籍データをディスプレイ等に表示する際に、書籍の実寸に応じた大小関係で表示することが出来る。このような表示方法によれば、書籍の厚みや高さの再現性が向上するため、表示内容を実際の本棚やキャビネットに近づけることが出来、ユーザーは、目的の書籍を探し出し易くなる。
1 情報処理装置
3 スキャナ

Claims (13)

  1. 書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する書籍データ取得手段と、
    前記書籍データに含まれる前記複数の画像データの2辺の長さに基づいて、前記書籍の縦長および横長を取得する長さ取得手段と、
    前記書籍の縦長および横長と各画像データの2辺の長さとを比較することで、単ページでも見開きページでもないと判定された画像データを、背表紙画像を含む画像データと判定する画像データ判定手段と、
    を備える情報処理装置。
  2. 前記画像データ判定手段は、一辺の長さが前記書籍の縦長と近似するが、他辺の長さが前記書籍の横長とも該横長の2倍とも近似しない画像データを、前記背表紙画像を含む画像データと判定する、
    請求項1に記載の情報処理装置。
  3. 前記長さ取得手段は、前記複数の画像データの2辺の長さのうち、所定の基準以上の画像データにおいて近似する長さを、前記書籍の縦長として取得する、
    請求項1または2に記載の情報処理装置。
  4. 前記長さ取得手段は、前記複数の画像データの2辺の長さのうち、前記縦長として取得されなかった方の長さ、または前記縦長として取得されなかった方の長さの半分の長さを、前記書籍の横長として取得する、
    請求項3に記載の情報処理装置。
  5. 前記背表紙画像を含む画像データのうち、前記背表紙画像の領域を、前記書籍の横長に基づいて特定する領域特定手段を更に備える、
    請求項1から4の何れか一項に記載の情報処理装置。
  6. 前記領域特定手段は、前記背表紙画像を含む画像データの横長が前記書籍の横長未満である場合、該画像データ全体を、前記背表紙画像の領域として特定する、
    請求項5に記載の情報処理装置。
  7. 前記領域特定手段は、前記背表紙画像を含む画像データの横長が前記書籍の横長の2倍を超える場合、前記書籍の横長分の画像を該画像データの両側から除いた領域を、前記背表紙画像の領域として特定する、
    請求項5または6に記載の情報処理装置。
  8. 前記領域特定手段は、前記背表紙画像を含む画像データの横長が前記書籍の横長を超え且つ前記書籍の横長の2倍未満である場合、該画像データの何れか一方の側から前記書籍の横長分の画像を除いた領域を、前記背表紙画像の領域として特定する、
    請求項5から7の何れか一項に記載の情報処理装置。
  9. 前記書籍のめくり方向を示すめくり方向情報に基づいて、前記背表紙画像を含む画像データのうち表表紙または裏表紙が配置された側を特定する配置特定手段を更に備え、
    前記領域特定手段は、前記背表紙画像を含む画像データの前記特定された側から前記書籍の横長分の画像を除いた領域を、前記背表紙画像の領域として特定する、
    請求項8に記載の情報処理装置。
  10. 前記背表紙画像を含む画像データから、特定された前記領域を切り出すことで、前記背
    表紙の画像データを取得する背表紙画像取得手段を更に備える、
    請求項5から9の何れか一項に記載の情報処理装置。
  11. 前記書籍データは、各画像データの縦長および横長の情報を含み、
    前記長さ取得手段は、該情報に基づいて前記書籍の縦長および横長を取得する、
    請求項1から10の何れか一項に記載の情報処理装置。
  12. コンピュータが、
    書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する書籍データ取得ステップと、
    前記書籍データに含まれる前記複数の画像データの2辺の長さに基づいて、前記書籍の縦長および横長を取得する長さ取得ステップと、
    前記書籍の縦長および横長と各画像データの2辺の長さとを比較することで、単ページでも見開きページでもないと判定された画像データを、背表紙画像を含む画像データと判定する画像データ判定ステップと、
    を実行する方法。
  13. コンピュータを、
    書籍の表紙および各ページに係る複数の画像データを含む書籍データを取得する書籍データ取得手段と、
    前記書籍データに含まれる前記複数の画像データの2辺の長さに基づいて、前記書籍の縦長および横長を取得する長さ取得手段と、
    前記書籍の縦長および横長と各画像データの2辺の長さとを比較することで、単ページでも見開きページでもないと判定された画像データを、背表紙画像を含む画像データと判定する画像データ判定手段と、
    として機能させるプログラム。
JP2013091647A 2013-04-24 2013-04-24 情報処理装置、方法およびプログラム Expired - Fee Related JP5981876B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2013091647A JP5981876B2 (ja) 2013-04-24 2013-04-24 情報処理装置、方法およびプログラム
US14/158,105 US9300831B2 (en) 2013-04-24 2014-01-17 Information processing apparatus, method, and recording medium
CN201410148361.0A CN104125368B (zh) 2013-04-24 2014-04-14 信息处理装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013091647A JP5981876B2 (ja) 2013-04-24 2013-04-24 情報処理装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2014215766A JP2014215766A (ja) 2014-11-17
JP5981876B2 true JP5981876B2 (ja) 2016-08-31

Family

ID=51770625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013091647A Expired - Fee Related JP5981876B2 (ja) 2013-04-24 2013-04-24 情報処理装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US9300831B2 (ja)
JP (1) JP5981876B2 (ja)
CN (1) CN104125368B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6179850A (ja) * 1984-09-25 1986-04-23 Mitsubishi Electric Corp スタ−リングエンジン
JP6123486B2 (ja) * 2013-05-28 2017-05-10 ブラザー工業株式会社 画像情報処理装置、およびプログラム
WO2015087383A1 (ja) * 2013-12-09 2015-06-18 株式会社Pfu オーバーヘッド型画像読取装置、画像処理方法、および、プログラム
JP2017146938A (ja) * 2016-02-19 2017-08-24 富士通株式会社 書籍検出装置、書籍検出方法及び書籍検出用コンピュータプログラム
WO2017208368A1 (ja) * 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
JP6946821B2 (ja) * 2017-07-27 2021-10-06 セイコーエプソン株式会社 制御装置、ブックカバーの生産方法および制御プログラム
CN114701264A (zh) * 2022-04-15 2022-07-05 广州标控科技有限公司 一种图书采编预处理方法、装置及系统

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835241A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method for determining the profile of a bound document with structured light
JP4358464B2 (ja) 2000-08-09 2009-11-04 三菱重工業株式会社 電子ファイル装置とそのシステム作成方法及び書類データの選択方法
AU2003270522A1 (en) * 2002-09-10 2004-04-30 Kirtas Technologies, Inc. Automated page turning apparatus to assist in viewing pages of a document
JP3814626B2 (ja) * 2004-04-05 2006-08-30 キヤノン株式会社 画像形成システムおよび制御方法および記憶媒体およびプログラムおよび画像形成装置
JP2007223803A (ja) * 2006-01-27 2007-09-06 Konica Minolta Business Technologies Inc 画像形成システム
JP2007206953A (ja) * 2006-02-01 2007-08-16 Konica Minolta Business Technologies Inc 情報処理装置、及びプログラム
JP2007279832A (ja) * 2006-04-03 2007-10-25 Canon Inc 情報処理装置および情報処理方法および情報処理プログラム
JP2008011024A (ja) * 2006-06-28 2008-01-17 Konica Minolta Business Technologies Inc 画像形成システム及び制御プログラム
JP5132426B2 (ja) * 2008-05-26 2013-01-30 キヤノン株式会社 画像処理装置およびその制御方法
JP2010224698A (ja) 2009-03-19 2010-10-07 Pfu Ltd 画像編集装置、仮想バインダー生成システム、画像編集方法、及びプログラム
JP2011130266A (ja) 2009-12-18 2011-06-30 Oki Data Corp 画像読取装置及び画像読取システム
CN101848307B (zh) * 2010-05-14 2013-05-15 彭煊 文档书籍全自动翻页扫描仪
JP5671906B2 (ja) * 2010-09-17 2015-02-18 富士ゼロックス株式会社 画像処理装置、画像処理システム、プログラム
JP2012208591A (ja) * 2011-03-29 2012-10-25 Visual Japan Inc 書籍の在庫確認システム

Also Published As

Publication number Publication date
CN104125368A (zh) 2014-10-29
JP2014215766A (ja) 2014-11-17
US20140320935A1 (en) 2014-10-30
US9300831B2 (en) 2016-03-29
CN104125368B (zh) 2017-06-06

Similar Documents

Publication Publication Date Title
JP5981876B2 (ja) 情報処理装置、方法およびプログラム
US9241084B2 (en) Scanning implemented software for time economy without rescanning (S.I.S.T.E.R.) identifying multiple documents with first scanning pass and generating multiple images with second scanning pass
US7660458B1 (en) Three-dimensional model construction using unstructured pattern
EP2650821B1 (en) Text image trimming method
JP6849387B2 (ja) 画像処理装置、画像処理システム、画像処理装置の制御方法、及びプログラム
JP6099457B2 (ja) 画像処理装置、領域決定方法及びコンピュータプログラム
US20140362422A1 (en) Handheld device document imaging
JP2013505669A5 (ja)
JP2011166537A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP6971789B2 (ja) 情報処理装置、プログラム及び情報処理方法
US9131124B2 (en) Information reading apparatus and computer-readable storage medium
US10992827B2 (en) Information processing system, information processing apparatus, information processing method, and storage medium to execute layout processing
WO2009094446A1 (en) Method and apparatus for cropping images
US20190058805A1 (en) Image processing apparatus, and method of controlling the same
JP6669390B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2008092451A (ja) スキャナシステム
JP2012015592A (ja) 画像処理装置
CN111144288A (zh) 一种图像处理方法、装置及电子设备
JP6639257B2 (ja) 情報処理装置及びその制御方法
JP5944221B2 (ja) 画像処理プログラムおよび画像処理装置、画像読取装置
JP5953954B2 (ja) 画像処理装置、方法及びプログラム
JP5550309B2 (ja) 画像処理装置及び表示制御方法
JP2017098617A (ja) 画像処理装置、画像処理方法、及びプログラム。
JP2024025569A (ja) 情報処理プログラム、及び情報処理装置
RU2653282C2 (ru) Использование встроенного в сканер программного обеспечения для экономии времени за счет отказа от повторного сканирования

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151009

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160719

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160729

R150 Certificate of patent or registration of utility model

Ref document number: 5981876

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees