JP2004246597A - Image processing device, recording medium and program - Google Patents

Image processing device, recording medium and program Download PDF

Info

Publication number
JP2004246597A
JP2004246597A JP2003035326A JP2003035326A JP2004246597A JP 2004246597 A JP2004246597 A JP 2004246597A JP 2003035326 A JP2003035326 A JP 2003035326A JP 2003035326 A JP2003035326 A JP 2003035326A JP 2004246597 A JP2004246597 A JP 2004246597A
Authority
JP
Japan
Prior art keywords
image
mark
page
title
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003035326A
Other languages
Japanese (ja)
Inventor
Hideaki Yamagata
秀明 山形
Toshifumi Yamaai
敏文 山合
Shinobu Yamamoto
忍 山本
Fumihiro Hasegawa
史裕 長谷川
Yoshihisa Oguro
慶久 大黒
Toshio Miyazawa
利夫 宮澤
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003035326A priority Critical patent/JP2004246597A/en
Publication of JP2004246597A publication Critical patent/JP2004246597A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image processing device, a recording medium and a program capable of obtaining a title image useful for searching a document by extracting a title assigned to the document and obtaining an image of an original document when digitalizing and accumulating the document. <P>SOLUTION: A CPU 401 of the image processing device 400 is equipped with a image processing function for extracting a mark region including a mark for encircling a title from a front page image of an input document and an image processing function for removing the mark from the mark region, and is structured so that the image of mark region after removing the mark and an image of the entire document after removing the mark are accumulated in an image accumulation device 403. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、タイトルが記された表紙を含む文書を電子化して記憶する画像処理装置、記録媒体およびプログラムに関するものである。
【0002】
【従来の技術】
従来の画像処理装置(電子ファイリング装置を含む)は、文書中のタイトルおよびキーワードに色情報を付加することにより、複数の文書を光学的に読み取って文書ごとに分離し、文書ごとの読み取りデータに前記タイトルおよびキーワードを付加して登録している(例えば、特許文献1参照)。ここでは、タイトルの文字部を蛍光ペンで塗った文書を示している。
【0003】
また、複数の文書を光学的に読み取って文書中のタイトルを抽出するとき、入力画像のレイアウト情報(文字領域の属性、行領域のレイアウト的特徴など)に基づいてタイトルを抽出しているものもある(例えば、特許文献2参照)。
【0004】
また、複数の文書を光学的に読み取って文書中のタイトルを抽出するとき、文字列の特徴(文字の大きさ、アスペクト比、網掛けの有無など)に基づいてタイトルを抽出しているものもある(例えば、特許文献3参照)。
【0005】
【特許文献1】
特開平6‐52236号公報(図1)
【0006】
【特許文献2】
特開2002‐297629号公報(図4)
【0007】
【特許文献3】
特開2002‐297638号公報(図1)
【0008】
【発明が解決しようとする課題】
しかしながら、「特許文献1」のような従来の画像処理装置では、例えば、蛍光ペンなどのマーカーでタイトルを囲むようにマーク付けされた文書のマーク検出方法や、スキャンした画像の後処理については具体的な方法が記載されておらず、実際に実施するには充分でないという問題がある。特に、保存文書の画像上にもマーカーの色が残ってしまうため、原本の保管という観点からは好ましくない。また、「特許文献2」、「特許文献3」のような従来の画像処理装置では、例えば、蛍光ペンなどのマーカーでタイトルを囲むようにマーク付けされた文書を読み取って電子化するとき、マーカーの色を利用してタイトル抽出を行う点については配慮がなされておらず、タイトル抽出処理の簡素化についてはさらに改善の余地がある。
【0009】
本発明は、このような問題を解決するためになされたもので、文書を電子化して蓄積するとき、文書に付与されたタイトルを抽出して文書検索に有用なタイトル画像を取得するとともに、原文書の画像を取得することが可能な画像処理装置、記録媒体およびプログラムを提供するものである。
【0010】
【課題を解決するための手段】
請求項1に係る本発明の画像処理装置は、処理対象の文書のタイトルを囲むように、予め指定された指定色のマークが付加されているとき、前記文書の入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出するマーク領域抽出手段と、前記マーク領域から前記マークを除去するマーク除去手段と、前記マーク除去手段により前記マークが除去された後の前記マーク領域の画像、および前記マーク除去手段により前記マークが除去された後の文書全体の画像を記憶する画像記憶手段とを備えた構成を有している。
【0011】
この構成により、マーク除去手段が入力画像からマークを除去した後の文書画像(文書全体の画像)と、マーク除去後のタイトル画像(マーク領域の画像)とを取得するので、マークが付加される前の原文書を電子化できることとなる。また、使用者は、マーク領域の画像(タイトル画像を含む)によって所望の文書を検索できることとなる。
【0012】
請求項2に係る本発明の画像処理装置は、処理対象の文書のタイトルを囲むように、予め指定された指定色のマークが付加されているとき、前記文書の入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出するマーク領域抽出手段と、前記マーク領域から文字画像を含む文字領域を抽出する文字領域抽出手段と、前記マーク領域から前記マークを除去するマーク除去手段と、前記文字領域抽出手段により抽出された文字領域の画像、および前記マーク除去手段により前記マークが除去された後の文書全体の画像を記憶する画像記憶手段とを備えた構成を有している。
【0013】
この構成により、文字領域抽出手段がマーク領域内の文字領域を抽出するので、文書検索に用いるタイトル画像のサイズをマーク領域よりさらに小さくできることとなる。
【0014】
請求項3に係る本発明の画像処理装置は、請求項2において、前記文字画像の文字を認識する文字認識手段を有し、前記画像記憶手段が、前記文字認識手段の認識結果を記憶するようにした構成を有している。
【0015】
この構成により、文字認識手段がマーク領域内の文字を認識するので、文字認識を施さない場合に比べ、鮮明で見やすいタイトル画像を提供できることとなる。
【0016】
請求項4に係る本発明の画像処理装置は、請求項1乃至3のいずれかにおいて、前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えた構成を有している。
【0017】
この構成により、先頭頁判断手段が指定色の画素数によって先頭頁か否かを判断するので、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0018】
請求項5に係る本発明の画像処理装置は、請求項1乃至3のいずれかにおいて、前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えた構成を有している。
【0019】
この構成により、先頭頁判断手段が指定色画素の連結成分の大きさ(例えば、画素数)によって先頭頁か否かを判断するので、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0020】
請求項6に係る本発明の画像処理装置は、請求項1乃至3のいずれかにおいて、前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えた構成を有している。
【0021】
この構成により、先頭頁判断手段が指定色画素の連結成分の外接矩形の大きさによって先頭頁か否かを判断するので、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0022】
請求項7に係る本発明の画像処理装置は、請求項1乃至3のいずれかにおいて、前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えた構成を有している。
【0023】
この構成により、先頭頁判断手段が指定色画素の連結成分の外接矩形内における文字画像の有無によって先頭頁か否かを判断するので、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。また、指定色の画素のみを用いた場合に比べ、より確実に先頭頁を検出できることとなる。
【0024】
請求項8に係る本発明の記録媒体は、コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、第3のステップで前記マークが除去された後の前記マーク領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第4のステップとを実行させるためのプログラムを記録している。
【0025】
この記録媒体により、マーク除去手段が入力画像からマークを除去した後の文書画像(文書全体の画像)と、マーク除去後のタイトル画像(マーク領域の画像)とを取得するようにした画像処理装置を実現し、この画像処理装置によって、マークが付加される前の原文書を電子化して記憶できることとなる。また、使用者は、電子化された文書を検索するとき、マーク領域の画像(タイトル画像を含む)によって所望の文書を検索できることとなる。
【0026】
請求項9に係る本発明の記録媒体は、コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、前記マーク領域から文字画像を含む文字領域を抽出する第4のステップと、第4のステップで抽出された前記文字領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第5のステップとを実行させるためのプログラムを記録している。
【0027】
この記録媒体により、文字領域抽出手段がマーク領域内の文字領域を抽出するようにした画像処理装置を実現し、文書検索に用いるタイトル画像のサイズをマーク領域よりさらに小さくできることとなる。
【0028】
請求項10に係る本発明の記録媒体は、請求項9において、前記コンピュータに、前記文字画像の文字を認識する文字認識ステップを実行させるためのプログラムを記録している。
【0029】
この記録媒体により、文字認識手段がマーク領域内の文字を認識するようにした画像処理装置を実現し、文字認識を施さない場合に比べ、鮮明で見やすいタイトル画像が得られることとなる。
【0030】
請求項11に係る本発明の記録媒体は、請求項8乃至10のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録している。
【0031】
この記録媒体により、先頭頁判断手段が指定色の画素数によって先頭頁か否かを判断するようにした画像処理装置を実現し、この画像処理装置によって、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0032】
請求項12に係る本発明の記録媒体は、請求項8乃至10のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録している。
【0033】
この記録媒体により、先頭頁判断手段が指定色画素の連結成分の大きさ(例えば、画素数)によって先頭頁か否かを判断するようにした画像処理装置を実現し、この画像処理装置によって、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0034】
請求項13に係る本発明の記録媒体は、請求項8乃至10のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録している。
【0035】
この記録媒体により、先頭頁判断手段が指定色画素の連結成分の外接矩形の大きさによって先頭頁か否かを判断するようにした画像処理装置を実現し、この画像処理装置によって、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0036】
請求項14に係る本発明の記録媒体は、請求項8乃至10のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録している。
【0037】
この記録媒体により、先頭頁判断手段が指定色画素の連結成分の外接矩形内における文字画像の有無によって先頭頁か否かを判断するようにした画像処理装置を実現し、この画像処理装置によって、タイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。また、指定色の画素のみを用いた場合に比べ、より確実に先頭頁を検出可能な画像処理装置を実現できる。
【0038】
請求項15に係る本発明のプログラムは、コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、第3のステップで前記マークが除去された後の前記マーク領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第4のステップとを実行させている。
【0039】
このプログラムにより、前述したようにマークが付加される前の原文書を電子化して記憶できることとなる。また、電子化された文書を検索するとき、マーク領域の画像(タイトル画像を含む)によって所望の文書を検索できることとなる。
【0040】
請求項16に係る本発明のプログラムは、コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、前記マーク領域から文字画像を含む文字領域を抽出する第4のステップと、第4のステップで抽出された前記文字領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第5のステップとを実行させている。
【0041】
このプログラムにより、前述したように文書検索に用いるタイトル画像のサイズをマーク領域よりさらに小さくできることとなる。
【0042】
請求項17に係る本発明のプログラムは、請求項16において、前記コンピュータに、前記文字画像の文字を認識する文字認識ステップを実行させている。
【0043】
このプログラムにより、前述したように文字認識を施さない場合に比べ、鮮明で見やすいタイトル画像が得られることとなる。
【0044】
請求項18に係る本発明のプログラムは、請求項15乃至17のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させている。
【0045】
このプログラムにより、前述したようにタイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0046】
請求項19に係る本発明のプログラムは、請求項15乃至17のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させている。
【0047】
このプログラムにより、前述したようにタイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0048】
請求項20に係る本発明のプログラムは、請求項15乃至17のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させている。
【0049】
このプログラムにより、前述したようにタイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。
【0050】
請求項21に係る本発明のプログラムは、請求項15乃至17のいずれかにおいて、前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させている。
【0051】
このプログラムにより、前述したようにタイトル表紙を有する複数部の文書を連続して文書ごとに電子化し、保持できることとなる。また、指定色の画素のみを用いた場合に比べ、より確実に先頭頁を検出できることとなる。
【0052】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて説明する。
[第1の実施形態]
図1は、本発明の第1の実施形態に係る画像処理装置を示す。これは、パーソナルコンピュータなどの汎用処理装置を用いて本発明の画像処理装置を構成し、画像処理機能をソフトウェアによって実現したものである。
【0053】
中央処理装置(以下、CPUという)401は、装置全体を制御し、本実施形態の画像処理機能を実現するものである。メモリ402は、ROMやRAM等で構成され、CPU401の制御プログラムを記憶するとともに、この制御プログラムがCPU401によって実行されるときにー時的に作成される情報等を保持するものである。画像蓄積装置403は、ハードディスクドライブ、ハードディスクなどからなり、このハードディスクに画像処理後の文書(後述するタイトル画像、表紙画像、入力画像を含む)を記憶および蓄積するものである。また、画像蓄積装置403は、前記表紙画像および入力画像を一時保持するための画像バッファメモリ(以下、画像バッファともいう)403a(図3に示す)、前記タイトル画像を一時保持するためのタイトルバッファメモリ(以下、タイトルバッファともいう)403b(図3に示す)、前記タイトル画像、表紙画像、入力画像を含む文書ごとの画像データを蓄積するための保存用メモリ403c(図3に示す)とを有している。さらに、画像蓄積装置403は、前記ハードディスクに記録された文書を読み込み、他の記憶装置へ格納するのに用いられる。画像入力装置404は、スキャナなどで構成され、シート原稿(文書に含まれる)などの画像を読み取り、メモリ402へ格納するものである。また、画像入力装置404には、カラー画像を読み取るために所定のカラーフィルタを有し、後述の指定色のマーク12を読み取ることができるようにしている。入力装置408は、キーボード、マウス、タッチパネル等で構成され、画像処理に関する情報(スキャナの操作情報を含む)の入力に用いられるものである。CD‐ROMドライブ405は、プログラムやデータ等を記録したCD‐ROM407を装着して読み込み、メモリ402へ格納するのに用いられる。出力装置406は、CRT、液晶ディスプレイ(LCD)、またはプリンタ等で構成され、画像入力装置404から入力された原画像、圧縮画像あるいは画像処理結果の2値画像などを表示、印刷するものである。CD‐ROM407(記録媒体に含まれる)には、本実施形態の画像処理機能や処理手順を実現させるためのプログラムやデータ等が記録されている。ネットワーク接続装置409は、画像処理装置400をインターネットなどのネットワークへ接続するものである。前述した装置401〜406、408、409は、バス410によって接続されている。
【0054】
さらに、前述した記録媒体として、CD‐ROM407の他に、半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、ディジタル・バーサタイル・ディスク(DVD)、光磁気ディスク(MO)、ミニディスク(MD)、書き込み可能なCD(CD‐R)等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク(FD)等)などを用いてもよい。
【0055】
また、前述した記録媒体からインストールされたプログラム、換言すれば、前述した記録媒体に記憶されたプログラムとしては、本実施形態の画像処理機能を実現するために用いられる画像処理プログラムがある。ここでは、画像処理プログラムを予めCD‐ROM407等の記録媒体に書き込んでおき、このCD‐ROM407等をCD‐ROMドライブ405などの媒体駆動装置に装着して読み込み、前記画像処理プログラムをメモリ402に格納し、CPU401が実行することによって、本実施形態の画像処理機能を実現するものである。さらに、画像処理プログラムが半導体の記録媒体に記録されている場合には、直接、メモリ402ヘロードされ、実行されることとなる。
【0056】
なお、メモリ402へロードされた画像処理プログラムを実行することにより、本実施形態の画像処理機能が実現されるだけでなく、画像処理プログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって本実施形態の画像処理機能が実現されるようにしてもよい。
【0057】
次に、本実施形態に係る画像処理プログラムを説明する。ここでは、図2のように、1部の文書10が複数枚のシート原稿からなり、文書先頭の表紙11にはタイトル13が記載され、さらにタイトル13を囲むように、予め指定された指定色のマーカーによってマーク12が記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図3に示すステップ(S101〜S109)を実行させるものである。
【0058】
まず、CPU401は、画像入力装置404により、処理対象の原画像を入力する。この取得された原画像のデータは、メモリ402に送出される(S101(第1のステップに含まれる))。
【0059】
次いで、CPU401は、最初に入力された入力画像から、前記指定色の画素を抽出する(S102(第2のステップに含まれる))。
【0060】
次いで、CPU401は、S102で抽出された指定色の画素が表すマーク12の外接矩形を抽出する(S103(第2のステップに含まれる))。
【0061】
次いで、CPU401は、S103で抽出された外接矩形領域(タイトル画像領域14に相当する)において、マーク12を構成する指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S104(第3のステップに含まれる))。前記背景色は、表紙画像中で最も画素数の多い画素値を用いる。また、文字色は、前記指定色、背景色以外の色であって、表紙画像中で最も画素数の多い画素値を用いる。こうして背景色と文字色とを設定した後、タイトル画像領域14に対して2値化処理を施すこととなる。なお、背景色と文字色とを設定した後に、この背景色、文字色以外の画素を中間画素として3値化処理を施し、例えば特開平9‐270917号公報に開示されている補完手法を用いてもよい。
【0062】
次いで、CPU401は、S106でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持し(S105(請求項8、請求項15の第4のステップに含まれる))、マーク12が消去されたタイトル画像領域14を、タイトル画像14aとしてタイトルバッファ403bに保持する(S106(請求項8、請求項15の第4のステップに含まれる))。
【0063】
次いで、CPU401は、全画像の入力が終了したか否かを判断する(S107)。この判断が「NO」の場合はS108に移り、「YES」の場合にはS110に移る。
【0064】
S108では、次の処理対象の画像を入力し、次いで入力画像をそのまま、あるいは適宜圧縮して画像バッファ403aに保持する(S109(請求項8、請求項15の第4のステップに含まれる))。
【0065】
S110(請求項8、請求項15の第4のステップに含まれる)では、タイトルバッファ403bに保持されているタイトル画像14aと、画像バッファ403aに保持されている表紙画像および入力画像とを含む画像群を保存用メモリ403cに蓄積して処理を終了する。
【0066】
ここで、前述の外接矩形抽出処理(S103)についてさらに説明する。
【0067】
まず、CPU401は、S101で取得された画像の各行ごとに前述した指定色のランを求める処理(ラン生成処理)を実行する。なお、ラン(run)とは、一般にある方向に連続して並ぶ同一濃淡レベルの画素列のことであり、この画素列の長さをランレングス(run length)という。ここでは、水平方向(行方向)に隣接する画素の色が指定色に近い場合に、それらをまとめてランとする。また、指定色に近いことを判定する方法としては、例えば画素値の各成分(R、G、Bなど)の差の2乗和を計算し、これを指定色と画素との色相違度(以下、色差という)とみなして、この値が予め定められた値よりも小さい場合に近いと判断するという方法を用いてもよい。さらに、抽出された各ランの色を定義するとき、ここではメジアン(複数のデータを昇順、または降順に整列した際の中央に位置する値)を用いる。なお、このメジアンの他に、例えば各ランの平均値、ランの長さによる加重平均値などを用いることが考えられる。
【0068】
具体的なラン生成処理の手順は以下のとおりである。まず、ある行(例えば、先頭行など)を注目行とし、この注目行のランを構成している画素をランデータとして登録する。次いで、ランを統合する。このとき、左端のランを参照ランとし、その隣のランを注目ランとして、参照ランと注目ランとの色差を比較する。この色差が予め決められた閾値以下の場合には、ラン同士を統合し、一つの長いランとして登録し、この統合したランを新しい参照ランとする。なお、統合後のランの色を設定するにはメジアンを用いる。一方、前述した色差と、予め決められた閾値とを比較した結果、色差が閾値以下でない場合、すなわち色差が閾値よりも大きい場合には、注目ランを新たな参照ランとする。次いで、前述したように統合された新しい参照ランか、または新しく定義された参照ラン(注目ラン)の右隣に、ランがあるか否かを判断する。ここで、新しい参照ランの右隣にランがある場合には、このランを新しい注目ランとして前述したランの統合を繰り返す。また、ここで、新しい参照ランの右隣にランがない場合には、統合を完全なものにするために、ラン統合を再度行うか否かを判断する。具体的には、前記左端のランを参照する処理から、前記右隣にランがあるか否かの判断処理に至るまでの一連の処理を実行した際、注目行のラン統合が1度でも行われたか否かを判断する。ここで、統合したランを新しい参照ランとする処理が1度も実行されなかった場合には、これ以上ランを統合する必要がないので、全ての行のランを抽出したと判断し、この行のラン統合をこれ以上繰り返して行わない。一方、前記注目行のラン統合が1度でも行われている場合には、再度、前記左端のランを参照する処理から、前記右隣にランがあるか否かの判断処理に至るまでの一連の処理を実行する。なお、全ての行におけるランの抽出作業が終了していない場合には、前記注目行を他行に変更して再度、前記ラン生成処理の手順を実行する。以上が前記ラン生成処理の手順である。
【0069】
次いで、CPU401は、前記ランの連結成分を統合する(ラン統合処理)。ここでは、前記ラン生成処理で取得されたランについて、前述した色差を用い、垂直方向に接するもの同士の色を比較し、色が近い場合には、両者を連結成分として統合する。
【0070】
具体的には、まず、前記ラン生成処理により生成されたランデータを連結成分データとしてそのままメモリ402などに登録する。次いで、この連結成分データの中から互いに接触する二つの連結成分データを抽出する。次いで、この二つの連結成分データの色を比較する。ここでは、前記ラン生成処理と同じ方法で色差を求め、この色差を予め決められた閾値と比較する。ここで、前記色差が前記閾値以下の場合には、連結成分同士を統合して一つの連結成分とする。統合された連結成分にも色情報が必要であるが、これも前記ラン生成処理に準じるものとする。一方、前記色差が前記閾値以上の場合には、連結成分同士の統合を行わず、全ての連結成分の組み合せについて連結成分データの色を比較する。すなわち、全ての連結成分の組み合せが終了するまで、互いに接触する二つの連結成分の抽出処理から全ての連結成分の組み合せについて色を比較し、連結成分同士を統合するまでの処理を繰り返す。こうして全ての連結成分の組み合せが完了すると、さらに予め定めておいた回数だけ、前述した処理の手順を繰り返して統合を行う。以上が前記ラン統合処理である。
【0071】
最後に、CPU401は、前記ラン統合処理で統合された連結成分の外接矩形を抽出する。この抽出処理は、マーク12の外接矩形、すなわち本実施形態のタイトル画像領域14(図4に示す)を抽出するものである。
【0072】
以上のように、本発明の第1の実施形態に係る画像処理装置400は、処理対象の文書のタイトル13を囲むように、予め指定された指定色のマーク12が付加されているとき、前記文書の表紙11の画像(入力画像に含まれる)からタイトル13およびマーク12を含むタイトル画像領域14(マーク領域に相当する)を抽出するCPU401の機能(マーク領域抽出手段に含まれる)と、タイトル画像領域14からマーク12を除去するCPU401の機能(マーク除去手段に含まれる)と、このCPU401の機能によりマーク12が除去された後のタイトル画像14a(マーク領域の画像に相当する)、およびCPU401の機能によりマーク12が除去された後の文書10(文書全体の画像に含まれる)を記憶する画像蓄積装置403(画像記憶手段に含まれる)とを備えているので、マーク12が付加される前の原文書を電子化して蓄積できる。また、電子化された複数の文書の中からタイトル画像14aによって文書10を検索できる。
【0073】
なお、前述した実施形態ではタイトル画像14aと入力画像群(マーク12が消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0074】
[第2の実施形態]
本発明の第2の実施形態に係る画像処理装置は、第1の実施形態と概ね同様の構成を有しているため、図1を用いるとともに、同一構成には同一符号を付与して説明を省略する。
【0075】
図5は、本発明の第2の実施形態に係る画像処理プログラムの概略を示す。ここでは、第1の実施形態(図2に示す)に準じ、1部の文書10が複数枚のシート原稿からなり、文書先頭の表紙11にはタイトル13が記載され、さらにタイトル13を囲むように、予め指定された指定色のマーカーによってマーク12が記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。
【0076】
前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図5に示すステップを実行させるものである。なお、第1の実施形態(図3に示す)と同一ステップには、同一符号を付与して説明を簡略にする。
【0077】
まず、CPU401は、第1の実施形態に準じ、画像入力装置404により、処理対象の原画像を入力する(S101)。
【0078】
次いで、CPU401は、第1の実施形態に準じ、最初に入力された入力画像から、前記指定色の画素を抽出する(S102)。
【0079】
次いで、CPU401は、第1の実施形態に準じ、S102で抽出された指定色の画素が表すマーク12の外接矩形を抽出する(S103)。
【0080】
次いで、CPU401は、第1の実施形態に準じ、S103で抽出された外接矩形領域において、前記指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S104)。なお、文字色については、前記指定色、背景色以外の色であって、表紙画像中で最も多い画素値などを用いる。さらに、文字色と背景色とを設定した後に、文字色、背景色以外の色の画素を中間画素として3値化し、例えば特開平9‐270917号公報に開示されている補完手法を用いてもよい。この方法により、より鮮明なタイトル画像を取得できることとなる。
【0081】
次いで、CPU401は、第1の実施形態に準じ、S104でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持する(S105)。
【0082】
次いで、CPU401は、S103で抽出され、S104で画素値の置換処理がなされた外接矩形領域において、タイトル文字列の外接矩形を抽出する(S121(請求項9、請求項16の第4のステップに含まれる))。
【0083】
次いで、CPU401は、S121で抽出されたタイトル文字列の外接矩形をタイトル画像14bとしてタイトルバッファ403bに保持する(S122(請求項9、請求項16の第5のステップに含まれる))。
【0084】
次いで、CPU401は、全画像の入力が終了したか否かを判断する(S107)。この判断が「NO」の場合はS108に移り、「YES」の場合にはS110に移る。
【0085】
S108では、次の処理対象の画像を入力し、次いで入力画像をそのまま、あるいは適宜圧縮して画像バッファ403aに保持する(S109)。
【0086】
S110では、タイトルバッファ403bに保持されているタイトル画像14bと、画像バッファ403aに保持されている表紙画像および入力画像とを含む画像群を保存用メモリ403cに蓄積して処理を終了する。
【0087】
ここで、前述の外接矩形抽出処理(S121)についてさらに説明する。
【0088】
まず、CPU401は、マーク12が消去されたタイトル画像領域14(タイトル画像14aに相当する)において、第1の実施形態に準じ、画像の各行ごとに隣接する文字色の画素(例えば、黒画素)のランを求める処理(ラン生成処理)を実行する。
【0089】
次いで、CPU401は、第1の実施形態に準じ、前記ランの連結成分を生成する(連結成分生成処理)。これは、マーク領域(タイトル画像14aに相当する)内の文字列を抽出するためである。
【0090】
次いで、CPU401は、前記連結成分生成処理で生成された連結成分の中から、予め決められた条件で連結成分を選別して削除する(連結成分選別処理)。これは、前記連結成分生成処理で取得された連結成分の中には、文字でないものが含まれている可能性があるためである。例えば、所定の大きさよりも小さい連結成分はノイズである可能性が高く、これをそのまま後段の処理に渡すと精度の低下や処理速度の低下を招くおそれがある。ここでは、ある一定の大きさ以下の連結成分を選別して削除する。
【0091】
具体的には、まず、前記連結成分生成処理で得られた連結成分の一つを取り出す。次いで、取り出された一つの連結成分が、予め決められた大きさ以下であるか否かを判断する。ここで、連結成分の大きさが所定の大きさ以下である場合には、ノイズとみなして連結成分データから削除する。また、前記一つの連結成分の大きさが所定の大きさより大きい場合には、当該連結成分の明度と、当該連結成分の周囲を取り巻く画素の明度とを比較する。ここでは、背景に対して明度の低い文字を抽出しようとしているので、連結成分の周囲に対して前記連結成分の明度が高い場合は、前記連結成分の明度が周囲より低い場合に比べ、文字である可能性が少ないことになる。そこで、連結成分より明度の高い画素数をカウントし、この明度の高い画素の割合が所定の割合より少ない場合には、当該連結成分が文字ではないと判断して連結データから削除する。
【0092】
次いで、CPU401は、前記連結成分選別処理で選別された連結成分に対し、この連結成分における外接矩形を統合する(外接矩形統合処理)。この統合の処理は、文字矩形を統合して文字領域(図6の文字列「パターンマッチング方法」を含む)を抽出するものである。 ここでは、隣接する矩形(外接矩形)のうち、サイズ、色とも予め決められた範囲内にあって似ているものを統合し、グループ化する。こうして統合された矩形グループ(外接矩形からなる)を文字列とする。
【0093】
最後に、CPU401は、前記外接矩形統合処理で統合された矩形グループの外接矩形を抽出し、2値化処理を施して2値画像を生成する。ここでは、マーク12で囲まれた前記文字列「パターンマッチング方法」の外接矩形、すなわちタイトル画像14bの領域が抽出される。
【0094】
以上のように、本発明の第2の実施形態に係る画像処理装置400は、処理対象の文書のタイトル13を囲むように、予め指定された指定色のマーク12が付加されているとき、前記文書の表紙11の画像(入力画像に含まれる)からタイトル13およびマーク12を含むタイトル画像領域14(マーク領域に相当する)を抽出するCPU401の機能(マーク領域抽出手段に含まれる)と、タイトル画像領域14からタイトル画像14b(文字画像に含まれる)を含む文字領域を抽出するCPU401の機能(文字領域抽出手段に含まれる)と、タイトル画像領域14からマーク12を除去するCPU401の機能(マーク除去手段に含まれる)と、このCPU401の機能により抽出されたタイトル画像14b(文字領域の画像に含まれる)、およびCPU401の機能によりマーク12が除去された後の文書10(文書全体の画像に含まれる)を記憶する画像蓄積装置403(画像記憶手段に含まれる)とを備えているので、文書検索に用いるタイトル画像14bのサイズをマーク12に外接するタイトル画像14aよりさらに小さくできる。
【0095】
なお、前述した実施形態ではタイトル画像14bと入力画像群(マーク12が消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0096】
[第3の実施形態]
本発明の第3の実施形態に係る画像処理装置は、第1の実施形態と概ね同様の構成を有しているため、図1を用いるとともに、同一構成には同一符号を付与して説明を省略する。
【0097】
図7は、本発明の第3の実施形態に係る画像処理プログラムの概略を示す。ここでは、図8に示すように、異なる同サイズの文書10a、10bが重ねられて処理対象の文書群10cを構成している。また、文書10a、10bは、第1の実施形態に準じ、それぞれ複数枚のシート原稿からなり、文書先頭の表紙11にはタイトル13が記載され、さらにタイトルを囲むように、予め指定された指定色のマーカーによってマーク12が記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。
【0098】
前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図7に示すステップを実行させるものである。なお、第1、第2の実施形態(図3、図5に示す)と同一の処理を行うステップについては、説明を簡略にする。
【0099】
まず、CPU401は、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S201)。
【0100】
次いで、CPU401は、第1の実施形態(図3のS107)に準じ、一つの文書の全画像に対する画像処理が終了したか否かを判断する(S202)。この判断が「NO」の場合はS203に移り、「YES」の場合にはS204に移る。
【0101】
S203では、CPU401は、第1の実施形態(図3のS101)に準じ、画像入力装置404により、処理対象の画像を入力する(S203)。
【0102】
次いで、CPU401は、入力画像から前記指定色の画素を抽出して、画素数をカウントする(S205(請求項11、請求項18の先頭頁判断ステップに含まれる))。ここで、前記指定色の画素数(=N)が所定の値(ここでは、閾値Th)よりも大きい場合には(S206(請求項11、請求項18の先頭頁判断ステップに含まれる)のYES)、入力画像にマーク12が含まれているものと判断してS207に移る。また、前記指定色の画素数が所定の値よりも小さい場合には(S206のNO)、表紙画像以外の入力画像であると判断して、入力画像を画像バッファ403aに保持する(S208)。
【0103】
S207では、S206で表紙のタイトルを囲むマーク12が検出されたことから、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに、複数部の画像群に分けて保存用メモリ403cに蓄積する。
【0104】
次いで、CPU401は、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S209)。
【0105】
次いで、CPU401は、第1の実施形態(図3のS103)に準じ、S205で抽出された前記指定色の画素が表す、マーク12の外接矩形を抽出する(S210)。
【0106】
次いで、CPU401は、第1の実施形態(図3のS104)に準じ、S210で抽出された外接矩形の画像領域において、前記指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S211)。
【0107】
次いで、CPU401は、第1の実施形態(図3のS105)に準じ、S211でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持する(S212)。
【0108】
次いで、CPU401は、第1の実施形態(図5のS121)に準じ、S210で抽出され、S211で画素値の置換処理がなされた外接矩形領域において、タイトル文字列の外接矩形を抽出する(S213)。
【0109】
次いで、CPU401は、第1の実施形態(図5のS122)に準じ、S213で抽出されたタイトル文字列の外接矩形をタイトル画像14bとしてタイトルバッファ403bに保持する(S214)。
【0110】
S204では、一つの文書における全画像の画像処理が終了したことから、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0111】
以上のように、本発明の第3の実施形態に係る画像処理装置400は、文書10a、10bには、タイトル13が記された表紙11(先頭頁に相当する)を含む複数の頁を有し、入力された頁ごとの画像から指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が表紙11であるか否かを判断するCPU401の機能(先頭頁判断手段に含まれる)を備えているので、タイトル付きの表紙11を有する複数部の文書を連続して電子化し、文書ごとに保持できる。
【0112】
なお、前述した実施形態ではタイトル画像と入力画像群(マーク12が消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0113】
[第4の実施形態]
本発明の第4の実施形態に係る画像処理装置は、第1の実施形態と概ね同様の構成を有しているため、図1を用いるとともに、同一構成には同一符号を付与して説明を省略する。
【0114】
図9は、本発明の第4の実施形態に係る画像処理プログラムの概略を示す。ここでは、第3の実施形態(図8に示す)に準じ、異なる同サイズの文書が重ねられて処理対象の文書群を構成している。また、それぞれの文書は、第1の実施形態に準じ、それぞれ複数枚のシート原稿からなり、文書先頭の表紙にはタイトルが記載され、さらにタイトルを囲むように、予め指定された指定色のマーカーによってマークが記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。
【0115】
前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図9に示すステップを実行させるものである。なお、第3の実施形態(図7に示す)と同一ステップには、同一符号を付与して説明を簡略にする。
【0116】
まず、CPU401は、第3の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S201)。
【0117】
次いで、CPU401は、第3の実施形態に準じ、一つの文書の全画像に対する画像処理が終了したか否かを判断する(S202)。この判断が「NO」の場合はS203に移り、「YES」の場合にはS204に移る。
【0118】
S203では、CPU401は、第3の実施形態に準じて処理対象の画像を入力する(S203)。
【0119】
次いで、CPU401は、第3の実施形態に準じて、入力画像から前記指定色の画素を抽出し(S205)、さらに抽出された画素の連結成分を生成する(S301(請求項12、請求項19の先頭頁判断ステップに含まれる))。ここで、前記指定色の画素の連結成分における画素数(=N)が所定の値(ここでは、閾値Th)よりも大きい場合には(S302(請求項12、請求項19の先頭頁判断ステップに含まれる)のYES)、S207に移る。また、前記指定色の画素の連結成分における画素数が所定の値よりも小さい場合には(S302のNO)、入力画像を画像バッファ403aに保持する(S208)。
【0120】
S207では、第3の実施形態に準じ、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0121】
次いで、CPU401は、第3の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S209)。
【0122】
次いで、CPU401は、S301で抽出された前記指定色の画素の連結成分(マーク12を表す)の外接矩形を抽出する(S210)。
【0123】
次いで、CPU401は、第3の実施形態に準じ、S210で抽出された外接矩形の画像領域において、前記指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S211)。
【0124】
次いで、CPU401は、第3の実施形態に準じ、S211でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持する(S212)。
【0125】
次いで、CPU401は、第3の実施形態に準じ、S210で抽出され、S211で画素値の置換処理がなされた外接矩形領域において、タイトル文字列の外接矩形を抽出する(S213)。
【0126】
次いで、CPU401は、第3の実施形態に準じ、S213で抽出されたタイトル文字列の外接矩形をタイトル画像14bとしてタイトルバッファ403bに保持する(S214)。
【0127】
S204では、第3の実施形態に準じ、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0128】
以上のように、本発明の第4の実施形態に係る画像処理装置400は、文書10a、10bには、タイトル13が記された表紙11(先頭頁に相当する)を含む複数の頁を有し、入力された頁ごとの画像から指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が表紙11であるか否かを判断するCPU401(先頭頁判断手段に含まれる)を備えているので、タイトル付きの表紙11を有する複数部の文書を連続して電子化し、文書ごとに保持するとき、前記指定色のノイズが入力画像上に散在していても、表紙の誤検出を回避できる。
【0129】
なお、前述した実施形態ではタイトル画像と入力画像群(前記マークが消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0130】
[第5の実施形態]
本発明の第5の実施形態に係る画像処理装置は、第1の実施形態と概ね同様の構成を有しているため、図1を用いるとともに、同一構成には同一符号を付与して説明を省略する。
【0131】
図10は、本発明の第5の実施形態に係る画像処理プログラムの概略を示す。ここでは、第3の実施形態(図8に示す)に準じ、異なる同サイズの文書が重ねられて処理対象の文書群を構成している。また、それぞれの文書は、第1の実施形態に準じ、それぞれ複数枚のシート原稿からなり、文書先頭の表紙にはタイトルが記載され、さらにタイトルを囲むように、予め指定された指定色のマーカーによってマークが記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。
【0132】
前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図10に示すステップを実行させるものである。なお、第4の実施形態(図9に示す)と同一ステップには、同一符号を付与して説明を簡略にする。
【0133】
まず、CPU401は、第4の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S201)。
【0134】
次いで、CPU401は、第4の実施形態に準じ、一つの文書の全画像に対する画像処理が終了したか否かを判断する(S202)。この判断が「NO」の場合はS203に移り、「YES」の場合にはS204に移る。
【0135】
S203では、CPU401は、第4の実施形態に準じて処理対象の画像を入力する(S203)。
【0136】
次いで、CPU401は、第4の実施形態に準じて、入力画像から前記指定色の画素を抽出し(S205)、抽出された画素の連結成分を生成する(S301)。
【0137】
次いで、CPU401は、S301で生成された連結成分の外接矩形を抽出し(S401(請求項13、請求項20の先頭頁判断ステップに含まれる))、抽出された外接矩形のサイズを求める。このサイズとしては、例えば、前記外接矩形内の画素数又は前記外接矩形の面積を用いてもよい。ここで、前記外接矩形のサイズが所定の値よりも大きい場合には(S402(請求項13、請求項20の先頭頁判断ステップに含まれる)のYES)、入力画像に指定色のマークが含まれているものと判断してS207に移る。また、前記外接矩形のサイズが所定の値よりも小さい場合には(S402のNO)、表紙画像以外の入力画像であると判断して、入力画像を画像バッファ403aに保持する(S208)。
【0138】
S207では、第4の実施形態に準じ、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0139】
次いで、CPU401は、第4の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S209)。
【0140】
次いで、CPU401は、第4の実施形態に準じ、S401で抽出された外接矩形の画像領域において、前記指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S211)。
【0141】
次いで、CPU401は、第4の実施形態に準じ、S211でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持する(S212)。
【0142】
次いで、CPU401は、第4の実施形態に準じ、S210で抽出され、S211で画素値の置換処理がなされた外接矩形領域において、タイトル文字列の外接矩形を抽出する(S213)。
【0143】
次いで、CPU401は、第4の実施形態に準じ、S213で抽出されたタイトル文字列の外接矩形をタイトル画像14bとしてタイトルバッファ403bに保持する(S214)。
【0144】
S204では、第4の実施形態に準じ、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0145】
以上のように、本発明の第5の実施形態に係る画像処理装置400は、文書10a、10bには、タイトル13が記された表紙11(先頭頁に相当する)を含む複数の頁を有し、入力された頁ごとの画像から指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が表紙11であるか否かを判断するCPU401の機能(先頭頁判断手段に含まれる)を備えているので、タイトル付きの表紙を有する複数部の文書を連続して電子化し、文書ごとに保持するとき、前記指定色のノイズが入力画像上に散在していても、表紙の誤検出を回避できる。
【0146】
なお、前述した実施形態ではタイトル画像と入力画像群(前記マークが消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0147】
[第6の実施形態]
本発明の第6の実施形態に係る画像処理装置は、第1の実施形態と概ね同様の構成を有しているため、図1を用いるとともに、同一構成には同一符号を付与して説明を省略する。
【0148】
図11は、本発明の第6の実施形態に係る画像処理プログラムの概略を示す。ここでは、第3の実施形態(図8に示す)に準じ、異なる同サイズの文書が重ねられて処理対象の文書群を構成している。また、それぞれの文書は、第1の実施形態に準じ、それぞれ複数枚のシート原稿からなり、文書先頭の表紙にはタイトルが記載され、さらにタイトルを囲むように、予め指定された指定色のマーカーによってマークが記されている。また、原稿に記された文字(タイトルを含む)は、紙色(背景色)および前記指定色よりも濃度が高いものとする。
【0149】
前記画像処理プログラムは、CPU401(コンピュータ装置に含まれる)に、図11に示すステップを実行させるものである。なお、第5の実施形態(図10に示す)と同一ステップには、同一符号を付与して説明を簡略にする。
【0150】
まず、CPU401は、第5の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S201)。
【0151】
次いで、CPU401は、第5の実施形態に準じ、一つの文書の全画像に対する画像処理が終了したか否かを判断する(S202)。この判断が「NO」の場合はS203に移り、「YES」の場合にはS204に移る。
【0152】
S203では、CPU401は、第5の実施形態に準じて処理対象の画像を入力する(S203)。
【0153】
次いで、CPU401は、第5の実施形態に準じて、入力画像から前記指定色の画素を抽出し(S205)、抽出された画素の連結成分を生成する(S301)。
【0154】
次いで、CPU401は、S301で生成された連結成分の外接矩形を抽出し(S401)、抽出された外接矩形が、文字列か否かを判断する(S501(請求項14、請求項21の先頭頁判断ステップに含まれる))。ここで、前記外接矩形が文字列である場合には(S502(請求項14、請求項21の先頭頁判断ステップに含まれる)のYES)、入力画像に指定色のマークが含まれているものと判断してS207に移る。また、前記外接矩形が文字列でない場合には(S502のNO)、表紙画像以外の入力画像であると判断して、入力画像を画像バッファ403aに保持する(S208)。
【0155】
次いで、CPU401は、第5の実施形態に準じ、画像バッファ403a、タイトルバッファ403b、保存用メモリ403cを全て初期化する(S209)。
【0156】
次いで、CPU401は、第5の実施形態に準じ、S210で抽出された外接矩形の画像領域において、前記指定色の画素の画素値を全て背景色(例えば、白色)の画素値に置換する処理を施し、マーク12を表紙画像から消去する(S211)。
【0157】
次いで、CPU401は、第5の実施形態に準じ、S211でマーク12が消去された表紙11の表紙画像を画像バッファ403aに保持する(S212)。
【0158】
次いで、CPU401は、S501の文字列判定処理で抽出されたタイトル文字列の外接矩形を抽出する(S213)。ここでは、マーク12で囲まれた文字列(図8の「パターンマッチング方法」、「特徴抽出方法」)の外接矩形、すなわちタイトル画像(図6の14bに相当する)の領域が抽出される。
【0159】
次いで、CPU401は、第5の実施形態に準じ、S213で抽出されたタイトル文字列の外接矩形をタイトル画像14bとしてタイトルバッファ403bに保持する(S214)。
【0160】
S204では、第5の実施形態に準じ、既に画像バッファ403aに保持されている表紙画像および表紙を除く入力画像を含む画像群を一つの文書とし、タイトルバッファ403bに保持されているタイトル画像14bとともに保存用メモリ403cに蓄積する。
【0161】
ここで、前述の文字列判定処理(S501)についてさらに説明する。
【0162】
まず、CPU401は、S210で抽出された前記指定色の画素連結成分の外接矩形領域において、第1の実施形態に準じ、画像の各行ごとに隣接する画素(例えば、黒画素)のランを生成する(ラン生成処理)。次いで、前記ランの連結成分を生成する(連結成分生成処理)。次いで、前記連結成分生成処理で生成された連結成分の中から、予め決められた条件で連結成分を選別して削除する(連結成分選別処理)。ここでは、ある一定の大きさ以下の連結成分を選別して削除する。次いで、前記連結成分選別処理で選別された連結成分に対し、この連結成分における外接矩形を統合する(外接矩形統合処理)。ここでは、隣接する矩形(外接矩形)のうち、サイズ、色とも予め決められた範囲内にあって似ているものを統合し、グループ化する。次いで、前記外接矩形統合処理で統合された矩形グループの外接矩形を抽出する(外接矩形抽出処理)。
【0163】
次いで、CPU401は、前記外接矩形抽出処理で抽出された外接矩形が、文字列の外接矩形か否かを判断する(外接矩形判定処理)。これは、前記統合された外接矩形に、図や写真の一部などを誤って統合するなどした、文字列でないものが含まれている場合があることによる。
【0164】
具体的には、まず、前記統合された外接矩形を一つ選択する。次いで、選択した外接矩形の高さが予め決められた値以上か否かを判断する。ここで、前記外接矩形の矩形の高さが予め決められた値以上である場合は、前記外接矩形が文字列でないと判断する。また、前記外接矩形の矩形の高さが予め決められた値より小さい場合には、前記外接矩形の色情報と前記外接矩形の周囲の色情報とを比較する。ここで、背景(周囲)より明度の低い文字を抽出するときは、周囲の明度が外接矩形の明度より低い場合に、前記外接矩形が文字列でないと判断する。なお、背景より明度の高い文字を抽出するときは、上述した判断条件とは逆に、周囲の明度が外接矩形の明度より高い場合に、前記外接矩形が文字列でないと判断する。次いで、前記外接矩形の色情報と前記外接矩形の周囲の色情報との比較により、前記外接矩形が文字列であると判断した場合、さらに前記外接矩形内のエッジ強度が予め決められた値より強い画素数をカウントする。ここでは、エッジ強度の測定は原画像上で行うものとし、例えば3×3画素の形状と所定の係数を持つ空間フィルタを測定対象の画素を中心にして個別に適用する。そして、得られた結果の2乗和をもってエッジ強度とする。次いで、前記エッジ強度が予め決められた値より強い画素数の、前記外接矩形内の全画素数に対する比率が予め決められた値より小さい場合には、文字列でないと判断する。
【0165】
以上のように、本発明の第6の実施形態に係る画像処理装置400は、文書10a、10bには、タイトル13が記された表紙11(先頭頁に相当する)を含む複数の頁を有し、入力された頁ごとの画像から指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が表紙11であるか否かを判断するCPU401の機能(先頭頁判断手段に含まれる)を備えているので、タイトル付きの表紙11を有する複数部の文書を連続して電子化し、文書ごとに保持できる。また、指定色の画素のみを用いて表紙11を識別する方法に比べ、より確実に表紙11を検出できる。
【0166】
なお、前述した実施形態ではタイトル画像と入力画像群(前記マークが消去された表紙画像、この表紙画像を除く入力画像を含む)とを画像処理装置400に記憶および蓄積した場合について説明したが、本発明はこのほかに、ネットワークを介し、前記タイトル画像と入力画像群とを関連づけて外部のサーバに記憶および蓄積しても同様の効果が得られるものである。この場合には、画像処理装置の使用者は前記外部のサーバにアクセスして、原稿(入力画像群)よりもサイズの小さいタイトル画像の一覧から所望の原稿を選択し、その内容を参照することが可能となる(後述の第7の実施形態に示す)。
【0167】
また、前述した実施形態ではマーク12の外接矩形領域内の文字列の有無により表紙か否かを判断し、前記文字列の外接矩形を抽出してタイトル画像14bとする場合について説明したが、本発明はこのほかに、前記外接矩形の文字領域に2値化処理を施して2値画像を生成し、この2値画像に対してパターンマッチング法、構造解析法などによる文字認識を行い、この文字認識の結果をタイトル画像として保持または蓄積しても同様の効果が得られるものである。この場合は、前記文字認識の処理をCPU401の機能(文字認識手段に含まれる)により実現してもよい。また、前記画像処理プログラムによって、CPU401に、前記文字列(文字画像に含まれる)の文字を認識する文字認識ステップを実行させるようにしてもよい。さらに、この構成を他の実施形態(前述の第1〜第5の実施形態、後述の第7の実施形態を含む)に適用してもよい。こうすることにより、文字認識を施さない場合に比べ、鮮明で見やすいタイトル画像を提供できる。
【0168】
[第7の実施形態]
図12は、本発明の第7の実施形態に係る画像処理システムを示す。これは第1乃至第6の実施形態とは、実際に文書の画像処理を実行する画像処理装置側と、画像処理により電子化された文書の画像を蓄積して管理する画像管理サーバ側とを分離し、両者をネットワークによって接続した点が相違している。
【0169】
図12の画像管理サーバ500において、CPU501は、装置全体を制御し、本実施形態の画像管理機能を実現するものである。メモリ502は、ROMやRAM等で構成され、CPU501の制御プログラム(画像管理プログラムを含む)を記憶するとともに、この制御プログラムがCPU501によって実行されるときにー時的に作成される情報等を保持するものである。画像蓄積装置503は、ハードディスクドライブ、ハードディスクなどで構成され、画像処理装置400a〜400cから送信された、タイトル画像のデータと入力画像群(タイトルを囲むマークが消去された表紙画像、この表紙画像を除く入力画像を含む)のデータとを関連づけて、ハードディスクに格納して管理するのに用いられる。また、画像蓄積装置503は、本実施形態の画像管理機能を実現するための画像管理プログラムを記録したハードディスクを装着して読み込み、メモリ502へ格納するのに用いられる。ネットワークカード504は、サーバ装置500をインターネット509(ネットワークに含まれる)へ接続するためのインタフェースであり、ルータ505およびインターネット509を介して他の通信装置(画像処理装置400a〜400cを含む)と信号及びデータを遣り取りするものである。ルータ505は、インターネット509上における画像管理サーバ500の接続先を振り分けるものである。前述した装置501〜505は、バス510によって接続されている。
【0170】
さらに、前記画像管理プログラムを記録した記録媒体として、ハードディスクの他に、半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、シーディーロム(CD‐ROM)、ディジタル・バーサタイル・ディスク(DVD)、光磁気ディスク(MO)、ミニディスク(MD)、書き込み可能なCD(CD‐R)等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク(FD)等)などを用いてもよい。
【0171】
また、インターネット509などのネットワークは、画像管理サーバ500、画像処理装置400a〜400cなどの通信装置間を結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけでなく、それらの間の通信プロトコルが一致するものであれば無線、有線及び放送波のいずれでもよく、例えば、構内網(LAN)、広域網(WAN)、アナログ電話網、ディジタル電話網(ISDN)、パーソナルハンディホンシステム(PHS)、携帯電話網、衛星通信網などを用いることができる。
【0172】
また、前記画像管理プログラムが半導体の記録媒体に記録されている場合には、前記画像管理プログラムは、前記媒体駆動装置からではなく、直接、前記メモリヘロードされ、実行されることとなる。
【0173】
なお、前記メモリへロードされた画像管理プログラムを実行することにより、本実施形態の画像管理機能が実現されるだけでなく、画像管理プログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって本実施形態の画像管理機能が実現されるようにしてもよい。
【0174】
図12の画像処理装置400a〜400cは、例えばパーソナルコンピュータであって、第1の実施形態と概ね同様の構成を有している。すなわち、詳細に図示していないが、装置全体を制御するCPU(図1の401に相当する)、このCPUの制御プログラムやデータを記憶するメモリ(図1の402に相当する)、画像処理プログラムなどを記録した記録媒体を装着して読み込み、前記メモリへ格納するための媒体駆動装置(図1の405に相当する)、キーボード、マウス、タッチパネル、スキャナなどの入力装置(図1の404、408に相当する)、CRT、液晶ディスプレイ(LCD)、プリンタなどの出力装置(図1の406に相当する)、および、画像処理装置400a〜400cをインターネット509(ネットワークに含まれる)へ接続するためのネットワーク接続装置(図1の409に相当する)を備えている。
【0175】
ここで、前記画像処理プログラムを記録した記録媒体として、ハードディスクは勿論のこと、この他に、半導体媒体(例えば、ROM、ICメモリカード等)、光媒体(例えば、シーディーロム(CD‐ROM)、ディジタル・バーサタイル・ディスク(DVD)、光磁気ディスク(MO)、ミニディスク(MD)、書き込み可能なCD(CD‐R)等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク(FD)等)などを用いてもよい。
【0176】
また、インターネット509などのネットワークは、画像管理サーバ500、画像処理装置400a〜400cなどの通信装置間を結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけでなく、それらの間の通信プロトコルが一致するものであれば無線、有線及び放送波のいずれでもよく、例えば、構内網(LAN)、広域網(WAN)、アナログ電話網、ディジタル電話網(ISDN)、パーソナルハンディホンシステム(PHS)、携帯電話網、衛星通信網などを用いることができる。
【0177】
また、前記画像処理プログラムが半導体の記録媒体に記録されている場合には、前記画像処理プログラムは、前記媒体駆動装置からではなく、直接、前記メモリヘロードされ、実行されることとなる。
【0178】
なお、前記メモリへロードされた画像処理プログラムを実行することにより、本実施形態の画像処理機能が実現されるだけでなく、画像処理プログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部または全部を行い、その処理によって本実施形態の画像処理機能が実現されるようにしてもよい。
【0179】
前述の構成により、インターネット509に接続された画像処理装置400a〜400cのいずれかが、前記画像処理プログラムによって表紙および複数の原稿からなる文書に対し、第1〜第6の実施形態に示した画像処理を施し、得られた表紙画像および表紙を除く入力画像を一つの文書とし、表紙画像から取得したタイトル画像とともに画像管理サーバ500に送信する。画像管理サーバ500では、ルータ505、ネットワークカード504を経て、画像処理装置400a〜400cからの画像群を受け取り、前記タイトル画像と一つの文書とを対応させて画像蓄積装置503に格納する。この後、画像処理装置400a〜400cから画像管理サーバ500に対してタイトル画像要求が送信されると、CPU501は、前記ハードディスクに格納されている画像管理プログラムをメモリ502に読み出して実行する。ここで、CPU501は、前記ハードディスクに格納されているタイトル画像群とタイトル画像ごとに付与された識別情報(タイトル情報を含む)とを読み出し、インターネット509を通して当該画像処理装置へ送信する。次いで、画像処理装置400a〜400cから画像管理サーバ500に対して文書検索要求(前記識別情報を含む)が送信されると、前記ハードディスクに格納されている文書の中から、前記識別情報と対応する文書を読み出し、インターネット509を通して当該画像処理装置へ送信する。
【0180】
なお、前記画像処理プログラムは、画像処理装置400a〜400cのCPU(コンピュータ装置に含まれる)に、第1〜第6の実施形態(図3、図5、図7、図9、図10、図11)のいずれかに示すステップを実行させるものである。但し、画像群の蓄積処理(S110、S204、S207)については、蓄積した文書の画像と当該タイトル画像とを含む画像群を画像管理サーバ500に対し、インターネット509を通して送信する送信処理ステップ(図示せず)を追加している。
【0181】
また、前記画像管理プログラムは、画像管理サーバ500のCPU501(コンピュータ装置に含まれる)に、図13に示すステップを実行させるものである。前記画像管理プログラムには、蓄積プログラム(図13(a)に示す)、検索補助プログラム(図13(b)に示す)、検索プログラム(図13(c)に示す)が含まれる。
【0182】
図13(a)では、まず、CPU501が、画像処理装置400a〜400cのいずれかから蓄積用の画像データ(タイトル画像、文書の画像を含む)が送信されたか否かを判断する(S601)。この判断が「NO」の場合は処理を終了し、「YES」の場合には、受信したタイトル画像と文書の画像(表紙画像を含む)とを対応付けて画像蓄積装置503に蓄積する(S602)。次いで、CPU501は、受信したタイトル画像ごとに識別情報を付与し、画像蓄積装置503に蓄積されているタイトル画像と1対1に対応する前記識別情報を「タイトル一覧」に追加登録する(S603)。ここで、前記「タイトル一覧」は、メモリ502又は画像蓄積装置503の所定領域に設定され、蓄積用の画像データを受信したとき、あるいは画像処理装置から400a〜400cの削除指示で前記画像データを削除したときに更新可能としている。
【0183】
図13(b)では、まず、CPU501が、画像処理装置400a〜400cのいずれかから前記タイトル一覧の送信要求があったか否かを判断する(S701)。この判断が「NO」の場合は処理を終了し、「YES」の場合には、前記タイトル一覧をメモリ502又は画像蓄積装置503から読み出し、インターネット509を通して当該画像処理装置へ送信する(S702)。
【0184】
図13(c)では、まず、CPU501が、画像処理装置400a〜400cのいずれかから画像検索要求(所望の文書のタイトル情報を含む)があったか否かを判断する(S801)。この判断が「NO」の場合は処理を終了し、「YES」の場合には、送信されたタイトル情報により前記タイトル一覧から所望のタイトルを検索する(S802)。この検索で前記タイトルが検出された場合(S803のYES)は、前記タイトルと対応する文書の画像データを画像蓄積装置503から読み出し(S804)、インターネット509を通して当該画像処理装置へ送信する(S805)。また、S803の検索結果が「NO」の場合には、エラー情報を送信して処理を終了する(S806)。
【0185】
なお、前述した実施形態では画像処理を画像処理装置400a〜400cで行った場合について説明したが、本発明はこの他に、画像処理装置400a〜400cで処理対象の画像を入力し、入力画像を画像蓄積サーバ500へ送信し、入力画像に対する画像処理は全て画像蓄積サーバ500で行うようにしてもよい。この場合、画像処理装置400a〜400cは画像処理プログラムを導入するための時間的コストを節約できるという効果が得られる。
【0186】
【発明の効果】
以上説明したように、本発明は入力画像のマーク領域からマークを除去するマーク除去手段(画像処理装置のCPUを含む)を設け、このマーク除去手段によりマークが除去された後のマーク領域の画像、および前記マーク除去手段によりマークが除去された後の文書全体の画像を記憶することにより、マークが付加される前の原文書を電子化して蓄積できるという優れた効果を有する画像処理装置を提供することができるものである。
【図面の簡単な説明】
【図1】第1の実施形態に係る画像処理装置の構成を示すブロック図である。
【図2】第1の実施形態に係る画像処理対象の文書を説明する図である。
【図3】第1の実施形態に係る画像処理プログラムを示すフローチャートである。
【図4】第1の実施形態に係る画像処理手順を説明する図である。
【図5】第2の実施形態に係る画像処理プログラムを示すフローチャートである。
【図6】第2の実施形態に係る画像処理手順を説明する図である。
【図7】第3の実施形態に係る画像処理プログラムを示すフローチャートである。
【図8】第3の実施形態に係る画像処理対象の文書を説明する図である。
【図9】第4の実施形態に係る画像処理プログラムを示すフローチャートである。
【図10】第5の実施形態に係る画像処理プログラムを示すフローチャートである。
【図11】第6の実施形態に係る画像処理プログラムを示すフローチャートである。
【図12】第7の実施形態に係る画像処理システムの構成を示すブロック図である。
【図13】第7の実施形態に係る画像管理プログラムを示すフローチャートである。
【符号の説明】
400、400a、400b、400c 画像処理装置
401、501 CPU
402、502 メモリ
403、503 画像蓄積装置
404 画像入力装置
405 CD‐ROMドライブ
406 出力装置
407 CD‐ROM
408 入力装置
409 ネットワーク接続装置
410、510 バス
500 画像管理サーバ
504 ネットワークカード
505 ルータ
509 インターネット
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an image processing apparatus, a recording medium, and a program for digitizing and storing a document including a cover with a title.
[0002]
[Prior art]
A conventional image processing apparatus (including an electronic filing apparatus) optically reads a plurality of documents by adding color information to titles and keywords in the documents, separates the documents into individual documents, and converts the read data of each document into read data. The title and the keyword are added and registered (for example, see Patent Document 1). Here, a document in which the character portion of the title is painted with a highlighter is shown.
[0003]
Further, when a plurality of documents are optically read to extract a title in the document, a title may be extracted based on layout information of an input image (attribute of a character area, layout characteristics of a line area, etc.). (For example, see Patent Document 2).
[0004]
When extracting a title in a document by optically reading a plurality of documents, some titles are extracted based on character string characteristics (character size, aspect ratio, presence or absence of shading, etc.). (For example, see Patent Document 3).
[0005]
[Patent Document 1]
JP-A-6-52236 (FIG. 1)
[0006]
[Patent Document 2]
JP-A-2002-297629 (FIG. 4)
[0007]
[Patent Document 3]
Japanese Patent Application Laid-Open No. 2002-297638 (FIG. 1)
[0008]
[Problems to be solved by the invention]
However, in a conventional image processing apparatus such as that described in Japanese Patent Application Laid-Open Publication No. H10-163, for example, a method of detecting a mark of a document marked so as to surround a title with a marker such as a highlighter, and post-processing of a scanned image are specific. However, there is a problem that a practical method is not described, and it is not enough for actual implementation. In particular, since the color of the marker remains on the image of the stored document, it is not preferable from the viewpoint of storing the original. In a conventional image processing apparatus such as “Patent Literature 2” and “Patent Literature 3”, for example, when a document marked to surround a title with a marker such as a highlighter pen is read and digitized, a marker is used. No consideration is given to performing the title extraction using the color of, and there is room for further improvement in simplifying the title extraction process.
[0009]
The present invention has been made to solve such a problem. When a document is digitized and stored, a title assigned to the document is extracted to obtain a title image useful for document search, and the original image is obtained. An image processing apparatus, a recording medium, and a program capable of acquiring an image of a document are provided.
[0010]
[Means for Solving the Problems]
The image processing apparatus according to the present invention according to claim 1, wherein when a mark of a designated color designated in advance is added so as to surround a title of a document to be processed, the title and the mark are obtained from an input image of the document. Mark area extracting means for extracting a mark area including: a mark removing means for removing the mark from the mark area; an image of the mark area after the mark is removed by the mark removing means; and the mark removal Means for storing an image of the entire document after the mark has been removed by the means.
[0011]
With this configuration, the mark removing unit acquires the document image (image of the entire document) after removing the mark from the input image and the title image (image of the mark area) after removing the mark, so that the mark is added. The previous original document can be digitized. Further, the user can search for a desired document by using the image (including the title image) of the mark area.
[0012]
3. The image processing apparatus according to claim 2, wherein when a mark of a designated color specified in advance is added so as to surround a title of the document to be processed, the title and the mark are obtained from an input image of the document. Mark area extracting means for extracting a mark area including a character image, character area extracting means for extracting a character area including a character image from the mark area, mark removing means for removing the mark from the mark area, and extracting the character area Means for storing an image of the character area extracted by the means and an image of the entire document after the mark has been removed by the mark removing means.
[0013]
With this configuration, since the character area extracting means extracts the character area in the mark area, the size of the title image used for document search can be made smaller than the mark area.
[0014]
An image processing apparatus according to a third aspect of the present invention is the image processing apparatus according to the second aspect, further comprising a character recognizing unit for recognizing characters of the character image, wherein the image storage unit stores a recognition result of the character recognizing unit. It has the following configuration.
[0015]
With this configuration, the character recognizing unit recognizes the character in the mark area, so that a clearer and easier-to-see title image can be provided as compared with a case where character recognition is not performed.
[0016]
According to a fourth aspect of the present invention, in the image processing apparatus according to any one of the first to third aspects, the document has a plurality of pages including a top page in which the title is written, and each input page has Of the specified color is extracted from the image of (1), and the first page determining means for determining whether or not the input image is the first page based on the number of pixels of the specified color.
[0017]
With this configuration, since the first page determination unit determines whether or not the page is the first page based on the number of pixels of the designated color, it is possible to continuously digitize and hold a plurality of copies of the document having the title cover for each document.
[0018]
According to a fifth aspect of the present invention, in the image processing apparatus according to any one of the first to third aspects, the document has a plurality of pages including a top page in which the title is written, and each input page has Extracting the pixel of the specified color from the image of the image, generating a connected component of the extracted pixel of the specified color, and determining whether the input image is the first page according to the size of the generated connected component. Is provided with a first page determining means for determining the first page.
[0019]
With this configuration, the first page determination unit determines whether or not the document is the first page based on the size of the connected component of the designated color pixel (for example, the number of pixels). It can be digitized and retained.
[0020]
According to a sixth aspect of the present invention, in the image processing apparatus according to any one of the first to third aspects, the document has a plurality of pages including a first page in which the title is described, and each of the input pages The pixel of the specified color is extracted from the image of the above, a connected component of the extracted pixel of the specified color is generated, a circumscribed rectangle of the generated connected component is extracted, and the size of the extracted circumscribed rectangle is determined. And a head page determining means for determining whether or not the input image is the head page.
[0021]
According to this configuration, the first page determination unit determines whether or not the document is the first page based on the size of the circumscribed rectangle of the connected component of the designated color pixel. It can be held.
[0022]
An image processing apparatus according to a seventh aspect of the present invention is the image processing apparatus according to any one of the first to third aspects, wherein the document has a plurality of pages including a top page in which the title is written, and each of the input pages Extracting the pixel of the specified color from the image of the above, generating a connected component of the extracted pixel of the specified color, extracting a circumscribed rectangle of the generated connected component, and within the extracted circumscribed rectangle area It has a configuration including a first page determination unit that determines whether or not the input image is the first page based on whether or not a character image exists.
[0023]
According to this configuration, the first page determining unit determines whether or not the document is the first page based on the presence or absence of the character image in the circumscribed rectangle of the connected component of the designated color pixel. It can be digitized and retained. In addition, the first page can be detected more reliably than when only pixels of the designated color are used.
[0024]
The recording medium of the present invention according to claim 8 includes a first step of inputting an image of a document in which a mark of a designated color specified in advance is added to surround a title, and a first step. A second step of extracting a mark area including the title and the mark from the input image when the image is input, and a third step of removing the mark from the mark area extracted in the second step And a fourth step of storing an image of the mark area after the mark has been removed in the third step and an image of the entire document after the mark has been removed in the third step. For recording programs.
[0025]
An image processing apparatus configured to acquire a document image (image of the entire document) after the mark is removed from the input image by the mark removing unit and a title image (image of the mark area) after the mark removal by the recording medium. The original document before the mark is added can be digitized and stored by this image processing apparatus. Further, when searching for a digitized document, the user can search for a desired document by using the image (including the title image) of the mark area.
[0026]
According to a ninth aspect of the present invention, there is provided a recording medium according to the first step, wherein a mark of a designated color designated in advance is input to a computer so as to surround a title. A second step of extracting a mark area including the title and the mark from the input image when the image is input, and a third step of removing the mark from the mark area extracted in the second step A fourth step of extracting a character area including a character image from the mark area, an image of the character area extracted in the fourth step, and a document after the mark is removed in the third step And a fifth step of storing the entire image.
[0027]
With this recording medium, it is possible to realize an image processing apparatus in which the character area extracting unit extracts the character area in the mark area, and the size of the title image used for document search can be made smaller than the mark area.
[0028]
According to a tenth aspect of the present invention, the recording medium according to the ninth aspect stores a program for causing the computer to execute a character recognition step of recognizing characters of the character image.
[0029]
This recording medium realizes an image processing apparatus in which the character recognizing means recognizes characters in the mark area, and a clearer and easier-to-see title image can be obtained as compared with a case where character recognition is not performed.
[0030]
The recording medium of the present invention according to claim 11 is the recording medium according to any one of claims 8 to 10, wherein, when the document has a plurality of pages including a first page in which the title is described, A program for extracting a pixel of the specified color from an image of each page and recording a program for executing a first page determination step of determining whether the input image is a first page based on the number of pixels of the specified color is recorded. are doing.
[0031]
With this recording medium, an image processing apparatus is realized in which the first page determining means determines whether or not the page is the first page based on the number of pixels of the designated color, and the image processing apparatus continuously prints a plurality of copies of a document having a title cover. Then, each document can be digitized and stored.
[0032]
According to a twelfth aspect of the present invention, in the recording medium according to any one of the eighth to tenth aspects, when the document includes a plurality of pages including a first page in which the title is written, the plurality of pages are input to the computer. Extracting the pixels of the specified color from the image of each page, generating a connected component of the extracted pixels of the specified color, and determining whether the input image is the first page according to the size of the generated connected component. It records a program for executing a first page determination step of determining whether or not the first page is determined.
[0033]
With this recording medium, an image processing apparatus is realized in which the first page determination unit determines whether or not the page is the first page based on the size (for example, the number of pixels) of the connected component of the designated color pixel. A plurality of copies of a document having a title cover can be continuously digitized for each document and held.
[0034]
A recording medium according to a thirteenth aspect of the present invention is the recording medium according to any one of the eighth to tenth aspects, wherein, when the document has a plurality of pages including a first page in which the title is written, the plurality of pages are input to the computer. The pixels of the specified color are extracted from the image of each page, a connected component of the extracted pixels of the specified color is generated, a circumscribed rectangle of the generated connected component is extracted, and a size of the extracted circumscribed rectangle is determined. Thus, a program for executing a first page determining step of determining whether the input image is the first page is recorded.
[0035]
With this recording medium, an image processing apparatus is realized in which the first page determination means determines whether or not the first page is the first page based on the size of the circumscribed rectangle of the connected component of the designated color pixel. This makes it possible to continuously digitize and hold multiple sets of documents for each document.
[0036]
According to a fourteenth aspect of the present invention, in the recording medium according to any one of the eighth to tenth aspects, when the document includes a plurality of pages including a first page in which the title is written, the plurality of pages are input to the computer. The pixels of the specified color are extracted from the image of each page, a connected component of the extracted pixels of the specified color is generated, a circumscribed rectangle of the generated connected component is extracted, and an area of the extracted circumscribed rectangle is extracted. A program for executing a first page determination step of determining whether or not the input image is the first page based on whether or not a character image exists in the first page is recorded.
[0037]
With this recording medium, an image processing apparatus is realized in which the first page determination unit determines whether or not the first page is present based on the presence or absence of a character image in the circumscribed rectangle of the connected component of the designated color pixel. A plurality of copies of a document having a title cover can be continuously digitized for each document and held. Further, it is possible to realize an image processing apparatus capable of more reliably detecting the first page as compared with the case where only pixels of the designated color are used.
[0038]
The program according to the present invention according to claim 15, wherein the first step of inputting an image of a document in which a mark of a designated color designated in advance to surround a title is input to the computer; A second step of extracting a mark area including the title and the mark from the input image when an image is input; a third step of removing the mark from the mark area extracted in the second step; Storing an image of the mark area after the mark has been removed in the third step, and a fourth step of storing an image of the entire document after the mark has been removed in the third step. I have.
[0039]
With this program, the original document before the mark is added can be digitized and stored as described above. In addition, when searching for an electronic document, a desired document can be searched for based on the image (including the title image) of the mark area.
[0040]
A program according to the present invention according to claim 16, wherein a first step of inputting an image of a document in which a mark of a designated color designated in advance to surround a title is input to a computer. A second step of extracting a mark area including the title and the mark from the input image when an image is input; a third step of removing the mark from the mark area extracted in the second step; A fourth step of extracting a character area including a character image from the mark area, an image of the character area extracted in the fourth step, and the entire document after the mark is removed in the third step And the fifth step of storing the image.
[0041]
With this program, as described above, the size of the title image used for document search can be made smaller than the mark area.
[0042]
According to a seventeenth aspect of the present invention, in the sixteenth aspect, the computer causes the computer to execute a character recognition step of recognizing characters of the character image.
[0043]
With this program, a clear and easy-to-view title image can be obtained as compared with the case where character recognition is not performed as described above.
[0044]
The program according to claim 18 is the program according to any one of claims 15 to 17, wherein when the document includes a plurality of pages including a first page in which the title is described, the page input to the computer is provided. The pixel of the specified color is extracted from each image, and a first page determining step of determining whether the input image is the first page based on the number of pixels of the specified color is executed.
[0045]
With this program, as described above, a plurality of copies of a document having a title cover can be continuously digitized for each document and held.
[0046]
A program according to a nineteenth aspect of the present invention is the program according to any one of the fifteenth to seventeenth aspects, wherein, when the document includes a plurality of pages including a top page in which the title is written, Extracting a pixel of the specified color from each image, generating a connected component of the extracted pixel of the specified color, and determining whether the input image is the first page according to the size of the generated connected component. A first page determination step is performed to determine whether or not the first page is determined.
[0047]
With this program, as described above, a plurality of copies of a document having a title cover can be continuously digitized for each document and held.
[0048]
According to a twentieth aspect of the present invention, in the program according to any one of the fifteenth to seventeenth aspects, when the document has a plurality of pages including a first page in which the title is written, Extracting the pixel of the specified color from each image, generating a connected component of the extracted pixel of the specified color, extracting a circumscribed rectangle of the generated connected component, and measuring a size of the extracted circumscribed rectangle. Thus, the first page determining step of determining whether or not the input image is the first page is executed.
[0049]
With this program, as described above, a plurality of copies of a document having a title cover can be continuously digitized for each document and held.
[0050]
A program according to a twenty-first aspect of the present invention is the program according to any one of the fifteenth to seventeenth aspects, wherein, when the document has a plurality of pages including a first page in which the title is described, Extracting a pixel of the specified color from each image, generating a connected component of the extracted pixel of the specified color, extracting a circumscribed rectangle of the generated connected component, and extracting the circumscribed rectangle of the generated circumscribed rectangle. The first page determination step is performed to determine whether the input image is the first page based on whether or not a character image exists.
[0051]
With this program, as described above, a plurality of copies of a document having a title cover can be continuously digitized for each document and held. In addition, the first page can be detected more reliably than when only pixels of the designated color are used.
[0052]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[First Embodiment]
FIG. 1 shows an image processing apparatus according to a first embodiment of the present invention. The image processing device of the present invention is configured by using a general-purpose processing device such as a personal computer, and the image processing function is realized by software.
[0053]
A central processing unit (hereinafter, referred to as a CPU) 401 controls the entire apparatus and realizes an image processing function of the present embodiment. The memory 402 is configured by a ROM, a RAM, or the like, and stores a control program of the CPU 401, and also holds information and the like that is created temporarily when the control program is executed by the CPU 401. The image storage device 403 includes a hard disk drive, a hard disk, and the like, and stores and stores documents (including a title image, a cover image, and an input image described later) after image processing on the hard disk. The image storage device 403 includes an image buffer memory (hereinafter, also referred to as an image buffer) 403a (shown in FIG. 3) for temporarily holding the cover image and the input image, and a title buffer for temporarily holding the title image. A memory (hereinafter, also referred to as a title buffer) 403b (shown in FIG. 3) and a storage memory 403c (shown in FIG. 3) for storing image data for each document including the title image, cover image, and input image. Have. Further, the image storage device 403 is used to read a document recorded on the hard disk and store it in another storage device. The image input device 404 is configured by a scanner or the like, reads an image such as a sheet document (included in a document), and stores the image in the memory 402. Further, the image input device 404 has a predetermined color filter for reading a color image so that a mark 12 of a designated color described later can be read. The input device 408 includes a keyboard, a mouse, a touch panel, and the like, and is used for inputting information related to image processing (including scanner operation information). The CD-ROM drive 405 is used to mount and read a CD-ROM 407 in which programs, data, and the like are recorded, and store the read data in the memory 402. The output device 406 is configured by a CRT, a liquid crystal display (LCD), a printer, or the like, and displays and prints an original image, a compressed image, or a binary image of an image processing result input from the image input device 404. . The CD-ROM 407 (included in the recording medium) stores programs, data, and the like for realizing the image processing functions and processing procedures of the present embodiment. The network connection device 409 connects the image processing device 400 to a network such as the Internet. The devices 401 to 406, 408, and 409 described above are connected by a bus 410.
[0054]
Further, in addition to the CD-ROM 407, semiconductor media (for example, ROM, IC memory card, etc.), optical media (for example, digital versatile disk (DVD), magneto-optical disk (MO), A disk (MD), a writable CD (CD-R) or the like, a magnetic medium (for example, a magnetic tape, a flexible disk (FD), or the like) may be used.
[0055]
Further, as the program installed from the above-described recording medium, in other words, as the program stored in the above-described recording medium, there is an image processing program used to realize the image processing function of the present embodiment. Here, the image processing program is written in a recording medium such as a CD-ROM 407 in advance, and the CD-ROM 407 or the like is mounted on a medium driving device such as a CD-ROM drive 405 and read. The image processing function of the present embodiment is realized by storing and executing the CPU 401. Further, when the image processing program is recorded on a semiconductor recording medium, it is directly loaded into the memory 402 and executed.
[0056]
By executing the image processing program loaded into the memory 402, not only the image processing function of the present embodiment is realized, but also the operating system or the like performs part of the actual processing based on the instruction of the image processing program. Alternatively, the entire processing may be performed, and the image processing function of the present embodiment may be realized by the processing.
[0057]
Next, an image processing program according to the present embodiment will be described. Here, as shown in FIG. 2, one copy of the document 10 is composed of a plurality of sheet documents, a title 13 is described on the front cover 11 of the document, and a designated color designated in advance so as to surround the title 13. The mark 12 is marked by the marker. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color. The image processing program causes the CPU 401 (included in the computer device) to execute the steps (S101 to S109) shown in FIG.
[0058]
First, the CPU 401 uses the image input device 404 to input an original image to be processed. The acquired data of the original image is sent to the memory 402 (S101 (included in the first step)).
[0059]
Next, the CPU 401 extracts the pixel of the specified color from the input image that is input first (S102 (included in the second step)).
[0060]
Next, the CPU 401 extracts a circumscribed rectangle of the mark 12 represented by the pixel of the designated color extracted in S102 (S103 (included in the second step)).
[0061]
Next, in the circumscribed rectangular area (corresponding to the title image area 14) extracted in S103, the CPU 401 replaces all the pixel values of the designated color pixels forming the mark 12 with the pixel values of the background color (for example, white). The mark 12 is deleted from the cover image (S104 (included in the third step)). As the background color, a pixel value having the largest number of pixels in the cover image is used. The character color is a color other than the designated color and the background color, and uses a pixel value having the largest number of pixels in the cover image. After setting the background color and the character color in this way, the binarization process is performed on the title image area 14. After setting the background color and the character color, the pixels other than the background color and the character color are subjected to a ternarization process using the pixels other than the background color as an intermediate pixel, for example, using a complementary method disclosed in Japanese Patent Application Laid-Open No. 9-270917. You may.
[0062]
Next, the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S106 in the image buffer 403a (S105 (included in the fourth step of claim 8 and claim 15)), and deletes the mark 12. The title image area 14 thus held is held in the title buffer 403b as the title image 14a (S106 (included in the fourth step of claim 8 and claim 15)).
[0063]
Next, the CPU 401 determines whether or not the input of all images has been completed (S107). If this determination is "NO", the flow proceeds to S108, and if "YES", the flow proceeds to S110.
[0064]
In S108, an image to be processed next is input, and then the input image is directly or appropriately compressed and stored in the image buffer 403a (S109 (included in the fourth step of claims 8 and 15)). .
[0065]
In S110 (included in the fourth step of claims 8 and 15), the image including the title image 14a held in the title buffer 403b and the cover image and the input image held in the image buffer 403a The group is stored in the storage memory 403c, and the process ends.
[0066]
Here, the above-described circumscribed rectangle extraction processing (S103) will be further described.
[0067]
First, the CPU 401 executes a process (run generation process) for obtaining a run of the specified color described above for each line of the image acquired in S101. Note that a run generally refers to a row of pixels having the same light and shade level continuously arranged in a certain direction, and the length of the row of pixels is referred to as a run length. Here, when the colors of pixels adjacent in the horizontal direction (row direction) are close to the designated color, they are collectively referred to as a run. In addition, as a method of determining that the pixel is close to the designated color, for example, a sum of squares of differences between components (R, G, B, and the like) of the pixel value is calculated, and this is calculated as a color difference ( (Hereinafter referred to as color difference), and a method of determining that this value is close to a case where the value is smaller than a predetermined value may be used. Further, when defining the color of each extracted run, a median (a value located at the center when a plurality of data are arranged in ascending or descending order) is used here. In addition to the median, for example, it is conceivable to use an average value of each run, a weighted average value based on a run length, or the like.
[0068]
The specific procedure of the run generation processing is as follows. First, a certain row (for example, a top row) is set as a target row, and pixels constituting a run of the target row are registered as run data. The runs are then integrated. At this time, the run at the left end is set as the reference run, and the run next to the run is set as the target run, and the color difference between the reference run and the target run is compared. If the color difference is equal to or smaller than a predetermined threshold, the runs are integrated, registered as one long run, and the integrated run is set as a new reference run. The median is used to set the color of the run after integration. On the other hand, as a result of comparing the above-described color difference with a predetermined threshold, if the color difference is not smaller than or equal to the threshold, that is, if the color difference is larger than the threshold, the target run is set as a new reference run. Next, it is determined whether there is a run next to the integrated new reference run or the newly defined reference run (target run) as described above. Here, if there is a run to the right of the new reference run, the run integration described above is repeated with this run as the new target run. If there is no run to the right of the new reference run, it is determined whether run integration should be performed again to complete the integration. Specifically, when a series of processes from the process of referring to the run at the left end to the process of determining whether or not there is a run on the right is executed, the run integration of the target row is performed even once. Judge whether or not it has been done. Here, if the process of setting the integrated run as a new reference run has never been executed, it is determined that all the runs have been extracted since there is no need to integrate the runs any more. Is not repeated any more. On the other hand, if the run integration of the line of interest has been performed at least once, a series of processes from the process of referring to the run at the left end to the process of determining whether or not there is a run on the right side is performed again. The processing of is performed. If the extraction of runs for all the rows has not been completed, the target row is changed to another row, and the procedure of the run generation processing is executed again. The above is the procedure of the run generation processing.
[0069]
Next, the CPU 401 integrates the connected components of the run (run integration processing). Here, for the runs acquired in the run generation processing, the colors of those that are in contact in the vertical direction are compared by using the above-described color difference.
[0070]
More specifically, first, the run data generated by the run generation processing is registered as connected component data as it is in the memory 402 or the like. Next, two connected component data that come into contact with each other are extracted from the connected component data. Next, the colors of the two connected component data are compared. Here, a color difference is obtained by the same method as in the run generation processing, and the color difference is compared with a predetermined threshold. Here, when the color difference is equal to or less than the threshold, the connected components are integrated into one connected component. Color information is also required for the integrated connected component, which is also based on the run generation processing. On the other hand, when the color difference is equal to or larger than the threshold value, the colors of the connected component data are compared for all combinations of the connected components without integrating the connected components. That is, until the combination of all the connected components is completed, the process of extracting the two connected components that are in contact with each other, comparing the colors of all the combinations of the connected components, and repeating the processes until the connected components are integrated. When the combination of all the connected components is completed in this way, the above-described processing procedure is repeated a further predetermined number of times to perform integration. The above is the run integration processing.
[0071]
Finally, the CPU 401 extracts a circumscribed rectangle of the connected component integrated in the run integration process. This extraction process extracts a circumscribed rectangle of the mark 12, that is, the title image area 14 (shown in FIG. 4) of the present embodiment.
[0072]
As described above, the image processing apparatus 400 according to the first embodiment of the present invention, when the mark 12 of the designated color designated in advance is added so as to surround the title 13 of the document to be processed, A function (included in the mark area extracting means) of the CPU 401 for extracting a title image area 14 (corresponding to a mark area) including the title 13 and the mark 12 from the image of the cover 11 of the document (included in the input image); The function of the CPU 401 for removing the mark 12 from the image area 14 (included in the mark removing means), the title image 14 a from which the mark 12 has been removed by the function of the CPU 401 (corresponding to the image of the mark area), and the CPU 401 Image storage device 4 for storing the document 10 (included in the image of the entire document) after the mark 12 has been removed by the function of 3 since a (included in the image storage means), a original document before the mark 12 is added can be stored in electronic form. Further, the document 10 can be searched from the plurality of digitized documents by the title image 14a.
[0073]
In the above-described embodiment, a case has been described in which the title image 14a and the input image group (including the cover image from which the mark 12 has been deleted and the input image excluding the cover image) are stored and accumulated in the image processing apparatus 400. In addition, in the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network in association with each other. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0074]
[Second embodiment]
The image processing apparatus according to the second embodiment of the present invention has substantially the same configuration as that of the first embodiment. Therefore, FIG. Omitted.
[0075]
FIG. 5 shows an outline of an image processing program according to the second embodiment of the present invention. Here, according to the first embodiment (shown in FIG. 2), one copy of the document 10 is composed of a plurality of sheet documents, and the title 13 is described on the front cover 11 of the document, and the title 13 is further surrounded. The mark 12 is marked with a marker of a designated color designated in advance. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color.
[0076]
The image processing program causes the CPU 401 (included in the computer device) to execute the steps shown in FIG. The same steps as in the first embodiment (shown in FIG. 3) are assigned the same reference numerals to simplify the description.
[0077]
First, the CPU 401 inputs an original image to be processed by the image input device 404 according to the first embodiment (S101).
[0078]
Next, the CPU 401 extracts pixels of the specified color from the first input image according to the first embodiment (S102).
[0079]
Next, according to the first embodiment, the CPU 401 extracts a circumscribed rectangle of the mark 12 represented by the pixel of the designated color extracted in S102 (S103).
[0080]
Next, in accordance with the first embodiment, the CPU 401 performs a process of replacing all pixel values of the pixels of the specified color with pixel values of a background color (for example, white) in the circumscribed rectangular area extracted in S103, The mark 12 is deleted from the cover image (S104). The character color is a color other than the designated color and the background color, and uses the largest pixel value in the cover image. Furthermore, after setting the character color and the background color, the pixels of the colors other than the character color and the background color are ternarized as intermediate pixels, and for example, a complementary method disclosed in JP-A-9-270917 may be used. Good. With this method, a clearer title image can be obtained.
[0081]
Next, in accordance with the first embodiment, the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S104 in the image buffer 403a (S105).
[0082]
Next, the CPU 401 extracts the circumscribed rectangle of the title character string in the circumscribed rectangular area extracted in S103 and subjected to the pixel value replacement processing in S104 (S121 (the fourth step of the ninth and sixteenth claims). included)).
[0083]
Next, the CPU 401 stores the circumscribed rectangle of the title character string extracted in S121 in the title buffer 403b as the title image 14b (S122 (included in the fifth step of claim 9 and claim 16)).
[0084]
Next, the CPU 401 determines whether or not the input of all images has been completed (S107). If this determination is "NO", the flow proceeds to S108, and if "YES", the flow proceeds to S110.
[0085]
In S108, the next image to be processed is input, and then the input image is stored in the image buffer 403a as it is or after being appropriately compressed (S109).
[0086]
In S110, an image group including the title image 14b held in the title buffer 403b and the cover image and the input image held in the image buffer 403a is stored in the storage memory 403c, and the process ends.
[0087]
Here, the above-described circumscribed rectangle extraction processing (S121) will be further described.
[0088]
First, in the title image area 14 (corresponding to the title image 14a) from which the mark 12 has been erased, the CPU 401 follows the first embodiment and adjoins a pixel of a character color (for example, a black pixel) for each line of the image according to the first embodiment. Is performed (run generation processing).
[0089]
Next, the CPU 401 generates a connected component of the run according to the first embodiment (connected component generation processing). This is for extracting a character string in the mark area (corresponding to the title image 14a).
[0090]
Next, the CPU 401 selects and deletes a connected component from the connected components generated in the connected component generation process under predetermined conditions (a connected component selection process). This is because the connected components obtained in the connected component generation processing may include non-character components. For example, a connected component smaller than a predetermined size is likely to be noise, and if passed as it is to a subsequent process as it is, there is a possibility that a reduction in accuracy or a reduction in processing speed may be caused. Here, connected components having a certain size or less are selected and deleted.
[0091]
Specifically, first, one of the connected components obtained in the connected component generation processing is extracted. Next, it is determined whether or not one of the extracted connected components is equal to or smaller than a predetermined size. Here, if the size of the connected component is equal to or smaller than a predetermined size, it is regarded as noise and deleted from the connected component data. If the size of the one connected component is larger than a predetermined size, the brightness of the connected component is compared with the brightness of pixels surrounding the connected component. Here, since a character with low brightness relative to the background is to be extracted, when the brightness of the connected component is high with respect to the surroundings of the connected component, the character is compared with the case where the brightness of the connected component is lower than the surroundings. This is unlikely. Therefore, the number of pixels having higher brightness than the connected component is counted, and when the ratio of the pixels having higher brightness is smaller than a predetermined ratio, it is determined that the connected component is not a character and is deleted from the connected data.
[0092]
Next, the CPU 401 integrates a circumscribed rectangle in the connected component with the connected component selected in the connected component selection process (circumscribed rectangle integration process). This integration process is to extract character regions (including the character string “pattern matching method” in FIG. 6) by integrating character rectangles. Here, of adjacent rectangles (circumscribed rectangles), those similar in size and color within a predetermined range are integrated and grouped. The rectangle group (consisting of circumscribed rectangles) integrated in this way is defined as a character string.
[0093]
Finally, the CPU 401 extracts a circumscribed rectangle of the rectangle group integrated in the circumscribed rectangle integration process, and performs a binarization process to generate a binary image. Here, a circumscribed rectangle of the character string “pattern matching method” surrounded by the mark 12, that is, an area of the title image 14b is extracted.
[0094]
As described above, the image processing apparatus 400 according to the second embodiment of the present invention, when the mark 12 of the designated color designated in advance is added so as to surround the title 13 of the document to be processed, A function (included in the mark area extracting means) of the CPU 401 for extracting a title image area 14 (corresponding to a mark area) including the title 13 and the mark 12 from the image of the cover 11 of the document (included in the input image); A function of the CPU 401 for extracting a character area including the title image 14b (included in the character image) from the image area 14 (included in the character area extracting means) and a function of the CPU 401 for removing the mark 12 from the title image area 14 (mark And the title image 14b (included in the character area image) extracted by the function of the CPU 401. ), And an image storage device 403 (included in the image storage unit) for storing the document 10 (included in the image of the entire document) after the mark 12 has been removed by the function of the CPU 401. The size of the title image 14b used for the mark 12 can be smaller than the title image 14a circumscribing the mark 12.
[0095]
In the above-described embodiment, a case has been described in which the title image 14b and the input image group (the cover image from which the mark 12 has been deleted, and the input image excluding the cover image) are stored and accumulated in the image processing apparatus 400. In addition, in the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network in association with each other. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0096]
[Third Embodiment]
The image processing apparatus according to the third embodiment of the present invention has substantially the same configuration as that of the first embodiment. Therefore, FIG. Omitted.
[0097]
FIG. 7 shows an outline of an image processing program according to the third embodiment of the present invention. Here, as shown in FIG. 8, differently sized documents 10a and 10b are overlapped to form a processing target document group 10c. The documents 10a and 10b are each composed of a plurality of sheet originals according to the first embodiment, a title 13 is described on a front cover 11 of the document, and a designation designated in advance so as to surround the title. The mark 12 is marked by a color marker. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color.
[0098]
The image processing program causes the CPU 401 (included in the computer device) to execute the steps shown in FIG. The steps for performing the same processing as in the first and second embodiments (shown in FIGS. 3 and 5) will be simplified.
[0099]
First, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c (S201).
[0100]
Next, in accordance with the first embodiment (S107 in FIG. 3), the CPU 401 determines whether or not image processing on all images of one document has been completed (S202). If this determination is "NO", the flow proceeds to S203, and if "YES", the flow proceeds to S204.
[0101]
In S203, the CPU 401 inputs an image to be processed by the image input device 404 according to the first embodiment (S101 in FIG. 3) (S203).
[0102]
Next, the CPU 401 extracts pixels of the specified color from the input image and counts the number of pixels (S205 (included in the first page determination step of claims 11 and 18)). Here, when the number of pixels (= N) of the designated color is larger than a predetermined value (here, threshold value Th), the process proceeds to S206 (included in the first page determination step of claims 11 and 18). YES), it is determined that the mark 12 is included in the input image, and the routine goes to S207. If the number of pixels of the designated color is smaller than a predetermined value (NO in S206), it is determined that the input image is other than the cover image, and the input image is stored in the image buffer 403a (S208).
[0103]
In S207, since the mark 12 surrounding the title of the cover is detected in S206, the image group including the cover image and the input image excluding the cover already held in the image buffer 403a is set as one document, and is stored in the title buffer 403b. Together with the held title image 14b, it is divided into a plurality of image groups and stored in the storage memory 403c.
[0104]
Next, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c (S209).
[0105]
Next, in accordance with the first embodiment (S103 in FIG. 3), the CPU 401 extracts a circumscribed rectangle of the mark 12 represented by the pixel of the designated color extracted in S205 (S210).
[0106]
Next, according to the first embodiment (S104 in FIG. 3), the CPU 401 replaces all the pixel values of the specified color pixels with the background color (for example, white) pixels in the circumscribed rectangular image area extracted in S210. A process of replacing with a value is performed, and the mark 12 is deleted from the cover image (S211).
[0107]
Next, in accordance with the first embodiment (S105 in FIG. 3), the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S211 in the image buffer 403a (S212).
[0108]
Next, in accordance with the first embodiment (S121 of FIG. 5), the CPU 401 extracts a circumscribed rectangle of the title character string in the circumscribed rectangular area extracted in S210 and subjected to the pixel value replacement processing in S211 (S213). ).
[0109]
Next, the CPU 401 stores the circumscribed rectangle of the title character string extracted in S213 as the title image 14b in the title buffer 403b according to the first embodiment (S122 in FIG. 5) (S214).
[0110]
In step S204, since the image processing of all the images in one document is completed, the image group including the cover image and the input image excluding the cover already held in the image buffer 403a is set as one document and held in the title buffer 403b. The title image 14b is stored in the storage memory 403c together with the title image 14b.
[0111]
As described above, the image processing apparatus 400 according to the third embodiment of the present invention has a plurality of pages including the cover 11 (corresponding to the top page) on which the title 13 is written in the documents 10a and 10b. A function of the CPU 401 that extracts pixels of the designated color from the input image of each page and determines whether or not the input image is the cover 11 based on the number of pixels of the designated color (the first page determination unit) ), A plurality of copies of the document having the cover 11 with the title can be continuously digitized and held for each document.
[0112]
In the above-described embodiment, a case has been described in which the title image and the input image group (the cover image from which the mark 12 has been deleted and the input image excluding the cover image are included) are stored and accumulated in the image processing apparatus 400. According to the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0113]
[Fourth embodiment]
The image processing apparatus according to the fourth embodiment of the present invention has substantially the same configuration as that of the first embodiment, so that FIG. Omitted.
[0114]
FIG. 9 shows an outline of an image processing program according to the fourth embodiment of the present invention. Here, according to the third embodiment (shown in FIG. 8), documents of the same size are superimposed to form a document group to be processed. Each document is composed of a plurality of sheet documents according to the first embodiment, a title is described on the front cover of the document, and a marker of a designated color designated in advance so as to surround the title. Marked by. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color.
[0115]
The image processing program causes the CPU 401 (included in the computer device) to execute the steps shown in FIG. The same steps as those in the third embodiment (shown in FIG. 7) are assigned the same reference numerals to simplify the description.
[0116]
First, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the third embodiment (S201).
[0117]
Next, according to the third embodiment, the CPU 401 determines whether or not the image processing for all the images of one document has been completed (S202). If this determination is "NO", the flow proceeds to S203, and if "YES", the flow proceeds to S204.
[0118]
In S203, the CPU 401 inputs an image to be processed according to the third embodiment (S203).
[0119]
Next, the CPU 401 extracts pixels of the specified color from the input image according to the third embodiment (S205), and further generates a connected component of the extracted pixels (S301 (Claims 12 and 19). Is included in the first page determination step). Here, the number of pixels (= N) in the connected component of the pixels of the designated color is a predetermined value (here, threshold Th 1 ) (YES in S302 (included in the first page determination step in claims 12 and 19)), the process proceeds to S207. If the number of pixels in the connected component of the specified color pixel is smaller than a predetermined value (NO in S302), the input image is held in the image buffer 403a (S208).
[0120]
In S207, according to the third embodiment, a group of images including the cover image already stored in the image buffer 403a and the input image excluding the cover is combined into one document, and together with the title image 14b stored in the title buffer 403b. The data is stored in the storage memory 403c.
[0121]
Next, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the third embodiment (S209).
[0122]
Next, the CPU 401 extracts a circumscribed rectangle of a connected component (representing the mark 12) of the pixel of the designated color extracted in S301 (S210).
[0123]
Next, in accordance with the third embodiment, the CPU 401 performs a process of replacing all pixel values of the specified color pixels with background color (for example, white) pixel values in the circumscribed rectangular image area extracted in S210. Then, the mark 12 is deleted from the cover image (S211).
[0124]
Next, the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S211 in the image buffer 403a according to the third embodiment (S212).
[0125]
Next, in accordance with the third embodiment, the CPU 401 extracts a circumscribed rectangle of the title character string in the circumscribed rectangular area extracted in S210 and subjected to the pixel value replacement processing in S211 (S213).
[0126]
Next, the CPU 401 stores the circumscribed rectangle of the title character string extracted in S213 as the title image 14b in the title buffer 403b according to the third embodiment (S214).
[0127]
In step S204, according to the third embodiment, the image group including the cover image already stored in the image buffer 403a and the input image excluding the cover is combined into one document, and the document group is created together with the title image 14b stored in the title buffer 403b. The data is stored in the storage memory 403c.
[0128]
As described above, the image processing apparatus 400 according to the fourth embodiment of the present invention has a plurality of pages including the cover 11 (corresponding to the first page) on which the title 13 is written in the documents 10a and 10b. Then, a pixel of a specified color is extracted from the input image of each page, a connected component of the extracted pixel of the specified color is generated, and the size of the generated connected component causes the input image to be a cover. Since it has a CPU 401 (included in the first page determination means) for determining whether or not the number is 11, the plurality of copies of the document having the cover 11 with the title are digitized continuously, and when each document is held, Even if the noise of the specified color is scattered on the input image, erroneous detection of the cover can be avoided.
[0129]
In the above-described embodiment, a case has been described in which the title image and the input image group (the cover image from which the mark has been deleted, and the input image excluding the cover image) are stored and stored in the image processing apparatus 400. According to the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0130]
[Fifth Embodiment]
The image processing apparatus according to the fifth embodiment of the present invention has substantially the same configuration as that of the first embodiment. Therefore, FIG. Omitted.
[0131]
FIG. 10 shows an outline of an image processing program according to the fifth embodiment of the present invention. Here, according to the third embodiment (shown in FIG. 8), documents of the same size are superimposed to form a document group to be processed. Each document is composed of a plurality of sheet documents according to the first embodiment, a title is described on the front cover of the document, and a marker of a designated color designated in advance so as to surround the title. Marked by. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color.
[0132]
The image processing program causes the CPU 401 (included in the computer device) to execute the steps shown in FIG. The same steps as in the fourth embodiment (shown in FIG. 9) are assigned the same reference numerals to simplify the description.
[0133]
First, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the fourth embodiment (S201).
[0134]
Next, the CPU 401 determines whether or not the image processing for all the images of one document has been completed according to the fourth embodiment (S202). If this determination is "NO", the flow proceeds to S203, and if "YES", the flow proceeds to S204.
[0135]
In S203, the CPU 401 inputs an image to be processed according to the fourth embodiment (S203).
[0136]
Next, the CPU 401 extracts pixels of the specified color from the input image according to the fourth embodiment (S205), and generates a connected component of the extracted pixels (S301).
[0137]
Next, the CPU 401 extracts the circumscribed rectangle of the connected component generated in S301 (S401 (included in the first page determination step of claims 13 and 20)), and obtains the size of the extracted circumscribed rectangle. As the size, for example, the number of pixels in the circumscribed rectangle or the area of the circumscribed rectangle may be used. Here, when the size of the circumscribed rectangle is larger than a predetermined value (YES in S402 (included in the first page determination step in claims 13 and 20)), the mark of the designated color is included in the input image. Then, the process proceeds to S207. If the size of the circumscribed rectangle is smaller than a predetermined value (NO in S402), it is determined that the input image is other than the cover image, and the input image is stored in the image buffer 403a (S208).
[0138]
In S207, according to the fourth embodiment, a group of images including the cover image already stored in the image buffer 403a and the input image excluding the cover is combined into one document, and together with the title image 14b stored in the title buffer 403b. The data is stored in the storage memory 403c.
[0139]
Next, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the fourth embodiment (S209).
[0140]
Next, according to the fourth embodiment, the CPU 401 performs a process of replacing all pixel values of the pixels of the specified color with pixel values of a background color (for example, white) in the circumscribed rectangular image region extracted in S401. Then, the mark 12 is deleted from the cover image (S211).
[0141]
Next, the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S211 in the image buffer 403a according to the fourth embodiment (S212).
[0142]
Next, in accordance with the fourth embodiment, the CPU 401 extracts a circumscribed rectangle of the title character string in the circumscribed rectangular area extracted in S210 and subjected to the pixel value replacement processing in S211 (S213).
[0143]
Next, the CPU 401 stores the circumscribed rectangle of the title character string extracted in S213 as the title image 14b in the title buffer 403b according to the fourth embodiment (S214).
[0144]
In step S204, according to the fourth embodiment, a group of images including the cover image already stored in the image buffer 403a and the input image excluding the cover is combined into one document, and together with the title image 14b stored in the title buffer 403b. The data is stored in the storage memory 403c.
[0145]
As described above, the image processing apparatus 400 according to the fifth embodiment of the present invention has a plurality of pages including the cover 11 (corresponding to the top page) on which the title 13 is written in the documents 10a and 10b. Then, a pixel of a specified color is extracted from the input image of each page, a connected component of the extracted pixel of the specified color is generated, a circumscribed rectangle of the generated connected component is extracted, and the extracted Since a function of the CPU 401 (included in the first page determining means) for determining whether or not the input image is the cover 11 according to the size of the circumscribed rectangle is provided, a plurality of documents having a cover with a title are provided. Is continuously digitized and stored for each document, even if noise of the designated color is scattered on the input image, erroneous detection of the cover can be avoided.
[0146]
In the above-described embodiment, a case has been described in which the title image and the input image group (the cover image from which the mark has been deleted, and the input image excluding the cover image) are stored and stored in the image processing apparatus 400. According to the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0147]
[Sixth Embodiment]
The image processing apparatus according to the sixth embodiment of the present invention has substantially the same configuration as that of the first embodiment. Therefore, FIG. Omitted.
[0148]
FIG. 11 shows an outline of an image processing program according to the sixth embodiment of the present invention. Here, according to the third embodiment (shown in FIG. 8), documents of the same size are superimposed to form a document group to be processed. Each document is composed of a plurality of sheet documents according to the first embodiment, a title is described on the front cover of the document, and a marker of a designated color designated in advance so as to surround the title. Marked by. Further, it is assumed that the characters (including the title) written on the document have a higher density than the paper color (background color) and the designated color.
[0149]
The image processing program causes the CPU 401 (included in the computer device) to execute the steps shown in FIG. The same steps as those in the fifth embodiment (shown in FIG. 10) are denoted by the same reference numerals, and the description will be simplified.
[0150]
First, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the fifth embodiment (S201).
[0151]
Next, the CPU 401 determines whether or not the image processing for all the images of one document has been completed according to the fifth embodiment (S202). If this determination is "NO", the flow proceeds to S203, and if "YES", the flow proceeds to S204.
[0152]
In S203, the CPU 401 inputs an image to be processed according to the fifth embodiment (S203).
[0153]
Next, the CPU 401 extracts pixels of the specified color from the input image according to the fifth embodiment (S205), and generates a connected component of the extracted pixels (S301).
[0154]
Next, the CPU 401 extracts the circumscribed rectangle of the connected component generated in S301 (S401), and determines whether or not the extracted circumscribed rectangle is a character string (S501 (first page of claims 14 and 21). Included in the decision step)). Here, if the circumscribed rectangle is a character string (YES in S502 (included in the first page determination step of claim 14 and claim 21)), the input image includes the mark of the designated color. It moves to S207. If the circumscribed rectangle is not a character string (NO in S502), the input image is determined to be an input image other than the cover image, and the input image is stored in the image buffer 403a (S208).
[0155]
Next, the CPU 401 initializes all of the image buffer 403a, the title buffer 403b, and the storage memory 403c according to the fifth embodiment (S209).
[0156]
Next, in accordance with the fifth embodiment, the CPU 401 performs a process of replacing all pixel values of the specified color pixels with background color (for example, white) pixel values in the circumscribed rectangular image region extracted in S210. Then, the mark 12 is deleted from the cover image (S211).
[0157]
Next, the CPU 401 stores the cover image of the cover 11 from which the mark 12 has been deleted in S211 in the image buffer 403a according to the fifth embodiment (S212).
[0158]
Next, the CPU 401 extracts a circumscribed rectangle of the title character string extracted in the character string determination processing in S501 (S213). Here, a circumscribed rectangle of a character string (“pattern matching method” and “feature extraction method” in FIG. 8) surrounded by the mark 12, that is, an area of a title image (corresponding to 14b in FIG. 6) is extracted.
[0159]
Next, in accordance with the fifth embodiment, the CPU 401 stores the circumscribed rectangle of the title character string extracted in S213 in the title buffer 403b as the title image 14b (S214).
[0160]
In S204, according to the fifth embodiment, a group of images including the cover image already stored in the image buffer 403a and the input image excluding the cover is combined into one document, and together with the title image 14b stored in the title buffer 403b. The data is stored in the storage memory 403c.
[0161]
Here, the above-described character string determination processing (S501) will be further described.
[0162]
First, the CPU 401 generates a run of adjacent pixels (for example, black pixels) for each row of the image in the circumscribed rectangular area of the pixel connection component of the specified color extracted in S210 according to the first embodiment. (Run generation processing). Next, a connected component of the run is generated (connected component generation processing). Next, a connected component is selected and deleted from the connected components generated in the connected component generation process under predetermined conditions (a connected component selection process). Here, connected components having a certain size or less are selected and deleted. Next, a circumscribed rectangle of the connected component is integrated with the connected component selected in the connected component selection process (a circumscribed rectangle integration process). Here, of adjacent rectangles (circumscribed rectangles), those similar in size and color within a predetermined range are integrated and grouped. Next, a circumscribed rectangle of the rectangle group integrated in the circumscribed rectangle integration process is extracted (a circumscribed rectangle extraction process).
[0163]
Next, the CPU 401 determines whether or not the circumscribed rectangle extracted in the circumscribed rectangle extraction process is a circumscribed rectangle of a character string (a circumscribed rectangle determination process). This is because the integrated circumscribed rectangle may include a non-character string in which a part of a figure or a photograph is erroneously integrated.
[0164]
Specifically, first, one of the integrated circumscribed rectangles is selected. Next, it is determined whether or not the height of the selected circumscribed rectangle is equal to or greater than a predetermined value. Here, if the height of the circumscribed rectangle is not less than a predetermined value, it is determined that the circumscribed rectangle is not a character string. If the height of the circumscribed rectangle is smaller than a predetermined value, the color information of the circumscribed rectangle is compared with the color information around the circumscribed rectangle. Here, when extracting a character having lower brightness than the background (surrounding), if the surrounding brightness is lower than the brightness of the circumscribed rectangle, it is determined that the circumscribed rectangle is not a character string. When extracting a character having a higher brightness than the background, contrary to the above-described determination condition, if the surrounding brightness is higher than the brightness of the circumscribed rectangle, it is determined that the circumscribed rectangle is not a character string. Next, when it is determined that the circumscribed rectangle is a character string by comparing the color information of the circumscribed rectangle with the color information around the circumscribed rectangle, the edge strength in the circumscribed rectangle is further determined from a predetermined value. Count the number of strong pixels. Here, it is assumed that the measurement of the edge strength is performed on the original image, and for example, a spatial filter having a shape of 3 × 3 pixels and a predetermined coefficient is individually applied around the pixel to be measured. Then, the sum of squares of the obtained result is used as the edge strength. Next, if the ratio of the number of pixels whose edge strength is higher than a predetermined value to the total number of pixels in the circumscribed rectangle is smaller than a predetermined value, it is determined that the character string is not a character string.
[0165]
As described above, the image processing apparatus 400 according to the sixth embodiment of the present invention has a plurality of pages including the cover 11 (corresponding to the top page) on which the title 13 is written in the documents 10a and 10b. Then, a pixel of a specified color is extracted from the input image of each page, a connected component of the extracted pixel of the specified color is generated, a circumscribed rectangle of the generated connected component is extracted, and the extracted Since the CPU 401 has a function of determining whether or not the input image is the cover 11 based on whether or not a character image exists in the area of the circumscribed rectangle (included in the first page determination means), the title is included. A plurality of documents having the attached cover 11 can be continuously digitized and held for each document. Also, the cover 11 can be detected more reliably than the method of identifying the cover 11 using only the pixels of the designated color.
[0166]
In the above-described embodiment, a case has been described in which the title image and the input image group (the cover image from which the mark has been deleted, and the input image excluding the cover image) are stored and stored in the image processing apparatus 400. According to the present invention, the same effect can be obtained even when the title image and the input image group are stored and stored in an external server via a network. In this case, the user of the image processing apparatus accesses the external server, selects a desired document from a list of title images smaller in size than the document (input image group), and refers to the content. (Shown in a seventh embodiment described later).
[0167]
Further, in the above-described embodiment, a case has been described where it is determined whether or not the cover is a cover based on the presence or absence of a character string in the circumscribed rectangular area of the mark 12, and the circumscribed rectangle of the character string is extracted as the title image 14b. In addition, the invention provides a binary image by performing a binarization process on the character region of the circumscribed rectangle, performing character recognition on the binary image by a pattern matching method, a structure analysis method, or the like. The same effect can be obtained even if the recognition result is held or stored as a title image. In this case, the character recognition process may be realized by a function of the CPU 401 (included in the character recognition unit). Further, the image processing program may cause the CPU 401 to execute a character recognition step of recognizing characters of the character string (included in the character image). Further, this configuration may be applied to other embodiments (including the above-described first to fifth embodiments and a seventh embodiment described later). This makes it possible to provide a clear and easy-to-view title image as compared with a case where character recognition is not performed.
[0168]
[Seventh embodiment]
FIG. 12 shows an image processing system according to the seventh embodiment of the present invention. This is different from the first to sixth embodiments in that an image processing apparatus that actually executes image processing of a document and an image management server that stores and manages an image of a document digitized by the image processing are used. The difference is that they are separated and connected by a network.
[0169]
In the image management server 500 of FIG. 12, the CPU 501 controls the entire apparatus and implements the image management function of the present embodiment. The memory 502 is configured by a ROM, a RAM, or the like, stores a control program (including an image management program) for the CPU 501, and holds information or the like that is created temporarily when the control program is executed by the CPU 501. Is what you do. The image storage device 503 includes a hard disk drive, a hard disk, and the like. The title image data and the input image group (the cover image in which the mark surrounding the title has been deleted, and the cover image transmitted from the image processing devices 400a to 400c, (Including an input image to be excluded) is stored in a hard disk and used for management. Further, the image storage device 503 is used to mount and read a hard disk in which an image management program for realizing the image management function of the present embodiment is recorded, and to store it in the memory 502. The network card 504 is an interface for connecting the server device 500 to the Internet 509 (included in the network), and communicates with other communication devices (including the image processing devices 400a to 400c) via the router 505 and the Internet 509. And data exchange. The router 505 distributes the connection destination of the image management server 500 on the Internet 509. The above-described devices 501 to 505 are connected by a bus 510.
[0170]
Further, as a recording medium on which the image management program is recorded, in addition to a hard disk, a semiconductor medium (for example, ROM, IC memory card, etc.), an optical medium (for example, CD-ROM), a digital versatile disk ( DVD), a magneto-optical disk (MO), a mini disk (MD), a writable CD (CD-R) or the like, a magnetic medium (for example, a magnetic tape, a flexible disk (FD), or the like) may be used.
[0171]
A network such as the Internet 509 is a transmission path for coupling communication devices such as the image management server 500 and the image processing devices 400a to 400c, and is generally realized by a cable. IP is used. However, the transmission path is not limited to a cable, but may be any of wireless, wired, and broadcast waves as long as the communication protocol between them is the same. For example, a local area network (LAN), a wide area network (WAN), an analog A telephone network, a digital telephone network (ISDN), a personal handy phone system (PHS), a mobile telephone network, a satellite communication network, or the like can be used.
[0172]
Further, when the image management program is recorded on a semiconductor recording medium, the image management program is directly loaded into the memory and executed, not from the medium driving device.
[0173]
By executing the image management program loaded into the memory, not only the image management function of the present embodiment is realized, but also the operating system or the like performs part of the actual processing based on the instruction of the image management program. Alternatively, the entire process may be performed, and the image management function of the present embodiment may be realized by the processing.
[0174]
The image processing apparatuses 400a to 400c in FIG. 12 are, for example, personal computers, and have substantially the same configuration as the first embodiment. That is, although not shown in detail, a CPU (corresponding to 401 in FIG. 1) for controlling the entire apparatus, a memory (corresponding to 402 in FIG. 1) for storing a control program and data for the CPU, an image processing program A medium drive device (corresponding to 405 in FIG. 1) for mounting and reading a recording medium on which data is recorded, and input devices such as a keyboard, a mouse, a touch panel, and a scanner (404 and 408 in FIG. 1) , A CRT, a liquid crystal display (LCD), an output device such as a printer (corresponding to 406 in FIG. 1), and the image processing devices 400a to 400c for connecting to the Internet 509 (included in the network). A network connection device (equivalent to 409 in FIG. 1) is provided.
[0175]
Here, as the recording medium on which the image processing program is recorded, not only a hard disk but also a semiconductor medium (for example, ROM, IC memory card, etc.), an optical medium (for example, CD ROM (CD-ROM), Digital versatile disk (DVD), magneto-optical disk (MO), mini disk (MD), writable CD (CD-R), etc., magnetic medium (eg, magnetic tape, flexible disk (FD), etc.) May be used.
[0176]
A network such as the Internet 509 is a transmission path for coupling communication devices such as the image management server 500 and the image processing devices 400a to 400c, and is generally realized by a cable. IP is used. However, the transmission path is not limited to a cable, but may be any of wireless, wired, and broadcast waves as long as the communication protocol between them is the same. For example, a local area network (LAN), a wide area network (WAN), an analog A telephone network, a digital telephone network (ISDN), a personal handy phone system (PHS), a mobile telephone network, a satellite communication network, or the like can be used.
[0177]
Further, when the image processing program is recorded on a semiconductor recording medium, the image processing program is directly loaded into the memory and executed, not from the medium driving device.
[0178]
By executing the image processing program loaded into the memory, not only the image processing function of the present embodiment is realized, but also the operating system or the like performs part of the actual processing based on the instruction of the image processing program. Alternatively, the entire processing may be performed, and the image processing function of the present embodiment may be realized by the processing.
[0179]
According to the above-described configuration, any one of the image processing apparatuses 400a to 400c connected to the Internet 509 applies the image processing program according to the first to sixth embodiments to a document including a cover and a plurality of originals according to the image processing program. Processing is performed, and the obtained cover image and the input image other than the cover image are combined into one document and transmitted to the image management server 500 together with the title image obtained from the cover image. The image management server 500 receives a group of images from the image processing apparatuses 400a to 400c via the router 505 and the network card 504, and stores the title image and one document in the image storage apparatus 503 in association with each other. Thereafter, when a title image request is transmitted from the image processing apparatuses 400a to 400c to the image management server 500, the CPU 501 reads out the image management program stored in the hard disk into the memory 502 and executes it. Here, the CPU 501 reads the title image group stored in the hard disk and identification information (including title information) assigned to each title image, and transmits the same to the image processing apparatus via the Internet 509. Next, when a document search request (including the identification information) is transmitted from the image processing apparatuses 400a to 400c to the image management server 500, the document corresponding to the identification information is selected from the documents stored in the hard disk. The document is read and transmitted to the image processing apparatus via the Internet 509.
[0180]
Note that the image processing program is stored in CPUs (included in the computer device) of the image processing apparatuses 400a to 400c in the first to sixth embodiments (FIGS. 3, 5, 7, 9, 10, and 10). 11) is executed. However, in the image group storage processing (S110, S204, S207), a transmission processing step (illustration shown) of transmitting an image group including the stored image of the document and the title image to the image management server 500 via the Internet 509 is shown. Zu) has been added.
[0181]
The image management program causes the CPU 501 (included in the computer device) of the image management server 500 to execute the steps shown in FIG. The image management program includes a storage program (shown in FIG. 13A), a search assistance program (shown in FIG. 13B), and a search program (shown in FIG. 13C).
[0182]
In FIG. 13A, first, the CPU 501 determines whether image data for storage (including a title image and a document image) has been transmitted from any of the image processing apparatuses 400a to 400c (S601). If the determination is "NO", the process ends. If the determination is "YES", the received title image and the document image (including the cover image) are stored in the image storage device 503 in association with each other (S602). ). Next, the CPU 501 assigns identification information to each received title image, and additionally registers the identification information corresponding to the title image stored in the image storage device 503 on a one-to-one basis in a “title list” (S603). . Here, the “title list” is set in a predetermined area of the memory 502 or the image storage device 503, and when the image data for storage is received, or when the image processing device deletes the image data 400a to 400c, the image data is deleted. It can be updated when deleted.
[0183]
In FIG. 13B, first, the CPU 501 determines whether any of the image processing apparatuses 400a to 400c has requested transmission of the title list (S701). If the determination is "NO", the process ends. If the determination is "YES", the title list is read from the memory 502 or the image storage device 503, and transmitted to the image processing device via the Internet 509 (S702).
[0184]
In FIG. 13C, first, the CPU 501 determines whether an image search request (including title information of a desired document) has been received from any of the image processing apparatuses 400a to 400c (S801). If the determination is "NO", the process ends. If the determination is "YES", a desired title is searched from the title list based on the transmitted title information (S802). If the title is detected in this search (YES in S803), the image data of the document corresponding to the title is read from the image storage device 503 (S804), and transmitted to the image processing device via the Internet 509 (S805). . If the search result in S803 is “NO”, error information is transmitted and the process ends (S806).
[0185]
In the above-described embodiment, the case where the image processing is performed by the image processing apparatuses 400a to 400c has been described. However, the present invention is also applicable to inputting an image to be processed by the image processing apparatuses 400a to 400c, The image may be transmitted to the image storage server 500, and all image processing on the input image may be performed by the image storage server 500. In this case, the effect is obtained that the image processing apparatuses 400a to 400c can save the time cost for introducing the image processing program.
[0186]
【The invention's effect】
As described above, the present invention is provided with the mark removing means (including the CPU of the image processing apparatus) for removing the mark from the mark area of the input image. And an image processing apparatus having an excellent effect that the original document before the mark is added can be digitized and stored by storing the image of the entire document after the mark is removed by the mark removing means. Is what you can do.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a configuration of an image processing apparatus according to a first embodiment.
FIG. 2 is a diagram illustrating a document to be subjected to image processing according to the first embodiment.
FIG. 3 is a flowchart illustrating an image processing program according to the first embodiment.
FIG. 4 is a diagram illustrating an image processing procedure according to the first embodiment.
FIG. 5 is a flowchart illustrating an image processing program according to a second embodiment.
FIG. 6 is a diagram illustrating an image processing procedure according to a second embodiment.
FIG. 7 is a flowchart illustrating an image processing program according to a third embodiment.
FIG. 8 is a diagram illustrating a document to be subjected to image processing according to a third embodiment.
FIG. 9 is a flowchart illustrating an image processing program according to a fourth embodiment.
FIG. 10 is a flowchart illustrating an image processing program according to a fifth embodiment.
FIG. 11 is a flowchart illustrating an image processing program according to a sixth embodiment.
FIG. 12 is a block diagram illustrating a configuration of an image processing system according to a seventh embodiment.
FIG. 13 is a flowchart illustrating an image management program according to a seventh embodiment.
[Explanation of symbols]
400, 400a, 400b, 400c image processing device
401, 501 CPU
402, 502 memory
403, 503 Image storage device
404 Image input device
405 CD-ROM drive
406 output device
407 CD-ROM
408 input device
409 Network connection device
410, 510 bus
500 image management server
504 network card
505 router
509 Internet

Claims (21)

処理対象の文書のタイトルを囲むように、予め指定された指定色のマークが付加されているとき、前記文書の入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出するマーク領域抽出手段と、前記マーク領域から前記マークを除去するマーク除去手段と、前記マーク除去手段により前記マークが除去された後の前記マーク領域の画像、および前記マーク除去手段により前記マークが除去された後の文書全体の画像を記憶する画像記憶手段とを備えたことを特徴とする画像処理装置。Mark area extracting means for extracting a mark area including the title and the mark from an input image of the document when a mark of a designated color specified in advance is added so as to surround the title of the document to be processed; A mark removing unit that removes the mark from the mark region; an image of the mark region after the mark is removed by the mark removing unit; and an entire document after the mark is removed by the mark removing unit. An image processing apparatus comprising: an image storage unit that stores an image. 処理対象の文書のタイトルを囲むように、予め指定された指定色のマークが付加されているとき、前記文書の入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出するマーク領域抽出手段と、前記マーク領域から文字画像を含む文字領域を抽出する文字領域抽出手段と、前記マーク領域から前記マークを除去するマーク除去手段と、前記文字領域抽出手段により抽出された文字領域の画像、および前記マーク除去手段により前記マークが除去された後の文書全体の画像を記憶する画像記憶手段とを備えたことを特徴とする画像処理装置。Mark area extracting means for extracting a mark area including the title and the mark from an input image of the document when a mark of a designated color specified in advance is added so as to surround the title of the document to be processed; A character region extracting unit for extracting a character region including a character image from the mark region, a mark removing unit for removing the mark from the mark region, an image of the character region extracted by the character region extracting unit, and the mark An image storage device for storing an image of the entire document after the mark has been removed by the removal device. 前記文字画像の文字を認識する文字認識手段を有し、前記画像記憶手段が、前記文字認識手段の認識結果を記憶するようにしたことを特徴とする請求項2に記載の画像処理装置。3. The image processing apparatus according to claim 2, further comprising character recognition means for recognizing characters of the character image, wherein the image storage means stores a recognition result of the character recognition means. 前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えたことを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。The document has a plurality of pages including a top page in which the title is written, extracts the pixels of the specified color from the image of each input page, and inputs the pixels by the number of pixels of the specified color. 4. The image processing apparatus according to claim 1, further comprising: a first page determining unit configured to determine whether the image is a first page. 前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えたことを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。The document has a plurality of pages including a top page on which the title is written, extracts pixels of the specified color from an image of each input page, and connects the extracted components of the pixels of the specified color. And a head page determining unit for determining whether the input image is a head page based on the size of the generated connected component. An image processing apparatus according to claim 1. 前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えたことを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。The document has a plurality of pages including a top page on which the title is written, extracts pixels of the specified color from an image of each input page, and connects the extracted components of the pixels of the specified color. And extracting a circumscribed rectangle of the generated connected component, and determining, based on the size of the extracted circumscribed rectangle, whether the input image is the first page or not. The image processing apparatus according to claim 1, wherein: 前記文書には、前記タイトルが記された先頭頁を含む複数の頁を有し、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断手段を備えたことを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。The document has a plurality of pages including a top page on which the title is written, extracts pixels of the specified color from an image of each input page, and connects the extracted components of the pixels of the specified color. Is generated, a circumscribed rectangle of the generated connected component is extracted, and whether or not the input image is the first page is determined based on whether or not a character image exists in the extracted circumscribed rectangle area. 4. The image processing apparatus according to claim 1, further comprising a first page determination unit for determining. コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、第3のステップで前記マークが除去された後の前記マーク領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第4のステップとを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A first step of inputting an image of a document in which a mark of a specified color specified in advance is provided so as to surround a title; and when the image is input in the first step, A second step of extracting a mark area including a title and the mark, a third step of removing the mark from the mark area extracted in the second step, and a step of removing the mark in a third step And a fourth step of storing an image of the mark area after the mark has been removed and an image of the entire document after the mark has been removed in the third step. . コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、前記マーク領域から文字画像を含む文字領域を抽出する第4のステップと、第4のステップで抽出された前記文字領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第5のステップとを実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A first step of inputting an image of a document in which a mark of a specified color specified in advance is provided so as to surround a title; and when the image is input in the first step, A second step of extracting a mark area including a title and the mark, a third step of removing the mark from the mark area extracted in the second step, and a character area including a character image from the mark area And a fifth step of storing the image of the character area extracted in the fourth step and the image of the entire document after the mark is removed in the third step. A computer-readable recording medium on which a program to be executed is recorded. 前記コンピュータに、前記文字画像の文字を認識する文字認識ステップを実行させるためのプログラムを記録した請求項9に記載のコンピュータ読み取り可能な記録媒体。10. The computer-readable recording medium according to claim 9, wherein a program for causing the computer to execute a character recognition step of recognizing characters of the character image is recorded. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録した請求項8乃至10のいずれかに記載のコンピュータ読み取り可能な記録媒体。When the document has a plurality of pages including the first page in which the title is written, the computer extracts the pixels of the specified color from the input image of each page, and calculates the number of pixels of the specified color. 11. The computer-readable recording medium according to claim 8, wherein a program for executing a first page determining step of determining whether an input image is a first page is recorded. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録した請求項8乃至10のいずれかに記載のコンピュータ読み取り可能な記録媒体。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. 10. A program for executing a first page determination step of determining whether an input image is the first page based on the size of the generated connected component is recorded. A computer-readable recording medium according to any one of claims 10 to 13. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録した請求項8乃至10のいずれかに記載のコンピュータ読み取り可能な記録媒体。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. Generating a connected component, extracting a circumscribed rectangle of the generated connected component, and determining whether the input image is the first page based on the size of the extracted circumscribed rectangle. The computer-readable recording medium according to any one of claims 8 to 10, wherein a program for executing the program is recorded. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるためのプログラムを記録した請求項8乃至10のいずれかに記載のコンピュータ読み取り可能な記録媒体。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. Is generated, a circumscribed rectangle of the generated connected component is extracted, and whether or not the input image is the first page is determined by whether or not a character image exists in the extracted circumscribed rectangle area. The computer-readable recording medium according to any one of claims 8 to 10, wherein a program for executing a first page determining step of determining whether or not the page is stored is recorded. コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、第3のステップで前記マークが除去された後の前記マーク領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第4のステップとを実行させるためのプログラム。A first step of inputting an image of a document in which a mark of a specified color specified in advance is provided so as to surround a title; and when the image is input in the first step, A second step of extracting a mark area including a title and the mark, a third step of removing the mark from the mark area extracted in the second step, and a step of removing the mark in a third step And a fourth step of storing an image of the mark area after the mark has been removed and an image of the entire document after the mark has been removed in the third step. コンピュータに、予め指定された指定色のマークが、タイトルを囲むように付加された文書の画像を入力する第1のステップと、第1のステップで前記画像が入力されたとき、入力画像から前記タイトルおよび前記マークを含むマーク領域を抽出する第2のステップと、第2のステップで抽出された前記マーク領域から前記マークを除去する第3のステップと、前記マーク領域から文字画像を含む文字領域を抽出する第4のステップと、第4のステップで抽出された前記文字領域の画像、および第3のステップで前記マークが除去された後の文書全体の画像を記憶する第5のステップとを実行させるためのプログラム。A first step of inputting an image of a document in which a mark of a specified color specified in advance is provided so as to surround a title; and when the image is input in the first step, A second step of extracting a mark area including a title and the mark, a third step of removing the mark from the mark area extracted in the second step, and a character area including a character image from the mark area And a fifth step of storing the image of the character area extracted in the fourth step and the image of the entire document after the mark is removed in the third step. The program to be executed. 前記コンピュータに、前記文字画像の文字を認識する文字認識ステップを実行させるための請求項16に記載のプログラム。17. The program according to claim 16, which causes the computer to execute a character recognition step of recognizing characters of the character image. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、前記指定色の画素の数により、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるための請求項15乃至17のいずれかに記載のプログラム。When the document has a plurality of pages including the first page in which the title is written, the computer extracts the pixels of the specified color from the input image of each page, and calculates the number of pixels of the specified color. The program according to any one of claims 15 to 17, for executing a first page determining step of determining whether an input image is a first page. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるための請求項15乃至17のいずれかに記載のプログラム。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. 21. A head page determining step of determining whether or not an input image is a head page based on the size of the generated connected component. The program described in. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の大きさにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるための請求項15乃至17のいずれかに記載のプログラム。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. Generating a connected component, extracting a circumscribed rectangle of the generated connected component, and determining whether the input image is the first page based on the size of the extracted circumscribed rectangle. The program according to any one of claims 15 to 17, for executing the program. 前記文書に、前記タイトルが記された先頭頁を含む複数の頁を有する場合、前記コンピュータに、入力された頁ごとの画像から前記指定色の画素を抽出し、抽出された前記指定色の画素の連結成分を生成し、生成された前記連結成分の外接矩形を抽出し、抽出された前記外接矩形の領域内に文字画像が存在するか否かにより、入力された画像が先頭頁であるか否かを判断する先頭頁判断ステップを実行させるための請求項15乃至17のいずれかに記載のプログラム。When the document has a plurality of pages including the first page on which the title is written, the computer extracts pixels of the specified color from an image of each input page, and extracts the extracted pixels of the specified color. Is generated, a circumscribed rectangle of the generated connected component is extracted, and whether or not the input image is the first page is determined by whether or not a character image exists in the extracted circumscribed rectangle area. The program according to any one of claims 15 to 17, for executing a first page determination step of determining whether or not the first page is determined.
JP2003035326A 2003-02-13 2003-02-13 Image processing device, recording medium and program Pending JP2004246597A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003035326A JP2004246597A (en) 2003-02-13 2003-02-13 Image processing device, recording medium and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003035326A JP2004246597A (en) 2003-02-13 2003-02-13 Image processing device, recording medium and program

Publications (1)

Publication Number Publication Date
JP2004246597A true JP2004246597A (en) 2004-09-02

Family

ID=33020776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003035326A Pending JP2004246597A (en) 2003-02-13 2003-02-13 Image processing device, recording medium and program

Country Status (1)

Country Link
JP (1) JP2004246597A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241355A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program
WO2008081666A1 (en) * 2006-12-28 2008-07-10 Konica Minolta Holdings, Inc. Document reader apparatus
JP2010211466A (en) * 2009-03-10 2010-09-24 Canon Inc Image processing apparatus, image processing method, and program
JP2018018303A (en) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 Information extraction device and image forming apparatus having the same

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241355A (en) * 2006-03-06 2007-09-20 Fuji Xerox Co Ltd Image processor and image processing program
WO2008081666A1 (en) * 2006-12-28 2008-07-10 Konica Minolta Holdings, Inc. Document reader apparatus
JP2010211466A (en) * 2009-03-10 2010-09-24 Canon Inc Image processing apparatus, image processing method, and program
US8737744B2 (en) 2009-03-10 2014-05-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program for displaying a preview of a document region and a recognized content processing
JP2018018303A (en) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 Information extraction device and image forming apparatus having the same
US10452903B2 (en) 2016-07-28 2019-10-22 Kyocera Document Solutions Inc. Information extraction device, image forming apparatus including information extraction device and method of controlling information extraction device

Similar Documents

Publication Publication Date Title
CN110135411B (en) Business card recognition method and device
EP0774729B1 (en) Character recognizing and translating system
US7545992B2 (en) Image processing system and image processing method
JP4208918B2 (en) Method and apparatus for extracting text from document image, computer program and storage medium thereof
US6351559B1 (en) User-enclosed region extraction from scanned document images
JP3950777B2 (en) Image processing method, image processing apparatus, and image processing program
CN100414550C (en) Image processing apparatus for image retrieval and control method therefor
US20060204096A1 (en) Apparatus, method, and computer program for analyzing document layout
JP4785655B2 (en) Document processing apparatus and document processing method
JP4522468B2 (en) Image discrimination device, image search device, image search program, and recording medium
JP2007164648A (en) Similar image search device, similar image search method, program and information recording medium
JP3972751B2 (en) Image processing device
JP2007172132A (en) Layout analysis program, layout analysis device and layout analysis method
AU2006235826A1 (en) Image processing device, image processing method, and storage medium storing image processing program
JP2001195598A (en) User plotting surrounding area extracting method for scanned and read document
JP4077919B2 (en) Image processing method and apparatus and storage medium therefor
JP2008204184A (en) Image processor, image processing method, program and recording medium
US8181108B2 (en) Device for editing metadata of divided object
JP4538214B2 (en) Image segmentation by graph
JP2004246597A (en) Image processing device, recording medium and program
JPH09138802A (en) Character recognition translation system
JP2003087562A (en) Image processor and image processing method
JP2005208977A (en) Document filing device and method
JP2007011762A (en) Area extraction apparatus and area extraction method
JP2004080341A (en) Image processor, image processing method, program, and recording medium