JP4708888B2 - 画像処理装置、画像処理方法及びコンピュータプログラム - Google Patents

画像処理装置、画像処理方法及びコンピュータプログラム Download PDF

Info

Publication number
JP4708888B2
JP4708888B2 JP2005203579A JP2005203579A JP4708888B2 JP 4708888 B2 JP4708888 B2 JP 4708888B2 JP 2005203579 A JP2005203579 A JP 2005203579A JP 2005203579 A JP2005203579 A JP 2005203579A JP 4708888 B2 JP4708888 B2 JP 4708888B2
Authority
JP
Japan
Prior art keywords
image
data
image data
unit
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005203579A
Other languages
English (en)
Other versions
JP2007025814A5 (ja
JP2007025814A (ja
Inventor
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005203579A priority Critical patent/JP4708888B2/ja
Priority to US11/483,059 priority patent/US7420150B2/en
Publication of JP2007025814A publication Critical patent/JP2007025814A/ja
Publication of JP2007025814A5 publication Critical patent/JP2007025814A5/ja
Application granted granted Critical
Publication of JP4708888B2 publication Critical patent/JP4708888B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/333Mode signalling or mode changing; Handshaking therefor
    • H04N1/3333Mode signalling or mode changing; Handshaking therefor during transmission, input or output of the picture signal; within a single document or page
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3871Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/64Systems for the transmission or the storage of the colour picture signal; Details therefor, e.g. coding or decoding means therefor
    • H04N1/642Adapting to different types of images, e.g. characters, graphs, black and white image portions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3243Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of type information, e.g. handwritten or text document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3247Data linking a set of images to one another, e.g. sequence, burst or continuous capture mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/333Mode signalling or mode changing; Handshaking therefor
    • H04N2201/33307Mode signalling or mode changing; Handshaking therefor of a particular mode
    • H04N2201/33342Mode signalling or mode changing; Handshaking therefor of a particular mode of transmission mode
    • H04N2201/33357Compression mode

Description

本発明は画像処理装置、画像処理方法及びコンピュータプログラムに関し、例えば紙文書を電子化保存しその一部を電子文書の編集に利用するために用いて好適な技術に関する。
近年、スキャナの普及により文書の電子化が進んでいる。しかし電子化された文書をフルカラービットマップ形式で保存しようとすると、例えば。A4サイズの場合では300dpi約24Mバイトにもなり、必要な保存領域が膨大になる。また、このような大容量のデータは、電子的に送信するのにも適していない。
そのようなフルカラー画像は圧縮することが通常行われており、その圧縮方式としてJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良い。しかし一方で、文字部などの高周波部分をJPEG圧縮すると、モスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。一般に利用される文書には、1ページに文字と画像の両方が含まれていることが多く、JPEGによる圧縮で画質と圧縮率を両立することは難しかった。
そこで前記の問題を解決するために、領域分割を行い、文字領域を抜いた下地部分のJPEG圧縮と、色情報付き文字領域部分のMMR圧縮を作成し、解凍時は白部分はJPEG画像を透過し、黒部分は代表文字色を載せて表現する方法があった。たとえば、特許文献1に開示される画像処理装置によれば、紙文書をスキャンして得た画像から、文字領域は解像度を落とさずに二値化して非可逆圧縮、下地は解像度を落として高い圧縮率のJPEG圧縮を施したデータが作成された。これにより、カラー情報を保ちながら、文字などの可読性は失われずに大幅にサイズが削減された、送信や保存に好適な電子化文書を得ることが可能だった。
一方、コンピュータの普及により、ワードプロセッサーのような文書編集アプケーションを用いて文書の作成、編集をする作業が一般に広く行われるようになっている。前述のように電子化され保存された文書も、閲覧されるだけではなく、それらをまるごと、あるいは一部を別文書に挿入、さらには編集加工するなどして利用したいという需要も高まっている。
このような要求の一部に応えるものとして、たとえば特許文献2にて公開される画像処理装置では、スキャンした文書のイメージデータから、当該文書に対応するオリジナル文書ファイルをデータベース等から検索して特定し、実際に印刷や再利用などはこのオリジナル文書ファイルに対しておこなうことで画質や編集性の高い利用が可能になっていた。
特開2002−77633号公報 特開2004−265384号公報
しかしながら、スキャンにより電子化された文書は、前述のとおり保存効率を良くするために圧縮が施されているために、別文書の作成に利用する場合には、圧縮による画像の劣化が問題になる。
前記、特許文献1に開示される画像処理装置によって電子化された文書であれば、文字の領域であれば解像度を落とさず可逆の圧縮を施されたデータを保持しているために、劣化を気にせずに当該領域の画像を抽出して利用することが可能だった。しかし、文字以外の領域は下地領域として高圧縮が施されているために、利用の際に画質が劣化する問題は避けられなかった。
また、特許文献2に開示される画像処理装置では、スキャンされた文書が検索で得られたオリジナル文書ファイルにより置き替えられることになるため、そのデータ量は必ずしも小さくならず、電子化した文書を送信したり保存したりする場合の効率が良いとは限らないという問題があった。
加えて、前記ワードプロセッサーのような文書編集アプリケーションによる文書作成をおこなう環境では、再利用に好適な写真や図面などは個別のデータとしてデータベースに登録されている可能性もある。これらのデータを引用して新規に作成された文書が文書ファイルとしてデータベースに登録されていない場合、前記画像処理装置でスキャンしても目的部分に対して本来はデータベース内に存在する筈のオリジナルデータを取得することはできなかった。
以上の課題、すなわち、スキャン画像から生成された、送信や保存効率の高いデータであって、かつこのデータを文書編集などに利用する際には、目的部分に対するオリジナルデータを容易に取得することを可能にする技術が求められていた。
本発明は前述の問題点にかんがみ、オリジナルデータを容易に取得することができるようにすることを目的としている。
本発明の画像処理装置は、画像を構成するデータを蓄積する画像データ蓄積手段と、紙文書の内容を光電変換により前記画像へと変換する画像読取手段と、前記画像読取手段によって変換された読取画像を領域の特性により領域分割する分割手段と、前記分割手段によって領域分割された読取画像の各部分を領域として特定する領域特定手段と、前記分割手段によって領域分割された読取画像を圧縮して圧縮データを生成する画像圧縮手段と、前記領域特定手段で特定された特定領域に対し前記画像データ蓄積手段から類似する画像データを検索する画像データ検索手段と、前記領域特定手段で特定された特定領域に対応する前記圧縮データの部分に前記画像データ検索手段による検索の結果を付加する情報付加手段とを有することを特徴とする。
本発明の画像処理方法は、画像を構成するデータを蓄積する画像データ蓄積手段と、紙文書の内容を光電変換により前記画像へと変換する画像読取手段と、を有する画像処理装置が実行する画像処理方法であって、前記画像読取手段によって変換された読取画像を領域の特性により領域分割する分割工程と、前記分割工程において領域分割された読取画像の各部分を領域として特定する領域特定工程と、前記領域分割された読取画像を圧縮して圧縮データを生成する画像圧縮工程と、前記領域特定工程において特定された特定領域に対し類似する画像データを検索する画像データ検索工程と、前記領域特定工程において特定された特定領域に対応する前記圧縮データの部分に前記画像データ検索工程における検索の結果を付加する情報付加工程とを有することを特徴とする。
本発明のコンピュータプログラムは、前記画像処理方法の各工程をコンピュータに実行させることを特徴とする。
本発明によれば、ユーザーが紙の原稿をスキャンして、そのデータを自分のPCなどのコンピュータ装置へと送信し、同装置内に保存する。この送信データは、送信効率や保存効率が良くするために高圧縮を施す。また、この送信データには更に、内包する図や写真などの各領域に対し、それらに関連する画像の所在や編集可能か否か等の情報が記述される。その結果、たとえばスキャンした紙原稿の生成に利用したオリジナルデータがデータベースから取得可能な場合、前記情報を用いてこのデータを取得することで、送信データ自体から画像を抽出するよりも、文書編集に好適な画質や編集性を備えたデータを利用することができる。
特に、この情報が送信データに記述されていることの効果としては、利用する時点で検索をおこなわなくてもよいので利用時の作業効率が向上することがある。また、高圧縮を施された送信データ中の画像を用いた検索は、情報量劣化の為は高精度の検索がおこなえないおそれがあるので、予め記述してある本情報のほうが信頼の高い情報として利用可能であるという点がある。
さらに、前記情報が編集可能か否かの情報を含むことの効果として、利用の際に選択領域に対する代替データとして編集可能なものが有るか否かをユーザーが直ちに知ることができるので、文書編集などの作業効率が向上する。
(第1の実施の形態)
図2は、本実施の形態を構成する画像検索システムを示す図である。
201は紙原稿を光電変換して画像データとするスキャナ部211、スキャンされた画像データに圧縮などの処理を施した送信データを作成する送信データ作成部212、画像データベースへの検索などにより入力画像に関連する画像データの情報を得て送信データに前記情報を追加する関連画像情報追加部214、送信データを201外部に送信する送信部213を備える画像処理装置である。
202は写真や図面などのデータが保存されている画像データベースである。ここでいう画像とは、いわゆるラスタ画像のほか、ベクトルパスの描画コマンド群によって構成されるデータ、たとえばSVG形式やその他のアプリケーション形式のデータを含み、しかしデータ形式にかかわらず画像特徴量の形式で検索が可能である。
203は汎用のコンピュータ装置であり、201から送信された送信データを受信する受信部231、受信データを保存するメモリあるいはハードディスクなどの保存部232、画像データベース202から必要な画像データを取得する画像検索部233を備え、アプリケーション実行部234はそれらのデータを利用するプログラムを実行する。なお、201、202、203はLANやインターネットなどの有線あるいは無線ネットワーク204で接続されている。
図2の装置群を用いて実行される本実施の形態に沿った処理の概略を、以下に2つのステップに分けて説明する。なお各ステップに関する詳細な説明は後述する。
第1は送信のステップで、ユーザーが紙の原稿を画像処理装置201でスキャンして、そのデータを自分のPCであるコンピュータ装置203へと送信し、同装置内に保管するステップである。その際送信されるデータは、送信時の効率や保存効率を良くするために、スキャン画像に対して極めて高い圧縮率で圧縮を施されるものとする。
ここでユーザーがスキャンする紙原稿は、コンピュータ装置203あるいはLAN上の他のコンピュータで作成して電子文書をプリントアウトしたものであり、更にこの電子文書は画像データベースに蓄積された写真や図などを一部引用して作成されたものであるとする。
このことを考慮して、本ステップでは、スキャンした紙原稿に対して生成される送信されるデータに対し、中に含まれる写真や図など画像部分に対し、データベースからそれらに類似する画像の情報を取得し、その情報を画像部分毎に、関連する画像の情報として付加する工程を含む。
第2は利用のステップで、ユーザーが先に保存したデータの一部を利用してあらたなデータを作成するステップである。たとえば、文書編集機能を有するアプリケーションをコンピュータ装置203で実行し、保存したデータに含まれる写真や図、あるいは文字の部分を選択的に抽出し、編集中の文書に挿入しようとするような場合である。
ここで、選択領域に対し保存データから抽出可能な画像データは、高圧縮を施された情報であるために品質が低い。度かつ可逆圧縮されたものであるが、写真や図などの部分の画像は解像度を落として非可逆高圧縮を施されたものであるため品質が低い。
したがって、先のステップで想定したように、当該部分のオリジナルデータに相当するデータが画像データベース202より取得することが可能であれば、保存データから抽出されるデータよりも、画質や再編集可能性などユーザーの文書編集に対しより望ましいデータとなる。したがって本ステップは、前記保存データに含まれる、関連する画像の情報を利用して、当該部分対する画像データをデータベースより取得する工程を含む。
以上の2ステップの処理について、以下にそれぞれの詳細を説明する。
まずは送信のステップとして、ユーザーが紙の原稿を画像処理装置201でスキャンして、その内容を自分のPCであるコンピュータ装置203へ送信する動作について、図3のフローチャートを用いて説明する。
図3の左側は、画像処理装置201の動作を示すフローチャートである。
ステップS301では、ユーザーが201に対して、スキャンしたデータの送信先を非図示のUIなどを用いて指定する。ここではコンピュータ装置203を指定したものとする。
ステップS302では、ユーザーがスキャナ部211が置かれた紙の原稿を公知の光電変換処理によって電子的な画像データに変換する。ステップS303では、送信データ作成部212が画像データに圧縮や特徴量抽出などの所定処理を施した送信データを作成する。
ステップS304では、関連画像情報追加部が、送信データが持つ画像データの特徴量を用いて、画像データベース202に対する検索処理をおこない、その結果得られた情報を送信データへと付加する。なお、本ステップS303およびステップS304処理の詳細については後で説明する。ステップS305ではステップS303で作成された送信データを送信部213がステップS301で指示された送信先へと送信する。
図3の右側はコンピュータ装置203の動作を示すフローチャートである。
ステップS306では、ステップS305で送信されたデータを受信部231が受信する。ステップS307では、受信したデータを保存部232へと保存する。
次に、図3のステップS303およびステップS304における処理について詳細に説明する。
図1は、送信データ作成部212および関連画像情報追加部214の構成を表すブロック図である。
101は文字領域検出部、102は文字領域画像作成部、103は文字部塗りつぶし部、104は文字色抽出部、105は文字領域画像圧縮部、106は下地画像圧縮部、107は画像領域検出部、108は画像特徴量生成部、109は関連画像情報取得部である。
これらの動作について図5のフローチャートを用いて説明する。
ステップS501では、文字領域検出部101が入力された多値画像110中の文字領域を検出して複数の文字領域座標121を作成する。
文字領域の検出には、公知の領域分割技術を用いることができる。領域分割技術とは1ページぶんの画像データを文字/図画/写真/線/表等の属性を持つ領域へと分割する処理である。
領域分割技術の実施例としては、USP5680478 "Method and Apparatus forcharacter recognition"(Shin-Ywan Wangら/CanonK.K.) がある。以下にその実施内容を簡単に説明する。
まず入力多値画像を二値化して白黒画像を作成する。二値化の方式としては公知の方式を用いる。次に、この白黒画像に対して8連結の黒画素輪郭追跡をおこなって黒画素の塊を抽出する。ここで面積の大きい黒画素の塊についてはその内部から4連結の白画素輪郭追跡をおこなって白画素の塊を抽出し、さらに一定面積以上の白画素の塊の内部からは再び黒画素輪郭追跡をおこなって黒画素の塊を抽出する。続いて、得られた黒画素の塊を大きさや形状、密度などで分類し、必要であればグループ化して文字/図画/写真/線/表など異なる属性を持つ領域へ分類していく。
例えば、縦横比が1に近く、大きさが定められた範囲のものを文字相当の画素塊とし、そのような文字相当の画素塊が互いに近接して整列良くグループ化が可能な部分を文字領域と判定する。それらを除いた黒画素塊のうち、一定以上扁平な画素塊は単独で線領域と、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域と、不定形の画素塊が散在している部分をグループ化した領域を写真領域と、それ以外の任意形状の画素塊が占める領域を図領域と、それぞれ判定していく。
図6は領域分割に対する入力多値画像(左)とその分割結果(右)の例を示す図である。
この領域分割によって得られた文字領域から文字領域座標121を作成する。ステップS502では、画像領域検出部107が入力の多値画像110中の写真領域や図領域などの画像領域を検出して複数の画像領域座標125を作成する。
画像領域の検出はステップS501でおこなった領域分割処理の結果を利用することができる。すなわち領域分割処理の結果から得られる写真および図の領域を画像領域とみなして画像領域座標125を作成する。ステップS503では、画像特徴量生成部108が前記画像領域座標125と多値画像110から各画像の画像特徴量として画像特徴量コード113を作成する。
画像特徴量は、画像から抽出される色のヒストグラム、色の構造、エッジのヒストグラム、テクスチャなど様々な方式があるが、その抽出目的は、前記画像データベース202より画像データを検索することにあるので、画像データベース202にて使用されている、あらかじめ定められた方式に従って求めることとなる。
ここでは、画像データベース202で使用される画像特徴量の1例として、エッジヒストグラムについて説明する。エッジヒストグラムとは、画像を4×4の格子状にブロック分割し、その各ブロックから垂直エッジ、水平エッジ、角度45度のエッジ、角度135度のエッジ、および方向性のないエッジの5種類についてそのエッジ量を抽出して得られた、合計4×4×5=80のエッジ量からなる特徴量ベクトルである。エッジ量とは、各ブロックの総ピクセル数に対するエッジを表すピクセル数の合を量子化したもので、具体的には1ブロックを統計上十分数な小領域へと分割し、各小領域内の輝度分布から前記5種エッジに対応するフィルタを用いて得ることができる。なお、画像データベース202で用いられる特徴量に従って、他の方法の画像特徴量を用いたり、複数の画像特徴量を組み合せる形で抽出したりしてもよい。
ステップS504では、文字領域画像作成部102が文字領域座標121と多値画像110から、文字領域画像111を作成する。具体的には、多値画像110中の各文字領域範囲に対し、公知の二値化手法をおこなって二値画像を取得する。二値画像内の画素値は文字線にあたる画素が1、それ以外が0とする。
ステップS505では、文字色抽出部104が前記文字領域画像111の文字線部画素と原画像を参照しながら文字線部分の文字領域代表色123を算出する。文字色抽出は、対応する文字領域画像111の文字線に対し細線化を施した細線化二値画像を作成し、その細線化二値画像上で1の画素に対応する多値画像110上の画素値の平均値をその領域の文字色とする。もし得られる画素値のばらつきが大きい場合は、文字領域を文字単位に分割してその各々に文字色を割りあてるようにしてもよい。
ステップS506では、文字部塗りつぶし部103が文字領域画像111の黒画素に対応する多値原画110上の画素を、その周辺の色と同等の色で塗りつぶして下地画像112を作成する。
文字部の塗りつぶしは次のようにしておこなう。まず対象の文字領域画像111を1画素ぶん太らせた二値画像を作成する。これは例えば二値画像である文字領域画像111からそれぞれ1dotずつ上、左、右、下にずらした4つの画像を作成し、もとの画像と合せて5つの画像を各画素ORをとって重ねあわせればよい。二値画像上で0にあたる画素に対し、多値画像110上での平均画素値を求める。この平均画素値で多値画像110上の文字部画素、すなわち太らせた二値画像で1にあたる画素を塗りつぶすことで、文字周辺の色のにじんだ画素を含めて塗りつぶされることになり、より平坦度合の高い下地画像112が得られる。
ステップS507では、文字領域画像圧縮部105は複数の文字領域画像111を圧縮して複数の圧縮コードA122を作成する。ここでは、MMRにより二値の文字領域画像を各々圧縮して圧縮コードA122を作成するものとする。
ステップS508では、下地画像圧縮部106は下地画像112を圧縮して圧縮コードB124を作成する。ここでは、下地画像112を半分の解像度になるように間引いたうえで、JPEGを用いて圧縮コードB124を作成するものとする。なお、目標とする圧縮率に応じ33%、25%など、解像度の変換率は変化させてもよい。
ステップS509では、関連画像情報取得部109が前記複数の画像領域125に対応する画像それぞれに関連する画像の情報をデータベース202から取得し、関連画像情報コード126を作成する。
ここでは、前記複数の画像領域座標125のそれぞれに対応する画像特徴量コード113を用いて、画像データベース202に対する検索をおこない、登録画像中で同特徴量のマッチングで得られる類似度の高いものを選出する。1つ以上の画像データが候補として選出された場合、それぞれ画像データに関する情報を取得して関連画像情報とする。具体的には、画像データの所在情報、特徴量マッチングの類似度、また画像データが編集可能であるか、すなわち登録画像データから、その画像を構成するパスなどの描画コマンドデータが取得できるか否かなどを取得する。
ステップS510では文字座標領域121〜関連画像情報コード126のデータを合わせたものを送信データ120とする。ここでは送信データの形式として、PDFを用いるものとし、圧縮コードA122および圧縮コードB124を描画データとして記述、その他の情報、すなわち画像や文字の領域情報や、それらの領域に関連する画像の情報は、メタデータとしてXMLオブジェクト形式で記述するものとする。しかしもちろんPDF以外の形式、たとえば描画データをSVG方式で記述し、全体としてXML形式をなすようにしてもよい。あるいは、すべてバイナリで記述してもよい。
メタデータ記述の具体例を図8に示す。801は文字の領域、802は画像の領域についての記述の例である。各領域は位置情報として左上のx座標値、y座標値、幅、高さを持つ。また802には、前記領域に関連する画像の情報群803が記述される。803は画像データベースより検索された、前記領域に類似する画像の情報であり、それぞれの所在を示すURL情報、類似度の値、そのデータが編集可能であるか否かを記述している。なお前記は1例であり、全く別の形式で記述してもよい。
次に、保存されたデータを利用するステップについて、図4のフローチャートを用いて説明する。
ステップS401では、ユーザーの指示に基づいて、保存部232に保存されているデータを読み出す。
ステップS402では、データが表わすスキャンページのどの部分を抽出するかを、ユーザーがコンピュータ装置203に接続された非図示のディスプレイおよびマウスやキーボードなどの手段を用いて領域指定する。
図7はこの領域指定をおこなうUI画面の例である。701はページ画像であり、データ120からページを再構成するように展開して作られた画像である。具体的には、圧縮コードB124を展開した画像の上に、圧縮コードA122を展開して得られた文字画像を文字領域座標121を基に描画することで、例のようなページの画像701が得られる。
また、702〜704はユーザーが選択可能な領域を示す枠である。702、705は文字領域座標121に対応する文字領域の指定枠、703は図領域、704は写真領域で、いずれも画像領域座標125に対応する画像領域の指定枠であり、ユーザーはマウスやキーボードなどを用いた一般的GUI操作により、702〜705の枠のいずれかを選択することで、抽出対象の領域を指定することができる。
図4に戻って、ステップS403では、ステップS402で指定された領域が画像領域であると判断されれば、ステップS404に進む。それ以外の場合と判断されればステップS411に進む。
ステップS404では、指定された画像領域が、当該領域に関連する画像の情報を保持しているか否をチェックし、このチェックの結果、保持している場合はステップS405に進む。ステップS404のチェックの結果、いない場合はステップS410に進む。
ステップS405では、指定領域に関連する画像の情報があることをユーザーに告知する。ステップS406では、指定領域に対する出力データとして、前記関連する画像のうちひとつを選択し、選択された関連画像をデータベースから取得して出力するか、あるいは元々保存データに含まれる画像部分のデータを出力するかを判断する。関連画像を取得して出力すると判断した場合はステップS407に、保存データ中の画像部をデータとして出力すると判断した場合はステップS410に進む。
図9は、ステップS405およびステップS406に関するユーザーインターフェース画面の例である。画面901は指定領域に対し、保存データが図8の例中803のような3つの関連画像を有している場合の告知画面の例である。画面902は図8中803の各関連画像それぞれに関する情報を候補として提示しユーザーに選択を促す画面の例である。画面902は画面901にてボタン910を指示した場合に表示される。
図10は、ステップS405およびステップS406に関する別のユーザーインターフェースの例を示す図である。画面1001は、指定領域が保有する関連画像情報において、編集可能なデータがある場合に表示される告知画面の例である。このように、複数の選択候補がある場合、最も利用に適した情報を自動的に選択し、その利用の有無を問うようなインターフェースであってもよい。
ステップS407では、ステップS406で選択された関連画像をデータベースから取得する。具体的には、選択された関連画像に対応する所在情報に記されるデータベースのアドレスを元に取得対象の画像データを要求し取得する。
ステップS408では、取得した画像のデータを本当に出力するか否かを判断する。この判断の結果、肯定したと判断した場合はステップS409に進む。また、否定したと判断した場合はステップS406に戻って選択をやりなおす。
図11は、ステップS408でユーザーに提示される確認画面の例を示す図である。
図11において、確認画面1101で「はい」が押下されると、肯定したと判断される。一方「いいえ」が押下されると、否定したと判断される。
ステップS409では、取得した画像データを、抽出対象の画像データとして出力し終了する。ステップS410では、下地画像から指定領域の部分を切り出した画像データを、抽出対象の画像データとして出力し終了する。ステップS411では、文字部の情報である圧縮コードA122を展開して得た画像データから、指定領域に対応するものを、抽出対象の画像データとして出力し終了する。
以上ステップS409〜S411のいずれかにより出力された画像データは、ユーザーが文書編集をおこなう別のアプリケーションにおいて使用することができる。たとえば、Windows(登録商標)に於けるクリップボード機能を利用する場合、前記画像データをクリップボードへとコピーすることで、ユーザーは任意のアプリケーションでそのデータを利用することができるようになる。
特に、データベースより取得した画像データが描画コマンドなどからなるデータを含む場合、このデータを文書編集のアプリケーションで編集加工の用途により好適に利用することが可能になる。
(本発明に係る他の実施の形態)
前述した本発明の実施の形態における画像処理装置を構成する各手段、並びに画像処理方法の各ステップは、コンピュータのRAMやROMなどに記憶されたプログラムが動作することによって実現できる。このプログラム及び前記プログラムを記録したコンピュータ読み取り可能な記録媒体は本発明に含まれる。
また、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施の形態も可能であり、具体的には、複数の機器から構成されるシステムに適用してもよいし、また、一つの機器からなる装置に適用してもよい。
なお、本発明は、前述した実施の形態の機能を実現するソフトウェアのプログラム(実施の形態では図4、5に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接、あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが前記供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
したがって、本発明の機能処理をコンピュータで実現するために、前記コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であってもよい。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、前記ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。
また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザーに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記録媒体に格納してユーザーに配布し、所定の条件をクリアしたユーザーに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施の形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施の形態の機能が実現される。
本発明の実施の形態における送信データ作成部分を説明するブロック図である。 本発明の実施の形態の装置構成を示す図である。 本発明の実施の形態の画像処理装置の一般動作を示すフローチャートである。 本発明の実施の形態における画像処理装置の利用時動作を示すフローチャートである。 本発明の実施の形態における画像処理装置の作成時動作を示すフローチャートである。 本発明の実施の形態における文書画像の文字および画像その他領域検出結果の例を示す図である。 本発明の実施の形態における利用時ユーザーインターフェース画面の例を示す図である。 本発明の実施の形態における送信データの例を示す図である。 本発明の実施の形態における利用時ユーザーインターフェース画面の例を示す図である。 本発明の実施の形態における利用時ユーザーインターフェース画面の例を示す図である。 本発明の実施の形態における利用時ユーザーインターフェース画面の例を示す図である。
符号の説明
101 文字領域検出部
102 文字領域画像作成部
103 文字部塗りつぶし部
104 文字色抽出部
105 文字領域画像圧縮部
106 下地画像圧縮部
107 画像領域検出部
108 画像特徴量生成部
109 関連画像情報取得部
110 多値画像
111 文字領域画像
112 下地画像
113 画像特徴コード
121 文字座標コード
122 圧縮コードA
123 文字領域代表色
124 圧縮コードB
125 画像領域座標
126 関連画像情報コード

Claims (12)

  1. 画像を構成するデータを蓄積する画像データ蓄積手段と、
    紙文書の内容を光電変換により前記画像へと変換する画像読取手段と、
    前記画像読取手段によって変換された読取画像を領域の特性により領域分割する分割手段と、
    前記分割手段によって領域分割された読取画像の各部分を領域として特定する領域特定手段と、
    前記分割手段によって領域分割された読取画像を圧縮して圧縮データを生成する画像圧縮手段と、
    前記領域特定手段で特定された特定領域に対し前記画像データ蓄積手段から類似する画像データを検索する画像データ検索手段と、
    前記領域特定手段で特定された特定領域に対応する前記圧縮データの部分に前記画像データ検索手段による検索の結果を付加する情報付加手段と
    を有することを特徴とする画像処理装置。
  2. 前記画像圧縮手段で圧縮された圧縮データに対し、ユーザーにより指定された領域の画像データを抽出する抽出手段と、
    前記抽出手段によって抽出された画像データの指定領域に前記情報付加手段により付加された情報が存在する場合に、前記ユーザーに通知する通知手段とを有することを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像データ検索手段は、前記読取画像の特定領域内の特徴量と、前記画像データ蓄積手段に蓄積された前記画像データの特徴量とのマッチングにより行うことを特徴とする請求項1に記載の画像処理装置。
  4. 前記画像を構成するデータは、非圧縮ラスタ画像と、圧縮ラスタ画像と、画像を描画する命令群とを含むことを特徴とする請求項1に記載の画像処理装置。
  5. 前記読取画像の特定領域内の特徴量は、画像データから算出された画像特徴量であることを特徴とする請求項3に記載の画像処理装置。
  6. 前記情報付加手段により付加される情報は、前記画像データ検索手段による検索結果に含まれる画像データの所在情報を列挙するものであることを特徴とする請求項1に記載の画像処理装置。
  7. 前記情報付加手段により付加される情報は、前記画像データ検索手段による検索結果に含まれる画像データが編集可能か否かに関する情報を含むことを特徴とする請求項6に記載の画像処理装置。
  8. 前記通知手段は、前記指定領域に対応する前記情報付加手段で付加された画像数を通知することを特徴とする請求項2に記載の画像処理装置。
  9. 前記通知手段は、前記指定領域に対応する前記情報付加手段で付加された情報中に編集可能な画像データが含まれるか否かを通知することを特徴とする請求項2に記載の画像処理装置。
  10. 前記画像圧縮手段で圧縮された圧縮データを、ネットワークを経由して他の装置へと送信する送信手段を有することを特徴とする請求項1に記載の画像処理装置。
  11. 画像を構成するデータを蓄積する画像データ蓄積手段と、紙文書の内容を光電変換により前記画像へと変換する画像読取手段と、を有する画像処理装置が実行する画像処理方法であって、
    前記画像読取手段によって変換された読取画像を領域の特性により領域分割する分割工程と、
    前記分割工程において領域分割された読取画像の各部分を領域として特定する領域特定工程と、
    前記領域分割された読取画像を圧縮して圧縮データを生成する画像圧縮工程と、
    前記領域特定工程において特定された特定領域に対し類似する画像データを検索する画像データ検索工程と、
    前記領域特定工程において特定された特定領域に対応する前記圧縮データの部分に前記画像データ検索工程における検索の結果を付加する情報付加工程と
    を有することを特徴とする画像処理方法。
  12. 請求項11に記載の画像処理方法の各工程をコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2005203579A 2005-07-12 2005-07-12 画像処理装置、画像処理方法及びコンピュータプログラム Expired - Fee Related JP4708888B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005203579A JP4708888B2 (ja) 2005-07-12 2005-07-12 画像処理装置、画像処理方法及びコンピュータプログラム
US11/483,059 US7420150B2 (en) 2005-07-12 2006-07-10 Image processing apparatus, image processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005203579A JP4708888B2 (ja) 2005-07-12 2005-07-12 画像処理装置、画像処理方法及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2007025814A JP2007025814A (ja) 2007-02-01
JP2007025814A5 JP2007025814A5 (ja) 2008-08-28
JP4708888B2 true JP4708888B2 (ja) 2011-06-22

Family

ID=37660844

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005203579A Expired - Fee Related JP4708888B2 (ja) 2005-07-12 2005-07-12 画像処理装置、画像処理方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US7420150B2 (ja)
JP (1) JP4708888B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4708888B2 (ja) * 2005-07-12 2011-06-22 キヤノン株式会社 画像処理装置、画像処理方法及びコンピュータプログラム
JP5013982B2 (ja) * 2007-06-12 2012-08-29 キヤノン株式会社 画像送信装置及びその制御方法、プログラム
JP2009080798A (ja) * 2007-09-06 2009-04-16 Ricoh Co Ltd 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
JP2009093627A (ja) * 2007-09-18 2009-04-30 Ricoh Co Ltd 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
JP5173721B2 (ja) 2008-10-01 2013-04-03 キヤノン株式会社 文書処理システム及びその制御方法、プログラム、記憶媒体
JP4766135B2 (ja) * 2009-03-17 2011-09-07 コニカミノルタビジネステクノロジーズ株式会社 情報提供装置、情報提供方法および情報提供プログラム
JP5612851B2 (ja) * 2009-12-24 2014-10-22 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
CN102682025B (zh) * 2011-03-16 2014-03-19 中兴通讯股份有限公司 一种web图片评论添加和显示方法及装置
CN105721810B (zh) * 2014-12-05 2019-06-04 北大方正集团有限公司 一种图像压缩存储方法及装置
JP6567685B2 (ja) 2015-03-24 2019-08-28 イラミーナ インコーポレーテッド 生物学的又は化学的な解析用のサンプルを撮像する方法、キャリヤ組立体、及びシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03177973A (ja) * 1989-12-07 1991-08-01 Nippon Telegr & Teleph Corp <Ntt> 画像表示方法
JP2000020721A (ja) * 1998-07-02 2000-01-21 Fujitsu Ltd 画像検索装置及び方法
JP2001142903A (ja) * 1999-08-30 2001-05-25 Canon Inc データ検索装置およびその方法、データ検索システム、記憶媒体
JP2004334340A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理方法及び装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US6404930B2 (en) * 1995-04-07 2002-06-11 Hitachi, Ltd. Signal processing equipment
JPH11127340A (ja) * 1997-10-24 1999-05-11 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
US7155062B1 (en) * 1999-11-17 2006-12-26 Genicom Corp. System and method for performing pattern matching image compression
US7133565B2 (en) * 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP4366003B2 (ja) 2000-08-25 2009-11-18 キヤノン株式会社 画像処理装置及び画像処理方法
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP4708888B2 (ja) * 2005-07-12 2011-06-22 キヤノン株式会社 画像処理装置、画像処理方法及びコンピュータプログラム
JP5164368B2 (ja) * 2006-12-07 2013-03-21 キヤノン株式会社 画像処理装置、画像処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03177973A (ja) * 1989-12-07 1991-08-01 Nippon Telegr & Teleph Corp <Ntt> 画像表示方法
JP2000020721A (ja) * 1998-07-02 2000-01-21 Fujitsu Ltd 画像検索装置及び方法
JP2001142903A (ja) * 1999-08-30 2001-05-25 Canon Inc データ検索装置およびその方法、データ検索システム、記憶媒体
JP2004334340A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理方法及び装置

Also Published As

Publication number Publication date
US20070012862A1 (en) 2007-01-18
US7420150B2 (en) 2008-09-02
JP2007025814A (ja) 2007-02-01

Similar Documents

Publication Publication Date Title
JP4717562B2 (ja) 画像処理装置及び方法
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US7551753B2 (en) Image processing apparatus and method therefor
US7860266B2 (en) Image processing system and image processing method
US8112706B2 (en) Information processing apparatus and method
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
JP4732250B2 (ja) 情報処理装置、制御方法、およびコンピュータプログラム
US7391917B2 (en) Image processing method
JP5036430B2 (ja) 画像処理装置及びその制御方法
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
JP5137759B2 (ja) 画像処理装置
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
JP2007305034A (ja) 画像処理装置、その制御方法、コンピュータプログラム
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP4261988B2 (ja) 画像処理装置及び方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
US8219594B2 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2007129557A (ja) 画像処理システム
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP2004128880A (ja) 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
JP2004128881A (ja) 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
JP2005210570A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080710

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110317

LAPS Cancellation because of no payment of annual fees