JP5012551B2 - 情報処理装置およびプログラム - Google Patents

情報処理装置およびプログラム Download PDF

Info

Publication number
JP5012551B2
JP5012551B2 JP2008032829A JP2008032829A JP5012551B2 JP 5012551 B2 JP5012551 B2 JP 5012551B2 JP 2008032829 A JP2008032829 A JP 2008032829A JP 2008032829 A JP2008032829 A JP 2008032829A JP 5012551 B2 JP5012551 B2 JP 5012551B2
Authority
JP
Japan
Prior art keywords
graph
area
color component
image data
frequency distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008032829A
Other languages
English (en)
Other versions
JP2009194612A (ja
Inventor
隆行 関
功幸 河野
裕之 河野
篤 伊藤
邦和 上野
浩明 前澤
なつみ 宮澤
晃一 藤井
正和 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008032829A priority Critical patent/JP5012551B2/ja
Publication of JP2009194612A publication Critical patent/JP2009194612A/ja
Application granted granted Critical
Publication of JP5012551B2 publication Critical patent/JP5012551B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)

Description

本発明は、情報処理装置およびプログラムに関する。
近年、DTPや電子ファイリングシステムなどが普及し、紙などの媒体上に記録されている文字や図形などがパーソナルコンピュータなどの計算機に入力されて利用できるようになってきている。しかし、一般の電子ファイリングなどでは、媒体上の文字や図形は画像として取り込まれるため、データ量が多く、編集しづらい場合がある。
特許文献1には、棒グラフを含む文書をスキャンすることでイメージデータを生成し、そのイメージデータから数値的関係を表現している棒グラフの構造を認識し、グラフ情報を再構成可能な数値的データあるいはデータ間の関係に変換する技術が開示されている。
特許文献2には、ユーザが電子的に作図する際に、あるいは、白黒の図からカラーの図を電子的に作成する際に、適切な配色が施された図を簡易に生成する技術が開示されている。
特許文献3には、白黒の表やグラフをカラーにする、あるいはすでに色がついた表やグラフの配色を変更する際に、表やグラフが示す意味に応じた修飾を、表やグラフの要素に対して自動的に行う技術が開示されている。
特開平9−134404号公報 特開平9−114958号公報 特開平8−287172号公報
ところで、文書に含まれるグラフには棒グラフ以外の例えば円グラフなども含まれる場合がある。このように棒グラフに限らず種々のグラフを含む文書をスキャンすることで得られる画像データを利用して、元々の文書に含まれるグラフの編集を行いたいという要望がある。
本発明は、文書を光学的に読み取ることで得られる画像データを利用して、元々の文書に含まれるグラフの編集の手間を低減することを目的とする。
本願請求項1に係る発明は、文書を光学的に読み取ることで得られる画像データであって、背景領域と少なくとも1つの絵柄領域とから構成される画像データの入力を受け付ける入力手段と、前記画像データの絵柄領域ごとに明度の頻度分布を求め、頻度分布中に存在する明度頻度のピークの数が所定数以上存在する絵柄領域をグラフ領域として検索するグラフ領域検索手段と、グラフ領域の色成分の頻度分布を求め、当該色成分の頻度分布中に存在する色成分の各ピークに対応する各色成分を、グラフを構成する要素の代表色成分として検索する代表色成分検索手段と、各代表色成分の各頻度を前記グラフの各要素の割合として示し、前記グラフの各要素の割合と代表色成分とが関連づけられたグラフ情報を生成するグラフ情報生成手段と、を備える情報処理装置である。
本願請求項2に係る発明は、請求項1に記載の情報処理装置において、前記画像データのグラフ領域から所定の範囲に存在する絵柄領域のうち、前記代表色成分を最も多く含む絵柄領域を、要素の凡例領域として、代表色成分ごとに検索する凡例領域検索手段と、凡例領域から所定の範囲に存在する文字列を凡例領域ごとに抽出し、各文字列を各凡例領域に関連づける文字列関連づけ手段と、を備え、前記グラフ情報生成手段は、各凡例領域に関連づけられた各文字列を、各凡例領域に対応する各要素の属性情報として含めて、グラフ情報を生成する、ことを特徴とする情報処理装置である。
本願請求項3に係る発明は、文書を光学的に読み取ることで得られる画像データであって、背景領域と少なくとも1つの絵柄領域とから構成される画像データの入力を受け付ける入力手段と、前記画像データの絵柄領域ごとに明度の頻度分布を求め、頻度分布中に存在する明度頻度のピークの数が所定数以上存在する絵柄領域をグラフ領域として検索するグラフ領域検索手段と、グラフ領域の色成分の頻度分布を求め、当該色成分の頻度分布中に存在する色成分の各ピークに対応する各色成分を、グラフを構成する要素の代表色成分として検索する代表色成分検索手段と、各代表色成分の各頻度を前記グラフの各要素の割合として示し、前記グラフの各要素の割合と代表色成分とが関連づけられたグラフ情報を生成するグラフ情報生成手段と、してコンピュータを機能させるためのプログラムである。
本願請求項1または3に係る発明によれば、文書を光学的に読み取ることで得られる画像データを構成する絵柄領域の中から明度頻度分布に基づいてグラフ領域を特定し、特定されたグラフ領域の色成分頻度分布に基づいて、グラフを構成する各要素の割合がグラフ情報として生成される。よって、そのグラフ情報を利用することで元々の文書に含まれるグラフの編集の手間を低減することができる。
本願請求項2に係る発明によれば、各要素の属性情報を含めてグラフ情報が生成されるため、属性情報を含まないグラフ情報よりもさらにグラフの編集の手間を低減することができる。
本発明を実施するための最良の形態(以下、実施形態と称す)について、以下図面を用いて説明する。
図1は、本実施形態に係る情報処理装置の機能ブロックを示す図である。
図1において、情報処理装置100は、画像が印字された用紙などの記録材料を画像読取部60で光学的に読み取り、印字された画像を画像データとして取り込む。本実施形態において、記録材料に印字される画像は、グラフなどの図形や、文字列などを含む画像であり、例えば図2Aに示すような画像である。情報処理装置100は、そのような画像を示す画像データからグラフを抽出して、グラフ解析を行い、グラフの数値化を行う。
CPU10は、不揮発性メモリ30に記憶されたプログラム40を揮発性メモリ20に展開して、展開されたプログラム40に従いバスライン90を介して、各部を制御する。不揮発性メモリ30は、プログラム40およびデータベース(DB)50を記憶する。プログラム40およびDB50の詳細については後述する。
画像読取部60は、記録材料に印字された画像を光学的に読み取り、画像データを生成する、いわゆるスキャナである。操作部70は、マウスやキーボードなどを介して操作者からの指示の入力を受け付ける。
続いて、不揮発性メモリ30に記憶されたプログラム40とDB50とについてさらに詳しく説明する。
画像データ蓄積部52は、画像読取部60が生成した画像データを記憶する。画像解析部42は、画像データ蓄積部52に蓄積された画像データ群の中から処理対象の画像データの選択をユーザから操作部70を介して受け付ける。さらに、画像解析部42は、選択された画像データを後述の手順に従って解析して、画像データが示す画像からグラフ領域を特定し、グラフ領域に示されたグラフを数値化して表データを生成し、その表データを画像データと関連づけて画像データ蓄積部52に登録する。なお、画像解析部42は、ユーザから処理対象の画像データの選択を受け付けるのではなく、画像読取部60が画像データを生成したことに対応して、生成された画像データの表データを生成してもよい。
本実施形態では、記録媒体上に印字された画像を光学的に読み取ることで得られた画像データに基づいて、その画像に示されるグラフを数値化する。このようにグラフを数値化することで、グラフの編集が容易になる。
図3は、画像解析部42が処理対象の画像データが示す画像からグラフを特定し、特定したグラフを数値化する手順を示すフローチャートである。
図3において、画像解析部42は、処理対象の画像データの入力を受けると、その画像データに示される画像の背景色を検知する(S100)。例えば、画像解析部42は、画像データがRGB画像であれば、各画素値(RGB値)のうち、最も出現頻度が多い画素値を背景色として検知する。次いで、画像解析部42は、背景色に対応する画素値をもつ画素を「0」、それ以外の画素値をもつ画素を「1」とした画像データを生成することで、処理対象の画像データを2値化画像データに変換する(S102)。例えば、図2Aに示すような画像であれば、2値化画像データは、図2Bのような画像で表される。
画像解析部42は、処理対象の画像データと2値化画像データとを比較して、処理対象の画像データを構成する各画素のうち、2値化画像データにおいて「1」の画素に対応する画素で構成される領域をそれぞれ絵柄領域として特定する(S104)。
続いて、画像解析部42は、画像の絵柄領域ごとに各領域に含まれる画素の明度(Value(Brightness))別の頻度分布を示す明度ヒストグラムを生成する。さらに、画像解析部42は、隣同士の画素の明度差を求めるために、各明度を一次微分した一次微分の明度ヒストグラムも生成する(S106)。なお、各画素の明度は、例えば画素がRGB値で与えられる場合には、R、G、Bの各要素のうち最も大きい値をもつ要素の値をその画素の明度とすればよい。
図4Aは、図3Aに示す画像中のグラフ200に対応する絵柄領域の明度ヒストグラムを示す。また、図4Bは、図4Aの明度ヒストグラムの各明度を一次微分した場合の一次微分明度ヒストグラムを示す。
さらに、画像解析部42は、明度ヒストグラムおよび一次微分明度ヒストグラムに基づいて、絵柄領域の中から、グラフ領域を検索する(S108)。
ここで、グラフを構成する各要素(要素とは、グラフ全体に対する各部分の割合(内訳)を示す部分のことをいう)は、要素ごとに異なる配色が施されるのが一般的である。また、その配色は単一色が利用されることが多い。そこで、本実施形態では、グラフの特徴を各要素の配色に着目して特定する。単一色の画素が多い画像の場合、明度ヒストグラムは、図4Aに示すように、明度のピークが局所的に現れたものとなる。また、グラフを示す画像の場合、グラフのそれぞれの要素は異なる配色が成されることが多いため、要素ごとにその明度のピークが現れることが多い。また、グラフの各要素の配色は隣同士の要素を視覚的に区別しやすいように配色されることが多い。そのため、各要素のエッジ部分の明度の差は、比較的に大きい値となる。つまり、グラフに対応する絵柄領域の一次微分明度ヒストグラムを求めた場合、図4Bに示すように、各要素のエッジ部分の明度の差が大きいため、要素ごとに局所的にピークが現れることが多い。
以上より、本実施形態では、画像解析部42は、明度ヒストグラムおよび一次明度ヒストグラムにおいて、所定の閾値以上の頻度をもつ明度あるいは一次微分明度のピークが所定の数(例えば2)以上存在する絵柄領域を、グラフ領域として検索する。
次いで、画像解析部42は、グラフ領域に含まれる画素の色相(Hue)別の頻度分布を示す色相ヒストグラムを生成し、その色相頻度ヒストグラムを参照して、所定の閾値以上の頻度を有するピークを示す色相を特定し、各ピークの色相をそれぞれ代表色相とする(S110)。ここで代表色相は、グラフの各要素の各配色に対応する。なお、色相Hは、例えば、画像データがRGB画像であれば、次の条件式により求めればよい。
続いて、画像解析部42は、グラフ領域から所定の範囲(例えば、グラフ領域を1.2倍に拡張した領域)に存在する絵柄領域を特定し、その絵柄領域のうち、ステップS110で求めたいずれかの代表色相と類似する色相(代表色相を基準として所定範囲に存在する色相)を有する絵柄領域を検索し、その検索された絵柄領域を凡例領域とする(S112)。ここで、凡例領域とは、グラフの各要素(各割合)の名称(内容)を定義する領域のことをいう。
さらに、画像解析部42は、各凡例領域から所定の範囲に存在する文字列を公知の文字認識技術を利用して抽出し、抽出した文字列を各要素の名称を示すものとして、各凡例領域の代表色相と関連づける(S114)。なお、凡例領域から所定の範囲に存在する文字列が複数存在する場合には、凡例領域からの距離が最も近い文字列をその凡例領域に対する文字列(名称)として、その文字列を凡例領域に関連づける。
最後に、画像解析部42は、各代表色相の頻度と、各代表色相に対応する凡例領域に関連づけられた文字列とに基づいて、グラフに対する表データを生成する(S116)。例えば、画像解析部42は、各代表色相の頻度を各要素の割合、各凡例領域に関連づけられた文字列を各要素の名称、各代表色相のRGB値を各要素の配色として、図5に示すような表データを作成する(S118)。画像解析部42は、生成された表データを処理対象の画像データを関連づけて画像データ蓄積部52に登録する。なお、画像解析部42は、表データを例えばXML形式で図6に示すように記述して、画像データに埋め込むことで、画像データと表データとを関連づければよい。図6において、符号300がグラフを構成する要素の名称、符号302が要素の割合、符号304が要素の配色を示す。
以上、本実施形態によれば、文書を光学的に読み取ることで得られる画像データからグラフを抽出して、グラフ解析を行い、グラフの数値化(表データ化)を行い、画像データに関連づける。よって、画像データに関連づけられたグラフの数値データを利用することで、元々の文書に含まれるグラフの編集する場合の手間が低減される。
本実施形態に係る情報処理装置の機能ブロックを示す図である。 光学的に読み取る画像の一例を示す図である。 光学的に読み取る画像を2値化処理して得られる画像の一例を示す図である。 画像解析部が処理対象の画像データが示す画像からグラフを特定し、特定したグラフを数値化する手順を示すフローチャートである。 絵柄領域の明度頻度ヒストグラムの一例を示す図である。 絵柄領域の一次微分明度頻度ヒストグラムの一例を示す図である。 画像解析部が生成する表データの一例を示す図である。 表データをXML形式で画像データに関連づける場合について説明するための図である。
符号の説明
10 CPU、20 揮発性メモリ、30 不揮発性メモリ、40 プログラム、42 画像解析部、52 画像データ蓄積部、60 画像読取部、70 操作部、90 バスライン、100 情報処理装置。

Claims (3)

  1. 文書を光学的に読み取ることで得られる画像データであって、背景領域と少なくとも1つの絵柄領域とから構成される画像データの入力を受け付ける入力手段と、
    前記画像データの絵柄領域ごとに明度の頻度分布を求め、頻度分布中に存在する明度頻度のピークの数が所定数以上存在する絵柄領域をグラフ領域として検索するグラフ領域検索手段と、
    グラフ領域の色成分の頻度分布を求め、当該色成分の頻度分布中に存在する色成分の各ピークに対応する各色成分を、グラフを構成する要素の代表色成分として検索する代表色成分検索手段と、
    各代表色成分の各頻度を前記グラフの各要素の割合として示し、前記グラフの各要素の割合と代表色成分とが関連づけられたグラフ情報を生成するグラフ情報生成手段と、
    を備える情報処理装置。
  2. 請求項1に記載の情報処理装置において、
    前記画像データのグラフ領域から所定の範囲に存在する絵柄領域のうち、前記代表色成分を最も多く含む絵柄領域を、要素の凡例領域として、代表色成分ごとに検索する凡例領域検索手段と、
    凡例領域から所定の範囲に存在する文字列を凡例領域ごとに抽出し、各文字列を各凡例領域に関連づける文字列関連づけ手段と、
    を備え、
    前記グラフ情報生成手段は、各凡例領域に関連づけられた各文字列を、各凡例領域に対応する各要素の属性情報として含めて、グラフ情報を生成する、
    ことを特徴とする情報処理装置。
  3. 文書を光学的に読み取ることで得られる画像データであって、背景領域と少なくとも1つの絵柄領域とから構成される画像データの入力を受け付ける入力手段と、
    前記画像データの絵柄領域ごとに明度の頻度分布を求め、頻度分布中に存在する明度頻度のピークの数が所定数以上存在する絵柄領域をグラフ領域として検索するグラフ領域検索手段と、
    グラフ領域の色成分の頻度分布を求め、当該色成分の頻度分布中に存在する色成分の各ピークに対応する各色成分を、グラフを構成する要素の代表色成分として検索する代表色成分検索手段と、
    各代表色成分の各頻度を前記グラフの各要素の割合として示し、前記グラフの各要素の割合と代表色成分とが関連づけられたグラフ情報を生成するグラフ情報生成手段と、
    してコンピュータを機能させるためのプログラム。
JP2008032829A 2008-02-14 2008-02-14 情報処理装置およびプログラム Expired - Fee Related JP5012551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008032829A JP5012551B2 (ja) 2008-02-14 2008-02-14 情報処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008032829A JP5012551B2 (ja) 2008-02-14 2008-02-14 情報処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2009194612A JP2009194612A (ja) 2009-08-27
JP5012551B2 true JP5012551B2 (ja) 2012-08-29

Family

ID=41076238

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008032829A Expired - Fee Related JP5012551B2 (ja) 2008-02-14 2008-02-14 情報処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5012551B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108740A (ja) * 1991-10-11 1993-04-30 Matsushita Electric Ind Co Ltd 帯グラフ認識装置
JP2800672B2 (ja) * 1994-01-31 1998-09-21 富士ゼロックス株式会社 文書処理装置
JP4123387B2 (ja) * 1996-11-13 2008-07-23 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラムを記録した媒体
JP2001319228A (ja) * 2000-02-28 2001-11-16 Sharp Corp 画像処理装置および画像処理システム
JP4543741B2 (ja) * 2004-05-12 2010-09-15 富士ゼロックス株式会社 グラフ作成装置、プログラムおよび記録媒体
JP5002997B2 (ja) * 2006-03-30 2012-08-15 カシオ計算機株式会社 投影装置及びプログラム

Also Published As

Publication number Publication date
JP2009194612A (ja) 2009-08-27

Similar Documents

Publication Publication Date Title
JP5302768B2 (ja) 画像処理装置及び画像処理方法
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US7272269B2 (en) Image processing apparatus and method therefor
US8203748B2 (en) Image processing apparatus, control method therefor, and program
US7623712B2 (en) Image processing method and apparatus
US8023147B2 (en) Image processing method and image processing apparatus
US7551753B2 (en) Image processing apparatus and method therefor
US8244035B2 (en) Image processing apparatus and control method thereof
JP4968882B2 (ja) 画像検索装置、画像検索方法およびプログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US7783108B2 (en) Document management method and apparatus
US7596271B2 (en) Image processing system and image processing method
JP3997198B2 (ja) 画像処理システム及び画像処理方法
US20060008113A1 (en) Image processing system and image processing method
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP5645612B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
CN102473278A (zh) 图像处理装置、图像处理方法和存储介质
JP2005151127A (ja) 画像処理システム及び画像処理方法
JP4739082B2 (ja) 画像処理方法及び画像処理装置
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP5012551B2 (ja) 情報処理装置およびプログラム
US8295602B2 (en) Image processing apparatus and image processing method
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP2008257537A (ja) 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120521

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150615

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5012551

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees