JP2008282149A - 画像処理装置、画像処理方法、画像処理プログラム - Google Patents

画像処理装置、画像処理方法、画像処理プログラム Download PDF

Info

Publication number
JP2008282149A
JP2008282149A JP2007124690A JP2007124690A JP2008282149A JP 2008282149 A JP2008282149 A JP 2008282149A JP 2007124690 A JP2007124690 A JP 2007124690A JP 2007124690 A JP2007124690 A JP 2007124690A JP 2008282149 A JP2008282149 A JP 2008282149A
Authority
JP
Japan
Prior art keywords
data
conversion
image processing
region
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007124690A
Other languages
English (en)
Other versions
JP2008282149A5 (ja
JP5020698B2 (ja
Inventor
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2007124690A priority Critical patent/JP5020698B2/ja
Publication of JP2008282149A publication Critical patent/JP2008282149A/ja
Publication of JP2008282149A5 publication Critical patent/JP2008282149A5/ja
Application granted granted Critical
Publication of JP5020698B2 publication Critical patent/JP5020698B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 様々な種類の要素が混在する原稿を電子化する際、作成されるデータの総量を小さくすること。
【解決手段】 まず、領域識別部211で画像データ200に含まれる領域を識別する。次に、領域別画像処理部212〜215で前記画像データの領域に対応した画像処理を行う。次に、内容データ生成部216で前記領域別画像処理されたデータを構造化し画像の内容を示す内容データを生成する。次に、変換データ生成部218で前記領域識別に基づき前記内容データをアプリケーションソフトで利用可能なデータへ変換するために用いる変換データ生成する。
【選択図】 図2

Description

本発明は、紙の原稿を電子化し再利用可能なデータを作成する技術に関する。
従来から、紙の原稿を電子化し再利用可能なデータを作成する様々な技術が存在する。原稿をいったん電子化してしまえば、そのデータは紙よりも効率的に保管し利用することが可能である。
まず、原稿に含まれる文書を文字コードへと変換する技術がある。特許文献1には、紙の原稿を電子的に読み込ませる際、その内容と一致する文書をデータベースから検索して取得し、読み込んだ紙面のデータの代わりに利用する技術が開示されている。この様な技術を用いて文字コード化されたデータは、テキスト編集のアプリケーションで利用することが可能である。
また、原稿に含まれる文字領域の画像をベクトルデータに変換する技術がある。特許文献2には、二値画像中の連結画素輪郭を関数記述として得る技術が開示されている。このデータを文書生成アプリケーション中で利用すれば、文字単位の位置やサイズの変更さらには幾何学的変形や色付けなどを容易におこなうことができる。この様な技術を用いてベクトル記述されたデータは、線画編集可能なアプリケーションで利用することが可能である。
また、原稿に含まれる表内のセルの位置関係と各セル内部の文字列を関連づけて記述する技術がある。特許文献3には、表形式の文書画像から枠線を認識することにより、表の要素である矩形枠とその位置関係を識別し、さらには各枠内の文字を前記文字認識技術によって得られた文字コードへと変換する技術が開示されている。この様な技術を用いて記述されたデータは、表計算のアプリケーションで利用することが可能である。
さらに、特許文献4には、原稿に複数種類の領域(文字や線画や表領域やその他自然画等)が混在する場合、各領域の範囲および種類を識別可能にする技術が開示されている。
文書の形式は様々である。それらの編集等を適切に行うことが可能なアプリケーションは、文書の種類ごとにそれぞれに特化された別々のものが用意されている場合が多い。また、一般に異なる文書形式に対応するアプリケーションは、それぞれ目的の異なるデータフォーマットを用いている場合が多い。その結果、紙の原稿を電子化する際には、あらかじめ適切なアプリケーションで利用可能なデータ形式へと変換して保存しておく必要があった。
図6に、異なる種類の原稿を例示する。(A)に対しては、表形式の文書として項目間の計算や集計機能を備えた、表計算タイプのアプリケーションが利用される。(B)に対しては、文字や図の配置や装飾に機能に優れた、プレゼンテーション作成タイプのアプリケーションが利用される。(C)に対しては、段組や文章の論理的な構成の編集機能を備えた、文章編集タイプのアプリケーションが利用される。(D)に対しては、図面の編集機能に優れた、図面編集タイプのアプリケーションが利用される。(E)に対しては、写真の色調や画像補正機能を有した、グラフィックレタッチタイプのアプリケーションが利用される。
このように、一つの要素のみからなる原稿を電子化する場合は、一つの入力に対して将来的に利用する可能性があるアプリケーションに対応するデータを一つ生成すればよい。
しかし、現実の原稿には様々な種類の要素が混在している場合が多い。例えば、図6(F)のように複数の種類の要素が混在する原稿は、状況に応じて複数の種類のアプリケーションから利用される可能性がある。このため、複数の種類の要素を含む原稿を電子化する場合は、一つの入力に対して将来的に利用する可能性がある複数のアプリケーションに対応するデータをそれぞれ生成していた。
特開2004−265384 特許3026592 特開平1−129358 USP 5680478
従来、様々な種類の要素が混在する原稿を電子化する際、1つの入力に対して内容を示すデータを対応するアプリケーションごとに複数生成していたので、作成されるデータの総量が大きくなっていた。
上記課題を解決するため、本発明は、画像の領域を識別する領域識別手段と、前記領域識別に基づき前記画像の領域に対応した画像処理を行う画像処理手段と、前記画像処理されたデータを構造化し画像の内容を示す内容データを1つ生成する内容データ生成手段と、前記領域識別に基づき前記内容データをアプリケーションソフトで利用可能なデータへ変換するために用いる変換データを少なくとも1つ以上生成する変換データ生成手段とを備えることを特徴とする。
本発明により、様々な種類の要素が混在する原稿を電子化する際、1つの入力に対して1つの内容データと少なくとも1つ以上の変換データを作成するので、作成されるデータの総量を小さくすることが可能になる。
まず、図1〜図3を用いて、本発明の実施形態に係る装置の構成を説明する。
図1は、本発明の実施形態に係るシステムの構成を示すブロック図である。
本発明のシステム構成は、複写機等に代表される画像処理装置100、パーソナルコンピュータ等に代表される情報処理装置120、画像処理装置100と情報処理装置120を繋ぐネットワーク110からなる。なお、ネットワーク110として実施例では有線の場合を示したが、これは無線であってもかまわない。
画像処理装置100は、画像データから画像の内容を示すデータ(以下、内容データと呼称する。)と内容データをアプリケーションソフトで利用可能なデータへ変換するために用いるデータ(以下、変換データと呼称する。)を生成する。スキャナ101は、読みとった文書の紙面情報を画像のデータに変換する。CPU 102は、画像データから内容データと変換データを生成するプログラムを実行する。メモリ103及びハードディスク104は、同プログラム及び同プログラムを実行した際の結果や途中のデータを保存する。ネットワークインターフェース(以下、NIと呼称する。)105は、同プログラムによって生成されたデータを装置外に出力する。ユーザーインターフェース(以下、UIと呼称する。)106は、一連の動作をユーザが制御するためのインタフェースであり、キーあるいはタッチパネル等の入力デバイスと液晶などの表示デバイスからなる。
本発明をソフト的に実現する場合は、CPU102がハードディスク104に格納された例えば図4に示す工程を持つ画像処理プログラムを実行することにより実現する。本発明をハード的に実現する場合は、図1には示していない画像処理回路が例えば図4に示す工程を実行することにより実現する。
情報処理装置120は、内容データと変換データからアプリケーションソフトで利用可能なデータ(以下、アプリデータと呼称する。)を生成する。CPU122は、内容データと変換データからアプリデータを生成するプログラムを実行する。メモリ123及びハードディスク124は、同プログラム及び同プログラムを実行した際の結果や途中のデータを保存する。NI125は、画像処理装置100によって生成されたデータを装置外から入力する。UI126は、一連の動作をユーザが制御するためのインタフェースであり、キーあるいはタッチパネル等の入力デバイスと液晶などの表示デバイスからなる。
本発明をソフト的に実現する場合は、CPU122がハードディスク124に格納された例えば図5に示す工程を持つ画像処理プログラムを実行することにより実現する。本発明をハード的に実現する場合は、図1には示していない画像処理回路が例えば図5に示す工程を実行することにより実現する。
図2及び図3は、本発明の実施形態に係る装置の動作の構成等を示す図である。これらの図は、本発明をソフト的な手段で実現する場合はプログラムにおけるデータの流れと各動作を実現する工程の関係を概念的に示すものである。またこれらの図は、本発明をハード的に実現する場合は専用の電子回路におけるデータの流れと各動作を実現する手段の関係を概念的に示すものである。
図2は、画像処理装置100における動作の構成とデータの流れ方を表す図である。なお、この動作はプログラムを用いてソフト的に実現しても良いし、電子回路を用いてハード的に実現しても良い。
200は、スキャナ101によって生成される画像データである。210は、画像データ200に対し画像処理装置100が実行する動作の構成(この動作の構成とは、発明をソフト的に実現する場合はプログラムの構成にあたり、ハード的に実現する場合は電子回路の構成にあたる。)である。220は、動作210によって生成されるデータである。
動作の構成210の要素は以下の通りである。211は、入力された文書画像中から文字、線画、表、自然画などの領域を識別し領域情報として出力する領域識別部である。212は、領域識別部の領域情報が示す領域のうち文字領域のデータを生成する文字領域処理部である。213は、領域識別部の領域情報が示す領域のうち表領域のデータを生成する表領域処理部である。214は、領域識別部の領域情報が示す領域のうち線画領域のデータを生成する線画領域処理部である。215は、領域識別部の領域情報が示す領域のうち自然画領域のデータを生成する自然画領域処理部である。216は、212、213、214、215が生成したデータを構造化して内容データを生成する内容データ生成部である。217は、211領域識別部の情報から変換データの変換種類を特定する変換種特定部である。218は、217が決定した変換種に基づいて変換データを生成する変換データ生成部である。
データ220を構成する要素は以下の通りである。221は、入力された文書画像の内容を記述した内容データである。222は、内容データをアプリデータへと変換する際に使用する変換データである。
図3は、情報処理装置120における動作の構成とデータの流れ方を表す図である。なお、この動作は、電子回路を用いてハード的に実現しても良い。
310は、データ220に対し本発明の情報処理装置が実施する動作の構成(この動作の構成とは、発明をソフト的に実現する場合はプログラムの構成にあたり、ハード的に実現する場合は電子回路の構成にあたる。)である。320は、動作310によって生成されるデータである。
動作の構成310の要素は以下の通りである。311は、211領域識別部の情報から、内容データ221をアプリデータ320に変換する際の変換先のアプリケーションを特定する変換先特定部である。312は、変換データ222を用いて内容データ221からアプリデータ320を生成するアプリデータ生成部である。
次に、本発明の実施形態に係る動作を、図4及び図5のフローチャートを用いて説明する。
図4は、画像処理装置100におけるCPU102の動作を説明するフローチャートである。本実施例では、かかるフローチャートに対応するプログラムがハードディスク104に記憶されており、そのプログラムがメモリ103に読み込まれCPU102により実行される。なお、本発明はハードウエアにより例えば図4に示す工程を実行することによっても実現することができる。また、本実施例において、データの処理過程で生成されるデータはメモリ103又はハードディスク104に記憶される。
ステップS401では、スキャナ101が紙原稿表面を走査し、光電変換によって紙に書かれた情報を画像データ200へと変換する。
ステップS402では、領域識別部211が公知の領域識別手法を用いてステップS401で得た画像データ200中の文字や線画、自然画などの領域を識別し領域情報を生成する。領域情報とは、画像内での領域四辺を特定する座標情報、および領域種別を表す属性情報である。この領域識別手法には、入力多値画像をそのまま解析する手法や、二値化した画像を解析する手法、あるいは微分エッジ情報などを生成して解析する手法などがあるが、そのいずれを用いてもよい。以下に一例として、入力画像を適切な閾値で白と黒に二値化した画像を利用して領域識別をおこなう方法について説明する。特許文献4(USP5680478)記載の領域識別処理によれば、画像データを文字、線画、写真などの自然画、表、などの文書的、形状的な特徴で分類された領域へと分割することができる。具体的には、先ず二値画像に対して8連結の黒画素輪郭追跡をおこなって黒画素の塊を抽出する。ここで面積の大きい黒画素の塊についてはその内部から4 連結の白画素輪郭追跡をおこなって白画素の塊を抽出し、さらに一定面積以上の白画素塊の内部からは再び黒画素輪郭追跡をおこなって黒画素の塊を抽出する。続いて、得られた黒画素の塊を大きさや形状、密度などで分類し、必要であればグループ化して文字/図画/写真/線/表など異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが定められた範囲のものを文字相当の画素塊とし、そのような文字相当の画素塊が互いに近接して整列良くグループ化が可能な部分を文字領域と判定する。それらを除いた黒画素塊のうち、一定以上扁平な画素塊は単独で線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を枠および表領域とする。残る不定形の画素塊のうち、黒画素密度の低い画素塊を線画領域、それ以外の画素塊および小画素塊が散在している部分をグループ化した領域を自然画領域と判定してゆく。図8に入力画像(A)および同公報記載の領域識別処理により領域識別をおこなった結果の例(B)を示す。801、803、804は文字領域、802は写真領域、805は線画領域、806は表領域で807〜810は表セル内の各文字領域である。
ステップS403では、図2中212〜215の各領域処理部が、S401で得た画像データ200に対し、ステップS402が出力した領域情報に基づいて対応する領域の画像情報に対する画像処理を行う。以下に212〜215の各処理部が行う処理の例を説明する。212文字領域処理部は、公知の文字認識技術を用いて領域内に存在する文字部分の二値画像の形状を一文字ずつ認識してそれぞれ対応する文字コードを生成する。文字認識技術の一例を簡単に説明する。まず領域の縦横の射影で規則的周期性を持つ方向から行方向を判別して行に切り出し、さらに行内で射影をとって1文字ずつの画像を切りだす。これら文字画像からそれぞれエッジ成分などを取り出して特徴ベクトル化し、あらかじめ字種分登録された辞書内の特徴ベクトルと類似度を求め、最も類似度の高い字の文字コードを認識結果とする。213表領域処理部は、公知の表認識技術を用いて領域内に存在する表の形状からいわゆるセルと呼ばれる線等で区切られた構成要素を認識し、その配置を記述する表構造情報を生成する。さらにセル内部にある文字情報に対しては212文字領域処理部と同様な処理を用いて文字コードを生成し、表構造情報と対応づけて出力する。表認識技術としては、例えば特許文献3(特開平1−129358)に開示される技術を用いればよい。214線画領域処理部は、公知の線画ベクトル情報生成技術を用いて領域内に存在する線画を直線・曲線・面などで描画可能とするベクトル記述情報を生成する。線画ベクトル情報生成技術としては、例えば特許文献2(特許第3026592号)に開示される二値画像ベクトル化技術を用いればよい。特許文献2は、二値画像をラスタ走査しながら注目画素とその近傍画素の状態に基づいて、アウトラインベクトルと呼ばれる連結画素データの周回を画素間ベクトルの集合で記述する情報を生成する技術を開示している。215自然画領域処理部は、領域内に存在する写真・絵画などの自然画情報を画像情報として出力する。本処理によれば、単に画像データの該当部分のみを抜き出した小画像が生成される。あるいは必要に応じて画像データの拡大・縮小・圧縮をおこなってもよい。なお、ここで説明した212〜215の処理内容はあくまで一例であって、他の処理をおこなって各領域のデータを生成してもよい。あるいは、処理結果は一領域に対して複数生成してもよい。たとえば、文字領域処理部で線画領域処理部と同様の処理をおこなって、文字外形のベクトル情報を文字領域の情報として生成したり、あるいはこのベクトル情報と文字認識結果である文字コード情報の両方を文字領域の情報としてもよい。
ステップS404では、内容データ生成部216がステップS403の212〜215で画像処理された各情報を合わせ構造化し内容データ221を生成する。図9に、XML形式を用いて内容データを記述した例を示す。900部分は文字領域内部の情報として文字コードを保持する場合の情報記述例、901部分は表領域の構造およびセル内文字情報記述例、902部分は自然画領域の画像情報記述例、903部分は線画領域のベクトル情報記述例である。各領域には画像内での位置情報として左上のx,y座標、幅、高さも記述されている。
ステップS405では、変換種特定部217が、ステップS402が出力した領域情報に基づいて、予め定められたアプリケーションを対象に処理中のデータがどのアプリケーションで利用することが適当であるか判断し生成する変換データの種類を特定する。
図13は、ステップS405の処理工程を詳しく示すフローチャートである。変換種の特定は注目種の領域に対するアプリケーションの使用可能性に基づき行われる。まず、ステップS1301で、S402の結果を元に画像データにどんな領域が含まれるか特定する。次に、ステップS1302で、S1301において特定された各領域に対し、必須(使用する可能性が高い)のアプリケーションに対する変換種を特定する。次に、ステップS1303で、S1301において特定した各領域について、その総面積と他の種類の領域の総面積との比率を算出する。次に、ステップS1304で、S1303において算出した比率があらかじめ定められた閾値よりも大きいか否かを判断し、大きければS1305に進み、そうでなければ変換種の特定を終了する。次に、ステップS1305で、S1301において特定された各領域に対し、S1303で算出した比率があらかじめ定められた閾値よりも大きいものについて、重要(使用する可能性が有る)なアプリケーションに対する変換種を特定する。この変換種の特定について、例として5種類のアプリケーションを対象とした場合を以下に説明する。ここで5種類のアプリケーションとは次に挙げるアプリケーションである。1つ目は図6(A)のような文書を対象とする表計算アプリケーションである。2つ目は図6(B)のような文書を対象とするプレゼンテーション作成アプリケーションである。3つ目は図6(C)のように文章主体の原稿を作成する文書編集アプリケーションである。4つ目は図6(D)のように線画を作成する図面編集アプリケーションである。5つ目は図6(E)のように写真画像に対して色調などの補正処理をおこなうグラフィックレタッチアプリケーションである。各アプリケーションに対し、現在処理中のデータを利用することが適当であるかどうかの判断は、図10の表を用いて行う。表の横行は領域識別処理によって得られた領域の種類、表の縦列はアプリケーションの種類を表す。項目の“◎”は、そのアプリケーションが必須であるという意味であり、該当行の領域種類を処理中データがすこしでも含む場合は、該当列のアプリケーションでこのデータを利用することは適当であると判断することを示している。また項目の“○”は、そのアプリケーションが重要であるという意味である。これはすなわち、該当行の領域種類を処理データが含み、かつその総面積と他の種類の領域の総面積との比率があらかじめ定められた閾値よりも大きい場合に、該当列のアプリケーションでこのデータを利用することは適当であると判断することを示している。また、処理データに領域が存在しない、すなわち白紙に相当する場合はあらかじめ設定されたデフォルトのアプリケーション、ここではプレゼンテーション作成アプリケーションが適当であると判断されるとする。なお上記はあくまで一例であって、対象となるアプリケーションの種類や数、および判断規準は異なるものを設定してもよい。
ステップS406では、ステップS405で特定された1または複数の変換種類を、データの変換候補として画像処理装置のUI 106の表示手段を介してユーザに提示する。例えば、変換種特定部217が図10に例示される表に従って判断を行う場合、図6(A) の文書に対しては、表計算アプリケーション、プレゼンテーション作成アプリケーションおよび文書編集アプリケーションが変換候補として表示される。同様に、図6(B)および図6(C)の場合は、文書編集アプリケーションとプレゼンテーション作成アプリケーションが変換候補として表示される。また、図6(D)の場合は、図面編集アプリケーションとプレゼンテーション作成アプリケーションが変換候補として表示される。また、図6(E)の場合は、グラフィックレタッチアプリケーションとプレゼンテーション作成アプリケーションが変換候補として表示される。また、図6(F)の場合は、文書作成アプリケーションとプレゼンテーション作成アプリケーション、および前記閾値の値によって表計算アプリケーションあるいはグラフィックレタッチアプリケーションも変換候補として表示される。
ステップS407では、ステップS406にて提示された変換候補の中から、実際にユーザが変換対象にしたいものを選択した結果を受け付ける。例えば、初期状態では提示されたすべての候補が変換対象となるようにし、ユーザに選択対象から外したい候補のチェックボックスをタッチして指定するような操作をUI106に備えればよい。
ステップS408では、変換データ生成部218が、ステップS407で選択された変換対象それぞれに対する変換データ222を生成する。例えば、ステップS407で変換対象として表計算アプリケーションとプレゼンテーション作成アプリケーションが選択された場合、各アプリケーションはそれぞれ独自のデータフォーマットを持つために内容データ221をそのまま利用することはできない。よって、内容データ221を表計算アプリケーションで利用可能なデータへ変換するための変換データと、内容データをプレゼンテーション作成アプリケーションで利用可能なデータに変換するための変換データの2つを生成して変換データ222として出力する。この変換データ222の例を、図11(A)を入力データ、図11(B)を出力データとする変換工程を例にとって説明する。この変換工程は以下のようなルールで実行されている。
・入力データにルート要素が出現したら、“E”という要素を出力し、その小要素にさらに以下のルールの適用結果を出力する
・入力データに“B”という要素が出現したら、“F”という要素を出力し、その属性“g”に入力の“B”要素の属性“b”の値を設定し、“F”要素の値には注目する“B”の小要素である“C”要素の値を設定する
上記の変換ルールは例えばXSL形式に従って記述すると図12のようになる。
ステップS408では、内容データ221と変換データ222を合わせた出力データを作成する。図7に出力データの構成例を示す。701はこの出力データの構成や作成日などの付加情報を格納するヘッダ部分、702は圧縮された内容データ221を格納する部分、703,704,705はそれぞれ異なるアプリケーション用のデータへの変換データを格納する部分を示す。
ステップS409では、ステップS408で生成された出力データ220をNI105を通じて送信する処理を行う。
この送信工程終了後に画像処理装置110における動作は終了する。
図5は、情報処理装置120のCPU動作を説明するフローチャートである。かかるフローチャートに対応するプログラムは後述するメモリに記憶され、CPUにより実行される。
CPU122がハードディスク124に格納された例えば図5に示す工程を持つ画像処理プログラムを実行することにより実現する。本発明をハード的に実現する場合は、回路が例えば図5に示す工程を実行することにより実現する。この時、データの処理過程で生成されるデータはメモリ123又はハードディスク124に記憶される。
図5は、情報処理装置120におけるCPU122の動作を説明するフローチャートである。本実施例では、かかるフローチャートに対応するプログラムがハードディスク124に記憶されており、そのプログラムがメモリ123に読み込まれCPU122により実行される。なお、本発明はハードウエアにより例えば図5に示す工程を実行することによっても実現することができる。また、本実施例において、データの処理過程で生成されるデータはメモリ123又はハードディスク124に記憶される。
ステップS501では、NI125を経由して画像処理装置100より送信された出力データ220を受信する。受信されたデータはメモリ123あるいはハードディスク124等に一時保存される。
ステップS502では、ステップS501で受信した出力データ220を読み込み、中に含まれる内容データ221を取得する。
ステップS503では、ステップS501で受信した出力データ220を読み込み、中に含まれる変換データ222を取得する。
ステップS504では、ステップS503で取得した変換データの数と種類の情報を基に、選択可能な変換先を特定する。例えば、出力データ220内に2つの異なる変換データが存在した場合、それぞれに対応する2つのアプリケーションを変換先として特定する。
ステップS505では、ステップS504で特定した変換先の候補を、ディスプレイ127を用いてユーザに提示する。
ステップS506では、ステップS505で提示された選択候補の中から、UI206を用いてユーザの希望する変換先を受け付ける。
ステップS507では、ステップS506で選択された変換先に対応する変換データを用いて、内容データ221をアプリデータ320へと変換する。アプリデータ320は例えば別ファイルとしてハードディスク124に保存され、ユーザはこのファイルを所望のアプリケーションで開くことが可能になる。あるいはアプリデータ320を保存するとともにユーザが所望するアプリケーションを起動し、さらに該データをアプリケーションの入力ファイルとして指定し、ユーザ直ちにアプリケーションで該データを利用できるようにしてもよい。
この変換工程終了後に情報処理装置120における動作は終了する。
なお、本発明に係るプログラムがハードディスク104又はハードディスク124に記憶されていない場合、外部のネットワークや記録媒体からプログラムをダウンロードして実行するように構成してもよい。
本発明では、様々な種類の要素が混在する原稿を電子化する際、1つの入力に対して1つの内容データと内容データから将来的に利用する可能性がある複数のアプリケーションに対応するデータを作成するために必要な変換データを少なくとも1つ以上生成する。これにより、作成されるデータの総量を小さくすることが可能になる。
また本発明では、様々な種類の要素が混在する原稿を電子化する際、利用するアプリケーションの種類を特定してから指定する。これにより、データの送信側又は受信側においてユーザの操作を簡単にすることが可能になる。
本発明の実施形態に係るシステムの構成を示すブロック図 本発明の実施形態に係る画像処理装置100における動作の構成とデータの流れ方を表す図 本発明の実施形態に係る情報処理装置120における動作の構成とデータの流れ方を表す図 本発明の実施形態に係る画像処理装置100の動作を説明するフローチャート 本発明の実施形態に係る情報処理装置120の動作を説明するフローチャート 本発明の実施形態に係る入力文書の例を示す図 本発明の実施形態に係る画像処理装置の出力データ構成の例を示す図 本発明の実施形態に係る領域識別処理の例を示す図 本発明の実施形態に係る内容データ記述の例を示す図 本発明の実施形態に係る変換種の特定判断の例を示す図 本発明の実施形態に係る変換データを適用するXML記述と適用後の例 本発明の実施形態に係る変換データ記述の例を示す図 本発明の実施形態に係る変換種特定の流れを示すフローチャート
符号の説明
100 画像処理装置
110 ネットワーク
120 情報処理装置
200 画像データ
210 画像処理装置100の動作構成
220 出力データ
310 情報処理装置120の動作構成
320 アプリデータ

Claims (19)

  1. 画像の領域を識別する領域識別手段と、
    前記領域識別に基づき前記画像の領域に対応した画像処理を行う画像処理手段と、
    前記画像処理されたデータを構造化し画像の内容を示す内容データを1つ生成する内容データ生成手段と、
    前記領域識別に基づき前記内容データをアプリケーションソフトで利用可能なデータへ変換するために用いる変換データを少なくとも1つ以上生成する変換データ生成手段と
    を備えることを特徴とする画像処理装置。
  2. 前記領域識別に基づき生成すべき変換データの種類を特定する変換種特定手段と
    を更に備え、
    前記変換データは前記特定された種類に基づき生成される
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記変換種特定は注目種の領域に対するアプリケーションの使用可能性に基づき行われる
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記変換種特定は注目種の領域とその他の領域との比率に基づき行われる
    ことを特徴とする請求項2に記載の画像処理装置。
  5. 内容データの変換先となるアプリケーションソフトを特定する変換先特定手段と、
    前記変換先特定に基づき変換データを用いて内容データを変換しアプリケーションソフトで利用可能なデータを生成するアプリデータ生成手段と
    を備えることを特徴とする画像処理装置。
  6. 前記変換先特定は受信した変換データの種類に基づき行われることを特徴とする
    請求項5に記載の画像処理装置。
  7. 画像の領域を識別する領域識別工程と、
    前記領域識別に基づき前記画像の領域に対応した画像処理を行う画像処理工程と、
    前記画像処理されたデータを構造化し画像の内容を示す内容データを1つ生成する内容データ生成工程と、
    前記領域識別に基づき前記内容データをアプリケーションソフトで利用可能なデータへ変換するために用いる変換データを少なくとも1つ以上生成する変換データ生成工程と
    を備えることを特徴とする画像処理方法。
  8. 前記領域識別に基づき生成すべき変換データの種類を特定する変換種特定工程と
    を更に備え、
    前記変換データは前記特定された種類に基づき生成される
    ことを特徴とする請求項7に記載の画像処理方法。
  9. 前記変換種特定は注目種の領域に対するアプリケーションの使用可能性に基づき行われる
    ことを特徴とする請求項8に記載の画像処理方法。
  10. 前記変換種特定は注目種の領域とその他の領域との比率に基づき行われる
    ことを特徴とする請求項8に記載の画像処理方法。
  11. 内容データの変換先となるアプリケーションソフトを特定する変換先特定工程と、
    前記変換先特定に基づき変換データを用いて内容データを変換しアプリケーションソフトで利用可能なデータを生成するアプリデータ生成工程と
    を備えることを特徴とする画像処理方法。
  12. 前記変換先特定は受信した変換データの種類に基づき行われることを特徴とする
    請求項11に記載の画像処理方法。
  13. 画像の領域を識別する領域識別ステップと、
    前記領域識別に基づき前記画像の領域に対応した画像処理を行う画像処理ステップと、
    前記画像処理されたデータを構造化し画像の内容を示す内容データを1つ生成する内容データ生成ステップと、
    前記領域識別に基づき前記内容データをアプリケーションソフトで利用可能なデータへ変換するために用いる変換データを少なくとも1つ以上生成する変換データ生成ステップと
    を備えることを特徴とする画像処理プログラム。
  14. 前記領域識別に基づき生成すべき変換データの種類を特定する変換種特定ステップと
    を更に備え、
    前記変換データは前記特定された種類に基づき生成される
    ことを特徴とする請求項13に記載の画像処理プログラム。
  15. 前記変換種特定は注目種の領域に対するアプリケーションの使用可能性に基づき行われる
    ことを特徴とする請求項14に記載の画像処理プログラム。
  16. 前記変換種特定は注目種の領域とその他の領域との比率に基づき行われる
    ことを特徴とする請求項14に記載の画像処理プログラム。
  17. 内容データの変換先となるアプリケーションソフトを特定する変換先特定ステップと、
    前記変換先特定に基づき変換データを用いて内容データを変換しアプリケーションソフトで利用可能なデータを生成するアプリデータ生成ステップと
    を備えることを特徴とする画像処理プログラム。
  18. 前記変換先特定は受信した変換データの種類に基づき行われることを特徴とする
    請求項17に記載の画像処理プログラム。
  19. 請求項13乃至18に記載のプログラムを記録した記録媒体。
JP2007124690A 2007-05-09 2007-05-09 画像処理装置、画像処理方法、画像処理プログラム Expired - Fee Related JP5020698B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007124690A JP5020698B2 (ja) 2007-05-09 2007-05-09 画像処理装置、画像処理方法、画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007124690A JP5020698B2 (ja) 2007-05-09 2007-05-09 画像処理装置、画像処理方法、画像処理プログラム

Publications (3)

Publication Number Publication Date
JP2008282149A true JP2008282149A (ja) 2008-11-20
JP2008282149A5 JP2008282149A5 (ja) 2010-06-24
JP5020698B2 JP5020698B2 (ja) 2012-09-05

Family

ID=40142926

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007124690A Expired - Fee Related JP5020698B2 (ja) 2007-05-09 2007-05-09 画像処理装置、画像処理方法、画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5020698B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013137761A (ja) * 2011-12-20 2013-07-11 Canon Inc 参照背景色に基づく透明化塗りつぶしの判定
JP2014238787A (ja) * 2013-06-10 2014-12-18 富士ゼロックス株式会社 画像処理装置及びプログラム
US10455116B2 (en) 2017-07-18 2019-10-22 Kyocera Document Solutions Inc. Image processing device and method for controlling image processing device
US10630854B2 (en) 2017-12-26 2020-04-21 Kyocera Document Solutions Inc. Image processing apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740432A (zh) * 2016-01-29 2016-07-06 上海摩软通讯技术有限公司 图片生成方法及模块、图片搜索方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004258724A (ja) * 2003-02-24 2004-09-16 Ricoh Co Ltd 文書作成支援装置、方法、プログラム、及び記録媒体
JP2005258592A (ja) * 2004-03-09 2005-09-22 Konica Minolta Business Technologies Inc フォーマット変換装置およびファイル検索装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004258724A (ja) * 2003-02-24 2004-09-16 Ricoh Co Ltd 文書作成支援装置、方法、プログラム、及び記録媒体
JP2005258592A (ja) * 2004-03-09 2005-09-22 Konica Minolta Business Technologies Inc フォーマット変換装置およびファイル検索装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013137761A (ja) * 2011-12-20 2013-07-11 Canon Inc 参照背景色に基づく透明化塗りつぶしの判定
JP2014238787A (ja) * 2013-06-10 2014-12-18 富士ゼロックス株式会社 画像処理装置及びプログラム
US10455116B2 (en) 2017-07-18 2019-10-22 Kyocera Document Solutions Inc. Image processing device and method for controlling image processing device
US10630854B2 (en) 2017-12-26 2020-04-21 Kyocera Document Solutions Inc. Image processing apparatus

Also Published As

Publication number Publication date
JP5020698B2 (ja) 2012-09-05

Similar Documents

Publication Publication Date Title
JP4181892B2 (ja) 画像処理方法
EP2270714B1 (en) Image processing device and image processing method
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP5059545B2 (ja) 画像処理装置及び画像処理方法
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP5121599B2 (ja) 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP4502385B2 (ja) 画像処理装置およびその制御方法
US20120250048A1 (en) Image processing apparatus and image processing method
JP2006023945A (ja) 画像処理システム及び画像処理方法
JP2007279828A (ja) 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2008022159A (ja) 文書処理装置及び文書処理方法
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2007129557A (ja) 画像処理システム
JPH06110996A (ja) テキストイメージ及び書式イメージの併合による自動イメージ生成
JP2010136192A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4323856B2 (ja) 画像処理方法
JP2004334340A (ja) 画像処理方法及び装置
JP2007334437A (ja) 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP2006134079A (ja) 画像処理装置及びプログラム
JPH10222688A (ja) 画像処理方法
JP2006261772A (ja) 画像形成装置及び画像形成方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100510

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100510

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110926

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111205

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120117

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120417

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120515

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120613

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150622

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees