JP5569367B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP5569367B2
JP5569367B2 JP2010268194A JP2010268194A JP5569367B2 JP 5569367 B2 JP5569367 B2 JP 5569367B2 JP 2010268194 A JP2010268194 A JP 2010268194A JP 2010268194 A JP2010268194 A JP 2010268194A JP 5569367 B2 JP5569367 B2 JP 5569367B2
Authority
JP
Japan
Prior art keywords
image data
template
file
data
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010268194A
Other languages
English (en)
Other versions
JP2012118780A (ja
Inventor
博司 野川
豊茂 能西
文人 秋山
昌裕 小澤
貴久 松永
泰史 青山
邦和 佐藤
康貴 下原
鉄蓮 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP2010268194A priority Critical patent/JP5569367B2/ja
Priority to CN201110330201.4A priority patent/CN102457643B/zh
Priority to CN201410276519.2A priority patent/CN104113656B/zh
Priority to US13/279,631 priority patent/US9049324B2/en
Publication of JP2012118780A publication Critical patent/JP2012118780A/ja
Application granted granted Critical
Publication of JP5569367B2 publication Critical patent/JP5569367B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Description

本発明は、画像処理装置、画像処理方法及びプログラムに関する。
近年、環境問題が叫ばれる中、オフィスにおけるペーパーレス化が急速に進んでいる。例えば、バインダ等に蓄積された紙原稿をスキャナで読み取り、データベースとして画像形成装置に蓄積することで、ペーパーレス化を実現する技術が知られている。
しかしながら、上述の技術では、紙原稿を保存するファイルがイメージデータであるため、原稿の一部のオブジェクトを再利用する場合、図、表等を新たにアプリケーションで作成しなければならなかった。
このため、紙原稿から読み取られたイメージデータを、文字/線画部分(以下、文字部分)の属性領域と画像部分の属性領域とに識別し、該識別された属性領域ごとにベクトル化処理を実行することで、一般のアプリケーションで編集可能な電子ファイルを生成する技術が知られている(例えば、特許文献1参照)。
具体的に特許文献1は、イメージデータを白黒画像に二値化し、二値化した黒画素の塊を抽出し、抽出した黒画素の塊の大きさ及び形状に基づいて、文字部分と画像部分との属性領域に識別をする技術である。
特開2005−157905号公報
しかしながら、上述の特許文献1の技術では、イメージデータ(以下、画像データ)の属性領域を識別する精度が低いという問題があった。例えば、黒画素の塊の大きさ及び形状に基づいて、画像データの属性領域を文字部分と識別した場合であっても、文字部分が異なる属性領域を有する場合、上述の特許文献1の技術では異なる属性領域の識別ができなかった。
また、属性領域の識別ができない場合、アプリケーションで編集可能な電子ファイルに変換することができず、ユーザは、データを再利用する際、データを新たにアプリケーションで作成しなければならなかった。
本発明の課題は、画像データを異なる属性領域に識別する精度を向上させ、且つ、ユーザの利便性を向上させることである。
上記課題を解決するため、請求項1に記載の発明の画像処理装置は、
画像データを取得する取得部と、
ユーザによるアプリケーションソフトウエアの選択が入力される入力部と、
前記取得部により取得された画像データと、ユーザにより選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応し、且つ前記判定部により一致すると判定された前記テンプレートに対応するファイル形式のファイルとして出力する制御を行う制御部と、
を備える。
また、請求項2に記載の発明は、請求項1に記載の画像処理装置において、
ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む。
請求項に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記複数のテンプレートは
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する。
請求項に記載の発明は、請求項1から3のいずれか一項に記載の画像処理装置において、
前記判定部は、
前記画像データが前記テンプレートにおけるテンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する。
請求項に記載の発明は、請求項に記載の画像処理装置において、
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う。
請求項に記載の発明は、請求項1からのいずれか一項に記載の画像処理装置において、
前記制御部は、
前記ベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応するファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートに対応するファイル形式のファイルを生成する。
請求項に記載の発明は、請求項に記載の画像処理装置において、
ユーザにより選択される記アプリケーションソフトウエアは、ワード(登録商標)、エクセル(登録商標)、及びパワーポイント(登録商標)のいずれかである。
請求項に記載の発明は、請求項1から7のいずれか一項に記載の画像処理装置において、
出力される前記ファイルは、OOXMLである。
請求項に記載の発明の画像処理方法は、
画像データを取得する工程と、
ユーザによるアプリケーションソフトウエアの選択が入力される工程と、
前記取得された画像データと、ユーザの入力により選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザの入力により選択されたアプリケーションソフトウエアに対応し、且つ一致すると判定された前記テンプレートに対応するファイル形式のファイルとして出力する工程と、
を含む。
また、請求項10に記載の発明は、請求項9に記載の画像処理方法において、
ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む。
請求項11に記載の発明のプログラムは、
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
ユーザによるアプリケーションソフトウエアの選択が入力される入力機能、
前記取得された画像データと、ユーザにより選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応し、且つ前記判定機能により一致すると判定された前記テンプレートに対応するファイル形式で出力する制御を行う制御機能、
を実現させる。
また、請求項12に記載の発明は、請求項11に記載のプログラムにおいて、
ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む。
本発明によれば、画像データを異なる属性に識別する精度を向上させ、且つ、ユーザの利便性を向上させることができる。
本発明に係る画像処理装置を有する画像形成装置を含むネットワーク構成図である。 コンピュータの主要構成を示すブロック図である。 画像形成装置の主要構成を示すブロック図である。 (A)は、スライド形式の紙原稿を示す図である。(B)は、ノート形式の紙原稿を示す図である。(C)は、配布資料形式の紙原稿を示す図である。 ノート形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。 配布資料形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。 ファイル出力処理の流れを示すフローチャートである。 ノート形式の紙原稿を示す図である。 (A)は、スライド形式のテンプレートを示す図である。(B)は、ノート形式のテンプレートを示す図である。(C)は、配布資料形式のテンプレートを示す図である。 「サンプル.pptx」ファイルの複数のパーツファイル群の一例を示す図である。 「Content_Types」.xmlを示す図である。 「ppt¥notesSlides¥notesSlide1.xml」を示す図である。 「ppt¥notesSlides¥notesSlide1.xml」を示す図である。 「ppt¥Slides¥Slide1.xml」を示す図である。 「ppt¥Slides¥Slide1.xml」を示す図である。 「ppt¥Slides¥Slide1.xml」を示す図である。 「ppt¥Slides¥Slide1.xml」を示す図である。 「ppt¥Slides¥_rels¥Slide1.xml.rels」を示す図である。 mediaフォルダのファイルパス「ppt¥ppt¥media¥image1.gif」を示す図である。 「サンプル.pptx」が表示された状態を示す図である。
以下、図を参照して本発明の実施の形態の例を詳細に説明する。
図1は、本発明による画像処理装置を有する画像形成装置1を含むネットワーク構成図である。
画像形成装置1、1、1は、回線3を介してコンピュータ2、2と通信可能に接続されている。
回線3は、画像形成装置1、1、1及びコンピュータ2、2によるネットワークを構成する。回線3は、コンピュータ2、2及び画像形成装置1、1、1を通信可能に接続するものであればその形態を問わない。例えば、回線3は、イーサネット(登録商標)、同軸ケーブル、光ファイバー等の有線接続回線や、無線通信を実現するための各種規格等、そのいずれか又は複数の組み合わせによってよい。また、回線3は、LAN(Local Area Network)、インターネット、その他のネットワーク規模を問わない。
図2は、コンピュータ2の主要構成を示すブロック図である。
コンピュータ2、2はそれぞれ、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、記憶部14、入力インタフェース(I/F)15、出力I/F16及び通信装置17を備え、これらの各構成はバス20により接続される。
CPU11は、ROM13内に記憶されたプログラムと協働し、RAM12に展開されたプログラムやデータ等に従ってコンピュータ2の動作制御を行う。
RAM12は、CPU11の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を格納する。
ROM13は、CPU11によって読み出されるプログラムやデータ等を記憶する。
記憶部14は、CPU11によって読み出されるプログラムやデータ等を記憶する。記憶部14は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
入力I/F15は、外部入力装置18による入力を受け付けるインタフェースである。外部入力装置18は、例えばキーボードやマウス等であり、ユーザの手動操作により入力指示が行われる。
出力I/F16は、外部出力装置19に対する出力を行うインタフェースである。外部出力装置19は、例えばCRTや液晶ディスプレイ等の表示装置等であり、CPU11の処理結果に基づいた出力画面を表示する。
通信装置17は、コンピュータ2を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置17は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
図3は、画像形成装置1の主要構成を示すブロック図である。図1に示す画像形成装置1、1、1は全て同じ構成によるので、以下一つの画像形成装置1について説明する。
画像形成装置1は、判定部、制御部としてのCPU21、RAM22、ROM23、記憶部24、入力I/F25、取得部としての画像読取部26、画像印刷部27、通信装置28を備え、これらの各構成はバス30により接続される。
CPU21は、ROM23内に記憶されたプログラムと協働し、RAM22に展開されたプログラムやデータ等に従って画像形成装置1の動作制御を行う。
RAM22は、CPU21の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を記憶する。
ROM23は、CPU21によって読み出されるプログラムやデータ等を記憶する。
記憶部24は、CPU21によって読み出されるプログラムやデータ等を記憶する。記憶部24は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。
入力I/F25は、外部入力装置29等の入力装置による入力を受け付けるインタフェースである。外部入力装置29は、例えばタッチパネルディスプレイを有する入力パネル等であり、ユーザの手動操作により入力指示が行われる。
画像読取部26は、自動原稿搬送部(ADF)、プラテンガラス、CCD等の光学系を備えて構成され、ADF又はプラテンガラスに載置された原稿の画像を光学系により読み取る機能を実現する。画像読取部26により読み取られた画像の画像データ(アナログ画像信号)は、A/D変換され各種画像処理が施された後、デジタルの画像データ(ファイル)として記憶部24に記憶されるとともに、画像印刷部27に出力される。
画像印刷部27は、入力された画像データに基づいて画像形成(印刷)を行う。画像印刷部27に採用可能な印刷方式としては、例えば電子写真方式やインクジェット方式、熱転写方式、オフセット等が挙げられる。本実施形態では、画像印刷部27は、電子写真方式による画像形成を行うための構成を有する。
通信装置28は、画像形成装置1を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置28は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。
次に、図4を参照して、画像読取部26で読み取る紙原稿の形式について説明する。以下、アプリケーションソフトウエア(以下、アプリケーション)としてパワーポイント(登録商標)を用いて印刷した紙原稿の形式について説明する。図4に示すように、紙原稿の形式としては、スライド形式の紙原稿(図4(A)参照)、ノート形式の紙原稿(図4(B)参照)、配布資料形式の紙原稿(図4(C)参照)がある。
スライド形式の紙原稿は、1ページのスライド画像が印刷された原稿である。スライド画像は、パワーポイントのスライド上に形成される画像であって、文字、線、表、図形、写真等の画像を含む。ノート形式の紙原稿は、1ページのスライド画像及びノート画像が印刷された原稿である。ノート画像は、スライドに関するメモ書き等の文字で構成される画像である。配布資料形式の紙原稿は、複数ページのスライド画像が印刷された原稿である。
次に、紙原稿をスキャンしてからパワーポイントで編集可能な電子ファイルを出力するまでの流れについて説明する。
例えば、図5に示すように、ノート形式の紙原稿が画像読取部26によりスキャンされた(読み取られた)場合、1ページ分のスライド画像データ及びノート画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータがノート形式のファイルとして出力される。すなわちノート形式のファイルとして記憶部24に記憶される。そして、ユーザにより、ノート形式のファイルを編集する指示が実行されると、ノート形式のファイルが記憶部24から読み出され、読み出されたノート形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示される(図5参照)。なお、ノート形式のファイルは、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。これにより、ユーザは、ノート形式のファイルを編集することが可能となり、利便性が向上する。
また、図6に示すように、配布資料形式の紙原稿が画像読取部26により読み取られた場合、複数のスライド画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータが配布資料形式のファイルとして記憶部24に記憶される。そして、配布資料形式のファイルを編集する指示が実行されると、記憶部24から配布資料形式のファイルが読み出され、読み出された配布資料形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図6参照)。このため、ユーザは、配布資料形式のファイルを編集することが可能となり、利便性が向上する
なお、図示していないが、スライド形式の紙原稿が画像読取部26により読み取られた場合は、1ページのスライド画像データで構成される画像データ(ファイル)が取得され、図5及び図6と同様の手順でスライド形式のファイルが出力される。このため、ユーザは、スライド形式のファイルを編集することが可能となり、利便性が向上する。
次に、図7を参照して、ファイル出力処理について説明する。ファイル出力処理は、紙原稿を画像読取部26により読み取って画像データを取得し、取得した画像データのファイル形式とテンプレートのファイル形式とが一致するかを判定し、画像データからベクトルデータを生成し、生成したベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。
予め、図8に示すノート形式の紙原稿が自動原稿搬送部(ADF)又はプラテンガラスに載置されているものとする。以下、図8に示すように、ノート形式の紙原稿において、スライド画像には、テキスト画像、イメージ画像及びグラフィック画像が含まれているものとする。また、ノート画像には、テキスト画像が含まれているものとする(ノート画像におけるテキスト画像は、「テキスト画像(ノート)」と記す)。
また、使用するアプリケーションを選択するための画面が予め外部入力装置29のタッチパネルディスプレイ上に表示されており、ユーザにより外部入力装置29を介して、使用するアプリケーションとして「パワーポイント」が選択入力されているものとする。
例えば、外部入力装置29を介して紙原稿の読み取りを実行開始するためのスキャンボタンが押下されたことをトリガとして、画像形成装置1においてファイル出力処理(図7参照)が実行開始される。
先ず、画像データの取得が行われる(ステップS1)。すなわち、紙原稿が画像読取部26により読み取られて画像データが取得される。そして、読み取られた画像の画像データ(アナログ画像信号)がA/D変換される。そして、A/D変換された画像データに各種画像処理が施され、各種画像処理が施されたデジタルの画像データが記憶部24に記憶される。
ステップS1の実行後、記憶部24に記憶された画像データが読み出され、該読み出された画像データとテンプレートとのマッチング判定が実行される(ステップS2)。マッチング判定は、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する処理である。ここで、図9を参照して、テンプレートについて説明する。テンプレートは、画像データのファイル形式を識別するための定型的なファイルである。マッチング判定によりマッチ(一致)すると判定されたテンプレートのファイル形式は、画像データのファイル形式として決定される。本処理では、テンプレートのファイル形式として、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートの3種類が予め記憶部24に記憶されており、マッチング判定の際に記憶部24から読み出されるものとする。
スライド形式のテンプレート(図9(A)参照)は、1ページ分のスライド画像の画像データで構成されるテンプレートである。画像データがスライド形式のテンプレートと一致する場合、画像データのファイル形式は、スライド形式のファイルと判定される。
ノート形式のテンプレート(図9(B)参照)は、1ページ分のスライド画像の画像データ及びノート画像の画像データで構成されるテンプレートである。画像データがノート形式のテンプレートと一致する場合、画像データのファイル形式は、ノート形式のファイルと判定される。
配布資料形式のテンプレート(図9(C)参照)は、複数ページ分のスライド画像の画像データで構成されるテンプレートである。画像データが複数ページのテンプレートと一致する場合、画像データのファイル形式は、配布資料形式のファイルと判定される。
なお、テンプレートにおいて、1ページ分のスライド画像の画像データで構成される領域を本文領域、ノート画像の画像データで構成される領域をノート領域と定義し、本文領域及びノート領域を総称してテンプレートデータ領域と定義する。
以下、ノート形式の紙原稿(図8参照)が読み取られ、1ページ分のスライド画像データ及びノート画像データで構成される画像データが取得された場合におけるマッチング判定について説明する。マッチング判定は、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かに応じて、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数をテンプレート毎に算出し、該算出された点数に基づいて判定を行う処理である。
先ず、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かが判定される。ここで、取得された画像データは、1ページ分のスライド画像データ及びノート画像データで構成される。この場合、取得された画像データにおける1ページ分のスライド画像データ及びノート画像データが各テンプレートのテンプレートデータ領域からはみ出すか否かが判定される。
例えば、画像データと、ノート形式のテンプレート(図9(B)参照)におけるテンプレート領域(本文領域及びノート領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域及びノート領域からはみ出さないと判定された場合、画像データは、テンプレートにおける本文領域及びノート領域のそれぞれからはみ出さないと判定される。この場合、画像データが本文領域からはみ出さないことにより点数「10点」が加算され、且つ、画像データがノート領域からはみ出さないことにより点数「10点」が加算される。すなわち、ノート形式のテンプレートの点数として「20点」が算出される。
また、画像データと、スライド形式のテンプレート(図9(A)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、スライド形式のテンプレートの点数として「0点」が算出される。
また、画像データと、配布資料形式のテンプレート(図9(C)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、配布資料形式のテンプレートの点数として「0点」が算出される。
上記の点数が算出された場合、点数の最も高いノート形式のテンプレートが画像データのファイル形式と一致すると判定される。
また、上述のマッチング判定において、算出された点数が所定の点数以下の場合は、テンプレートのファイル形式をユーザに選択させるようにしてもよい。例えば、算出された点数が所定の点数以下の場合、テンプレートのファイル形式をユーザに選択させるための選択情報としてテンプレートのファイル形式を選択できる画面が外部入力装置29のタッチパネルディスプレイ上に表示される。また、選択情報は、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。
図7において、ステップS2の実行後、マッチング判定結果の判別が実行される(ステップS3)。ステップS3において、マッチング判定結果がスライド形式のテンプレートにマッチすると判別された場合(ステップS3;スライド)、画像データの本文領域にOCR処理が実行される(ステップS4)。ステップS3において、マッチング判定処理がノート形式のテンプレートにマッチすると判別された場合(ステップS3;ノート)、画像データの本文領域及びノート領域にOCR処理が実行される(ステップS5)。ステップS3において、マッチング判定処理が配布資料形式のテンプレートにマッチすると判別された場合(ステップS3;配布資料)、画像データの各本文領域にOCR処理が実行される(ステップS6)。ここで、画像データの本文領域とは、テンプレートの本文領域に相当する画像データのデータ領域である。また、画像データのノート領域とは、テンプレートのノート領域に相当する画像データのデータ領域である。画像データの本文領域と画像データのノート領域との識別は、画像データ内における枠線の有無により識別される。
また、ステップS4〜S6においてOCR処理が実行されることにより、画像データからベクトルデータが生成される。
ステップS4〜S6の実行後、ファイル出力処理が実行される(ステップS7)。ファイル出力処理は、ベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。具体的には、ファイル出力処理は、ベクトルデータを、ワード(登録商標)、エクセル(登録商標)、パワーポイント等で扱えるファイル形式であるOOXML(Office Open XML)のファイルに追記し、一致すると判定されたテンプレートのファイル形式のファイルを生成し、該生成したファイルを記憶部24に記憶する処理である。
OOXMLは、マイクロソフト・オフィス(登録商標)2007において、新たに採用されたファイルの保存形式(ファイル形式)である。具体的には、OOXMLは、ワード、エクセル、パワーポイント等のファイル形式として採用されている。このため、OOXMLのファイル形式のファイルあれば、ワード、エクセル、パワーポイント等のアプリケーションで扱うこと、すなわち編集することが可能となる。
また、OOXMLの拡張子はそれぞれ、「docx」、「xlsx」、「pptx」で定義される。例えば、ユーザがファイル「サンプル.pptx」の拡張子「pptx」を「zip」に変更した後、「zip」に変更したファイルを解凍ソフトにより解凍すると、ユーザは、OOXMLのファイル形式のファイル「サンプル.pptx」を参照することが可能となる。ファイル「サンプル.pptx」は、図10に示すように、複数のパーツファイル群で構成される。
図11〜図15に、ファイル「サンプル.pptx」の複数のパーツファイル群のうち、一致すると判定されたテンプレートのファイル形式のファイルを生成するために、データの追記が必要なパーツファイルを示すとともに、追記が必要なパーツファイル内におけるデータの追記箇所を示す。以下、一致すると判定されたテンプレートのファイル形式がノート形式であり、該ノート形式のファイルを生成するためにデータの追記が必要なパーツファイル及び追記箇所の一例を示す。
例えば、図8に示すイメージ画像のデータの種類が「image1.gif」であり、「image1.gif」のコンテンツタイプを示すデータを追記する場合、複数のパーツファイル群のうち、ファイル定義情報で構成されるパーツファイル「Content_Types」.xml(図11参照)に追記が必要となる。具体的には、コンテンツタイプ(gif)を示すデータ(図11に示す追記部分1)がパーツファイル「Content_Types」.xml内に追記される。
また、画像データのノート領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、ノート領域のデータで構成されるパーツファイル「ppt¥notesSlides¥notesSlide1.xml」(図12A及び図12B参照)に追記が必要となる。具体的には、画像データのノート領域をOCR処理して得られたベクトルデータ(図12Bのテキスト部分のデータ)がパーツファイル「ppt¥notesSlides¥notesSlide1.xml」に追記される。なお、図12Bのテキスト部分のデータは、図8におけるテキスト画像(ノート)から得られたベクトルデータに相当する。
また、画像データの本文領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、本文領域のデータで構成されるパーツファイル「ppt¥Slides¥Slide1.xml」(図13A〜図13D)に追記が必要となる。具体的には、画像データの本文領域をOCR処理して得られたベクトルデータ(図13Aに示すテキスト部分のデータ、図13Bに示すイメージ部分のデータ及び図13Cに示すグラフィック部分のデータ)がパーツファイル「ppt¥Slides¥Slide1.xml」に追記される。なお、図13Aのテキスト部分のデータは、図8におけるテキスト画像から得られたベクトルデータに相当し、図13Bのイメージ部分のデータは、図8におけるイメージ画像から得られたベクトルデータに相当し、図13Cのグラフィック部分のデータは、図8におけるグラフィック画像から得られたベクトルデータに相当する。
また、本文領域の構成に関するリレーションシップ(関連性)を示すデータを追記する場合、複数のファイル群のうち、関連性を示すデータで構成されるパーツファイル「ppt¥Slides¥_rels¥Slide1.xml.rels」(図14参照)に追記が必要となる。具体的には、イメージ画像のパーツファイル「image1.gif」のリレーションシップを示すデータ(リレーションIDとファイルパス:図14に示す追記部分2)が追記される。
なお、追記部分2は、図13Bのイメージ部分においてリレーションID=rId3と定義されたイメージデータが「image1.gif」としてmediaフォルダに格納されていることを示すデータである。また、mediaフォルダは、イメージ画像のファイルで構成されるフォルダである。例えば、mediaフォルダに「image1.gif」が格納されると、ファイルパスは、「ppt¥ppt¥media¥image1.gif」となる(図15参照)。
上述のように、画像データの本文領域及び画像データのノート領域におけるベクトルデータを、ファイル「サンプル.pptx」に追記、すなわちファイル「サンプル.pptx」における複数のパーツファイル群のうち所定のパーツファイルに追記することで、ノート形式のファイル「サンプル.pptx」が生成される。
そして、生成されたノート形式のファイル「サンプル.pptx」が記憶部24に記憶される。そして、ユーザにより、ノート形式のファイル「サンプル.pptx」を編集する指示が実行されると、ノート形式のファイル「サンプル.pptx」が記憶部24から読み出され、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図16参照)。このため、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
以上、本実施の形態によれば、取得された画像データと、テンプレートにおけるテンプレート領域とを比較し、画像データがテンプレート領域からはみ出さないか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する。このため、画像データのファイル形式とテンプレートのファイル形式とが一致するかを正確に判定できる。
また、画像読取部26により取得された画像データを、枠線の有無により本文領域かノート領域かに識別する。このため、例えば、文字部分が異なる属性領域(例えば、本文領域及びノート領域)を有する場合であっても、ノート領域か本文領域かについての識別ができるので、画像データを異なる属性に識別する精度を向上させることができる。
また、画像データからベクトルデータを生成し、生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力するので、ユーザは、パワーポイントを用いてファイルを編集することが可能となる。このため、ユーザの利便性を向上させることができる。
また、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数を算出し、算出した点数の最も高いテンプレートのファイル形式を一致するテンプレートのファイル形式と判定するので、画像データのファイル形式とテンプレートのファイル形式との一致の判定をより正確に行うことができる。
また、算出した点数が所定の点数以下の場合、テンプレートのファイル形式を選択させるための選択情報を外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示する。このため、算出した点数が所定の点数以下の場合、ユーザは、所望のテンプレートのファイル形式を選択することができる。
また、ベクトルデータを、OOXMLのファイル形式のファイル「サンプル.pptx」に追記することで、ノート形式のファイル「サンプル.pptx」が生成される。そして、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示されると、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。
なお、上記実施の形態における記述は、本発明に係る画像形成装置の一例であり、これに限定されるものではない。
例えば、上記実施の形態では、紙原稿を画像読取部26により読み取ることで画像データを取得することとしたが、これに限定されるものではない。例えば、PC2上で作成された画像データを通信装置28を介してPC2から受信し、該受信した画像データを取得することとしてもよい。
また、上記実施の形態では、アプリケーションソフトとしてパワーポイントを用い、テンプレートはパワーポイントのファイル形式としたが、これに限定されるものではない。例えば、アプリケーションとしてパワーポイント以外のアプリケーション(例えば、ワード)を用いることとしてもよい。
また、テンプレートとして複数のテンプレート(例えば、N−アップ形式のテンプレート)を用いることとしてもよい。
その他、本実施の形態における、画像形成装置の細部構造及び詳細動作に関しても、本発明の趣旨を逸脱しない範囲で適宜変更可能である。
1 画像形成装置
2 コンピュータ
3 回線
11 CPU
12,22 RAM
13,23 ROM
14,24 記憶部
15,25 入力I/F
16 出力I/F
17 通信装置
18 外部入力装置
19 外部出力装置(所定の出力部)
20 バス
21 CPU(判定部、制御部)
26 画像読取部(取得部)
27 画像印刷部
29 外部入力装置(所定の出力部)

Claims (12)

  1. 画像データを取得する取得部と、
    ユーザによるアプリケーションソフトウエアの選択が入力される入力部と、
    前記取得部により取得された画像データと、ユーザにより選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する判定部と、
    前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応し、且つ前記判定部により一致すると判定された前記テンプレートに対応するファイル形式のファイルとして出力する制御を行う制御部と、
    を備える画像処理装置。
  2. ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む請求項1に記載の画像処理装置。
  3. 前記複数のテンプレートは
    外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
    前記判定部は、
    前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する請求項1又は2に記載の画像処理装置。
  4. 前記判定部は、
    前記画像データが前記テンプレートにおけるテンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する請求項1から3のいずれか一項に記載の画像処理装置。
  5. 前記制御部は、
    前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う請求項に記載の画像処理装置。
  6. 前記制御部は、
    前記ベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応するファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートに対応するファイル形式のファイルを生成する請求項1からのいずれか一項に記載の画像処理装置。
  7. ユーザにより選択される記アプリケーションソフトウエアは、ワード(登録商標)、エクセル(登録商標)、及びパワーポイント(登録商標)のいずれかである請求項に記載の画像処理装置。
  8. 出力される前記ファイルは、OOXMLである請求項1から7のいずれか一項に記載の画像処理装置。
  9. 画像データを取得する工程と、
    ユーザによるアプリケーションソフトウエアの選択が入力される工程と、
    前記取得された画像データと、ユーザの入力により選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する工程と、
    前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザの入力により選択されたアプリケーションソフトウエアに対応し、且つ一致すると判定された前記テンプレートに対応するファイル形式のファイルとして出力する工程と、
    を含む画像処理方法。
  10. ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む請求項9に記載の画像処理方法。
  11. コンピュータに、
    画像データを取得する取得部に画像データを取得させる取得機能、
    ユーザによるアプリケーションソフトウエアの選択が入力される入力機能、
    前記取得された画像データと、ユーザにより選択された前記アプリケーションソフトウエアに対応する複数のテンプレートとを比較し、前記画像データが前記複数のテンプレートのうちいずれの前記テンプレートと一致するかを判定する判定機能、
    前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記ユーザにより選択されたアプリケーションソフトウエアに対応し、且つ前記判定機能により一致すると判定された前記テンプレートに対応するファイル形式で出力する制御を行う制御機能、
    を実現させるためのプログラム。
  12. ユーザにより選択される前記アプリケーションソフトウエアは、パワーポイント(登録商標)であり、前記複数のテンプレートは、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートを含む請求項11に記載のプログラム。
JP2010268194A 2010-10-25 2010-12-01 画像処理装置、画像処理方法及びプログラム Active JP5569367B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010268194A JP5569367B2 (ja) 2010-12-01 2010-12-01 画像処理装置、画像処理方法及びプログラム
CN201110330201.4A CN102457643B (zh) 2010-10-25 2011-10-21 数据处理装置及数据处理方法
CN201410276519.2A CN104113656B (zh) 2010-10-25 2011-10-21 数据处理装置及数据处理方法
US13/279,631 US9049324B2 (en) 2010-10-25 2011-10-24 Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010268194A JP5569367B2 (ja) 2010-12-01 2010-12-01 画像処理装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2012118780A JP2012118780A (ja) 2012-06-21
JP5569367B2 true JP5569367B2 (ja) 2014-08-13

Family

ID=46501524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010268194A Active JP5569367B2 (ja) 2010-10-25 2010-12-01 画像処理装置、画像処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5569367B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5959392B2 (ja) * 2012-09-27 2016-08-02 京セラドキュメントソリューションズ株式会社 画像形成装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330397A (ja) * 1996-06-13 1997-12-22 Canon Inc 自動画像編集装置
JP2006134230A (ja) * 2004-11-09 2006-05-25 Canon Inc 画像編集装置
JP2009071781A (ja) * 2007-09-18 2009-04-02 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
JP5361471B2 (ja) * 2009-03-16 2013-12-04 キヤノン株式会社 情報処理装置、その制御方法、及びプログラム

Also Published As

Publication number Publication date
JP2012118780A (ja) 2012-06-21

Similar Documents

Publication Publication Date Title
CN102117269B (zh) 对文档进行数字化的装置及方法
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US10528679B2 (en) System and method for real time translation
US9049324B2 (en) Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2010262584A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
US20080270879A1 (en) Computer-readable medium, document processing apparatus and document processing system
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
US9864750B2 (en) Objectification with deep searchability
US9798724B2 (en) Document discovery strategy to find original electronic file from hardcopy version
JP7379987B2 (ja) 情報処理装置及びプログラム
JP7196600B2 (ja) 情報処理システム、サーバ装置、情報処理方法、及びプログラム
JP5569367B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6780380B2 (ja) 画像処理装置及びプログラム
JP6601143B2 (ja) 印刷装置
JP7396126B2 (ja) 情報処理装置、情報処理システム、変換方法およびプログラム
JP7302175B2 (ja) 情報処理装置、及び情報処理プログラム
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
US20230102476A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JP7476691B2 (ja) 画像処理システム、情報処理システム、画像処理方法、プログラム
JP7206894B2 (ja) 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
US20230297543A1 (en) Data management device, data management system, and recording medium

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130416

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140609

R150 Certificate of patent or registration of utility model

Ref document number: 5569367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150