JP2012118780A - Image processing apparatus, image processing method, and image processing program - Google Patents

Image processing apparatus, image processing method, and image processing program Download PDF

Info

Publication number
JP2012118780A
JP2012118780A JP2010268194A JP2010268194A JP2012118780A JP 2012118780 A JP2012118780 A JP 2012118780A JP 2010268194 A JP2010268194 A JP 2010268194A JP 2010268194 A JP2010268194 A JP 2010268194A JP 2012118780 A JP2012118780 A JP 2012118780A
Authority
JP
Japan
Prior art keywords
template
image data
data
image
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010268194A
Other languages
Japanese (ja)
Other versions
JP5569367B2 (en
Inventor
Hiroshi Nogawa
博司 野川
Toyoshige Nosai
豊茂 能西
Fumito Akiyama
文人 秋山
Masahiro Ozawa
昌裕 小澤
Takahisa Matsunaga
貴久 松永
Yasushi Aoyama
泰史 青山
Kunikazu Sato
邦和 佐藤
Yasutaka Shimohara
康貴 下原
Cheol Yeon Lee
鉄蓮 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2010268194A priority Critical patent/JP5569367B2/en
Priority to CN201110330201.4A priority patent/CN102457643B/en
Priority to CN201410276519.2A priority patent/CN104113656B/en
Priority to US13/279,631 priority patent/US9049324B2/en
Publication of JP2012118780A publication Critical patent/JP2012118780A/en
Application granted granted Critical
Publication of JP5569367B2 publication Critical patent/JP5569367B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To improve accuracy of discerning different attribute regions in image data and to improve convenience of a user.SOLUTION: The image processing apparatus comprises: an image reading unit 26 to obtain image data, a CPU 21 to compare the obtained image data by the image reading unit 26 with a template data region within a given template, and determine whether a file format of the image data corresponds with a file format of the template, by determining whether the image data extend outside of the template data region, and a CPU 21 to generate vector data from the image data, and perform control of outputting the generated vector data in the file format of the template which was determined to correspond.

Description

本発明は、画像処理装置、画像処理方法及びプログラムに関する。   The present invention relates to an image processing apparatus, an image processing method, and a program.

近年、環境問題が叫ばれる中、オフィスにおけるペーパーレス化が急速に進んでいる。例えば、バインダ等に蓄積された紙原稿をスキャナで読み取り、データベースとして画像形成装置に蓄積することで、ペーパーレス化を実現する技術が知られている。   In recent years, paperless offices are rapidly becoming paperless as environmental issues are screamed. For example, a technique for realizing paperless by reading a paper document stored in a binder or the like with a scanner and storing it in an image forming apparatus as a database is known.

しかしながら、上述の技術では、紙原稿を保存するファイルがイメージデータであるため、原稿の一部のオブジェクトを再利用する場合、図、表等を新たにアプリケーションで作成しなければならなかった。   However, in the above-described technique, since a file for storing a paper document is image data, when a part of an object of the document is reused, a figure, a table, and the like have to be newly created by an application.

このため、紙原稿から読み取られたイメージデータを、文字/線画部分(以下、文字部分)の属性領域と画像部分の属性領域とに識別し、該識別された属性領域ごとにベクトル化処理を実行することで、一般のアプリケーションで編集可能な電子ファイルを生成する技術が知られている(例えば、特許文献1参照)。
具体的に特許文献1は、イメージデータを白黒画像に二値化し、二値化した黒画素の塊を抽出し、抽出した黒画素の塊の大きさ及び形状に基づいて、文字部分と画像部分との属性領域に識別をする技術である。
Therefore, image data read from a paper document is identified as an attribute area of a character / line drawing part (hereinafter referred to as a character part) and an attribute area of an image part, and vectorization processing is executed for each identified attribute area. Thus, a technique for generating an electronic file that can be edited by a general application is known (for example, see Patent Document 1).
Specifically, Patent Document 1 binarizes image data into a black and white image, extracts a binarized black pixel block, and based on the size and shape of the extracted black pixel block, a character portion and an image portion This is a technique for identifying the attribute area.

特開2005−157905号公報JP 2005-157905 A

しかしながら、上述の特許文献1の技術では、イメージデータ(以下、画像データ)の属性領域を識別する精度が低いという問題があった。例えば、黒画素の塊の大きさ及び形状に基づいて、画像データの属性領域を文字部分と識別した場合であっても、文字部分が異なる属性領域を有する場合、上述の特許文献1の技術では異なる属性領域の識別ができなかった。
また、属性領域の識別ができない場合、アプリケーションで編集可能な電子ファイルに変換することができず、ユーザは、データを再利用する際、データを新たにアプリケーションで作成しなければならなかった。
However, the technique disclosed in Patent Document 1 has a problem in that the accuracy of identifying an attribute area of image data (hereinafter, image data) is low. For example, even when the attribute area of the image data is identified as a character part based on the size and shape of the black pixel block, the technique disclosed in Patent Document 1 described above has a different attribute area. Different attribute areas could not be identified.
Also, if the attribute area cannot be identified, it cannot be converted into an electronic file that can be edited by the application, and the user has to create new data in the application when reusing the data.

本発明の課題は、画像データを異なる属性領域に識別する精度を向上させ、且つ、ユーザの利便性を向上させることである。   An object of the present invention is to improve the accuracy of identifying image data into different attribute areas and improve user convenience.

上記課題を解決するため、請求項1に記載の発明の画像処理装置は、
画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、を備える。
In order to solve the above problem, an image processing apparatus according to claim 1 is provided.
An acquisition unit for acquiring image data;
By comparing the image data acquired by the acquisition unit with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the A determination unit that determines whether or not the file format of the template matches;
A control unit that performs control to generate vector data from the image data and output the generated vector data in a file format of a template determined to be coincident by the determination unit.

請求項2に記載の発明は、請求項1に記載の画像処理装置において、
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する。
The invention according to claim 2 is the image processing apparatus according to claim 1,
The template data area is
Including at least one of a first data area whose outer frame is surrounded by a frame line and a second data area whose outer frame of the data area of the image data is not surrounded by a frame line;
The determination unit
The data area of the image data corresponding to the first data area and the data area of the image data corresponding to the second data area are identified by the presence or absence of the frame line in the image data.

請求項3に記載の発明は、請求項1又は2に記載の画像処理装置において、
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する。
The invention according to claim 3 is the image processing apparatus according to claim 1 or 2,
The determination unit
Depending on whether or not the image data protrudes from the template data area, a score indicating a degree of coincidence between the file format of the image data and the file format of the template is calculated, and based on the calculated score, the image A match between the data file format and the template file format is determined.

請求項4に記載の発明は、請求項3に記載の画像処理装置において、
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う。
The invention according to claim 4 is the image processing apparatus according to claim 3,
The controller is
When the calculated score is equal to or less than a predetermined score, control is performed to output selection information for allowing the user to select a file format of the template to a predetermined output unit.

請求項5に記載の発明は、請求項1から4のいずれか一項に記載の画像処理装置において、
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する。
The invention according to claim 5 is the image processing apparatus according to any one of claims 1 to 4,
The controller is
The vector data is added to a file of a predetermined file format that can be handled by predetermined application software, and a file of a template file format determined to be matched by the determination unit is generated.

請求項6に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である。
The invention according to claim 6 is the image processing apparatus according to claim 5,
The predetermined application software is PowerPoint (registered trademark).

請求項7に記載の発明は、請求項5に記載の画像処理装置において、
前記所定のファイル形式は、OOXMLである。
The invention according to claim 7 is the image processing apparatus according to claim 5,
The predetermined file format is OOXML.

請求項8に記載の発明の画像処理方法は、
画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、を含む。
An image processing method according to an eighth aspect of the present invention includes:
Acquiring image data; and
By comparing the acquired image data with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the file of the template Determining whether the format matches,
Generating vector data from the image data, and outputting the generated vector data in a file format of a template determined to match.

請求項9に記載の発明のプログラムは、
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、を実現させる。
The program of the invention according to claim 9 is:
On the computer,
An acquisition function that causes an acquisition unit to acquire image data to acquire image data;
By comparing the acquired image data with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the file of the template Judgment function to determine whether the format matches,
A control function for generating vector data from the image data and performing control to output the generated vector data in the file format of the template determined to match is realized.

本発明によれば、画像データを異なる属性に識別する精度を向上させ、且つ、ユーザの利便性を向上させることができる。   ADVANTAGE OF THE INVENTION According to this invention, the precision which identifies image data to a different attribute can be improved, and a user's convenience can be improved.

本発明に係る画像処理装置を有する画像形成装置を含むネットワーク構成図である。1 is a network configuration diagram including an image forming apparatus having an image processing apparatus according to the present invention. コンピュータの主要構成を示すブロック図である。It is a block diagram which shows the main structures of a computer. 画像形成装置の主要構成を示すブロック図である。1 is a block diagram illustrating a main configuration of an image forming apparatus. (A)は、スライド形式の紙原稿を示す図である。(B)は、ノート形式の紙原稿を示す図である。(C)は、配布資料形式の紙原稿を示す図である。(A) is a diagram showing a paper document in a slide format. (B) is a diagram showing a paper document in a notebook format. (C) is a diagram showing a paper document in a distribution material format. ノート形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。FIG. 6 is a diagram illustrating a file output when a notebook-type paper document is read by an image reading unit. 配布資料形式の紙原稿が画像読取部により読み取られた場合に出力されるファイルを示す図である。FIG. 6 is a diagram illustrating a file output when a paper document in a distribution material format is read by an image reading unit. ファイル出力処理の流れを示すフローチャートである。It is a flowchart which shows the flow of a file output process. ノート形式の紙原稿を示す図である。It is a figure which shows the paper document of a note format. (A)は、スライド形式のテンプレートを示す図である。(B)は、ノート形式のテンプレートを示す図である。(C)は、配布資料形式のテンプレートを示す図である。(A) is a figure which shows the template of a slide format. (B) is a diagram showing a notebook template. (C) is a diagram showing a template in a distribution material format. 「サンプル.pptx」ファイルの複数のパーツファイル群の一例を示す図である。It is a figure which shows an example of the some part file group of a "sample.pptx" file. 「Content_Types」.xmlを示す図である。“Content_Types”. It is a figure which shows xml. 「ppt¥notesSlides¥notesSlide1.xml」を示す図である。It is a figure which shows "ppt \ notesSlides \ notesSlide1.xml". 「ppt¥notesSlides¥notesSlide1.xml」を示す図である。It is a figure which shows "ppt \ notesSlides \ notesSlide1.xml". 「ppt¥Slides¥Slide1.xml」を示す図である。It is a figure which shows "ppt \ Slides \ Slide1.xml". 「ppt¥Slides¥Slide1.xml」を示す図である。It is a figure which shows "ppt \ Slides \ Slide1.xml". 「ppt¥Slides¥Slide1.xml」を示す図である。It is a figure which shows "ppt \ Slides \ Slide1.xml". 「ppt¥Slides¥Slide1.xml」を示す図である。It is a figure which shows "ppt \ Slides \ Slide1.xml". 「ppt¥Slides¥_rels¥Slide1.xml.rels」を示す図である。It is a figure which shows "ppt \ Slides \ _rels \ Slide1.xml.rels". mediaフォルダのファイルパス「ppt¥ppt¥media¥image1.gif」を示す図である。It is a figure which shows file path "ppt \ ppt \ media \ image1.gif" of a media folder. 「サンプル.pptx」が表示された状態を示す図である。It is a figure which shows the state by which "sample.pptx" was displayed.

以下、図を参照して本発明の実施の形態の例を詳細に説明する。
図1は、本発明による画像処理装置を有する画像形成装置1を含むネットワーク構成図である。
Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a network configuration diagram including an image forming apparatus 1 having an image processing apparatus according to the present invention.

画像形成装置1、1、1は、回線3を介してコンピュータ2、2と通信可能に接続されている。
回線3は、画像形成装置1、1、1及びコンピュータ2、2によるネットワークを構成する。回線3は、コンピュータ2、2及び画像形成装置1、1、1を通信可能に接続するものであればその形態を問わない。例えば、回線3は、イーサネット(登録商標)、同軸ケーブル、光ファイバー等の有線接続回線や、無線通信を実現するための各種規格等、そのいずれか又は複数の組み合わせによってよい。また、回線3は、LAN(Local Area Network)、インターネット、その他のネットワーク規模を問わない。
The image forming apparatuses 1, 1, 1 are communicably connected to the computers 2, 2 via a line 3.
The line 3 constitutes a network of image forming apparatuses 1, 1, 1 and computers 2, 2. The line 3 may be in any form as long as it connects the computers 2 and 2 and the image forming apparatuses 1, 1, and 1 so as to communicate with each other. For example, the line 3 may be a wired connection line such as Ethernet (registered trademark), a coaxial cable, and an optical fiber, or various standards for realizing wireless communication, or any combination thereof. The line 3 may be a LAN (Local Area Network), the Internet, or any other network scale.

図2は、コンピュータ2の主要構成を示すブロック図である。
コンピュータ2、2はそれぞれ、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、記憶部14、入力インタフェース(I/F)15、出力I/F16及び通信装置17を備え、これらの各構成はバス20により接続される。
FIG. 2 is a block diagram showing the main configuration of the computer 2.
Each of the computers 2 and 2 includes a CPU (Central Processing Unit) 11, a RAM (Random Access Memory) 12, a ROM (Read Only Memory) 13, a storage unit 14, an input interface (I / F) 15, an output I / F 16, and a communication. A device 17 is provided, and each of these components is connected by a bus 20.

CPU11は、ROM13内に記憶されたプログラムと協働し、RAM12に展開されたプログラムやデータ等に従ってコンピュータ2の動作制御を行う。
RAM12は、CPU11の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を格納する。
ROM13は、CPU11によって読み出されるプログラムやデータ等を記憶する。
The CPU 11 cooperates with the program stored in the ROM 13 and controls the operation of the computer 2 in accordance with the program, data, etc. expanded in the RAM 12.
The RAM 12 stores data expanded by the processing of the CPU 11, data temporarily generated by the processing, and the like.
The ROM 13 stores programs and data read by the CPU 11.

記憶部14は、CPU11によって読み出されるプログラムやデータ等を記憶する。記憶部14は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。   The storage unit 14 stores programs and data read by the CPU 11. The storage unit 14 is a storage unit that can rewrite a program, data, and the like, and includes, for example, a flash memory, a hard disk drive, another rewritable storage device, or a combination of these storage devices.

入力I/F15は、外部入力装置18による入力を受け付けるインタフェースである。外部入力装置18は、例えばキーボードやマウス等であり、ユーザの手動操作により入力指示が行われる。   The input I / F 15 is an interface that accepts input from the external input device 18. The external input device 18 is, for example, a keyboard or a mouse, and an input instruction is performed by a manual operation of the user.

出力I/F16は、外部出力装置19に対する出力を行うインタフェースである。外部出力装置19は、例えばCRTや液晶ディスプレイ等の表示装置等であり、CPU11の処理結果に基づいた出力画面を表示する。   The output I / F 16 is an interface that outputs to the external output device 19. The external output device 19 is a display device such as a CRT or a liquid crystal display, for example, and displays an output screen based on the processing result of the CPU 11.

通信装置17は、コンピュータ2を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置17は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。   The communication device 17 connects the computer 2 to an external communication line (for example, line 3), and enables communication with an external device. The communication device 17 is, for example, a NIC (Network Interface Card) or the like, and a device that enables connection according to the type of communication line can be used.

図3は、画像形成装置1の主要構成を示すブロック図である。図1に示す画像形成装置1、1、1は全て同じ構成によるので、以下一つの画像形成装置1について説明する。
画像形成装置1は、判定部、制御部としてのCPU21、RAM22、ROM23、記憶部24、入力I/F25、取得部としての画像読取部26、画像印刷部27、通信装置28を備え、これらの各構成はバス30により接続される。
FIG. 3 is a block diagram illustrating a main configuration of the image forming apparatus 1. Since the image forming apparatuses 1, 1, 1 shown in FIG. 1 all have the same configuration, only one image forming apparatus 1 will be described below.
The image forming apparatus 1 includes a CPU 21 as a determination unit, a control unit, a RAM 22, a ROM 23, a storage unit 24, an input I / F 25, an image reading unit 26 as an acquisition unit, an image printing unit 27, and a communication device 28. Each component is connected by a bus 30.

CPU21は、ROM23内に記憶されたプログラムと協働し、RAM22に展開されたプログラムやデータ等に従って画像形成装置1の動作制御を行う。
RAM22は、CPU21の処理によって展開されたデータや、当該処理によって一時的に生じたデータ等を記憶する。
ROM23は、CPU21によって読み出されるプログラムやデータ等を記憶する。
The CPU 21 cooperates with the program stored in the ROM 23 and controls the operation of the image forming apparatus 1 according to the program and data developed in the RAM 22.
The RAM 22 stores data expanded by the processing of the CPU 21, data temporarily generated by the processing, and the like.
The ROM 23 stores programs and data read by the CPU 21.

記憶部24は、CPU21によって読み出されるプログラムやデータ等を記憶する。記憶部24は、プログラムやデータ等を書き換え可能な記憶部であって、例えばフラッシュメモリやハードディスクドライブ、その他の書き換え可能な記憶装置又はそれらの記憶装置の組合せ等によって構成される。   The storage unit 24 stores programs and data read by the CPU 21. The storage unit 24 is a storage unit that can rewrite programs, data, and the like, and includes, for example, a flash memory, a hard disk drive, another rewritable storage device, or a combination of these storage devices.

入力I/F25は、外部入力装置29等の入力装置による入力を受け付けるインタフェースである。外部入力装置29は、例えばタッチパネルディスプレイを有する入力パネル等であり、ユーザの手動操作により入力指示が行われる。   The input I / F 25 is an interface that receives input from an input device such as the external input device 29. The external input device 29 is, for example, an input panel having a touch panel display, and an input instruction is performed by a user's manual operation.

画像読取部26は、自動原稿搬送部(ADF)、プラテンガラス、CCD等の光学系を備えて構成され、ADF又はプラテンガラスに載置された原稿の画像を光学系により読み取る機能を実現する。画像読取部26により読み取られた画像の画像データ(アナログ画像信号)は、A/D変換され各種画像処理が施された後、デジタルの画像データ(ファイル)として記憶部24に記憶されるとともに、画像印刷部27に出力される。   The image reading unit 26 includes an optical system such as an automatic document feeder (ADF), a platen glass, and a CCD, and realizes a function of reading an image of a document placed on the ADF or the platen glass by the optical system. The image data (analog image signal) of the image read by the image reading unit 26 is A / D converted and subjected to various image processing, and then stored in the storage unit 24 as digital image data (file). The image is output to the image printing unit 27.

画像印刷部27は、入力された画像データに基づいて画像形成(印刷)を行う。画像印刷部27に採用可能な印刷方式としては、例えば電子写真方式やインクジェット方式、熱転写方式、オフセット等が挙げられる。本実施形態では、画像印刷部27は、電子写真方式による画像形成を行うための構成を有する。   The image printing unit 27 performs image formation (printing) based on the input image data. Examples of printing methods that can be employed in the image printing unit 27 include an electrophotographic method, an inkjet method, a thermal transfer method, and an offset. In the present embodiment, the image printing unit 27 has a configuration for performing image formation by an electrophotographic method.

通信装置28は、画像形成装置1を外部の通信回線(例えば回線3)と接続し、外部の機器との通信を可能とする。通信装置28は、例えばNIC(Network Interface Card)等であり、通信回線の種類に応じた接続を可能とする装置を用いることができる。   The communication device 28 connects the image forming apparatus 1 to an external communication line (for example, the line 3), and enables communication with an external device. The communication device 28 is, for example, a NIC (Network Interface Card) or the like, and a device that enables connection according to the type of communication line can be used.

次に、図4を参照して、画像読取部26で読み取る紙原稿の形式について説明する。以下、アプリケーションソフトウエア(以下、アプリケーション)としてパワーポイント(登録商標)を用いて印刷した紙原稿の形式について説明する。図4に示すように、紙原稿の形式としては、スライド形式の紙原稿(図4(A)参照)、ノート形式の紙原稿(図4(B)参照)、配布資料形式の紙原稿(図4(C)参照)がある。   Next, the format of a paper document read by the image reading unit 26 will be described with reference to FIG. Hereinafter, the format of a paper document printed using PowerPoint (registered trademark) as application software (hereinafter referred to as an application) will be described. As shown in FIG. 4, the paper manuscript format includes a slide-type paper manuscript (see FIG. 4A), a notebook-type paper manuscript (see FIG. 4B), and a distribution material-format paper manuscript (see FIG. 4). 4 (C)).

スライド形式の紙原稿は、1ページのスライド画像が印刷された原稿である。スライド画像は、パワーポイントのスライド上に形成される画像であって、文字、線、表、図形、写真等の画像を含む。ノート形式の紙原稿は、1ページのスライド画像及びノート画像が印刷された原稿である。ノート画像は、スライドに関するメモ書き等の文字で構成される画像である。配布資料形式の紙原稿は、複数ページのスライド画像が印刷された原稿である。   A slide-type paper document is a document on which a slide image of one page is printed. The slide image is an image formed on a PowerPoint slide, and includes images such as characters, lines, tables, figures, and photographs. A notebook-type paper document is a document on which a slide image and a note image of one page are printed. The note image is an image composed of characters such as a memo for a slide. The paper document in the distribution material format is a document on which a slide image of a plurality of pages is printed.

次に、紙原稿をスキャンしてからパワーポイントで編集可能な電子ファイルを出力するまでの流れについて説明する。
例えば、図5に示すように、ノート形式の紙原稿が画像読取部26によりスキャンされた(読み取られた)場合、1ページ分のスライド画像データ及びノート画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータがノート形式のファイルとして出力される。すなわちノート形式のファイルとして記憶部24に記憶される。そして、ユーザにより、ノート形式のファイルを編集する指示が実行されると、ノート形式のファイルが記憶部24から読み出され、読み出されたノート形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示される(図5参照)。なお、ノート形式のファイルは、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。これにより、ユーザは、ノート形式のファイルを編集することが可能となり、利便性が向上する。
Next, the flow from scanning a paper document to outputting an electronic file that can be edited with PowerPoint will be described.
For example, as shown in FIG. 5, when a notebook-type paper document is scanned (read) by the image reading unit 26, image data (file) composed of slide image data and note image data for one page. Is acquired. Then, vector data is generated based on the acquired image data. The generated vector data is output as a note format file. That is, it is stored in the storage unit 24 as a note format file. When the user issues an instruction to edit the note format file, the note format file is read from the storage unit 24, and the read note format file is displayed on the touch panel display of the external input device 29. Is displayed (see FIG. 5). The notebook format file may be transmitted to the PC 2 via the communication device 28 and displayed on the external output device 19. As a result, the user can edit the notebook format file, which improves convenience.

また、図6に示すように、配布資料形式の紙原稿が画像読取部26により読み取られた場合、複数のスライド画像データで構成される画像データ(ファイル)が取得される。そして、取得された画像データに基づいて、ベクトルデータが生成される。そして、生成されたベクトルデータが配布資料形式のファイルとして記憶部24に記憶される。そして、配布資料形式のファイルを編集する指示が実行されると、記憶部24から配布資料形式のファイルが読み出され、読み出された配布資料形式のファイルが外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図6参照)。このため、ユーザは、配布資料形式のファイルを編集することが可能となり、利便性が向上する   As shown in FIG. 6, when a paper document in a distribution material format is read by the image reading unit 26, image data (file) composed of a plurality of slide image data is acquired. Then, vector data is generated based on the acquired image data. The generated vector data is stored in the storage unit 24 as a distribution material format file. When an instruction to edit the distribution material format file is executed, the distribution material format file is read from the storage unit 24, and the read distribution material format file is read on the touch panel display of the external input device 29. Displayed or displayed on the external output device 19 (see FIG. 6). For this reason, the user can edit the distribution material format file, which improves convenience.

なお、図示していないが、スライド形式の紙原稿が画像読取部26により読み取られた場合は、1ページのスライド画像データで構成される画像データ(ファイル)が取得され、図5及び図6と同様の手順でスライド形式のファイルが出力される。このため、ユーザは、スライド形式のファイルを編集することが可能となり、利便性が向上する。   Although not shown, when a slide-type paper document is read by the image reading unit 26, image data (file) composed of one page of slide image data is acquired, and FIGS. A slide format file is output in the same procedure. Therefore, the user can edit the slide format file, and convenience is improved.

次に、図7を参照して、ファイル出力処理について説明する。ファイル出力処理は、紙原稿を画像読取部26により読み取って画像データを取得し、取得した画像データのファイル形式とテンプレートのファイル形式とが一致するかを判定し、画像データからベクトルデータを生成し、生成したベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。   Next, the file output process will be described with reference to FIG. In the file output process, a paper original is read by the image reading unit 26 to acquire image data, it is determined whether the file format of the acquired image data matches the file format of the template, and vector data is generated from the image data. This is a process of outputting the generated vector data in the file format of a template determined to match.

予め、図8に示すノート形式の紙原稿が自動原稿搬送部(ADF)又はプラテンガラスに載置されているものとする。以下、図8に示すように、ノート形式の紙原稿において、スライド画像には、テキスト画像、イメージ画像及びグラフィック画像が含まれているものとする。また、ノート画像には、テキスト画像が含まれているものとする(ノート画像におけるテキスト画像は、「テキスト画像(ノート)」と記す)。   Assume that the paper document of the note format shown in FIG. 8 is previously placed on the automatic document feeder (ADF) or the platen glass. Hereinafter, as shown in FIG. 8, in a notebook-type paper document, the slide image includes a text image, an image image, and a graphic image. In addition, it is assumed that the note image includes a text image (the text image in the note image is referred to as “text image (note)”).

また、使用するアプリケーションを選択するための画面が予め外部入力装置29のタッチパネルディスプレイ上に表示されており、ユーザにより外部入力装置29を介して、使用するアプリケーションとして「パワーポイント」が選択入力されているものとする。   In addition, a screen for selecting an application to be used is displayed in advance on the touch panel display of the external input device 29, and “power point” is selected and input as an application to be used by the user via the external input device 29. Shall.

例えば、外部入力装置29を介して紙原稿の読み取りを実行開始するためのスキャンボタンが押下されたことをトリガとして、画像形成装置1においてファイル出力処理(図7参照)が実行開始される。   For example, a file output process (see FIG. 7) is started in the image forming apparatus 1 when a scan button for starting to read a paper document via the external input device 29 is pressed.

先ず、画像データの取得が行われる(ステップS1)。すなわち、紙原稿が画像読取部26により読み取られて画像データが取得される。そして、読み取られた画像の画像データ(アナログ画像信号)がA/D変換される。そして、A/D変換された画像データに各種画像処理が施され、各種画像処理が施されたデジタルの画像データが記憶部24に記憶される。   First, image data is acquired (step S1). That is, a paper document is read by the image reading unit 26 and image data is acquired. The image data (analog image signal) of the read image is A / D converted. Various image processes are performed on the A / D converted image data, and digital image data subjected to the various image processes is stored in the storage unit 24.

ステップS1の実行後、記憶部24に記憶された画像データが読み出され、該読み出された画像データとテンプレートとのマッチング判定が実行される(ステップS2)。マッチング判定は、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する処理である。ここで、図9を参照して、テンプレートについて説明する。テンプレートは、画像データのファイル形式を識別するための定型的なファイルである。マッチング判定によりマッチ(一致)すると判定されたテンプレートのファイル形式は、画像データのファイル形式として決定される。本処理では、テンプレートのファイル形式として、スライド形式のテンプレート、ノート形式のテンプレート及び配布資料形式のテンプレートの3種類が予め記憶部24に記憶されており、マッチング判定の際に記憶部24から読み出されるものとする。   After execution of step S1, the image data stored in the storage unit 24 is read out, and the matching determination between the read image data and the template is executed (step S2). The matching determination is a process for determining whether the file format of the image data matches the file format of the template. Here, the template will be described with reference to FIG. The template is a standard file for identifying the file format of the image data. The file format of the template determined to be matched (matched) by the matching determination is determined as the file format of the image data. In this process, three types of template file formats, a slide format template, a note format template, and a distribution material format template, are stored in advance in the storage unit 24 and read from the storage unit 24 at the time of matching determination. Shall.

スライド形式のテンプレート(図9(A)参照)は、1ページ分のスライド画像の画像データで構成されるテンプレートである。画像データがスライド形式のテンプレートと一致する場合、画像データのファイル形式は、スライド形式のファイルと判定される。
ノート形式のテンプレート(図9(B)参照)は、1ページ分のスライド画像の画像データ及びノート画像の画像データで構成されるテンプレートである。画像データがノート形式のテンプレートと一致する場合、画像データのファイル形式は、ノート形式のファイルと判定される。
配布資料形式のテンプレート(図9(C)参照)は、複数ページ分のスライド画像の画像データで構成されるテンプレートである。画像データが複数ページのテンプレートと一致する場合、画像データのファイル形式は、配布資料形式のファイルと判定される。
なお、テンプレートにおいて、1ページ分のスライド画像の画像データで構成される領域を本文領域、ノート画像の画像データで構成される領域をノート領域と定義し、本文領域及びノート領域を総称してテンプレートデータ領域と定義する。
The slide format template (see FIG. 9A) is a template composed of image data of a slide image for one page. If the image data matches the slide format template, the file format of the image data is determined to be a slide format file.
The template in the note format (see FIG. 9B) is a template composed of image data of a slide image for one page and image data of a note image. If the image data matches the notebook template, the file format of the image data is determined to be a notebook file.
The distribution material format template (see FIG. 9C) is a template composed of image data of a plurality of pages of slide images. When the image data matches a template of a plurality of pages, the file format of the image data is determined as a distribution material format file.
In the template, an area composed of image data of a slide image for one page is defined as a text area, an area composed of image data of a note image is defined as a note area, and the text area and the note area are collectively referred to as a template. It is defined as a data area.

以下、ノート形式の紙原稿(図8参照)が読み取られ、1ページ分のスライド画像データ及びノート画像データで構成される画像データが取得された場合におけるマッチング判定について説明する。マッチング判定は、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かに応じて、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数をテンプレート毎に算出し、該算出された点数に基づいて判定を行う処理である。   Hereinafter, a description will be given of matching determination when a note-type paper document (see FIG. 8) is read and image data composed of slide image data and note image data for one page is acquired. In the matching determination, the degree of coincidence between the file format of the image data and the file format of the template is determined based on whether the acquired image data is compared with the template data area in the template and whether the image data protrudes from the template data area. Is calculated for each template, and a determination is made based on the calculated score.

先ず、取得された画像データと、テンプレートにおけるテンプレートデータ領域とが比較され、画像データがテンプレートデータ領域からはみ出すか否かが判定される。ここで、取得された画像データは、1ページ分のスライド画像データ及びノート画像データで構成される。この場合、取得された画像データにおける1ページ分のスライド画像データ及びノート画像データが各テンプレートのテンプレートデータ領域からはみ出すか否かが判定される。   First, the acquired image data is compared with the template data area in the template, and it is determined whether or not the image data protrudes from the template data area. Here, the acquired image data is composed of slide image data and note image data for one page. In this case, it is determined whether slide image data and note image data for one page in the acquired image data protrude from the template data area of each template.

例えば、画像データと、ノート形式のテンプレート(図9(B)参照)におけるテンプレート領域(本文領域及びノート領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域及びノート領域からはみ出さないと判定された場合、画像データは、テンプレートにおける本文領域及びノート領域のそれぞれからはみ出さないと判定される。この場合、画像データが本文領域からはみ出さないことにより点数「10点」が加算され、且つ、画像データがノート領域からはみ出さないことにより点数「10点」が加算される。すなわち、ノート形式のテンプレートの点数として「20点」が算出される。   For example, the image data is compared with a template area (text area and note area) in a notebook template (see FIG. 9B), and one page of slide image data and note image data in the image data is included in the template. If it is determined that the image data does not protrude from the text area and the note area, it is determined that the image data does not protrude from each of the text area and the note area in the template. In this case, the score “10 points” is added when the image data does not protrude from the body area, and the score “10 points” is added when the image data does not protrude from the note area. That is, “20 points” is calculated as the score of the note format template.

また、画像データと、スライド形式のテンプレート(図9(A)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、スライド形式のテンプレートの点数として「0点」が算出される。   Further, the image data is compared with the template area (text area) in the slide format template (see FIG. 9A), and one page of slide image data and note image data in the image data is compared with the text area in the template. If it is determined to protrude, “0 points” is calculated as the score of the slide template.

また、画像データと、配布資料形式のテンプレート(図9(C)参照)におけるテンプレート領域(本文領域)とが比較され、画像データにおける1ページ分のスライド画像データ及びノート画像データがテンプレートにおける本文領域からはみ出すと判定された場合、配布資料形式のテンプレートの点数として「0点」が算出される。
上記の点数が算出された場合、点数の最も高いノート形式のテンプレートが画像データのファイル形式と一致すると判定される。
Also, the image data is compared with the template area (text area) in the distribution material format template (see FIG. 9C), and the slide image data and note image data for one page in the image data are the text area in the template. If it is determined that the image is out of the range, “0 points” is calculated as the score of the distribution material template.
When the above score is calculated, it is determined that the note format template having the highest score matches the file format of the image data.

また、上述のマッチング判定において、算出された点数が所定の点数以下の場合は、テンプレートのファイル形式をユーザに選択させるようにしてもよい。例えば、算出された点数が所定の点数以下の場合、テンプレートのファイル形式をユーザに選択させるための選択情報としてテンプレートのファイル形式を選択できる画面が外部入力装置29のタッチパネルディスプレイ上に表示される。また、選択情報は、通信装置28を介してPC2に送信され、外部出力装置19に表示されることとしてもよい。   Further, in the above-described matching determination, when the calculated score is equal to or less than a predetermined score, the user may be allowed to select a template file format. For example, when the calculated score is equal to or less than a predetermined score, a screen on which the template file format can be selected is displayed on the touch panel display of the external input device 29 as selection information for allowing the user to select the template file format. The selection information may be transmitted to the PC 2 via the communication device 28 and displayed on the external output device 19.

図7において、ステップS2の実行後、マッチング判定結果の判別が実行される(ステップS3)。ステップS3において、マッチング判定結果がスライド形式のテンプレートにマッチすると判別された場合(ステップS3;スライド)、画像データの本文領域にOCR処理が実行される(ステップS4)。ステップS3において、マッチング判定処理がノート形式のテンプレートにマッチすると判別された場合(ステップS3;ノート)、画像データの本文領域及びノート領域にOCR処理が実行される(ステップS5)。ステップS3において、マッチング判定処理が配布資料形式のテンプレートにマッチすると判別された場合(ステップS3;配布資料)、画像データの各本文領域にOCR処理が実行される(ステップS6)。ここで、画像データの本文領域とは、テンプレートの本文領域に相当する画像データのデータ領域である。また、画像データのノート領域とは、テンプレートのノート領域に相当する画像データのデータ領域である。画像データの本文領域と画像データのノート領域との識別は、画像データ内における枠線の有無により識別される。
また、ステップS4〜S6においてOCR処理が実行されることにより、画像データからベクトルデータが生成される。
In FIG. 7, after the execution of step S2, the determination of the matching determination result is executed (step S3). If it is determined in step S3 that the matching determination result matches the template in the slide format (step S3; slide), the OCR process is executed on the body area of the image data (step S4). In step S3, when it is determined that the matching determination process matches the template in the note format (step S3; note), the OCR process is executed on the body area and the note area of the image data (step S5). If it is determined in step S3 that the matching determination process matches the template in the distribution material format (step S3; distribution material), the OCR process is performed on each body area of the image data (step S6). Here, the body area of the image data is a data area of the image data corresponding to the body area of the template. Further, the note area of image data is a data area of image data corresponding to the note area of the template. The body area of the image data and the note area of the image data are identified by the presence or absence of a frame line in the image data.
Moreover, vector data is produced | generated from image data by performing OCR process in step S4-S6.

ステップS4〜S6の実行後、ファイル出力処理が実行される(ステップS7)。ファイル出力処理は、ベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力する処理である。具体的には、ファイル出力処理は、ベクトルデータを、ワード(登録商標)、エクセル(登録商標)、パワーポイント等で扱えるファイル形式であるOOXML(Office Open XML)のファイルに追記し、一致すると判定されたテンプレートのファイル形式のファイルを生成し、該生成したファイルを記憶部24に記憶する処理である。   After execution of steps S4 to S6, a file output process is executed (step S7). The file output process is a process for outputting vector data in the file format of a template determined to match. Specifically, in the file output process, vector data is added to an OOXML (Office Open XML) file, which is a file format that can be handled by Word (registered trademark), Excel (registered trademark), PowerPoint, etc., and it is determined that they match. The template file format file is generated, and the generated file is stored in the storage unit 24.

OOXMLは、マイクロソフト・オフィス(登録商標)2007において、新たに採用されたファイルの保存形式(ファイル形式)である。具体的には、OOXMLは、ワード、エクセル、パワーポイント等のファイル形式として採用されている。このため、OOXMLのファイル形式のファイルあれば、ワード、エクセル、パワーポイント等のアプリケーションで扱うこと、すなわち編集することが可能となる。   OOXML is a file storage format (file format) newly adopted in Microsoft Office (registered trademark) 2007. Specifically, OOXML is adopted as a file format such as word, excel, and power point. For this reason, any file in the OOXML file format can be handled, that is, edited by an application such as Word, Excel, or PowerPoint.

また、OOXMLの拡張子はそれぞれ、「docx」、「xlsx」、「pptx」で定義される。例えば、ユーザがファイル「サンプル.pptx」の拡張子「pptx」を「zip」に変更した後、「zip」に変更したファイルを解凍ソフトにより解凍すると、ユーザは、OOXMLのファイル形式のファイル「サンプル.pptx」を参照することが可能となる。ファイル「サンプル.pptx」は、図10に示すように、複数のパーツファイル群で構成される。   The extensions of OOXML are defined by “docx”, “xlsx”, and “pptx”, respectively. For example, after the user changes the extension “pptx” of the file “sample.pptx” to “zip” and then decompresses the file changed to “zip” with the decompression software, the user uses the file “sample of OOXML file format” .Pptx "can be referred to. The file “sample.pptx” is composed of a plurality of part file groups as shown in FIG.

図11〜図15に、ファイル「サンプル.pptx」の複数のパーツファイル群のうち、一致すると判定されたテンプレートのファイル形式のファイルを生成するために、データの追記が必要なパーツファイルを示すとともに、追記が必要なパーツファイル内におけるデータの追記箇所を示す。以下、一致すると判定されたテンプレートのファイル形式がノート形式であり、該ノート形式のファイルを生成するためにデータの追記が必要なパーツファイル及び追記箇所の一例を示す。   FIGS. 11 to 15 show part files that require additional data to generate a template file format determined to match among a plurality of part file groups of the file “sample.pptx”. This indicates the location where data is to be added in the part file that requires additional writing. In the following, the template file format determined to match is a note format, and an example of a part file and an additional location where data must be additionally written to generate the note format file will be shown.

例えば、図8に示すイメージ画像のデータの種類が「image1.gif」であり、「image1.gif」のコンテンツタイプを示すデータを追記する場合、複数のパーツファイル群のうち、ファイル定義情報で構成されるパーツファイル「Content_Types」.xml(図11参照)に追記が必要となる。具体的には、コンテンツタイプ(gif)を示すデータ(図11に示す追記部分1)がパーツファイル「Content_Types」.xml内に追記される。   For example, when the data type of the image shown in FIG. 8 is “image1.gif” and data indicating the content type of “image1.gif” is additionally written, it is composed of file definition information among a plurality of part file groups. Parts file “Content_Types”. Additional writing is required in xml (see FIG. 11). Specifically, data indicating the content type (gif) (additional part 1 shown in FIG. 11) is a part file “Content_Types”. Added in xml.

また、画像データのノート領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、ノート領域のデータで構成されるパーツファイル「ppt¥notesSlides¥notesSlide1.xml」(図12A及び図12B参照)に追記が必要となる。具体的には、画像データのノート領域をOCR処理して得られたベクトルデータ(図12Bのテキスト部分のデータ)がパーツファイル「ppt¥notesSlides¥notesSlide1.xml」に追記される。なお、図12Bのテキスト部分のデータは、図8におけるテキスト画像(ノート)から得られたベクトルデータに相当する。   Further, when adding vector data obtained by performing OCR processing on a note area of image data, a part file “ppt \ notesSlides \ notesSlide1.xml” composed of note area data among a plurality of part file groups ( (Refer to FIG. 12A and FIG. 12B). Specifically, vector data (text portion data in FIG. 12B) obtained by OCR processing of the note area of the image data is added to the part file “ppt \ notesSlides \ notesSlide1.xml”. The text portion data in FIG. 12B corresponds to the vector data obtained from the text image (note) in FIG.

また、画像データの本文領域をOCR処理して得られたベクトルデータを追記する場合、複数のパーツファイル群のうち、本文領域のデータで構成されるパーツファイル「ppt¥Slides¥Slide1.xml」(図13A〜図13D)に追記が必要となる。具体的には、画像データの本文領域をOCR処理して得られたベクトルデータ(図13Aに示すテキスト部分のデータ、図13Bに示すイメージ部分のデータ及び図13Cに示すグラフィック部分のデータ)がパーツファイル「ppt¥Slides¥Slide1.xml」に追記される。なお、図13Aのテキスト部分のデータは、図8におけるテキスト画像から得られたベクトルデータに相当し、図13Bのイメージ部分のデータは、図8におけるイメージ画像から得られたベクトルデータに相当し、図13Cのグラフィック部分のデータは、図8におけるグラフィック画像から得られたベクトルデータに相当する。   In addition, when adding vector data obtained by performing OCR processing on the body area of image data, a part file “ppt \ Slides \ Slide1.xml” composed of body area data among a plurality of part file groups ( 13A to 13D) need to be additionally written. Specifically, vector data (text portion data shown in FIG. 13A, image portion data shown in FIG. 13B, and graphic portion data shown in FIG. 13C) obtained by performing OCR processing on the body area of the image data is a part. It is added to the file “ppt \ Slides \ Slide1.xml”. The text portion data in FIG. 13A corresponds to the vector data obtained from the text image in FIG. 8, and the image portion data in FIG. 13B corresponds to the vector data obtained from the image image in FIG. 13C corresponds to vector data obtained from the graphic image in FIG.

また、本文領域の構成に関するリレーションシップ(関連性)を示すデータを追記する場合、複数のファイル群のうち、関連性を示すデータで構成されるパーツファイル「ppt¥Slides¥_rels¥Slide1.xml.rels」(図14参照)に追記が必要となる。具体的には、イメージ画像のパーツファイル「image1.gif」のリレーションシップを示すデータ(リレーションIDとファイルパス:図14に示す追記部分2)が追記される。
なお、追記部分2は、図13Bのイメージ部分においてリレーションID=rId3と定義されたイメージデータが「image1.gif」としてmediaフォルダに格納されていることを示すデータである。また、mediaフォルダは、イメージ画像のファイルで構成されるフォルダである。例えば、mediaフォルダに「image1.gif」が格納されると、ファイルパスは、「ppt¥ppt¥media¥image1.gif」となる(図15参照)。
In addition, when data indicating a relationship (relevance) related to the structure of the body area is added, a part file “ppt \ Slides \ _rels \ Slide1.xml. “rels” (see FIG. 14) needs to be added. Specifically, data indicating the relationship of the part file “image1.gif” of the image image (relation ID and file path: additional portion 2 shown in FIG. 14) is additionally written.
Note that the additional recording part 2 is data indicating that the image data defined as relation ID = rId3 in the image part of FIG. 13B is stored in the media folder as “image1.gif”. The media folder is a folder composed of image image files. For example, if “image1.gif” is stored in the media folder, the file path is “ppt \ ppt \ media \ image1.gif” (see FIG. 15).

上述のように、画像データの本文領域及び画像データのノート領域におけるベクトルデータを、ファイル「サンプル.pptx」に追記、すなわちファイル「サンプル.pptx」における複数のパーツファイル群のうち所定のパーツファイルに追記することで、ノート形式のファイル「サンプル.pptx」が生成される。   As described above, the vector data in the body area of the image data and the note area of the image data is added to the file “sample.pptx”, that is, in a predetermined part file among a plurality of part file groups in the file “sample.pptx”. By additionally writing, a note-format file “sample.pptx” is generated.

そして、生成されたノート形式のファイル「サンプル.pptx」が記憶部24に記憶される。そして、ユーザにより、ノート形式のファイル「サンプル.pptx」を編集する指示が実行されると、ノート形式のファイル「サンプル.pptx」が記憶部24から読み出され、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示される(図16参照)。このため、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。   The generated note format file “sample.pptx” is stored in the storage unit 24. When an instruction to edit the note format file “sample.pptx” is executed by the user, the note format file “sample.pptx” is read from the storage unit 24 and the note format file “sample.pptx” is read out. Is displayed on the touch panel display of the external input device 29 or displayed on the external output device 19 (see FIG. 16). Therefore, the user can refer to the note-format file “sample.pptx” and can edit “sample.pptx” with PowerPoint via the external input device 29 or the external input device 18. Become.

以上、本実施の形態によれば、取得された画像データと、テンプレートにおけるテンプレート領域とを比較し、画像データがテンプレート領域からはみ出さないか否かを判定することにより、画像データのファイル形式とテンプレートのファイル形式とが一致するか否かを判定する。このため、画像データのファイル形式とテンプレートのファイル形式とが一致するかを正確に判定できる。
また、画像読取部26により取得された画像データを、枠線の有無により本文領域かノート領域かに識別する。このため、例えば、文字部分が異なる属性領域(例えば、本文領域及びノート領域)を有する場合であっても、ノート領域か本文領域かについての識別ができるので、画像データを異なる属性に識別する精度を向上させることができる。
また、画像データからベクトルデータを生成し、生成されたベクトルデータを、一致すると判定されたテンプレートのファイル形式で出力するので、ユーザは、パワーポイントを用いてファイルを編集することが可能となる。このため、ユーザの利便性を向上させることができる。
As described above, according to the present embodiment, the acquired image data is compared with the template area in the template, and it is determined whether the image data does not protrude from the template area. It is determined whether or not the file format of the template matches. For this reason, it is possible to accurately determine whether the file format of the image data matches the file format of the template.
In addition, the image data acquired by the image reading unit 26 is identified as a text area or a note area depending on the presence or absence of a frame line. For this reason, for example, even when the character portion has different attribute areas (for example, a text area and a note area), it is possible to identify whether the text area is a note area or a text area. Can be improved.
Further, since vector data is generated from the image data and the generated vector data is output in the file format of the template determined to match, the user can edit the file using PowerPoint. For this reason, a user's convenience can be improved.

また、画像データのファイル形式とテンプレートのファイル形式との一致度を示す点数を算出し、算出した点数の最も高いテンプレートのファイル形式を一致するテンプレートのファイル形式と判定するので、画像データのファイル形式とテンプレートのファイル形式との一致の判定をより正確に行うことができる。   Also, the score indicating the degree of matching between the image data file format and the template file format is calculated, and the template file format with the highest score is determined as the matching template file format. And the template file format can be determined more accurately.

また、算出した点数が所定の点数以下の場合、テンプレートのファイル形式を選択させるための選択情報を外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示する。このため、算出した点数が所定の点数以下の場合、ユーザは、所望のテンプレートのファイル形式を選択することができる。   If the calculated score is equal to or less than the predetermined score, selection information for selecting the file format of the template is displayed on the touch panel display of the external input device 29 or displayed on the external output device 19. For this reason, when the calculated score is equal to or less than the predetermined score, the user can select a desired template file format.

また、ベクトルデータを、OOXMLのファイル形式のファイル「サンプル.pptx」に追記することで、ノート形式のファイル「サンプル.pptx」が生成される。そして、ノート形式のファイル「サンプル.pptx」が、外部入力装置29のタッチパネルディスプレイ上に表示、又は外部出力装置19に表示されると、ユーザはノート形式のファイル「サンプル.pptx」を参照することが可能となるとともに、外部入力装置29又は外部入力装置18を介して「サンプル.pptx」をパワーポイントで編集することが可能となる。   Further, by adding the vector data to the file “sample.pptx” in the file format of OOXML, a note-format file “sample.pptx” is generated. When the note format file “sample.pptx” is displayed on the touch panel display of the external input device 29 or displayed on the external output device 19, the user refers to the note format file “sample.pptx”. In addition, “Sample.pptx” can be edited with PowerPoint via the external input device 29 or the external input device 18.

なお、上記実施の形態における記述は、本発明に係る画像形成装置の一例であり、これに限定されるものではない。   Note that the description in the above embodiment is an example of the image forming apparatus according to the present invention, and the present invention is not limited to this.

例えば、上記実施の形態では、紙原稿を画像読取部26により読み取ることで画像データを取得することとしたが、これに限定されるものではない。例えば、PC2上で作成された画像データを通信装置28を介してPC2から受信し、該受信した画像データを取得することとしてもよい。   For example, in the above embodiment, the image data is obtained by reading a paper document by the image reading unit 26, but the present invention is not limited to this. For example, the image data created on the PC 2 may be received from the PC 2 via the communication device 28 and the received image data may be acquired.

また、上記実施の形態では、アプリケーションソフトとしてパワーポイントを用い、テンプレートはパワーポイントのファイル形式としたが、これに限定されるものではない。例えば、アプリケーションとしてパワーポイント以外のアプリケーション(例えば、ワード)を用いることとしてもよい。
また、テンプレートとして複数のテンプレート(例えば、N−アップ形式のテンプレート)を用いることとしてもよい。
In the above embodiment, PowerPoint is used as application software and the template is a PowerPoint file format. However, the present invention is not limited to this. For example, an application (for example, word) other than PowerPoint may be used as the application.
Also, a plurality of templates (for example, N-up format templates) may be used as templates.

その他、本実施の形態における、画像形成装置の細部構造及び詳細動作に関しても、本発明の趣旨を逸脱しない範囲で適宜変更可能である。   In addition, the detailed structure and detailed operation of the image forming apparatus in the present embodiment can be changed as appropriate without departing from the spirit of the present invention.

1 画像形成装置
2 コンピュータ
3 回線
11 CPU
12,22 RAM
13,23 ROM
14,24 記憶部
15,25 入力I/F
16 出力I/F
17 通信装置
18 外部入力装置
19 外部出力装置(所定の出力部)
20 バス
21 CPU(判定部、制御部)
26 画像読取部(取得部)
27 画像印刷部
29 外部入力装置(所定の出力部)
1 Image forming apparatus 2 Computer 3 Line 11 CPU
12,22 RAM
13,23 ROM
14, 24 Storage unit 15, 25 Input I / F
16 output I / F
17 Communication device 18 External input device 19 External output device (predetermined output unit)
20 bus 21 CPU (determination unit, control unit)
26 Image reading unit (acquiring unit)
27 Image printing unit 29 External input device (predetermined output unit)

Claims (9)

画像データを取得する取得部と、
前記取得部により取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定部と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、前記判定部により一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御部と、
を備える画像処理装置。
An acquisition unit for acquiring image data;
By comparing the image data acquired by the acquisition unit with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the A determination unit that determines whether or not the file format of the template matches;
A control unit that generates vector data from the image data, and performs control to output the generated vector data in a file format of a template determined to match by the determination unit;
An image processing apparatus comprising:
前記テンプレートデータ領域は、
外枠が枠線で囲まれた第1データ領域及び前記画像データのデータ領域の外枠が枠線で囲まれていない第2データ領域の少なくとも1つを含み、
前記判定部は、
前記画像データ内における前記枠線の有無により前記第1データ領域に相当する前記画像データのデータ領域と前記第2データ領域に相当する前記画像データのデータ領域とを識別する請求項1に記載の画像処理装置。
The template data area is
Including at least one of a first data area whose outer frame is surrounded by a frame line and a second data area whose outer frame of the data area of the image data is not surrounded by a frame line;
The determination unit
The data area of the image data corresponding to the first data area and the data area of the image data corresponding to the second data area are identified by the presence or absence of the frame line in the image data. Image processing device.
前記判定部は、
前記画像データが前記テンプレートデータ領域からはみ出すか否かに応じて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致度を示す点数を算出し、該算出した点数に基づいて、前記画像データのファイル形式と前記テンプレートのファイル形式との一致を判定する請求項1又は2に記載の画像処理装置。
The determination unit
Depending on whether or not the image data protrudes from the template data area, a score indicating a degree of coincidence between the file format of the image data and the file format of the template is calculated, and based on the calculated score, the image The image processing apparatus according to claim 1, wherein a match between a data file format and the template file format is determined.
前記制御部は、
前記算出した点数が所定の点数以下の場合、前記テンプレートのファイル形式をユーザに選択させるための選択情報を所定の出力部に出力する制御を行う請求項3に記載の画像処理装置。
The controller is
The image processing apparatus according to claim 3, wherein when the calculated score is equal to or less than a predetermined score, control is performed to output selection information for allowing a user to select a file format of the template to a predetermined output unit.
前記制御部は、
前記ベクトルデータを、所定のアプリケーションソフトウエアで扱える所定のファイル形式のファイルに追記し、前記判定部により一致すると判定されたテンプレートのファイル形式のファイルを生成する請求項1から4のいずれか一項に記載の画像処理装置。
The controller is
The vector data is added to a file having a predetermined file format that can be handled by predetermined application software, and a file having a template file format determined to be matched by the determination unit is generated. An image processing apparatus according to 1.
前記所定のアプリケーションソフトウエアは、パワーポイント(登録商標)である請求項5に記載の画像処理装置。   The image processing apparatus according to claim 5, wherein the predetermined application software is PowerPoint (registered trademark). 前記所定のファイル形式は、OOXMLである請求項5に記載の画像処理装置。   The image processing apparatus according to claim 5, wherein the predetermined file format is OOXML. 画像データを取得する工程と、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する工程と、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する工程と、
を含む画像処理方法。
Acquiring image data; and
By comparing the acquired image data with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the file of the template Determining whether the format matches,
Generating vector data from the image data, and outputting the generated vector data in a file format of a template determined to match,
An image processing method including:
コンピュータに、
画像データを取得する取得部に画像データを取得させる取得機能、
前記取得された画像データと、所定のテンプレートにおけるテンプレートデータ領域とを比較し、前記画像データが前記テンプレートデータ領域からはみだすか否かを判定することにより、前記画像データのファイル形式と前記テンプレートのファイル形式とが一致するか否かを判定する判定機能、
前記画像データからベクトルデータを生成し、該生成されたベクトルデータを、該一致すると判定されたテンプレートのファイル形式で出力する制御を行う制御機能、
を実現させるためのプログラム。
On the computer,
An acquisition function that causes an acquisition unit to acquire image data to acquire image data;
By comparing the acquired image data with a template data area in a predetermined template and determining whether the image data protrudes from the template data area, the file format of the image data and the file of the template Judgment function to determine whether the format matches,
A control function for performing control to generate vector data from the image data and output the generated vector data in a file format of a template determined to match
A program to realize
JP2010268194A 2010-10-25 2010-12-01 Image processing apparatus, image processing method, and program Active JP5569367B2 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2010268194A JP5569367B2 (en) 2010-12-01 2010-12-01 Image processing apparatus, image processing method, and program
CN201110330201.4A CN102457643B (en) 2010-10-25 2011-10-21 Data processing device and data processing method
CN201410276519.2A CN104113656B (en) 2010-10-25 2011-10-21 Data processing equipment and data processing method
US13/279,631 US9049324B2 (en) 2010-10-25 2011-10-24 Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010268194A JP5569367B2 (en) 2010-12-01 2010-12-01 Image processing apparatus, image processing method, and program

Publications (2)

Publication Number Publication Date
JP2012118780A true JP2012118780A (en) 2012-06-21
JP5569367B2 JP5569367B2 (en) 2014-08-13

Family

ID=46501524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010268194A Active JP5569367B2 (en) 2010-10-25 2010-12-01 Image processing apparatus, image processing method, and program

Country Status (1)

Country Link
JP (1) JP5569367B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014067346A (en) * 2012-09-27 2014-04-17 Kyocera Document Solutions Inc Image processing program, electronic apparatus, and image forming apparatus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330397A (en) * 1996-06-13 1997-12-22 Canon Inc Automatic image editor
JP2006134230A (en) * 2004-11-09 2006-05-25 Canon Inc Image editing device
JP2009071781A (en) * 2007-09-18 2009-04-02 Fuji Xerox Co Ltd Image processor and image processing program
JP2010219789A (en) * 2009-03-16 2010-09-30 Canon Inc Image processing system, information processing apparatus, control method thereof, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09330397A (en) * 1996-06-13 1997-12-22 Canon Inc Automatic image editor
JP2006134230A (en) * 2004-11-09 2006-05-25 Canon Inc Image editing device
JP2009071781A (en) * 2007-09-18 2009-04-02 Fuji Xerox Co Ltd Image processor and image processing program
JP2010219789A (en) * 2009-03-16 2010-09-30 Canon Inc Image processing system, information processing apparatus, control method thereof, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014067346A (en) * 2012-09-27 2014-04-17 Kyocera Document Solutions Inc Image processing program, electronic apparatus, and image forming apparatus

Also Published As

Publication number Publication date
JP5569367B2 (en) 2014-08-13

Similar Documents

Publication Publication Date Title
US10356266B2 (en) Information processing system, information processing apparatus, and method for processing information
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
US10528679B2 (en) System and method for real time translation
US9049324B2 (en) Data processing device and data processing method for creating a file in a specified format or outputting a file in a determined format
US20080170785A1 (en) Converting Text
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2010262584A (en) Apparatus, system, and method for processing information and program
US11887391B2 (en) Information processing system, data output system, image processing method, and recording medium
US9864750B2 (en) Objectification with deep searchability
JP6262708B2 (en) Document detection method for detecting original electronic files from hard copy and objectification with deep searchability
US9798724B2 (en) Document discovery strategy to find original electronic file from hardcopy version
JP7196600B2 (en) Information processing system, server device, information processing method, and program
JP5569367B2 (en) Image processing apparatus, image processing method, and program
US20220272209A1 (en) Service providing system, information processing method, and non-transitory recording medium
JP6601143B2 (en) Printing device
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP7396126B2 (en) Information processing device, information processing system, conversion method and program
JP7302175B2 (en) Information processing device and information processing program
JP2007048061A (en) Character processing device, character processing method, and recording medium
US20230102476A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
US10609246B1 (en) System and method for ascertaining and printing supplemental forms identified from content of a scanned base form
US20230297543A1 (en) Data management device, data management system, and recording medium
JP2010092141A (en) Image processing system, image reader, image processor, and image processing program
JP2012146102A (en) Image reader, image reading method and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20130416

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140527

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140609

R150 Certificate of patent or registration of utility model

Ref document number: 5569367

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150