JP2006133960A - Image processing device and program - Google Patents

Image processing device and program Download PDF

Info

Publication number
JP2006133960A
JP2006133960A JP2004320493A JP2004320493A JP2006133960A JP 2006133960 A JP2006133960 A JP 2006133960A JP 2004320493 A JP2004320493 A JP 2004320493A JP 2004320493 A JP2004320493 A JP 2004320493A JP 2006133960 A JP2006133960 A JP 2006133960A
Authority
JP
Japan
Prior art keywords
image
additional
area
unit
postscript
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004320493A
Other languages
Japanese (ja)
Other versions
JP4517818B2 (en
Inventor
Toshiya Koyama
俊哉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004320493A priority Critical patent/JP4517818B2/en
Publication of JP2006133960A publication Critical patent/JP2006133960A/en
Application granted granted Critical
Publication of JP4517818B2 publication Critical patent/JP4517818B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To extract an additionally written part specified by additional writing to a document original and to apply various processings to the additionally written part. <P>SOLUTION: A controller 11 extracts an additionally written image from an additionally written document indicated by image data inputted to an input unit 13 and specifies a region to be written additionally having a predetermined position relation to the additionally written image. Further, the controller 11 extracts the image data to be written additionally arranged in the specified region to be written additionally, and performs a processing specified by the color of the additional writing to the image to be written additionally. Accordingly, an additionally writing person merely perform the additionally writing in the part of the document by a pen of the color corresponding to the content of the processing. Thereby, the additionally writing person can perform the desired processing in the image processing apparatus 1. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、文書原本になされた追記によって指定された被追記部分に対して各種の処理を行うための技術に関する。   The present invention relates to a technique for performing various kinds of processing on a portion to be added designated by additional writing made on a document original.

文書には、各種のコメントが記されたり、その文書の内容を承認したことを示すための承認者のサインや印影などが付されることがある。従来から、このような追記部分だけを抽出するための技術が提案されている。例えば特許文献1には、文書原本と、その原本に追記がなされた追記文書を比較照合することにより、追記部分のみを抽出するという技術が記載されている。特許文献2には、ある文書がすでにデータベースに登録済みの文書Aの追記文書Bであった場合には、その追記文書Bと文書Aとを比較して追記部分の画像データを抽出し、抽出した画像データを文書Aに対応付けるという仕組みが提案されている。そして、特許文献3には、特許文献2に記載されているように追記文書Bと文書Aとを比較して追記部分の画像データを抽出したうえで、その追記部分の画像データに関する情報(例えばキーワードや更新日時)をユーザが入力し、これらの入力情報を追記部分の画像データと共に記憶しておくことが記載されている。   Various comments may be written on the document, and an approver's signature or seal may be added to indicate that the content of the document has been approved. Conventionally, techniques for extracting only such additional portions have been proposed. For example, Patent Document 1 describes a technique in which only an added part is extracted by comparing and collating a document original and an additionally-written document added to the original. In Patent Document 2, if a certain document is a recordable document B of the document A that has already been registered in the database, the recordable document B and the document A are compared to extract image data of a recordable part and extract it. A mechanism for associating the processed image data with the document A has been proposed. In Patent Document 3, as described in Patent Document 2, after comparing the postscript document B and the document A and extracting the image data of the postscript portion, information on the image data of the postscript portion (for example, It is described that the user inputs a keyword and update date and that the input information is stored together with the image data of the additional portion.

ところで、新聞や雑誌等の記事を参照している最中に、興味がある記事を切り出して保存したいとか、或いは、不要な記事にマスクをかけて塗りつぶしたいというような場合がある。このような場合に、例えばマーカーペンによるマーキング等の追記によって、その記事(被追記部分)を指定するだけで、上記のような記事の切り出し処理やマスク処理を行うことができれば非常に便利である。ところが、特許文献1〜3に記載されているような追記に関わる技術では、このような要請に応えることができない。
特開昭61−267177号公報 特開平8−317155号公報 特開2000−148790号公報
By the way, while referring to articles such as newspapers and magazines, there are cases where it is desired to cut out and save articles of interest, or to mask unnecessary articles and paint them. In such a case, for example, it is very convenient if the above-described article extraction process or mask process can be performed only by designating the article (part to be added) by, for example, additional writing such as marking with a marker pen. . However, such a request cannot be met by the technology relating to additional writing as described in Patent Documents 1 to 3.
Japanese Patent Laid-Open No. 61-267177 JP-A-8-317155 JP 2000-148790 A

本発明は、このような背景に鑑みてなされたものであり、その目的は、文書原本に対する追記によって指定された被追記部分を抽出し、この被追記部分に各種処理を施すことが可能な技術を提供することにある。   The present invention has been made in view of such a background, and an object of the present invention is to extract a portion to be added designated by appending to the original document and perform various processes on the portion to be added. Is to provide.

上述の目的を達成するために、本発明は、画像データが入力される入力手段と、入力された前記画像データが表す画像から、決められた条件に従って特定される追記画像を抽出する追記画像抽出手段と、抽出された前記追記画像と所定の位置関係を有する画像領域を被追記領域として特定する領域特定手段と、特定された前記被追記領域に配置されている画像を被追記画像として抽出する被追記画像抽出手段と、抽出された被追記画像に対して指定された処理を行う処理手段とを備えた画像処理装置を提供する。この画像処理装置によれば、追記画像と所定の位置関係を有する画像領域を被追記領域として特定し、特定した被追記領域に配置されている被追記画像に対し、指定された処理を行うことが可能となる。   In order to achieve the above-described object, the present invention provides an input means for inputting image data and an additional image extraction for extracting an additional image specified according to a predetermined condition from an image represented by the input image data. Means for specifying an image area having a predetermined positional relationship with the extracted additional recording image as an additional recording area, and extracting an image arranged in the specified additional recording area as an additional recording image Provided is an image processing apparatus including a postscript image extraction unit and a processing unit that performs a specified process on the extracted postscript image. According to this image processing apparatus, an image area having a predetermined positional relationship with the additional recording image is specified as the additional recording area, and the specified process is performed on the additional recording image arranged in the specified additional recording area. Is possible.

本発明の好ましい態様においては、前記追記画像抽出手段によって抽出された追記画像が線を表しており、その線に途切れた箇所がある場合には、その途切れた箇所を線で補完する補完手段を備え、前記領域特定手段は、前記補完手段によって補完された追記画像と所定の位置関係を有する被追記領域を特定する。   In a preferred aspect of the present invention, when the additional image extracted by the additional image extraction means represents a line, and there is a discontinuity in the line, a complement means for complementing the discontinuity with the line is provided. The region specifying unit specifies a region to be added having a predetermined positional relationship with the additional image supplemented by the complementing unit.

前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合には、前記領域特定手段は、前記追記画像が表すループによって囲まれた画像領域を前記被追記領域として特定するようにしてもよい。   When the additional image extracted by the additional image extraction unit is an image representing a closed loop, the region specifying unit specifies an image region surrounded by the loop represented by the additional image as the additional region. You may make it do.

本発明の好ましい態様においては、入力された前記画像データが表す画像に対して、または、当該画像から前記追記画像が除去された画像に対して、レイアウト解析を行い、該画像を複数のレイアウト単位領域に分割するレイアウト解析手段を備え、前記領域特定手段は、前記レイアウト解析手段によって分割されたレイアウト単位領域のうち、前記追記画像抽出手段によって抽出された前記追記画像と所定の位置関係を有するレイアウト単位領域を前記被追記領域として特定する。   In a preferred aspect of the present invention, layout analysis is performed on an image represented by the input image data or an image obtained by removing the additional image from the image, and the image is converted into a plurality of layout units. Layout analysis means for dividing into regions, wherein the area specifying means has a predetermined positional relationship with the additional image extracted by the additional image extraction means among the layout unit areas divided by the layout analysis means. A unit area is specified as the additional recording area.

例えば、前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合に、前記領域特定手段は、前記追記画像が表すループによってほぼ全域が囲まれた前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。また、前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合に、前記領域特定手段は、前記追記画像が表すループが存在するかまたは当該ループによって包含される全ての前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。また、前記追記画像抽出手段によって抽出された追記画像に外接する外接矩形を生成する外接矩形生成手段を備え、前記領域特定手段は、前記外接矩形によってほぼ全域が囲まれた前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。また、前記追記画像抽出手段によって抽出された追記画像に外接する外接矩形を生成する外接矩形生成手段を備え、前記領域特定手段は、前記外接矩形が存在するかまたは当該外接矩形によって包含される全ての前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。また、前記領域特定手段は、前記追記画像抽出手段によって抽出された追記画像のほぼ全域が存在する前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。前記領域特定手段は、前記追記画像抽出手段によって抽出された追記画像の少なくとも一部が存在する全ての前記レイアウト単位領域を前記被追記領域として特定するようにしてもよい。   For example, when the additional image extracted by the additional image extraction unit is an image representing a closed loop, the region specifying unit may determine the layout unit region substantially surrounded by the loop represented by the additional image. You may make it identify as said additional recording area. In addition, when the additional image extracted by the additional image extraction unit is an image representing a closed loop, the region specifying unit includes the loop represented by the additional image or all of the loops included in the loop. The layout unit area may be specified as the added area. In addition, the apparatus includes a circumscribed rectangle generating unit that generates a circumscribed rectangle circumscribing the additional image extracted by the additional image extracting unit, and the region specifying unit includes the layout unit region substantially surrounded by the circumscribed rectangle. It may be specified as a postscript area. In addition, a circumscribed rectangle generating unit that generates a circumscribed rectangle circumscribing the additional image extracted by the additional image extracting unit is provided, and the region specifying unit includes all of the circumscribed rectangle or whether it is included in the circumscribed rectangle. The layout unit area may be specified as the added area. The area specifying unit may specify the layout unit area in which almost the entire area of the additional image extracted by the additional image extraction unit exists as the additional recording area. The area specifying unit may specify all the layout unit areas in which at least a part of the additional image extracted by the additional image extraction unit exists as the additional area.

さらに、前記領域特定手段は、前記追記画像と所定の位置関係を有するレイアウト単位領域に加えて、当該レイアウト単位領域に隣接するレイアウト単位領域を前記被追記領域として特定するようにしてもよい。また、前記レイアウト単位領域に含まれる文字列に対し文字認識を行う文字認識手段と、前記文字認識手段による認識結果に対して自然言語解析を行う自然言語解析手段と、前記自然言語解析手段による解析結果に基づいて、関連のあるレイアウト単位領域どうしをグループ化するグルーピング手段とを備え、前記領域特定手段は、前記追記画像と所定の位置関係を有するレイアウト単位領域に加えて、前記グルーピング手段によって当該レイアウト単位領域と同じグループに属するとされたレイアウト単位領域を前記被追記領域として特定するようにしてもよい。   Furthermore, the area specifying unit may specify a layout unit area adjacent to the layout unit area as the additional recording area in addition to the layout unit area having a predetermined positional relationship with the additional image. Further, character recognition means for performing character recognition on a character string included in the layout unit area, natural language analysis means for performing natural language analysis on a recognition result by the character recognition means, and analysis by the natural language analysis means Grouping means for grouping related layout unit areas based on the results, the area specifying means in addition to the layout unit area having a predetermined positional relationship with the additional image, the grouping means A layout unit area that belongs to the same group as the layout unit area may be specified as the additional recording area.

前記処理手段は、抽出された被追記画像に対して、当該被追記画像の抽出処理、削除ないしマスク処理、他の画像との置換処理、文字認識処理、または当該文字認識の結果に対する翻訳処理のうち、少なくともいずれか1つの処理を行うようにしてもよい。   The processing means performs extraction processing of the postscript image, deletion or mask processing, replacement processing with another image, character recognition processing, or translation processing for the result of the character recognition on the extracted postscript image. Of these, at least one of the processes may be performed.

また、前記追記画像の色を識別する色識別手段と、前記追記画像の色と処理の内容とを対応付けて記憶した記憶手段とを備え、前記処理手段は、抽出された前記被追記画像に対し、当該被追記画像と所定の位置関係を有する前記追記画像の色に対応付けて前記記憶手段に記憶されている内容の処理を行うようにしてもよい。   In addition, a color identification unit that identifies the color of the additional image, and a storage unit that stores the color of the additional image and the content of the processing in association with each other, and the processing unit adds the extracted additional image to the additional image. On the other hand, the content stored in the storage unit may be processed in association with the color of the additional image having a predetermined positional relationship with the additional image.

また、前記追記画像の形状を識別する形状識別手段と、前記追記画像の形状と処理の内容とを対応付けて記憶した記憶手段とを備え、前記処理手段は、抽出された前記被追記画像に対し、当該被追記画像と所定の位置関係を有する前記追記画像の形状に対応付けて前記記憶手段に記憶されている内容の処理を行うようにしてもよい。   Further, the image processing apparatus includes a shape identifying unit that identifies the shape of the additional image, and a storage unit that stores the shape of the additional image and the content of the process in association with each other, and the processing unit adds the extracted additional image to the additional image to be recorded. On the other hand, the content stored in the storage unit may be processed in association with the shape of the additional image having a predetermined positional relationship with the additional image.

また、本発明は、コンピュータに、入力された前記画像データが表す画像から、決められた条件に従って特定される追記画像を抽出する追記画像抽出機能と、抽出された前記追記画像と所定の位置関係を有する画像領域を被追記領域として特定する領域特定機能と、特定された前記被追記領域に配置されている画像を被追記画像として抽出する被追記画像抽出機能と、抽出された被追記画像に対して指定された処理を行う処理機能とを実現させるためのプログラムを提供する。   Further, the present invention provides a computer with a postscript image extraction function for extracting a postscript image specified according to a predetermined condition from an image represented by the input image data, and a predetermined positional relationship between the extracted postscript image and the computer. An area specifying function for specifying an image area having a postscript area, a postscript image extraction function for extracting an image arranged in the specified postscript area as a postscript image, and an extracted postscript image A program for realizing a processing function for performing a specified process is provided.

まず、本発明の実施形態で用いる主要な用語を定義しておく。
「文書原本」とは、プリンタ等の画像形成装置によって画像が形成されてから追記者による追記が一切なされていない文書を意味している。「原本画像データ」とは、この文書原本の内容を表した画像データである。
これに対し、「追記文書」とは、文書原本に対して追記がなされた状態の文書を意味している。また、「追記画像」とは文書原本の追記部分の画像を意味している。例えば或る文字列を線で囲むような追記の場合には、その線そのものが追記画像である。「追記画像データ」とは、追記画像の内容を表した画像データである。
そして、「被追記画像」とは、文書原本において追記によって指定された部分(被追記部分)の画像を意味している。例えば或る文字列を線で囲むような追記の場合には、その文字列が被追記画像である。「被追記画像データ」とは、被追記部分の内容を表した画像データである。
First, main terms used in the embodiment of the present invention are defined.
The “original document” means a document that has not been additionally written by an adder after an image is formed by an image forming apparatus such as a printer. “Original image data” is image data representing the contents of the original document.
On the other hand, the “additional document” means a document in a state where the original document is additionally written. In addition, “additional image” means an image of a postscript portion of the original document. For example, in the case of additional writing in which a certain character string is surrounded by a line, the line itself is the additional recording image. “Additional image data” is image data representing the contents of the additional image.
The “recorded image” means an image of a portion (added portion) designated by appending in the original document. For example, in the case of additional writing in which a certain character string is surrounded by a line, the character string is a postscript image. “Additional image data” is image data representing the contents of the added portion.

(1)第1実施形態
図1は、第1実施形態に係る画像処理装置1の構成を示したブロック図である。画像処理装置1は、例えばパーソナルコンピュータであり、制御部11と、不揮発性記憶部12と、入力部13と、表示部14と、操作部15とを備えている。入力部13には通信ケーブルを介してスキャナ等の画像読取装置2が接続されている。
(1) First Embodiment FIG. 1 is a block diagram illustrating a configuration of an image processing apparatus 1 according to a first embodiment. The image processing apparatus 1 is a personal computer, for example, and includes a control unit 11, a nonvolatile storage unit 12, an input unit 13, a display unit 14, and an operation unit 15. An image reading device 2 such as a scanner is connected to the input unit 13 via a communication cable.

制御部11は、CPU(Central Processing Unit)111、ROM(Read Only Memory)112及びRAM(Random Access Memory)113を備えており、画像読取装置2から入力部13を介して入力された画像データに対し、各種の画像処理を実行する。不揮発性記憶部12は例えばハードディスクであり、制御部11が実行する画像処理の手順が記述された画像処理プログラムPRGを記憶している。操作部15は、例えばキーボードやマウスを備えており、ユーザによる入力操作を受け付けて、その操作に応じた信号を制御部11に供給する。表示部14は例えば液晶ディスプレイ装置であり、制御部11による制御の下で各種画像を表示する。   The control unit 11 includes a CPU (Central Processing Unit) 111, a ROM (Read Only Memory) 112, and a RAM (Random Access Memory) 113. The control unit 11 converts image data input from the image reading device 2 through the input unit 13. On the other hand, various image processing is executed. The non-volatile storage unit 12 is, for example, a hard disk, and stores an image processing program PRG describing a procedure of image processing executed by the control unit 11. The operation unit 15 includes, for example, a keyboard and a mouse, receives an input operation by a user, and supplies a signal corresponding to the operation to the control unit 11. The display unit 14 is a liquid crystal display device, for example, and displays various images under the control of the control unit 11.

図2は、画像処理プログラムPRGに記述された手順を示すフローチャートである。
追記者は文書原本に追記を行う。具体的には、ごく一般的なテキスト文書のように白色地の記録紙に黒色の画像が形成されたモノクロの文書原本に対し、追記者はペンを用いて、例えば切り出して保存したい文書内容を線で囲むような追記を行う。ここで用いられるペンは、例えば赤、黄、青などの色のペンである。第1実施形態では、追記を行う際のルールとして、切り出して保存する内容に対しては赤色の線で囲み、削除する内容に対しては青色の線で囲むということが事前に決められているものとする。このような追記に用いるべき色と処理の内容とは、それぞれ対応付けられて不揮発性記憶部12に予め記憶されている。
FIG. 2 is a flowchart showing a procedure described in the image processing program PRG.
The appender adds to the original document. Specifically, for a monochrome original document in which a black image is formed on a white background recording paper like a very general text document, the appender uses a pen to specify the document content to be cut out and saved, for example. Add a note that is enclosed in a line. The pen used here is, for example, a pen of a color such as red, yellow, or blue. In the first embodiment, as a rule for performing additional writing, it is predetermined that contents to be cut out and stored are surrounded by a red line, and contents to be deleted are surrounded by a blue line. Shall. The color to be used for such additional recording and the content of the processing are associated with each other and stored in advance in the nonvolatile storage unit 12.

ここで、図3の追記文書D1は、上記のようなルールで追記がなされた追記文書の一例を示している。この例では、青色の線l1によって文書の一部の内容が囲まれている。画像処理装置1の操作者は、図3に示したような追記文書D1を画像読取装置2によって読み取らせる。画像読取装置2は、読み取った画像を表す画像データを画像処理装置1の入力部13に入力する。   Here, the postscript document D1 of FIG. 3 shows an example of the postscript document that has been postscripted according to the above rules. In this example, part of the content of the document is surrounded by a blue line l1. The operator of the image processing apparatus 1 causes the image reading apparatus 2 to read the postscript document D1 as shown in FIG. The image reading device 2 inputs image data representing the read image to the input unit 13 of the image processing device 1.

図2において、入力部13に画像データが入力されると(ステップS1)、制御部11は、その画像データから、予め決められた条件に従って追記画像を特定し、これらを抽出する(ステップS2)。上述したように追記の色は予め決められているので、ここでは、制御部11は、画像データからその色の画素からなる画像を追記画像として抽出すればよい。図3の例では青色の線l1が追記画像として抽出されることになる。   In FIG. 2, when image data is input to the input unit 13 (step S1), the control unit 11 specifies additional images from the image data according to predetermined conditions and extracts them (step S2). . As described above, since the color of additional recording is determined in advance, the control unit 11 may extract an image composed of pixels of that color from the image data as an additional recording image. In the example of FIG. 3, the blue line l1 is extracted as a postscript image.

次いで、制御部11は、ステップS2で抽出した追記画像に補完が必要か否かを判断する。例えば追記者が閉ループを記入しようとしても、完全な閉ループにならずに、ループの一部が途切れてしまうことがある。一例を挙げると、図4の追記文書D2のように、青色の線l2が完全な閉ループを形成していないような場合である。このような場合、制御部11は、追記画像(線l2)の一端と他端との距離を算出し、その距離が閾値未満の場合には補完が必要だと判断して(ステップS3;Yes)、その一端と他端を線l2’で結んで補完する(ステップS4)。この補完処理によって、文書D2’に示すように完全な閉ループが形成される。   Next, the control unit 11 determines whether or not it is necessary to complement the additional image extracted in step S2. For example, even if an appender tries to fill in a closed loop, the loop may be interrupted without being a complete closed loop. As an example, it is a case where the blue line 12 does not form a complete closed loop as in the postscript document D2 of FIG. In such a case, the control unit 11 calculates the distance between one end and the other end of the postscript image (line 12), and determines that complementation is necessary when the distance is less than the threshold (step S3; Yes). ), One end and the other end are connected by a line l2 ′ to complement (step S4). By this complementing process, a complete closed loop is formed as shown in the document D2 '.

次いで、制御部11は、抽出した追記画像と所定の位置関係を有する被追記領域を特定する(ステップS5)。例えば、図3の追記文書D1のように青色の線l1で閉ループが形成されているような場合には、その閉ループによって囲まれた画像領域a1(図3の斜線部分)が被追記領域である。同様に、図4の文書D2’のように補完された青色の線l2によって閉ループが形成されているような場合には、その閉ループによって囲まれた画像領域a2(図4の斜線部分)が被追記領域である。   Next, the control unit 11 identifies a postscript area having a predetermined positional relationship with the extracted postscript image (step S5). For example, when a closed loop is formed with a blue line l1 as in the additional record document D1 in FIG. 3, the image area a1 (shaded area in FIG. 3) surrounded by the closed loop is the postscript area. . Similarly, when the closed loop is formed by the complemented blue line l2 as in the document D2 ′ in FIG. 4, the image region a2 (shaded portion in FIG. 4) surrounded by the closed loop is covered. This is a postscript area.

次に、制御部11は、特定された被追記領域に配置されている画像を被追記画像として抽出する(ステップS6)。そして、制御部11は、抽出した被追記画像に対し、追記の色に対応する処理を実行する(ステップS7)。ここでは、青色の追記に対応する処理は、被追記画像の削除であるから、図3,4に示した文書D1’、D2”のように、被追記領域a1,a2の画像が削除されることになる。そして、制御部11は、その処理の結果(文書D1’、D2”を表す画像データ)を不揮発性記憶部12に記憶する。   Next, the control part 11 extracts the image arrange | positioned at the specified to-be-recorded area as a to-be-recorded image (step S6). And the control part 11 performs the process corresponding to the color of additional recording with respect to the extracted additional recording image (step S7). Here, since the process corresponding to the blue additional recording is the deletion of the postscript image, the images of the postscript areas a1 and a2 are deleted as in the documents D1 ′ and D2 ″ shown in FIGS. Then, the control unit 11 stores the processing result (image data representing the documents D1 ′ and D2 ″) in the nonvolatile storage unit 12.

この第1実施形態によれば、制御部11は、入力部13に入力された画像データが表す追記文書から追記画像を抽出し、その追記画像と所定の位置関係を有する被追記領域を特定する。さらに、制御部11は、特定された被追記領域に配置された被追記画像データを抽出して、これら被追記画像に対し、追記の色によって指定された処理を実行する。従って、追記者は、処理の内容に応じた色のペンで文書原本に追記を行うだけで、自身が所望する処理を画像処理装置1に実行させることができる。また、図4に示したように線l2が途切れるなど、追記が不完全な場合であっても、その途切れた部分を画像処理装置1が補完するので、追記者にとっては追記作業が簡便になる。なお、黒色の文字の上に例えば青色の線で追記した場合、その追記画像を抽出しようとすると、実際には、文字と重なっている部分は青色の画素ではなく黒色の画素であるから、この部分が全て途切れてしまうことになる。第1実施形態では補完処理を行うので、このような場合であっても、被追記画像を適切に抽出することができる。   According to the first embodiment, the control unit 11 extracts a postscript image from the postscript document represented by the image data input to the input unit 13, and specifies a postscript area having a predetermined positional relationship with the postscript image. . Further, the control unit 11 extracts the postscript image data arranged in the specified postscript area, and executes a process designated by the color of the postscript for these postscript images. Accordingly, the appender can cause the image processing apparatus 1 to execute the process desired by the appender only by performing the appending to the original document document with a color pen corresponding to the content of the process. Further, even if the additional writing is incomplete, such as when the line l2 is interrupted as shown in FIG. 4, the interrupted portion is supplemented by the image processing apparatus 1, so that the additional writing operation is easy for the additional writer. . In addition, when additional writing is performed on a black character with, for example, a blue line, when the additional recording image is extracted, the portion that overlaps the character is actually a black pixel instead of a blue pixel. All parts will be interrupted. Since complement processing is performed in the first embodiment, a postscript image can be appropriately extracted even in such a case.

なお、第1実施形態は次のような変形が可能である。
追記画像を抽出する際には、上記のように追記画像の色の別に基づいて抽出するという方法の他にも、様々な方法がある。例えば、上述した特許文献1〜3に記載されているように、予め電子データ化して保存された文書原本と、その文書原本に追記がなされた追記文書とを比較することで追記部分を抽出するという方法を採用してもよい。
The first embodiment can be modified as follows.
When extracting the postscript image, there are various methods besides the method of extracting based on the color of the postscript image as described above. For example, as described in Patent Documents 1 to 3 described above, a postscript portion is extracted by comparing a document original that has been stored in advance as electronic data with a postscript that has been added to the original document. This method may be adopted.

また、次のような方法もある。制御部11は、画像処理装置1に入力された画像データに含まれる各画素の色をいわゆる限定色化し(つまり幾つかの代表色に変換し)、これらの代表色のうち少なくともいずれか2色を基本色として特定する。ここでいう基本色とは、文書原本の内容を表すために用いられている色であり、例えば白色の記録紙に黒色の文字が形成されているような場合には、白と黒が基本色である。そして、制御部11は、代表色に変換された画像データを、基本色の画素からなる原本画像データと、その基本色以外の代表色の画素からなる追記画像データとに分離する。ここで、原本画像データは、基本色によって表される画像データであるから、文書原本の内容を表しているはずである。一方、基本色以外(黒と白以外)の代表色の画素によって構成された画像データは、追記画像を表しているはずである。   There are also the following methods. The control unit 11 changes the color of each pixel included in the image data input to the image processing apparatus 1 to a so-called limited color (that is, converts it into several representative colors), and at least any two of these representative colors Is specified as the basic color. The basic color here is a color used to represent the contents of the original document. For example, when black characters are formed on white recording paper, white and black are the basic colors. It is. Then, the control unit 11 separates the image data converted into the representative color into original image data composed of basic color pixels and additional image data composed of representative color pixels other than the basic color. Here, since the original image data is image data represented by basic colors, it should represent the contents of the original document. On the other hand, the image data composed of pixels of representative colors other than the basic colors (other than black and white) should represent a postscript image.

なお、被追記画像に施す処理の種類は、上述した切り出し処理や削除処理に限らず、任意の処理を適用し得る。例えば、他の画像との置換処理であってもよい。   Note that the type of processing performed on the postscript image is not limited to the above-described clipping processing and deletion processing, and any processing can be applied. For example, a replacement process with another image may be performed.

また、画像処理装置1はパーソナルコンピュータによって実現してもよいし、この画像処理装置1の機能を備えた複合機によって実現してもよい。また、画像処理装置1の機能の一部を画像読取装置2によって実現してもよい。また、画像処理装置1の制御部11は、抽出した被追記画像データを画像処理装置1に内蔵された不揮発性記憶部12に記憶するのではなく、フロッピー(登録商標)ディスクやその他の記録媒体に記憶するようにしてもよい。なお、画像処理プログラムPRGは、磁気ディスク、フロッピー(登録商標)ディスク、CD(Compact Disk),DVD(Digital Versatile Disk),RAM等の種々の記録媒体に記録した状態で提供することが可能である。   Further, the image processing apparatus 1 may be realized by a personal computer, or may be realized by a multifunction machine having the function of the image processing apparatus 1. Further, part of the functions of the image processing apparatus 1 may be realized by the image reading apparatus 2. In addition, the control unit 11 of the image processing apparatus 1 does not store the extracted additional image data to be stored in the nonvolatile storage unit 12 built in the image processing apparatus 1, but a floppy (registered trademark) disk or other recording medium. You may make it memorize. The image processing program PRG can be provided in a state of being recorded on various recording media such as a magnetic disk, a floppy (registered trademark) disk, a CD (Compact Disk), a DVD (Digital Versatile Disk), and a RAM. .

(2)第2実施形態
次に、本発明の第2実施形態について説明する。この第2実施形態では、追記文書に対してレイアウト解析を行ってから被追記画像を抽出する点が第1実施形態と異なっている。この第2実施形態に係る画像処理装置の構成は、画像処理プログラムPRGに記述された手順の一部を除いて、図1に示した画像処理装置1と同じであるから、その詳細な説明は省略する。
(2) Second Embodiment Next, a second embodiment of the present invention will be described. The second embodiment is different from the first embodiment in that a postscript image is extracted after layout analysis is performed on a postscript document. The configuration of the image processing apparatus according to the second embodiment is the same as that of the image processing apparatus 1 shown in FIG. 1 except for a part of the procedure described in the image processing program PRG. Omitted.

図5は、第2実施形態に係る画像処理プログラムPRGに記述された手順を示すフローチャートである。図5において図2の内容と異なる点は、ステップS2とステップS5の間に、レイアウト解析を行う処理(ステップS8)が挿入されているところである。なお、図5には、追記画像の補完処理(ステップS3,4)の図示を省略しているが、もちろんこの補完処理の後にステップS8を行うようにしてもよい。   FIG. 5 is a flowchart showing a procedure described in the image processing program PRG according to the second embodiment. 5 is different from the content of FIG. 2 in that a process (step S8) for performing layout analysis is inserted between step S2 and step S5. In FIG. 5, the supplemental image supplement processing (steps S3 and S4) is not shown in FIG. 5, but step S8 may be performed after the supplement processing.

ここで、レイアウト解析後に被追記領域を特定する具体的方法について、図6〜図9を参照しながら説明する。
(2−1)閉ループによって囲まれたレイアウト単位領域を被追記領域として特定する方法
図6に示す追記文書D3には、赤色の線l3からなる閉ループが追記されている。制御部11は、この閉ループを抽出してから(ステップS2)、この閉ループをいったん除去してレイアウト解析を実行し(ステップS8)、図6の点線で示すようなレイアウト単位領域にそれぞれ分割する。そして、制御部11は、閉ループによって囲まれているレイアウト単位領域a3(図6の斜線部分)を特定する。ここで、レイアウト単位領域a3の全域が完全に閉ループによって囲まれていなくても、そのレイアウト単位領域a3のほぼ全域が囲まれていれば、制御部11は、そのレイアウト単位領域a3を被追記領域として特定すればよい。
Here, a specific method for specifying the postscript area after layout analysis will be described with reference to FIGS.
(2-1) Method for Specifying Layout Unit Area Surrounded by Closed Loop as Additional Recording Area A closed loop consisting of a red line l3 is additionally written in the additional writing document D3 shown in FIG. After extracting the closed loop (step S2), the control unit 11 removes the closed loop once and executes layout analysis (step S8), and divides the layout unit regions as shown by dotted lines in FIG. Then, the control unit 11 specifies the layout unit region a3 (shaded portion in FIG. 6) surrounded by the closed loop. Here, even if the entire layout unit region a3 is not completely surrounded by the closed loop, if the almost entire region of the layout unit region a3 is surrounded, the control unit 11 defines the layout unit region a3 as the additional recording region. It may be specified as

次いで、制御部11は、特定されたレイアウト単位領域a3(被追記領域)に配置されている画像を被追記画像として抽出する(ステップS6)。ここで、追記の色は赤であるから、制御部11は、抽出した被追記画像を切り出し、不揮発性記憶部12に保存する処理を実行する(ステップS7)。なお、図6において、矢印pは追記画像をいったん除去してからレイアウト解析を行う場合の手順を示している。これに対し、矢印qは、追記画像を除去せずにレイアウト解析を行う場合の手順を示している(以降の図7〜図11において同じ)。いずれの手順でレイアウト解析を実行するかについては適切な方を適宜選択すればよい。   Next, the control unit 11 extracts an image arranged in the specified layout unit area a3 (recorded area) as a recorded image (step S6). Here, since the color of the additional recording is red, the control unit 11 performs a process of cutting out the extracted additional recording image and storing it in the nonvolatile storage unit 12 (step S7). In FIG. 6, an arrow p indicates a procedure for performing layout analysis after once removing the postscript image. On the other hand, the arrow q indicates the procedure when layout analysis is performed without removing the additional image (the same applies to FIGS. 7 to 11 below). An appropriate one may be appropriately selected as to which procedure is used for layout analysis.

(2−2)閉ループが存在するかまたは閉ループによって包含される全てのレイアウト単位領域を被追記領域として特定する方法
次に、図7は、閉ループが存在するかまたは閉ループによって包含される全てのレイアウト単位領域を被追記領域として特定する場合の例を示している。制御部11は、図7の閉ループを示す線l4(赤色)が存在するかまたはその閉ループによって包含される全てのレイアウト単位領域a4(図7の斜線部分)を被追記領域として特定する。その後、制御部11は、特定されたレイアウト単位領域a4に配置されている画像を被追記画像として抽出する(ステップS6)。ここで、追記画像の色は赤であるから、制御部11は、抽出した被追記画像を切り出し、不揮発性記憶部12に保存する処理を実行する(ステップS7)。
(2-2) Method for Specifying All Layout Unit Regions Existing or Enclosed by Closed Loop as Added Regions Next, FIG. 7 shows all layouts that exist or are enclosed by the closed loop. An example in which a unit area is specified as a postscript area is shown. The control unit 11 specifies all layout unit regions a4 (hatched portions in FIG. 7) that include the line 14 (red) indicating the closed loop of FIG. Thereafter, the control unit 11 extracts an image arranged in the specified layout unit region a4 as a postscript image (step S6). Here, since the color of the additional recording image is red, the control unit 11 performs a process of cutting out the extracted additional recording image and storing it in the nonvolatile storage unit 12 (step S7).

(2−3)追記画像の外接矩形によって囲まれたレイアウト単位領域を被追記領域として特定する方法
次に、図8は、追記画像の外接矩形を用いて被追記領域を特定する場合の例を示している。図8に示す追記文書D5には、赤色の線l5からなる閉ループが追記されている。制御部11は、この閉ループを抽出してから(ステップS2)、この閉ループを除去してレイアウト解析を実行し(ステップS8)、図8の点線で示すようなレイアウト単位領域に分割する。そして、制御部11は、閉ループの外接矩形s5を生成し、その外接矩形s5によって囲まれているレイアウト単位領域a5(図8の斜線部分)を特定する。ここで、レイアウト単位領域a5の全域が完全に外接矩形s5によって囲まれていなくても、そのレイアウト単位領域a5のほぼ全域が囲まれていれば、制御部11は、そのレイアウト単位領域を被追記領域として特定すればよい。
(2-3) Method of Specifying Layout Unit Area Surrounded by circumscribing Rectangle of Additional Recording Image as Additional Recording Area Next, FIG. 8 shows an example of specifying the additional recording area using the circumscribed rectangle of the additional recording image. Show. In the postscript document D5 shown in FIG. 8, a closed loop consisting of a red line l5 is added. After extracting the closed loop (step S2), the control unit 11 removes the closed loop and executes layout analysis (step S8), and divides the layout unit area as shown by the dotted line in FIG. Then, the control unit 11 generates a closed-loop circumscribed rectangle s5 and specifies a layout unit region a5 (shaded portion in FIG. 8) surrounded by the circumscribed rectangle s5. Here, even if the whole area of the layout unit area a5 is not completely surrounded by the circumscribed rectangle s5, if the whole area of the layout unit area a5 is surrounded, the control unit 11 adds the layout unit area to the target. What is necessary is just to specify as an area | region.

次いで、制御部11は、特定されたレイアウト単位領域a5(被追記領域)に配置されている画像を被追記画像として抽出する(ステップS6)。ここで、追記の色は赤であるから、制御部11は、抽出した被追記画像を切り出し、不揮発性記憶部12に保存する処理を実行する(ステップS7)。   Next, the control unit 11 extracts an image arranged in the specified layout unit area a5 (added recording area) as an added image (step S6). Here, since the color of the additional recording is red, the control unit 11 performs a process of cutting out the extracted additional recording image and storing it in the nonvolatile storage unit 12 (step S7).

(2−4)追記画像の外接矩形が存在するかまたは外接矩形によって包含される全てのレイアウト単位領域を被追記領域として特定する方法
次に、図9は、追記画像の外接矩形が存在するかまたは外接矩形によって包含される全てのレイアウト単位領域を被追記領域として特定する場合の例を示している。制御部11は、図9の外接矩形s6が存在しているかまたは外接矩形s6によって包含される全てのレイアウト単位領域a6(図9の斜線部分)を被追記領域として特定する。その後、制御部11は、特定されたレイアウト単位領域a6に配置されている画像を被追記画像として抽出する(ステップS6)。ここで、追記画像の色は赤であるから、制御部11は、抽出した被追記画像を切り出し、不揮発性記憶部12に保存する処理を実行する(ステップS7)。
この第2実施形態においては、第1実施形態で述べた変形例と同様の変形が可能である。
(2-4) Method of specifying circumscribing rectangle of additional image or all layout unit regions included in circumscribed rectangle as additional recording region Next, FIG. Alternatively, an example is shown in which all layout unit areas included in the circumscribed rectangle are specified as a postscript area. The control unit 11 specifies all layout unit regions a6 (hatched portions in FIG. 9) where the circumscribed rectangle s6 of FIG. 9 exists or is encompassed by the circumscribed rectangle s6 as the additional recording region. Thereafter, the control unit 11 extracts an image arranged in the specified layout unit area a6 as a postscript image (step S6). Here, since the color of the additional recording image is red, the control unit 11 performs a process of cutting out the extracted additional recording image and storing it in the nonvolatile storage unit 12 (step S7).
In the second embodiment, the same modification as the modification described in the first embodiment is possible.

(3)第3実施形態
第3実施形態では、被追記画像に施すべき処理が追記画像の形状によって指定される。具体的には、制御部11は、追記の形状が閉ループの場合は、その追記によって指定された被追記画像を切り出して保存する処理を行い、追記の形状が×印の場合は、その追記によって指定された被追記画像を削除する処理を行う。このような追記画像の形状と処理の内容とは、それぞれ対応付けられて不揮発性記憶部12に予め記憶されている。この第3実施形態に係る画像処理装置の構成は、図1に示した画像処理装置1と同じであるから、その詳細な説明は省略する。また、画像処理プログラムPRGに記述された手順は、以下の点を除いて図5に示した手順と同じである。
(3) Third Embodiment In the third embodiment, the process to be performed on the postscript image is specified by the shape of the postscript image. Specifically, the control unit 11 performs a process of cutting out and saving the postscript image specified by the additional writing when the shape of the additional writing is a closed loop, and when the shape of the additional writing is X, the additional writing is performed. A process for deleting the specified postscript image is performed. The shape of the additional image and the content of the process are associated with each other and stored in advance in the nonvolatile storage unit 12. Since the configuration of the image processing apparatus according to the third embodiment is the same as that of the image processing apparatus 1 shown in FIG. 1, detailed description thereof is omitted. The procedure described in the image processing program PRG is the same as the procedure shown in FIG. 5 except for the following points.

図10は、文書原本に×印の追記がなされた場合の例を示している。制御部11は、この×印の追記画像l7を抽出してから(ステップS2)、この追記画像l7を除去してレイアウト解析を実行し(ステップS8)、図10の点線で示すようなレイアウト単位領域に分割する。そして、制御部11は、×印の追記画像l7の全域或いはほぼ全域が含まれるレイアウト単位領域a7(図10の斜線部分)を特定する。次いで、制御部11は、特定されたレイアウト単位領域a7に配置されている画像を被追記画像として抽出する(ステップS6)。制御部11は、抽出した被追記画像を削除する処理を実行する(ステップS7)。   FIG. 10 shows an example in which a cross mark is added to the original document. The control unit 11 extracts the additional image 17 with the x mark (step S2), removes the additional image 17 and executes layout analysis (step S8), and performs a layout unit as indicated by the dotted line in FIG. Divide into areas. Then, the control unit 11 specifies the layout unit region a7 (the hatched portion in FIG. 10) that includes the entire region or almost the entire region of the additional image 17 with the x mark. Next, the control unit 11 extracts an image arranged in the specified layout unit region a7 as a postscript image (step S6). The control part 11 performs the process which deletes the extracted postscript image (step S7).

次に、図11は、×印の追記画像l8が存在する全てのレイアウト単位領域を被追記領域として特定する場合の例を示している。制御部11は、図11の追記画像l8が存在している全てのレイアウト単位領域a8(図11の斜線部分)を被追記領域として特定する。その後、制御部11は、特定されたレイアウト単位領域a8に配置されている画像を被追記画像として抽出する(ステップS6)。制御部11は、抽出した被追記画像を削除する処理を実行する(ステップS7)。
この第3実施形態においては、第1実施形態で述べた変形例と同様の変形が可能である。
Next, FIG. 11 shows an example in which all layout unit areas in which the additional recording image l8 marked with X is specified as the additional recording area. The control unit 11 identifies all layout unit areas a8 (hatched portions in FIG. 11) where the additional recording image l8 in FIG. 11 exists as the additional recording area. Thereafter, the control unit 11 extracts an image arranged in the specified layout unit region a8 as a postscript image (step S6). The control part 11 performs the process which deletes the extracted postscript image (step S7).
In the third embodiment, the same modification as the modification described in the first embodiment is possible.

(4)第4実施形態
第4実施形態に係る画像処理装置は、追記画像と所定の位置関係を有するレイアウト単位領域に加えて、そのレイアウト単位領域に隣接するレイアウト単位領域をも被追記領域として特定するようになっている。このようにすれば、被追記画像のサイズが非常に大きい場合であっても、追記者は、その被追記画像の中央付近に追記を行うだけで済む。この第4実施形態に係る画像処理装置の構成は、画像処理プログラムPRGに記述された手順の一部を除いて、図1に示した画像処理装置1と同じであるから、その詳細な説明は省略する。
(4) Fourth Embodiment In the image processing apparatus according to the fourth embodiment, in addition to the layout unit area having a predetermined positional relationship with the additional recording image, the layout unit area adjacent to the layout unit area is also set as the additional recording area. It has come to identify. In this way, even if the size of the postscript image is very large, the postscripter only needs to make a postscript near the center of the postscript image. The configuration of the image processing apparatus according to the fourth embodiment is the same as that of the image processing apparatus 1 shown in FIG. 1 except for a part of the procedure described in the image processing program PRG. Omitted.

図12は、第4実施形態に係る画像処理プログラムPRGに記述された手順を示すフローチャートである。図12において図5の内容と異なる点は、ステップS5とステップS6の間に、ステップ9,10の処理が挿入されているところである。このステップS9,10の処理は具体的には次のようになる。   FIG. 12 is a flowchart showing a procedure described in the image processing program PRG according to the fourth embodiment. 12 is different from the content of FIG. 5 in that the processes of steps 9 and 10 are inserted between steps S5 and S6. Specifically, the processes in steps S9 and S10 are as follows.

図13は、文書原本に×印の追記がなされた場合の例を示している。制御部11は、この×印の追記画像l9を抽出してから(ステップS2)、この追記画像l9を除去してレイアウト解析を実行し(ステップS8)、図13の点線で示すようなレイアウト単位領域に分割する。そして、制御部11は、×印の追記画像l9の全域或いはほぼ全域が含まれるレイアウト単位領域a9を特定する(ステップS5)。次いで、制御部11は、特定されたレイアウト単位領域a9に隣接するレイアウト単位領域があるか否かを判断し(ステップS9)、隣接するレイアウト単位領域があれば(ステップS9;Yes)、ステップS5で特定したレイアウト単位領域a9に、そのレイアウト単位領域に隣接するレイアウト単位領域(この場合、レイアウト単位領域a9’)を追加する(ステップS10)。そして、制御部11は、これらのレイアウト単位領域a9,a9’に配置されている画像を被追記画像として抽出する(ステップS6)。制御部11は、抽出した被追記画像を削除する処理を実行する(ステップS7)。
この第4実施形態においても第1実施形態と同様の変形が可能である。
FIG. 13 shows an example in the case where an x mark is added to the original document. The control unit 11 extracts the additional image l9 marked with x (step S2), removes the additional image 19 and executes layout analysis (step S8), and performs a layout unit as shown by the dotted line in FIG. Divide into areas. Then, the control unit 11 specifies the layout unit region a9 that includes the entire region or almost the entire region of the additional image l9 marked with a cross (step S5). Next, the control unit 11 determines whether there is a layout unit area adjacent to the specified layout unit area a9 (step S9). If there is an adjacent layout unit area (step S9; Yes), step S5 is performed. The layout unit area (in this case, the layout unit area a9 ′) adjacent to the layout unit area is added to the layout unit area a9 specified in (Step S10). And the control part 11 extracts the image arrange | positioned in these layout unit area | regions a9 and a9 'as a postscript image (step S6). The control part 11 performs the process which deletes the extracted postscript image (step S7).
The fourth embodiment can be modified in the same manner as in the first embodiment.

(5)第5実施形態
第4実施形態では、位置的に近いレイアウト単位領域同士を1つの被追記領域とみなしたものであった。これに対し、第5実施形態では、自然言語解析を用いて文書の意味内容が近いと判断されるレイアウト単位領域同士をグループ化し、同じグループに属するとされたレイアウト単位領域を被追記領域とみなすものである。このようにすれば、追記者が指定した被追記画像の内容に近い意味内容の被追記画像に対しても同種の処理を実行することができる。この第5実施形態に係る画像処理装置の構成は、画像処理プログラムPRGに記述された手順の一部を除いて、図1に示した画像処理装置1と同じであるから、その詳細な説明は省略する。
(5) Fifth Embodiment In the fourth embodiment, the layout unit areas that are close to each other are regarded as one added area. On the other hand, in the fifth embodiment, layout unit areas that are determined to have similar semantic contents by using natural language analysis are grouped together, and layout unit areas that belong to the same group are regarded as additional write areas. Is. In this way, it is possible to execute the same type of processing on a postscript image having a semantic content close to the content of the postscript image designated by the postscriptor. The configuration of the image processing apparatus according to the fifth embodiment is the same as that of the image processing apparatus 1 shown in FIG. 1 except for a part of the procedure described in the image processing program PRG. Omitted.

図14は、第5実施形態に係る画像処理プログラムPRGに記述された手順を示すフローチャートである。図14において図5の内容と異なる点は、ステップS5とステップS6の間に、ステップ11〜S14の処理が挿入されているところである。このステップS11〜S14の処理は、具体的には次のようになる。図14において、制御部11は、ステップS5において、図15に示したような閉ループl10の全域或いはほぼ全域が含まれるレイアウト単位領域a10を特定したのち、文字認識を行って(ステップS11)、さらに自然言語解析を行う(ステップS12)。制御部11は、この自然言語解析処理において、各種解析手法(例えば構文解析、意味解析、文脈解析或いは形態素解析など)を用いて、各レイアウト単位領域の内容を解析し、それぞれのレイアウト単位領域のうち意味的に関連するレイアウト単位領域があるか否かを判断する(ステップS13)。   FIG. 14 is a flowchart showing a procedure described in the image processing program PRG according to the fifth embodiment. 14 is different from the content of FIG. 5 in that steps 11 to S14 are inserted between steps S5 and S6. Specifically, the processes in steps S11 to S14 are as follows. 14, in step S5, the control unit 11 specifies a layout unit region a10 including the entire or almost entire closed loop l10 as shown in FIG. 15, and then performs character recognition (step S11). Natural language analysis is performed (step S12). In this natural language analysis process, the control unit 11 analyzes the contents of each layout unit area using various analysis methods (for example, syntax analysis, semantic analysis, context analysis, morphological analysis, etc.), and It is determined whether or not there is a layout unit area that is semantically related (step S13).

そして、関連するレイアウト単位領域があれば(ステップS13;Yes)、制御部11は、ステップS5で特定したレイアウト単位領域a10に、そのレイアウト単位領域a10に関連するレイアウト単位領域(ここではレイアウト単位領域a10’とする)を追加する(ステップS14)。そして、制御部11は、これらのレイアウト単位領域a10,a10’に配置されている画像を被追記画像として抽出する(ステップS6)。制御部11は、抽出した被追記画像を削除する処理を実行する(ステップS7)。
この第5実施形態においても第1実施形態と同様の変形が可能である。また、被追記画像を切り出して保存する場合には、制御部11は、この被追記画像の文字認識結果に対しさらに翻訳処理を施してもよい。
If there is a related layout unit area (step S13; Yes), the control unit 11 adds a layout unit area (here, a layout unit area) related to the layout unit area a10 to the layout unit area a10 specified in step S5. a10 ′) is added (step S14). And the control part 11 extracts the image arrange | positioned in these layout unit area | regions a10 and a10 'as a postscript image (step S6). The control part 11 performs the process which deletes the extracted postscript image (step S7).
The fifth embodiment can be modified in the same way as the first embodiment. In addition, when the image to be added is cut out and stored, the control unit 11 may further perform a translation process on the character recognition result of the image to be added.

本発明の第1実施形態に係る画像処理装置の構成を示したブロック図である。1 is a block diagram illustrating a configuration of an image processing apparatus according to a first embodiment of the present invention. 同実施形態に係る画像処理装置が実行する手順を示すフローチャートである。4 is a flowchart illustrating a procedure executed by the image processing apparatus according to the embodiment. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 本発明の第2実施形態に係る画像処理装置が実行する手順を示すフローチャートである。It is a flowchart which shows the procedure which the image processing apparatus which concerns on 2nd Embodiment of this invention performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 本発明の第3実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on 3rd Embodiment of this invention performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 本発明の第4実施形態に係る画像処理装置が実行する手順を示すフローチャートである。It is a flowchart which shows the procedure which the image processing apparatus which concerns on 4th Embodiment of this invention performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs. 本発明の第5実施形態に係る画像処理装置が実行する手順を示すフローチャートである。It is a flowchart which shows the procedure which the image processing apparatus which concerns on 5th Embodiment of this invention performs. 同実施形態に係る画像処理装置が行う画像処理の過程を説明する図である。It is a figure explaining the process of the image processing which the image processing apparatus which concerns on the same embodiment performs.

符号の説明Explanation of symbols

1、1a…画像処理装置、2…画像読取装置、11…制御部、111…CPU,112…ROM,113…RAM,12…不揮発性記憶部,13…入力部,14…表示部、15・・・操作部、PRG・・・画像処理プログラム。 DESCRIPTION OF SYMBOLS 1, 1a ... Image processing apparatus, 2 ... Image reading apparatus, 11 ... Control part, 111 ... CPU, 112 ... ROM, 113 ... RAM, 12 ... Nonvolatile memory | storage part, 13 ... Input part, 14 ... Display part, 15 * ..Operation unit, PRG: Image processing program.

Claims (16)

画像データが入力される入力手段と、
入力された前記画像データが表す画像から、決められた条件に従って特定される追記画像を抽出する追記画像抽出手段と、
抽出された前記追記画像と所定の位置関係を有する画像領域を被追記領域として特定する領域特定手段と、
特定された前記被追記領域に配置されている画像を被追記画像として抽出する被追記画像抽出手段と、
抽出された被追記画像に対して指定された処理を行う処理手段と
を備えた画像処理装置。
An input means for inputting image data;
A recordable image extracting means for extracting a recordable image specified according to a predetermined condition from the image represented by the input image data;
Area specifying means for specifying an image area having a predetermined positional relationship with the extracted postscript image as a postscript area;
A postscript image extraction means for extracting an image arranged in the specified postscript area as a postscript image;
An image processing apparatus comprising: processing means for performing specified processing on the extracted postscript image.
前記追記画像抽出手段によって抽出された追記画像が線を表した画像であり、その線に途切れた箇所がある場合には、その途切れた箇所を線で補完する補完手段を備え、
前記領域特定手段は、前記補完手段によって補完された追記画像と所定の位置関係を有する被追記領域を特定する請求項1記載の画像処理装置。
The additional image extracted by the additional image extraction means is an image representing a line, and if there is a discontinuity in the line, the supplement image includes a complement means for complementing the discontinuity with a line,
The image processing apparatus according to claim 1, wherein the region specifying unit specifies a postscript region having a predetermined positional relationship with the postscript image supplemented by the complementing unit.
前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合には、前記領域特定手段は、前記追記画像が表すループによって囲まれた画像領域を前記被追記領域として特定する請求項1記載の画像処理装置。   When the additional image extracted by the additional image extraction unit is an image representing a closed loop, the region specifying unit specifies an image region surrounded by the loop represented by the additional image as the additional region. The image processing apparatus according to claim 1. 入力された前記画像データが表す画像に対して、または、当該画像から前記追記画像が除去された画像に対して、レイアウト解析を行って該画像を複数のレイアウト単位領域に分割するレイアウト解析手段を備え、
前記領域特定手段は、前記レイアウト解析手段によって分割されたレイアウト単位領域のうち、前記追記画像抽出手段によって抽出された前記追記画像と所定の位置関係を有するレイアウト単位領域を前記被追記領域として特定する請求項1記載の画像処理装置。
Layout analysis means for performing layout analysis on an image represented by the input image data or an image obtained by removing the additional image from the image and dividing the image into a plurality of layout unit areas; Prepared,
The region specifying unit specifies a layout unit region having a predetermined positional relationship with the additional image extracted by the additional image extracting unit as the additional region, out of the layout unit regions divided by the layout analysis unit. The image processing apparatus according to claim 1.
前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合に、前記領域特定手段は、前記追記画像が表すループによってほぼ全域が囲まれた前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。   When the additional image extracted by the additional image extraction unit is an image representing a closed loop, the area specifying unit includes the layout unit region substantially surrounded by the loop represented by the additional image. The image processing apparatus according to claim 4, wherein the image processing apparatus is specified as an additional recording area. 前記追記画像抽出手段によって抽出された追記画像が閉じたループを表した画像である場合に、前記領域特定手段は、前記追記画像が表すループが存在するかまたは当該ループによって包含される全ての前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。   When the additional image extracted by the additional image extraction unit is an image representing a closed loop, the region specifying unit includes the loop represented by the additional image or all of the above-described loops included in the loop. The image processing apparatus according to claim 4, wherein a layout unit area is specified as the additional recording area. 前記追記画像抽出手段によって抽出された追記画像に外接する外接矩形を生成する外接矩形生成手段を備え、
前記領域特定手段は、前記外接矩形によってほぼ全域が囲まれた前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。
A circumscribed rectangle generating unit that generates a circumscribed rectangle circumscribing the additional image extracted by the additional image extracting unit;
The image processing apparatus according to claim 4, wherein the area specifying unit specifies the layout unit area surrounded almost entirely by the circumscribed rectangle as the area to be added.
前記追記画像抽出手段によって抽出された追記画像に外接する外接矩形を生成する外接矩形生成手段を備え、
前記領域特定手段は、前記外接矩形が存在するかまたは当該外接矩形によって包含される全ての前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。
A circumscribed rectangle generating unit that generates a circumscribed rectangle circumscribing the additional image extracted by the additional image extracting unit;
The image processing apparatus according to claim 4, wherein the area specifying unit specifies all the layout unit areas that include the circumscribed rectangle or are included in the circumscribed rectangle as the additional recording area.
前記領域特定手段は、前記追記画像抽出手段によって抽出された追記画像のほぼ全域が存在する前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。   The image processing apparatus according to claim 4, wherein the area specifying unit specifies the layout unit area in which almost the entire area of the additional image extracted by the additional image extraction unit exists as the additional recording area. 前記領域特定手段は、前記追記画像抽出手段によって抽出された追記画像の少なくとも一部が存在する全ての前記レイアウト単位領域を前記被追記領域として特定する請求項4記載の画像処理装置。   The image processing apparatus according to claim 4, wherein the area specifying unit specifies all the layout unit areas in which at least a part of the additional image extracted by the additional image extraction unit exists as the additional area. 前記領域特定手段は、前記追記画像と所定の位置関係を有するレイアウト単位領域に加えて、当該レイアウト単位領域に隣接するレイアウト単位領域を前記被追記領域として特定する請求項5〜10のいずれか1項に記載の画像処理装置。   The area specifying unit specifies a layout unit area adjacent to the layout unit area as the additional recording area in addition to the layout unit area having a predetermined positional relationship with the additional recording image. The image processing apparatus according to item. 前記レイアウト単位領域に含まれる文字列に対し文字認識を行う文字認識手段と、
前記文字認識手段による認識結果に対して自然言語解析を行う自然言語解析手段と、
前記自然言語解析手段による解析結果に基づいて、関連のあるレイアウト単位領域どうしをグループ化するグルーピング手段とを備え、
前記領域特定手段は、前記追記画像と所定の位置関係を有するレイアウト単位領域に加えて、前記グルーピング手段によって当該レイアウト単位領域と同じグループに属するとされたレイアウト単位領域を前記被追記領域として特定する請求項5〜10のいずれか1項に記載の画像処理装置。
Character recognition means for performing character recognition on a character string included in the layout unit region;
Natural language analysis means for performing natural language analysis on the recognition result by the character recognition means;
Grouping means for grouping related layout unit areas based on the analysis result by the natural language analysis means,
The area specifying unit specifies a layout unit area that belongs to the same group as the layout unit area by the grouping unit as the additional recording area in addition to the layout unit area having a predetermined positional relationship with the additional image. The image processing apparatus according to claim 5.
前記処理手段は、抽出された被追記画像に対して、当該被追記画像の抽出処理、削除ないしマスク処理、他の画像との置換処理、文字認識処理、または当該文字認識の結果に対する翻訳処理のうち、少なくともいずれか1つの処理を行う請求項1記載の画像処理装置。   The processing means performs extraction processing of the postscript image, deletion or mask processing, replacement processing with another image, character recognition processing, or translation processing for the result of the character recognition on the extracted postscript image. The image processing apparatus according to claim 1, wherein at least one of the processes is performed. 前記追記画像の色を識別する色識別手段と、
前記追記画像の色と処理の内容とを対応付けて記憶した記憶手段とを備え、
前記処理手段は、抽出された前記被追記画像に対し、当該被追記画像と所定の位置関係を有する前記追記画像の色に対応付けて前記記憶手段に記憶されている内容の処理を行う請求項1記載の画像処理装置。
Color identifying means for identifying the color of the additional image;
Storage means for storing the color of the additional image and the content of the processing in association with each other,
The processing means performs processing of contents stored in the storage means in association with a color of the additional image having a predetermined positional relationship with the additional image, on the extracted additional image. The image processing apparatus according to 1.
前記追記画像の形状を識別する形状識別手段と、
前記追記画像の形状と処理の内容とを対応付けて記憶した記憶手段とを備え、
前記処理手段は、抽出された前記被追記画像に対し、当該被追記画像と所定の位置関係を有する前記追記画像の形状に対応付けて前記記憶手段に記憶されている内容の処理を行う請求項1記載の画像処理装置。
Shape identifying means for identifying the shape of the additional image;
Storage means for storing the shape of the additional image and the content of the processing in association with each other,
The processing means performs processing of the content stored in the storage means in association with the shape of the additional image having a predetermined positional relationship with the additional image on the extracted additional image. The image processing apparatus according to 1.
コンピュータに、
入力された前記画像データが表す画像から、決められた条件に従って特定される追記画像を抽出する追記画像抽出機能と、
抽出された前記追記画像と所定の位置関係を有する画像領域を被追記領域として特定する領域特定機能と、
特定された前記被追記領域に配置されている画像を被追記画像として抽出する被追記画像抽出機能と、
抽出された被追記画像に対して指定された処理を行う処理機能と
を実現させるためのプログラム。
On the computer,
A recordable image extraction function for extracting a recordable image specified according to a predetermined condition from an image represented by the input image data;
An area specifying function for specifying an image area having a predetermined positional relationship with the extracted postscript image as a postscript area;
A postscript image extraction function for extracting an image arranged in the specified postscript area as a postscript image;
A program for realizing a processing function for performing a specified process on the extracted postscript image.
JP2004320493A 2004-11-04 2004-11-04 Image processing apparatus and program Expired - Fee Related JP4517818B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004320493A JP4517818B2 (en) 2004-11-04 2004-11-04 Image processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004320493A JP4517818B2 (en) 2004-11-04 2004-11-04 Image processing apparatus and program

Publications (2)

Publication Number Publication Date
JP2006133960A true JP2006133960A (en) 2006-05-25
JP4517818B2 JP4517818B2 (en) 2010-08-04

Family

ID=36727473

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004320493A Expired - Fee Related JP4517818B2 (en) 2004-11-04 2004-11-04 Image processing apparatus and program

Country Status (1)

Country Link
JP (1) JP4517818B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074425A (en) * 2008-09-17 2010-04-02 Ricoh Co Ltd Image processing apparatus, program, and image processing method
WO2013021879A1 (en) * 2011-08-11 2013-02-14 シャープ株式会社 Information processing device, screen display method, control program and recording medium
WO2013021878A1 (en) * 2011-08-11 2013-02-14 シャープ株式会社 Information processing device, operating screen display method, control program and recording medium
CN103198310A (en) * 2012-01-06 2013-07-10 富士施乐株式会社 Image processing apparatus and image processing method
KR20130081193A (en) 2012-01-06 2013-07-16 후지제롯쿠스 가부시끼가이샤 Image processing apparatus and method, designated mark estimation apparatus and method, and storage medium
JP2014075042A (en) * 2012-10-04 2014-04-24 Dainippon Printing Co Ltd Transcription system and transcription program for written document for medical purpose
US8797617B2 (en) 2011-12-27 2014-08-05 Fuji Xerox Co., Ltd. Image estimation apparatus, image processing apparatus and computer readable medium

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1141452A (en) * 1997-07-23 1999-02-12 Minolta Co Ltd Image forming device
JP2002366928A (en) * 2001-06-05 2002-12-20 Minolta Co Ltd System, device, method and program for processing image and recording medium recorded with the image processing program
JP2004272822A (en) * 2003-03-12 2004-09-30 Seiko Epson Corp Character recognition device, character recognition means and computer program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1141452A (en) * 1997-07-23 1999-02-12 Minolta Co Ltd Image forming device
JP2002366928A (en) * 2001-06-05 2002-12-20 Minolta Co Ltd System, device, method and program for processing image and recording medium recorded with the image processing program
JP2004272822A (en) * 2003-03-12 2004-09-30 Seiko Epson Corp Character recognition device, character recognition means and computer program

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010074425A (en) * 2008-09-17 2010-04-02 Ricoh Co Ltd Image processing apparatus, program, and image processing method
WO2013021879A1 (en) * 2011-08-11 2013-02-14 シャープ株式会社 Information processing device, screen display method, control program and recording medium
WO2013021878A1 (en) * 2011-08-11 2013-02-14 シャープ株式会社 Information processing device, operating screen display method, control program and recording medium
JP2013041333A (en) * 2011-08-11 2013-02-28 Sharp Corp Information processing device, screen display method, control program and recording medium
JP2013041332A (en) * 2011-08-11 2013-02-28 Sharp Corp Information processing device, operation screen display method, control program and recording medium
US8797617B2 (en) 2011-12-27 2014-08-05 Fuji Xerox Co., Ltd. Image estimation apparatus, image processing apparatus and computer readable medium
CN103198310A (en) * 2012-01-06 2013-07-10 富士施乐株式会社 Image processing apparatus and image processing method
KR20130081193A (en) 2012-01-06 2013-07-16 후지제롯쿠스 가부시끼가이샤 Image processing apparatus and method, designated mark estimation apparatus and method, and storage medium
JP2013143595A (en) * 2012-01-06 2013-07-22 Fuji Xerox Co Ltd Image processing device and program
US9098946B2 (en) 2012-01-06 2015-08-04 Fuji Xerox Co., Ltd Image processing apparatus and method, specifying mark estimating apparatus and method, and non-transitory computer readable medium
CN103198310B (en) * 2012-01-06 2018-06-01 富士施乐株式会社 Image processing apparatus and image processing method
JP2014075042A (en) * 2012-10-04 2014-04-24 Dainippon Printing Co Ltd Transcription system and transcription program for written document for medical purpose

Also Published As

Publication number Publication date
JP4517818B2 (en) 2010-08-04

Similar Documents

Publication Publication Date Title
US7555711B2 (en) Generating a text layout boundary from a text block in an electronic document
KR101334483B1 (en) Apparatus and method for digitizing a document, and computer-readable recording medium
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
US8952985B2 (en) Digital comic editor, method and non-transitory computer-readable medium
JPH11328380A (en) Image processor, method for image processing and computer-readable recording medium where program allowing computer to implement same method is recorded
US20130104016A1 (en) Digital comic editor, method and non-transitory computer-readable medium
JP2003230001A (en) Apparatus for embedding electronic watermark to document, apparatus for extracting electronic watermark from document, and control method therefor
JP2008146605A (en) Image processor and its control method
JP2010009509A (en) Image processor, image processing method, program thereof, and storage medium
US8447143B2 (en) Image processing apparatus and storage medium storing image processing program
JP5149690B2 (en) Image processing apparatus, image processing method, and image processing program
JP2006301695A (en) Document processing device and program
JP4517818B2 (en) Image processing apparatus and program
JP2007109179A (en) Image processing apparatus, its control method, and program
JP5950700B2 (en) Image processing apparatus, image processing method, and program
JP2006065477A (en) Character recognition device
JP2008108114A (en) Document processor and document processing method
JP2008282149A (en) Image processor, image processing method and image processing program
JP5096989B2 (en) Document processing apparatus and document processing method
CN101118479A (en) File editing system and editing method
JP2006135664A (en) Picture processor and program
JP4518212B2 (en) Image processing apparatus and program
JP2007241355A (en) Image processor and image processing program
JP4517822B2 (en) Image processing apparatus and program
JP4517821B2 (en) Image processing apparatus and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090904

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4517818

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees