JP2009075879A - Image processor, image processing method, and program - Google Patents

Image processor, image processing method, and program Download PDF

Info

Publication number
JP2009075879A
JP2009075879A JP2007244353A JP2007244353A JP2009075879A JP 2009075879 A JP2009075879 A JP 2009075879A JP 2007244353 A JP2007244353 A JP 2007244353A JP 2007244353 A JP2007244353 A JP 2007244353A JP 2009075879 A JP2009075879 A JP 2009075879A
Authority
JP
Japan
Prior art keywords
image
image data
page
data
electronic document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007244353A
Other languages
Japanese (ja)
Inventor
Yuichiro Sakuta
雄一郎 作田
Masaki Tasaka
政樹 田坂
Hirohisa Saito
浩久 斉藤
Seiji Takahashi
征司 高橋
Hiroshi Ota
広志 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007244353A priority Critical patent/JP2009075879A/en
Publication of JP2009075879A publication Critical patent/JP2009075879A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To easily grasp the configurations of an electronic document, and to perform edition for every image region or character region in the page of the document. <P>SOLUTION: A region extraction part 11 extracts an image region including an image and the image data of a character region including a character string from the page image data of electronic document data, and a registration part 13 registers the electronic document data and the page image data of the electronic document data and the region image data extracted by the region extraction part 11 about the page image data in a storage part 14 by associating them one another, and a retrieval display part 2 displays a document structure configured of the page configuration of the electronic document data and the region image data in a page on the basis of the data registered in the storage part 14 at a display part 20. A request control part 21 performs edition to the region image data, and performs rewriting for reflecting the edition content on the electronic document data of the storage part 14 through a retrieval part 22. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

この発明は、コンピュータを含む画像処理装置と画像処理方法とプログラムに関する。   The present invention relates to an image processing apparatus including a computer, an image processing method, and a program.

コンピュータの急速な普及に伴って、従来は紙をファイリングすることによって保存していた文書を、電子化された情報として保存することが一般的となってきている。
従来、図、表、写真等の画像および文字列が混在した文書から画像を含む画像領域および文字列を含む文字領域を認識して領域抽出し、抽出した画像を検索対象として格納し、抽出した文字を検索用テキストとして用いて、格納した画像を容易に検索できるようにした情報処理装置(例えば、特許文献1参照)があった。
このような情報処理装置では、電子化された大量の情報の中から必要な情報が検索できる。
特開平11−25113号公報
With the rapid spread of computers, it has become common to store documents previously stored by filing paper as computerized information.
Conventionally, an image region including an image and a character region including a character string are recognized and extracted from a document in which images and character strings such as diagrams, tables, and photographs are mixed, and the extracted image is stored and extracted as a search target. There has been an information processing apparatus (see, for example, Patent Document 1) in which a stored image can be easily searched using characters as search text.
In such an information processing apparatus, necessary information can be searched from a large amount of information digitized.
Japanese Patent Laid-Open No. 11-25113

しかしながら、上述のような従来の情報処理装置では、電子化するのは文書のみならず、文書を構成する個々の画像やテキストも電子化された情報として保存されることになるが、ユーザには電子化された文書や画像がどのような構成で保存されているのかを確認する手段がなく、文書の管理が困難であるという問題があった。
また、抽出された画像自体を操作する手段が提供されていない為、再利用性に乏しいものであるという問題もあった。
この発明は上記の点に鑑みてなされたものであり、電子化された文書の構成を容易に把握することができ、かつ、文書のページ内の画像領域又は文字領域毎に編集できるようにして文書管理性と再利用性を向上させることを目的とする
However, in the conventional information processing apparatus as described above, not only the document but also individual images and texts constituting the document are stored as digitized information. There has been a problem that it is difficult to manage documents because there is no means for confirming in what configuration electronic documents and images are stored.
Further, since no means for operating the extracted image itself is provided, there is a problem that the reusability is poor.
The present invention has been made in view of the above points, and can easily comprehend the structure of a digitized document and can edit it for each image area or character area in the page of the document. The purpose is to improve document management and reusability

この発明は上記の目的を達成するため、次の画像処理装置と画像処理方法とプログラムを提供する。
(1)電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出手段と、上記電子文書データと上記電子文書データのページ画像データとそのページ画像データについて上記抽出手段によって抽出した画像データをそれぞれ関連付けて登録する登録手段と、その登録手段によって登録されたデータに基づいて上記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示手段を備えた画像処理装置において、上記画像データに編集を加える編集手段と、その編集手段によって編集された後の画像データを上記電子文書データのページ画像データと関連付けるか否かを選択する選択手段と、その選択手段によって関連付けると選択されたとき、上記電子文書データのページ画像データに関連付けられている画像データに代えて、上記編集手段によって編集された後の画像データを上記電子文書データのページ画像データと関連付ける手段を設けた画像処理装置。
In order to achieve the above object, the present invention provides the following image processing apparatus, image processing method and program.
(1) Extraction means for respectively extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, the electronic document data, and the page of the electronic document data Registration means for associating and registering image data and image data extracted by the extraction means for the page image data, and a page configuration of the electronic document data and an image area in the page based on the data registered by the registration means In an image processing apparatus comprising a display means for displaying a document structure consisting of an area structure of a character area and an edit means for editing the image data, the image data edited by the edit means is converted into the electronic data Selecting means for selecting whether or not to associate the page data of the document data with the selecting means; Means for associating the image data edited by the editing means with the page image data of the electronic document data instead of the image data associated with the page image data of the electronic document data. An image processing apparatus.

(2)上記のような画像処理装置において、上記編集手段は、上記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える手段であり、上記指定された他の画像データの画像の大きさが上記登録されている画像データの画像の大きさと異なる場合、上記指定された他の画像データの画像の大きさを、上記登録されている画像データの画像の大きさに合せる調整手段を設けた画像処理装置。 (2) In the image processing apparatus as described above, the editing unit performs editing for replacing the image data registered in association with the page image data of the electronic document data with other designated image data. If the image size of the specified other image data is different from the image size of the registered image data, the size of the image of the specified other image data is An image processing apparatus provided with adjusting means for matching the size of the image data.

(3)上記のような画像処理装置において、上記編集手段は、上記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える手段である画像処理装置。
(4)上記のような画像処理装置において、上記編集手段は、上記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える手段である画像処理装置。
(3) In the image processing apparatus as described above, the editing unit adds a plurality of pieces of image data registered in association with the page image data of the electronic document data to add editing into one image data. An image processing apparatus.
(4) In the image processing apparatus as described above, the editing means is an image processing means for performing editing for dividing image data registered in association with page image data of the electronic document data into a plurality of image data. apparatus.

(5)上記のような画像処理装置において、上記編集手段は、上記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える手段である画像処理装置。
(6)上記のような画像処理装置において、上記編集手段は、上記ページ画像データに関連付けて登録されている画像データを削除する編集を加える手段である画像処理装置。
(5) In the image processing apparatus as described above, the editing means is means for adding editing for adding new image data to a designated position in the page image data.
(6) In the image processing apparatus as described above, the editing means is means for adding editing for deleting image data registered in association with the page image data.

(7)電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出工程と、上記電子文書データと上記電子文書データのページ画像データとそのページ画像データについて上記抽出工程によって抽出した画像データをそれぞれ関連付けて登録する登録工程と、その登録工程によって登録されたデータに基づいて上記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示工程とからなる画像処理方法において、上記画像データに編集を加える編集工程と、その編集工程によって編集された後の画像データを上記電子文書データのページ画像データと関連付けるか否かを選択する選択工程と、その選択工程によって関連付けると選択されたとき、上記電子文書データのページ画像データに関連付けられている画像データに代えて、上記編集工程によって編集された後の画像データを上記電子文書データのページ画像データと関連付ける工程を設けた画像処理方法。 (7) An extraction process for extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, and the electronic document data and the page of the electronic document data A registration step for registering the image data and the image data extracted by the extraction step in association with each other, and a page configuration of the electronic document data and an image area in the page based on the data registered by the registration step An image processing method comprising: a display step for displaying a document structure comprising a region structure of a character region and a character region; an editing step for editing the image data; and the image data edited by the editing step for the electronic data A selection process for selecting whether or not to associate with page image data of document data, and the selection process In this case, instead of the image data associated with the page image data of the electronic document data, the image data edited by the editing step is associated with the page image data of the electronic document data. An image processing method provided with a process.

(8)上記のような画像処理方法において、上記編集工程は、上記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える工程であり、上記指定された他の画像データの画像の大きさが上記登録されている画像データの画像の大きさと異なる場合、上記指定された他の画像データの画像の大きさを、上記登録されている画像データの画像の大きさに合せる調整工程を設けた画像処理方法。 (8) In the image processing method as described above, the editing step includes a step of performing editing for replacing the image data registered in association with the page image data of the electronic document data with other designated image data. If the image size of the specified other image data is different from the image size of the registered image data, the size of the image of the specified other image data is An image processing method provided with an adjusting step for matching the size of the image data.

(9)上記のような画像処理方法において、上記編集工程は、上記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える工程である画像処理方法。
(10)上記のような画像処理方法において、上記編集工程は、上記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える工程である画像処理方法。
(9) In the image processing method as described above, the editing step is a step of adding a plurality of image data registered in association with the page image data of the electronic document data to make one image data. An image processing method.
(10) In the image processing method as described above, the editing step is an image processing in which editing is performed to divide image data registered in association with page image data of the electronic document data into a plurality of image data. Method.

(11)上記のような画像処理方法において、上記編集工程は、上記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える工程である画像処理方法。
(12)上記のような画像処理方法において、上記編集工程は、上記ページ画像データに関連付けて登録されている画像データを削除する編集を加える工程である画像処理方法。
(11) In the image processing method as described above, the editing step is a step of adding an edit for adding new image data to a designated position in the page image data.
(12) In the image processing method as described above, the editing step is a step of adding an edit for deleting image data registered in association with the page image data.

(13)コンピュータに、電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出手順と、上記電子文書データと上記電子文書データのページ画像データとそのページ画像データについて上記抽出手順によって抽出した画像データをそれぞれ関連付けて登録する登録手順と、その登録手順によって登録されたデータに基づいて上記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示手順を実行させるためのプログラムにおいて、上記画像データに編集を加える編集手順と、その編集手順によって編集された後の画像データを上記電子文書データのページ画像データと関連付けるか否かを選択する選択手順と、その選択手順によって関連付けると選択されたとき、上記電子文書データのページ画像データに関連付けられている画像データに代えて、上記編集手順によって編集された後の画像データを上記電子文書データのページ画像データと関連付ける手順を実行させるためのプログラム。 (13) An extraction procedure for extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, and the electronic document data and the electronic document. A registration procedure for registering the page image data of the data and the image data extracted by the extraction procedure in association with each other, and the page configuration and the page of the electronic document data based on the data registered by the registration procedure In a program for executing a display procedure for displaying a document structure composed of an image area and a character area, an editing procedure for editing the image data, and image data edited by the editing procedure To select whether or not to associate with the page image data of the electronic document data. When it is selected that the procedure is associated with the selection procedure, the image data edited by the editing procedure is replaced with the image data of the electronic document data instead of the image data associated with the page image data of the electronic document data. A program for executing a procedure associated with page image data.

(14)上記のようなプログラムにおいて、上記編集手順は、上記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える手順であり、上記指定された他の画像データの画像の大きさが上記登録されている画像データの画像の大きさと異なる場合、上記指定された他の画像データの画像の大きさを、上記登録されている画像データの画像の大きさに合せる調整手順を実行させるためのプログラム。 (14) In the program as described above, the editing procedure is a procedure for adding editing to replace the image data registered in association with the page image data of the electronic document data with other designated image data. If the image size of the specified other image data is different from the image size of the registered image data, the size of the image of the specified other image data is registered. A program for executing an adjustment procedure that matches the image size of the image data.

(15)上記のようなプログラムにおいて、上記編集手順は、上記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える手順であるプログラム。
(16)上記のようなプログラムにおいて、上記編集手順は、上記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える手順であるプログラム。
(15) In the program as described above, the editing procedure is a procedure for adding a plurality of image data registered in association with the page image data of the electronic document data to make one image data. program.
(16) In the program as described above, the editing procedure is a procedure for performing editing for dividing image data registered in association with page image data of the electronic document data into a plurality of image data.

(17)上記のようなプログラムにおいて、上記編集手順は、上記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える手順であるプログラム。
(18)上記のようなプログラムにおいて、上記編集手順は、上記ページ画像データに関連付けて登録されている画像データを削除する編集を加える手順であるプログラム。
(17) In the program as described above, the editing procedure is a procedure for adding editing for adding new image data to a designated position in the page image data.
(18) In the program as described above, the editing procedure is a procedure for adding editing for deleting image data registered in association with the page image data.

この発明による画像処理装置と画像処理方法は、電子化された文書の構成を容易に把握することができ、かつ、文書のページ内の画像領域又は文字領域毎に編集できるようにして文書管理性と再利用性を向上させることができる。
また、この発明によるプログラムは、コンピュータに、電子化された文書の構成を容易に把握することができ、かつ、文書のページ内の画像領域又は文字領域毎に編集できるようにして文書管理性と再利用性を向上させることができるようにするための機能を実現させることができる。
The image processing apparatus and the image processing method according to the present invention can easily grasp the configuration of a digitized document and can edit each image area or character area in the page of the document so as to manage the document. And reusability can be improved.
In addition, the program according to the present invention allows the computer to easily grasp the configuration of the digitized document and edit it for each image area or character area in the document page. A function for enabling reusability to be improved can be realized.

以下、この発明を実施するための最良の形態を図面に基づいて具体的に説明する。
〔実施例〕
図1は、この発明の実施例の画像処理装置の機能構成を示すブロック図である。
この画像処理装置は、パーソナルコンピュータを含む情報処理装置全般であり、文書から図、表、テキストを画像として抽出すると共に、抽出した画像を抽出元のページに関連づけ、その文書構造を表示するものである。
なお、上記抽出された画像のことを領域画像と定義することにする。
Hereinafter, the best mode for carrying out the present invention will be specifically described with reference to the drawings.
〔Example〕
FIG. 1 is a block diagram showing a functional configuration of an image processing apparatus according to an embodiment of the present invention.
This image processing apparatus is a general information processing apparatus including a personal computer, and extracts a figure, a table, and a text from a document as an image, associates the extracted image with an extraction source page, and displays the document structure. is there.
The extracted image is defined as a region image.

この画像処理装置は、登録処理部1と検索表示部2からなる。
登録処理部1は、紙文書を光学的に読み取って、電子化された電子文書データを得るための文書入力部10と、電子文書データのページ画像データから図、表の画像を含む画像領域の画像データと、文字列(テキスト)を含む文字領域の画像データとをそれぞれ抽出する領域抽出部11と、画像領域の画像データと文字領域の画像データ中の本文やキャプションについて文字認識し、その認識したテキストを抽出するテキスト抽出部12と、領域抽出部11で抽出された画像データにそれぞれテキスト抽出部12で抽出されたテキストを関連付け、更に、抽出元のページ画像データを関連付けて記憶装置である格納部14に登録する登録部13から構成される。
This image processing apparatus includes a registration processing unit 1 and a search display unit 2.
The registration processing unit 1 optically reads a paper document to obtain digitized electronic document data, and an image area including images of diagrams and tables from page image data of the electronic document data. An area extraction unit 11 that extracts image data and image data of a character area including a character string (text), respectively, recognizes characters about the image data of the image area and the text and captions in the image data of the character area, and recognizes the recognition The text extraction unit 12 that extracts the text and the image data extracted by the region extraction unit 11 are associated with the text extracted by the text extraction unit 12, and the page image data of the extraction source is further associated with the storage device. The registration unit 13 is registered in the storage unit 14.

上記登録部13によって登録されるデータの詳細は後述する。
なお、登録処理部1は、スキャナで読み取った文書をはじめ、ワープロソフトで作成した文書や、SGML、HTML、XMLを含む構造化文書等、いかなる形式の文書についても扱うことができるものである。
一方、検索表示部2は、ユーザインタフェース部であるLCDを含む表示部20と、図示を省略した入力装置からのユーザの要求受付から応答までの一連のフローを制御する要求制御部21と、指定されたキーワードに従い格納部14から画像,テキストの検索を行う検索部22と、その検索結果に基づいて表示用データを生成し、表示部20へ送信する表示情報生成部23から構成される。
Details of the data registered by the registration unit 13 will be described later.
The registration processing unit 1 can handle documents of any format such as a document read by a scanner, a document created by word processing software, and a structured document including SGML, HTML, and XML.
On the other hand, the search display unit 2 includes a display unit 20 including an LCD as a user interface unit, a request control unit 21 that controls a series of flow from user request reception to response from an input device (not shown), and designation. The search unit 22 is configured to search for images and text from the storage unit 14 according to the keyword, and the display information generation unit 23 is configured to generate display data based on the search result and transmit the display data to the display unit 20.

[格納部に登録されたデータの説明]
図2乃至図4は、図1に示した登録部13によって格納部14へ登録される情報の詳しい説明図である。
格納部14に登録される情報は、格納される文書データそのものである電子文書データ30と、それに付随する電子文書メタデータ31と(以上、図2に示す)、電子文書データを構成するページ画像データ32と、それに付随するページ画像メタデータ33と(以上、図3に示す)、電子文書データを構成する各ページ画像データから抽出された画像を含む画像領域又は文字列を含む文字領域の画像データである領域画像データ34と、それに付随する領域画像メタデータ35(以上、図4に示す)がそれぞれ関連付けられて格納される。
[Description of data registered in the storage unit]
2 to 4 are detailed explanatory diagrams of information registered in the storage unit 14 by the registration unit 13 illustrated in FIG.
The information registered in the storage unit 14 includes electronic document data 30 that is stored document data itself, electronic document metadata 31 accompanying the electronic document data 31 (shown in FIG. 2), and page images constituting the electronic document data. Data 32, page image metadata 33 accompanying it (shown above in FIG. 3), and an image of a character region including an image region or character string including an image extracted from each page image data constituting electronic document data The area image data 34, which is data, and the area image metadata 35 (shown in FIG. 4) associated therewith are stored in association with each other.

まず、上記電子文書メタデータ31は、電子文書データを一意に特定する為の電子文書IDと、電子文書データの格納部14における登録場所を示す保管場所、電子文書データが何ページから構成される文書であるかを示すページ数の各データからなる。
次に、上記ページ画像メタデータ33は、ページ画像データを一意に特定する為のページID、ページ画像データの領域を特定する為の座標情報、ページ画像データが含まれる電子文書データを特定する為の所属情報、ページ画像データから抽出された画像領域又は文字領域の画像データを特定する為の領域画像情報の各データからなる。
上記座標情報を、例えば、(x0,y0,x1,y1)とした場合、ページ画像データ中に設定された原点に対して、x0は画像左上のX座標、y0は画像左上のY座標、x1は画像右下のX座標、y1は画像右下のY座標を意味し、ページ画像メタデータの場合、x0,y0は常に0が設定される。
First, the electronic document metadata 31 includes an electronic document ID for uniquely identifying electronic document data, a storage location indicating a registration location in the storage unit 14 for electronic document data, and how many pages of electronic document data are included. It consists of each data of the number of pages indicating whether it is a document.
Next, the page image metadata 33 specifies a page ID for uniquely specifying page image data, coordinate information for specifying an area of the page image data, and electronic document data including page image data. Data of area image information for specifying image data of image areas or character areas extracted from page image data.
When the coordinate information is, for example, (x0, y0, x1, y1), x0 is the X coordinate at the upper left of the image, y0 is the Y coordinate at the upper left of the image, and x1 with respect to the origin set in the page image data. Represents the X coordinate at the lower right of the image, and y1 represents the Y coordinate at the lower right of the image. In the case of page image metadata, x0 and y0 are always set to 0.

次に、領域画像メタデータ35は、画像領域又は文字領域の画像データ(領域画像データ)を一意に特定する為の領域画像ID(画像領域の画像データについては画像領域画像IDに相当し、文字領域の画像データについては文字領域画像IDに相当する)と、領域画像データの格納部14における登録場所を示す保管場所、領域画像データの種別を示す画像タイプ(画像の種別として少なくともテキスト、表、図に分類するデータ)と、領域画像データがどの電子文書データのどのページ画像データと関連があるかを特定する為の所属情報と、領域画像データのページ中の領域を特定する為の座標情報と、領域画像データから抽出された文字列情報であるキーテキストと、キーテキストの中で更にリンク情報として認識されたハイパーリンクの各データからなる。   Next, the area image metadata 35 corresponds to an area image ID for uniquely specifying image data (area image data) of an image area or character area (corresponding to an image area image ID for image data of an image area). The image data of the area corresponds to the character area image ID), the storage location indicating the registration location in the storage unit 14 of the area image data, and the image type indicating the type of the area image data (at least text, table, Data to be classified into the figure), affiliation information for specifying which page image data of which electronic document data the area image data is related to, and coordinate information for specifying the area in the page of the area image data Key text that is character string information extracted from the area image data, and hyperlink recognized as link information in the key text. Each consisting of data.

[表示例の説明]
次に、図5乃至図7を用いて電子文書の文書構造を表示する画面例について説明する。
まず、図5は、ユーザが検索表示部2を介し、格納部14に保管されている電子文書の一覧を表示した際の画面例である。
この画面により、ユーザは格納部14に保管されている電子文書の一覧を参照することができる。
ここで表示されるサムネイル画像は、その電子文書を構成するページ一覧画面へのリンクとなっており、ユーザがサムネイル画像をクリックすることでページ一覧画面が表示される。
[Explanation of display examples]
Next, an example of a screen for displaying the document structure of the electronic document will be described with reference to FIGS.
First, FIG. 5 is a screen example when the user displays a list of electronic documents stored in the storage unit 14 via the search display unit 2.
With this screen, the user can refer to a list of electronic documents stored in the storage unit 14.
The thumbnail image displayed here is a link to a page list screen constituting the electronic document, and the page list screen is displayed when the user clicks on the thumbnail image.

例えば、図5の電子文書のサムネイル画像40をクリックすると、図6に示すように、ページ一覧画面が表示される。
このページ一覧画面には、矢示41のように、電子文書の各ページ毎のページ画像が一覧表示される。
この時、画面中の表示対象欄42でページが指定されている為、電子文書の各ページ画像が一覧表示される。
ここで、画面中の表示対象欄42で文書ツリーを指定すると、図7に示すようなページ一覧画面が表示され、矢示43のように、電子文書とその電子文書の各ページ毎のページ画像と、各ページ画像毎にページ中の領域画像とがツリー形式で表示される。
For example, when the thumbnail image 40 of the electronic document in FIG. 5 is clicked, a page list screen is displayed as shown in FIG.
On this page list screen, as indicated by arrow 41, a list of page images for each page of the electronic document is displayed.
At this time, since a page is designated in the display target column 42 on the screen, each page image of the electronic document is displayed in a list.
Here, when a document tree is designated in the display target field 42 in the screen, a page list screen as shown in FIG. 7 is displayed, and as shown by an arrow 43, a page image for each page of the electronic document and the electronic document. And the area image in the page is displayed in a tree format for each page image.

[ツリー形式の表示例の説明]
図7に示したように、電子文書の文書構造を示すツリー形式は3段構成になっており、図中の左から電子文書、その電子文書データの各ページ画像、各ページ毎の領域画像のそれぞれのサムネイルとメタデータが表示される。
ここでは、電子文書として文書の先頭ページの画像を表示しているが、ページ画像の1ページ目と重複する為、文書であることを意味するアイコンや別画像を表示してもよい。
また、メタデータとして、ここでは図2に示したメタデータの一部を表示しているが、全メタデータを表示してもよい。
さらに、ユーザによってメタデータが追加されることがあればそれを表示してもよい。
[Description of display example in tree format]
As shown in FIG. 7, the tree format indicating the document structure of the electronic document has a three-stage structure. From the left in the figure, the electronic document, each page image of the electronic document data, and the region image for each page are displayed. Each thumbnail and metadata is displayed.
Here, the image of the first page of the document is displayed as an electronic document. However, since it overlaps with the first page of the page image, an icon indicating that the document is a document or another image may be displayed.
In addition, as metadata, a part of the metadata shown in FIG. 2 is displayed here, but all metadata may be displayed.
Further, if metadata is added by the user, it may be displayed.

また、ツリー中の各画像は展開及び省略の表示が可能であり、ツリー上に表示される省略アイコン(−アイコン)44をクリックすることで、不要な領域画像を省略したり、また、展開アイコン(+アイコン)45をクリックすることで省略された領域画像を展開することも可能である。
なお、領域画像を子ノードとして持たないページについては、これらの展開アイコンと省略アイコンは表示されない。
Further, each image in the tree can be expanded and omitted, and by clicking an abbreviated icon (-icon) 44 displayed on the tree, an unnecessary area image can be omitted, or an expanded icon can be displayed. By clicking the (+ icon) 45, it is possible to expand the omitted area image.
Note that these expanded icons and abbreviated icons are not displayed for pages that do not have region images as child nodes.

もし、領域画像のメタデータとしてURL等のハイパーリンクが存在する場合は、それを表示することにより、その表示されたハイパーリンクが選択されたときにハイパーリンクのリンク先のインターネット上のページにジャンプしてそのページを表示するリンク先のサイトを参照させることも可能である。
この実施例では、HTMLで画面表示を行い、領域画像の展開と省略の制御をジャバスクリプト(JavaScript:登録商標)を行うことを想定して記載しているが、実現手段をこれに制限するものではない。
If there is a hyperlink such as a URL as the metadata of the area image, it is displayed, and when the displayed hyperlink is selected, the page jumps to the Internet page to which the hyperlink is linked. It is also possible to refer to the linked site displaying the page.
In this embodiment, description is made on the assumption that screen display is performed in HTML, and the development and omission control of the region image is performed using Javascript (registered trademark). However, the implementation means is limited to this. is not.

[ツリー形成の表示処理の説明]
次に、ページ一覧画面から文書ツリー画面に切り替えるときの処理について説明する。
図8は、ページ一覧画面から文書ツリー画面に切り替えるときの処理を示すフローチャート図である。
図6に示したページ一覧に表示中のページで先頭ページについて、例えば、先頭ページのメタデータである所属情報を参照し、ページが属する電子文書データを特定する為の情報である電子文書IDと電子文書の保管場所が得られる為、それらの情報に基づいて上記所属情報と一致する電子文書データを検索する(ステップ(図中「S」で示す)1)。
上記検索で得られた電子文書データについて、その電子文書データからページ画像データを抽出し、電子文書データをルートノードとし、その電子文書データから抽出された各ページのデータを子ノードとした表示用ツリーを形成する表示データを作成する(S2)。
[Explanation of tree formation display processing]
Next, processing when switching from the page list screen to the document tree screen will be described.
FIG. 8 is a flowchart showing processing when switching from the page list screen to the document tree screen.
For the first page in the page currently displayed in the page list shown in FIG. 6, for example, with reference to affiliation information that is metadata of the first page, an electronic document ID that is information for specifying the electronic document data to which the page belongs and Since the storage location of the electronic document is obtained, the electronic document data that matches the affiliation information is searched based on the information (step (indicated by “S” in the figure) 1).
For the electronic document data obtained by the above search, page image data is extracted from the electronic document data, the electronic document data is used as a root node, and the data of each page extracted from the electronic document data is used as a child node. Display data forming a tree is created (S2).

次に、抽出されたページ画像メタデータについて、そのページ画像メタデータの領域画像情報に値が存在するか否かを判断する(S3)。
ステップ3の判断で値が存在しないと判断したら、そのページに関連する領域画像が存在しないことを意味し、ツリーの形成は行わないでこの処理を終了するが、値が存在すると判断したら、ステップ4でページ画像メタデータから抽出された領域画像を特定する為の情報である電子文書IDと領域画像の保管場所がリスト形式で得られる為、それらの情報に基づいてリスト長分の領域画像データ(画像領域又は文字領域の画像データ)を検索する(S4)。
ステップ4の検索で得られた全領域画像データをページの子ノードとした表示用ツリーを形成する表示データを作成する(S5)。
Next, for the extracted page image metadata, it is determined whether or not there is a value in the area image information of the page image metadata (S3).
If it is determined in step 3 that the value does not exist, this means that there is no region image related to the page, and this process is terminated without forming a tree. In step 4, the electronic document ID, which is information for specifying the region image extracted from the page image metadata, and the storage location of the region image are obtained in a list format. Therefore, the region image data corresponding to the list length is obtained based on the information. (Image data of image area or character area) is searched (S4).
Display data that forms a display tree with all region image data obtained by the search in step 4 as child nodes of the page is created (S5).

全ページについて調べたか否かを判断し、調べてなければステップ5へ戻って上記処理を繰り返し、全ページについて調べたら、この処理を終了する。
以上の処理により電子文書をルートノードとしたツリー表示の表示データが形成され、その表示データを表示部20に送信することで電子文書の文書構造(ページ構成と各ページ中の画像領域又は文字領域の構成)とをツリー形式で表示し、ユーザはそのツリーを参照して電子文書の文書構造を容易に確認することが可能となる。
It is determined whether or not all the pages have been checked. If not checked, the process returns to step 5 to repeat the above process, and if all the pages have been checked, this process ends.
Through the processing described above, display data in a tree display with the electronic document as a root node is formed, and the display data is transmitted to the display unit 20, whereby the document structure of the electronic document (page configuration and image area or character area in each page) And the user can easily confirm the document structure of the electronic document by referring to the tree.

[領域画像のソートの説明]
次に、図8のステップ5の処理において、何のルールも無くツリーを形成すると、ページの上部にある領域画像とページの下部にある領域画像が入り乱れて表示されてしまい、ページ画像と領域画像の対応関係が分かり難くなる可能性がある。
これを回避する為に、領域画像のメタデータである座標情報に基づいてソートを行うとよい。
[Description of sorting area image]
Next, if the tree is formed without any rules in the process of step 5 in FIG. 8, the region image at the top of the page and the region image at the bottom of the page are displayed confusedly, and the page image and the region image are displayed. It may be difficult to understand the correspondence relationship.
In order to avoid this, it is preferable to perform sorting based on coordinate information that is metadata of the region image.

図9は、領域画像のソートの説明図である。
50〜54は、それぞれ画像領域又は文字領域の領域画像であり、図番の順はソート結果に基づいた表示順を意味している。
ここで、ページの左上をX座標0、Y座標0とした場合、表示順は以下の1,2に従って決定される。
1.Y座標の始点の値が0に近い領域画像を優先的に表示させる。
2.Y座標の始点の値が同じであった場合は、X座標の始点の値がより0に近いもの優先的に表示させる。
上記2点に従うことにより、領域画像50〜54の順にソートされた領域画像をツリーに表示することが可能となる。
また、本ソートはツリー以外の表示方法を採用した場合でも同様に可能である。
FIG. 9 is an explanatory diagram of sorting of region images.
Reference numerals 50 to 54 denote area images of image areas or character areas, respectively, and the order of the figure numbers means the display order based on the sorting result.
Here, when the upper left corner of the page is set to X coordinate 0 and Y coordinate 0, the display order is determined according to the following 1 and 2.
1. A region image having a Y coordinate starting point value close to 0 is preferentially displayed.
2. When the value of the start point of the Y coordinate is the same, the value of the start point of the X coordinate closer to 0 is displayed preferentially.
By following the above two points, it is possible to display the area images sorted in the order of the area images 50 to 54 on the tree.
Further, this sort is possible even when a display method other than the tree is adopted.

[ツリー表示の展開と省略の表示処理の説明]
次に、表示部20に対してツリー表示の展開又は省略の表示データを送信することでユーザに対して不要な領域画像を省略し、必要な情報だけを表示させることができる。
図10は、ツリー表示で展開中の領域画像を省略表示にする処理を示すフローチャート図である。
表示部20に表示されているツリー表示において、ページに付随する省略アイコン(−アイコン)がクリックされたか否かを判断する(S11)。
[Explanation of tree display expansion and omission display processing]
Next, by transmitting display data of tree display expansion or omission to the display unit 20, unnecessary area images can be omitted for the user, and only necessary information can be displayed.
FIG. 10 is a flowchart showing a process of omitting the area image being developed in the tree display.
In the tree display displayed on the display unit 20, it is determined whether or not an omission icon (-icon) attached to the page has been clicked (S11).

ステップ11で省略アイコンがクリックされなかったと判断したら、この処理を終了し、クリックされたと判断したら、該当ページに属する領域画像が表示中である否かを判断する(S12)。
ステップ12で領域画像が表示中であると判断したら、該当ページに属する領域画像を非表示にし、画面上に表示させないようにする(S13)。
さらに、省略アイコンを展開アイコンに切替えて表示し(S14)、この処理を終了する。このように、アイコンが展開アイコンに切り替わることにより、ユーザは領域画像が省略されていることを認識することができる。
If it is determined in step 11 that the abbreviated icon has not been clicked, this process ends. If it is determined that the clicked icon has been clicked, it is determined whether an area image belonging to the page is being displayed (S12).
If it is determined in step 12 that the area image is being displayed, the area image belonging to the corresponding page is hidden and is not displayed on the screen (S13).
Further, the abbreviated icon is switched to the expanded icon and displayed (S14), and this process ends. Thus, the user can recognize that the area image is omitted by switching the icon to the expanded icon.

また、ツリー表示で省略中の領域画像を展開表示にする処理は、
表示部20に表示されているツリー表示において、ページに付随する展開アイコン(+アイコン)がクリックされたか否かを判断し、展開アイコンがクリックされなかったと判断したら、この処理を終了し、クリックされたと判断したら、該当ページに属する領域画像の表示が省略中である否かを判断し、領域画像の表示が省略中であると判断したら、該当ページに属する領域画像を展開表示にし、画面上に表示するようにする。
さらに、展開アイコンを省略アイコンに切替えて表示し、この処理を終了する。
In addition, processing to expand the area image that is omitted in the tree display,
In the tree display displayed on the display unit 20, it is determined whether or not the expansion icon (+ icon) attached to the page has been clicked. If it is determined that the expansion icon has not been clicked, this processing is terminated and the click is performed. If it is determined that the display of the region image belonging to the corresponding page is omitted, and if it is determined that the display of the region image is omitted, the region image belonging to the corresponding page is expanded and displayed on the screen. Display it.
Further, the expanded icon is switched to the abbreviated icon and displayed, and this process ends.

次に、この画像処理装置では、電子文書を構成するページを表示する際、領域画像のエリアを矩形表示し、指定された領域画像をドラッグ&ドロップし、ワープロソフト等の別アプリケーションに添付することができる。
[プレビュー表示の画面の説明]
例えば、図6に示したページ一覧画面において、各ページのサムネイル画像にリンクが貼られており、サムネイル画像をクリックすることにより、そのサムネイル画像が示すページのプレビュー画面が表示される。
Next, in this image processing apparatus, when displaying the page constituting the electronic document, the area of the area image is displayed in a rectangular shape, the specified area image is dragged and dropped, and attached to another application such as word processing software. Can do.
[Description of preview display screen]
For example, in the page list screen shown in FIG. 6, a link is pasted to the thumbnail image of each page, and when the thumbnail image is clicked, a preview screen of the page indicated by the thumbnail image is displayed.

[プレビュー画面の説明]
図11は、プレビュー画面の一例を示す図である。
このプレビュー画面では、ページから抽出された領域画像のエリアを、図中波線枠で示す矩形枠で表示されており、ユーザは矩形枠をドラッグ&ドロップすることで別アプリケーションへ矩形枠内の領域画像データを添付することができる。
このとき、領域画像の画像種別がテキストである場合、添付されるのは領域画像ではなく、領域画像メタデータのキーテキストであることを特徴とする。
なお、矩形枠は、図中には黒の点線で表示しているが、他の色や線種で表示するようにしてもよい。
また、この実施例ではドラッグ&ドロップの実現手段としてジャバアプレット(JavaApplet:登録商標)を採用することを想定して記載しているが、実現手段をこれに制限するものではなく、他の手段を用いても良い。
[Description of preview screen]
FIG. 11 is a diagram illustrating an example of a preview screen.
In this preview screen, the area image area extracted from the page is displayed as a rectangular frame indicated by a wavy frame in the figure, and the user drags and drops the rectangular frame to another application to display the area image in the rectangular frame. Data can be attached.
At this time, if the image type of the area image is text, the attached image is not the area image but the key text of the area image metadata.
The rectangular frame is displayed with a black dotted line in the figure, but may be displayed with other colors and line types.
In this embodiment, the description is made assuming that a Java applet (registered trademark) is adopted as means for realizing drag and drop. However, the means for realizing the invention is not limited to this, and other means may be used. It may be used.

[プレビュー画面の表示処理の説明]
次に、ページ一覧画面からプレビュー画面に切り替える処理について説明する。
図12は、ページ一覧画面からプレビュー画面に切り替える処理のフローチャート図である。
ユーザによって指定されたページのメタデータである保管場所に基づいてページ画像データのプレビュー画像を取得する(S21)。
さらに、ページ画像メタデータに領域画像情報の値が存在するか否か判断する(S22)。
[Description of preview screen display processing]
Next, processing for switching from the page list screen to the preview screen will be described.
FIG. 12 is a flowchart of processing for switching from the page list screen to the preview screen.
A preview image of the page image data is acquired based on the storage location that is the metadata of the page specified by the user (S21).
Further, it is determined whether or not the region image information value exists in the page image metadata (S22).

ステップ22で値が存在しないと判断したら、そのページに関連する領域画像が存在しないことを意味し、矩形枠のリンクエリアの形成は行わずに、この処理を終了するが、値が存在すると判断したら、ページから抽出された領域画像を特定する為の情報である電子文書IDと領域画像の保管場所がリスト形式で得られる為、それらの情報に基づいてリスト長分の領域画像を全て検索する(S23)。
上記検索で得られた全領域画像のメタデータから画像領域を示す座標情報を取得する(S24)。
上記取得した画像領域を示す座標情報に基づいてプレビュー画像上に矩形のリンクエリア(矩形枠)を形成し、リンク先として保管場所に基づくダウンロード先のURIを設定し、リンク先に領域画像を指定する(S25)。
これにより、ページ中の各領域画像について矩形のリンクエリアを伴ったプレビュー表示が可能となる。
If it is determined in step 22 that there is no value, this means that there is no region image related to the page, and this processing ends without forming a rectangular link area, but it is determined that a value exists. Then, since the electronic document ID that is information for specifying the region image extracted from the page and the storage location of the region image are obtained in a list format, all the region images for the list length are searched based on the information. (S23).
The coordinate information indicating the image area is acquired from the metadata of the entire area image obtained by the search (S24).
Based on the coordinate information indicating the acquired image area, a rectangular link area (rectangular frame) is formed on the preview image, the URI of the download destination based on the storage location is set as the link destination, and the area image is specified as the link destination (S25).
Thereby, a preview display with a rectangular link area can be performed for each area image in the page.

[領域画像をドラッグ&ドロップするときの処理の説明]
次に、ユーザがプレビュー表示されたページの領域画像をドラッグ&ドロップする際の処理について説明する。
図13は、プレビュー表示されたページの領域画像をドラッグ&ドロップする際の処理を示すフローチャート図である。
例えば、図11に示したページ中のいずれかのリンクエリア(図中波線で示す矩形枠内)がユーザによってクリックされたか否かを判断する(S31)。
ステップ31でクリックされなかったと判断したら、この処理を終了するが、クリックされたと判断したら、そのクリックされたリンクエリアのリンク先の領域画像のメタデータの画像タイプを取得し、この値に基づいて領域画像がテキスト画像か否かを判断する(S32)。
[Description of processing when dragging and dropping an area image]
Next, processing when the user drags and drops an area image of a page displayed as a preview will be described.
FIG. 13 is a flowchart illustrating processing when dragging and dropping an area image of a page displayed as a preview.
For example, it is determined whether or not any link area in the page shown in FIG. 11 (in the rectangular frame indicated by the wavy line in the figure) has been clicked by the user (S31).
If it is determined in step 31 that it has not been clicked, this process ends. If it is determined that it has been clicked, the image type of the metadata of the linked area image of the clicked link area is acquired, and based on this value It is determined whether the area image is a text image (S32).

ステップ32でリンク先の領域画像がテキスト画像であると判断したら、リンク先の領域画像に登録されているキーテキストをダウンロードする(S33)。
一方、ステップ32でリンク先の領域画像がテキスト画像では無いと判断したら、すなわち、画像タイプが画像や表であった場合は、領域画像をダウンロードする(S35)。
ステップ33においてクリックによりキーテキストがダウンロード、ステップ35においてクリックにより領域画像がダウンロードされた後、ユーザによるダウンロードデータのドラッグ&ドロップ操作に応じてデータの表示位置の移動と、そのドロップ先が他のアプリケーションソフトウェアによるデータにキーテキスト又は領域画像を添付し、この処理を終了する。
このようにして、ユーザはリンクエリア(矩形枠)内の画像をドラッグ&ドロップすることで、別アプリケーションにテキスト又は画像を添付することができる。
If it is determined in step 32 that the linked area image is a text image, the key text registered in the linked area image is downloaded (S33).
On the other hand, if it is determined in step 32 that the linked area image is not a text image, that is, if the image type is image or table, the area image is downloaded (S35).
After the key text is downloaded by clicking in step 33 and the region image is downloaded by clicking in step 35, the data display position is moved in accordance with the drag and drop operation of the download data by the user, and the drop destination is set to another application. The key text or region image is attached to the data by the software, and this process is terminated.
In this way, the user can attach text or an image to another application by dragging and dropping the image in the link area (rectangular frame).

上述の説明では、この画像処理装置における電子文書の構造をツリー形式で表示する場合について説明したが、電子文書、ページ、領域画像の関連を表示する方法はツリー形式に制限されるものではない。
次に、ツリー以外の領域画像の表示形式について説明する。
[ツリー形式以外の表示形式の説明〜その1〜]
図14は、ツリー形式以外の表示形式の説明図である。
この表示処理については、上述した説明済みの内容を用いれば実施可能であり、フローチャート図を用いた説明は省略し、表示内容についてのみ説明する。
図14に示した画面は、表示対象欄60で「ページ+領域画像」を選択した際に表示される画面であり、3つのフレームで構成される。
In the above description, the case where the structure of the electronic document in the image processing apparatus is displayed in the tree format has been described. However, the method for displaying the relationship between the electronic document, the page, and the region image is not limited to the tree format.
Next, the display format of the area image other than the tree will be described.
[Description of display formats other than tree format-1]
FIG. 14 is an explanatory diagram of a display format other than the tree format.
This display process can be performed by using the above-described content, and the description using the flowchart will be omitted, and only the display content will be described.
The screen illustrated in FIG. 14 is a screen that is displayed when “page + region image” is selected in the display target column 60, and is configured by three frames.

上部のフレーム61には「私の文書」という電子文書のファイル名が表示され、左部のフレーム62には電子文書を構成する各ページのサムネール画像が一覧表示され、中央部から右部にわたるフレーム63には、上記サムネール画像で選択中のページに関連する領域画像が一覧表示されている。
この画面では、左部のフレーム62において電子文書の3ページ目のサムネール画像が選択され、それにより中央部から右部にわたるフレーム63に3ページ目と関連をもつ領域画像(画像領域画像と文字領域画像)が表示されている。
各領域画像には、上述したプレビュー画面へのリンクが張られており、ユーザがいずれかの領域画像をクリックすることにより、そのクリックされた領域画像のプレビュー画面へ遷移することが可能である。
The upper frame 61 displays the file name of the electronic document “My Document”, the left frame 62 displays a list of thumbnail images of each page constituting the electronic document, and the frame extends from the center to the right. Reference numeral 63 denotes a list of area images related to the page selected in the thumbnail image.
In this screen, the thumbnail image of the third page of the electronic document is selected in the left frame 62, whereby a region image (image region image and character region) associated with the third page in the frame 63 extending from the center to the right portion. Image) is displayed.
Each area image has a link to the above-described preview screen, and when the user clicks one of the area images, it is possible to transition to the preview screen of the clicked area image.

そのとき、プレビュー画面では遷移元の領域画像の座標情報に基づいて該当するエリアを強調表示してもよい。
図15は、プレビュー画面におけるエリア強調表示例を示す説明図である。
このプレビュー画面では、遷移元の領域画像の座標情報に基づいて該当するエリア64が強調表示(図中に太線枠で示す)されている。
At that time, the corresponding area may be highlighted on the preview screen based on the coordinate information of the transition source region image.
FIG. 15 is an explanatory diagram illustrating an example of area emphasis display on the preview screen.
In this preview screen, the corresponding area 64 is highlighted (indicated by a bold frame in the figure) based on the coordinate information of the transition source region image.

[ツリー形式以外の表示形式の説明〜その2〜]
図16は、ツリー形式以外の表示形式の他の例の説明図である。
この表示処理についても、上述した説明済みの内容を用いれば実施可能であり、フローチャート図を用いた説明は省略し、表示内容についてのみ説明する。
図16に示した画面は、表示対象欄60で「領域画像」を選択した際に表示される画面であり、矢示65のように、ページをまたいで各ページの領域画像のみを一覧表示している。
この画面のように、表示対象が領域画像となっている場合、さらに領域画像メタデータの画像種別による絞込みが可能であり、同図では、画像種別がテキストである画像のみを表示させている画面を示している。
ここで、ユーザが絞込みを解除したい場合、画像種別の全てを選択することで全画像種別を一覧表示することが可能である。
[Description of display format other than tree format-2]
FIG. 16 is an explanatory diagram of another example of the display format other than the tree format.
This display process can also be performed by using the above-described content, and the description using the flowchart will be omitted, and only the display content will be described.
The screen shown in FIG. 16 is a screen that is displayed when “region image” is selected in the display target column 60, and as shown by arrow 65, only the region images of each page are displayed as a list across the pages. ing.
As shown in this screen, when the display target is a region image, it is possible to further narrow down the region image metadata by the image type. In this figure, only the image whose image type is text is displayed. Is shown.
Here, when the user wants to cancel the narrowing down, it is possible to display a list of all image types by selecting all the image types.

この画像処理装置は、電子文書についてページ構成と各ページ中の領域画像構成からなる文書構造を表示するので、文書とページと領域画像の関係が明確になり、ユーザにとって文書管理性が向上する。
また、電子文書とページと領域画像の文書構造をツリー形式で表示することにより、視覚的に文書全体が把握しやすくなり、ユーザにとって文書管理性が向上する。
さらに、ツリーの展開と省略の表示を可能とすることにより、ユーザは必要な情報のみを得ることができる。
また、領域画像に登録したメタデータに基づく領域画像間のソートや領域画像の絞込みができるので、ユーザの好みに応じた表示が可能となる。
Since the image processing apparatus displays a document structure including a page configuration and a region image configuration in each page for an electronic document, the relationship between the document, the page, and the region image becomes clear, and the document management is improved for the user.
Further, by displaying the document structure of the electronic document, the page, and the region image in a tree format, the entire document can be easily grasped visually, and the document management is improved for the user.
Furthermore, by enabling the tree expansion and display of omission, the user can obtain only necessary information.
In addition, since it is possible to sort between area images based on the metadata registered in the area image and to narrow down the area images, it is possible to display according to the user's preference.

さらに、領域画像の座標情報に基づいてソートすることにより、ユーザにとってページと領域画像の位置関係が視覚的に把握しやすくなる。
また、領域画像から抽出したテキストをハイパーリンクとして表示することにより、ユーザはハイパーテキストを選択するだけで、リンク先を開いて参照することができる。
さらに、領域画像のドラッグ&ドロップを可能とすることにより、ユーザによる領域画像の再利用性が高まる。
さらにまた、ドラッグ&ドロップの対象となる領域画像の画像種別がテキストである場合、画像としてではなくメタデータであるキーテキストを添付することにより、ユーザは添付先のアプリケーションでテキスト編集が可能となる。
Furthermore, by sorting based on the coordinate information of the region image, it becomes easier for the user to visually grasp the positional relationship between the page and the region image.
Further, by displaying the text extracted from the region image as a hyperlink, the user can open and refer to the link destination simply by selecting the hypertext.
Further, by enabling the drag and drop of the area image, the reusability of the area image by the user is enhanced.
Furthermore, when the image type of the region image to be dragged and dropped is text, the user can edit the text in the application at the attachment destination by attaching key text that is metadata instead of as an image. .

次に、この画像処理装置における電子文書データのページ画像に対する各種の加工処理について説明する。
この画像処理装置では、要求制御部21が、ユーザによる編集、置換、結合、分割、追加、削除のいずれかの作業の入力を検出すると、表示情報生成部23によって生成した編集、置換、結合、分割、追加、又は削除の作業画面の表示情報に基づいて表示部20に編集、置換、結合、分割、追加、削除のいずれかの作業画面を表示する。
Next, various types of processing for the page image of the electronic document data in the image processing apparatus will be described.
In this image processing apparatus, when the request control unit 21 detects an input of any of editing, replacement, combination, division, addition, and deletion work by the user, the edit, replacement, combination, Based on the display information of the division, addition, or deletion work screen, any one of the edit, replacement, combination, division, addition, and deletion work screens is displayed on the display unit 20.

そして、要求制御部21が、検索部22を介して格納部14に格納された加工対象の電子文書データの各ページ画像データについて、そのページ内の画像領域又は文字領域の画像データの内容を変更する編集処理、そのページ内の画像領域又は文字領域の画像データを他の画像データに代える置換処理、そのページ内の画像領域又は文字領域の画像データの複数を結合する結合処理、そのページ内の画像領域又は文字領域の画像データを複数の画像データに分割する分割処理、そのページ内の画像領域又は文字領域の画像データに他の画像データを追加する追加処理、そのページ内の画像領域又は文字領域の画像データを削除する削除処理の各加工処理を行う。   Then, the request control unit 21 changes the content of the image data in the image area or character area in the page for each page image data of the electronic document data to be processed stored in the storage unit 14 via the search unit 22. Editing processing, replacement processing for replacing image data in the page or character area with other image data, combining processing for combining a plurality of image data in the page or character area, Division processing that divides image data in the image area or character area into a plurality of image data, additional processing that adds other image data to image data in the image area or character area in the page, image area or character in the page Each processing of the deletion process for deleting the image data of the area is performed.

[ページ内の画像領域又は文字領域の画像データの編集処理]
図17は、この画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの編集処理を示すフローチャート図である。
図18は、画像データの編集処理時の電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
図19は、編集前のページ画像データとページ画像メタデータを示す図である。
図20は、編集前の領域画像データと領域画像メタデータを示す図である。
図21は、編集操作時に表示する編集ウインドウを示す図である。
図22は、編集後の領域画像データと領域画像メタデータを示す図である。
[Editing of image data in the image area or character area in the page]
FIG. 17 is a flowchart showing editing processing of image data in an image area or a character area in a page image in this image processing apparatus.
FIG. 18 is a diagram showing a tree-format list screen showing the document structure of the electronic document during the image data editing process.
FIG. 19 is a diagram showing page image data and page image metadata before editing.
FIG. 20 is a diagram showing area image data and area image metadata before editing.
FIG. 21 is a diagram showing an editing window displayed during editing operation.
FIG. 22 is a diagram showing edited area image data and area image metadata.

図23は、編集後の内容を電子文書データに反映させるか否かを選択する選択ダイアログ画面を示す図である。
図24は、編集後のページ画像データとページ画像メタデータの一例の図である。
図25は、編集後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
FIG. 23 is a diagram showing a selection dialog screen for selecting whether or not to reflect the edited content in the electronic document data.
FIG. 24 is a diagram illustrating an example of edited page image data and page image metadata.
FIG. 25 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the edited content is reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における編集処理は、図17に示すように、ステップ(図中「S」で示す)41で、編集する領域画像に対して表示されている編集ボタンの押下を検出すると、ステップ42で、押下された編集ボタンに対応する領域画像の編集ウインドウを表示し、ステップ43で、編集ウインドウに表示された領域画像の内容に指示入力に基づいた編集をし、ステップ44で編集ウインドウ内のキャンセルボタンの押下を検出したか否かを判断し、押下を検出したらこの処理を終了するが、押下を検出しなかったら、ステップ45で、編集ウインドウ内の編集完了ボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ43の処理へ戻る。   As shown in FIG. 17, in the editing process in this image processing apparatus, in step (indicated by “S” in the figure) 41, when it is detected that the edit button displayed on the area image to be edited is pressed, step 42 is performed. Then, the editing window of the area image corresponding to the pressed edit button is displayed. In step 43, the contents of the area image displayed in the editing window are edited based on the instruction input. It is determined whether or not pressing of the cancel button has been detected. If pressing is detected, the process ends. If no pressing has been detected, whether or not pressing of the edit completion button in the editing window has been detected in step 45. If no depression is detected, the process returns to step 43.

一方、ステップ45の判断で編集完了ボタンの押下を検出したら、ステップ46で編集後の領域画像についての領域画像メタデータを作成し、その領域画像メタデータに基づいて編集後の領域画像データを作成し、その編集後の領域画像データと領域画像メタデータを対応させて格納部の新たな保管場所に記憶して保管し、ステップ47で全体画像(電子文書データ全体)に反映させる指示の入力を検出したか否かを判断し、反映させる指示の入力を検出しなければ、この処理を終了し、反映させる指示の入力を検出したら、ステップ48で、編集後の領域画像データと領域画像メタデータを関連付けるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。   On the other hand, if it is detected in step 45 that the edit completion button has been pressed, area image metadata for the edited area image is created in step 46, and edited area image data is created based on the area image metadata. Then, the edited region image data and region image metadata are associated with each other and stored and stored in a new storage location in the storage unit, and in step 47, an instruction to be reflected in the entire image (entire electronic document data) is input. If it is determined whether or not the input of the instruction to be reflected is detected, the process is terminated. If the input of the instruction to be reflected is detected, the edited region image data and region image metadata are obtained in step 48. So that the page image data and the page image metadata of the electronic document data are rewritten, and this process ends.

次に、領域画像に対する編集処理と操作手順と表示画面例について説明する。
例えば、図18の(a)に示すページ画像70に対する編集をする場合、ユーザからの編集作業の選択入力があると、図18の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、ページ内の領域画像の一覧画像で表示されている各領域画像の右隣にそれぞれ編集ボタンを表示する。
例えば、領域画像71を編集する場合、ユーザは、領域画像71の右隣に位置する編集ボタン72を押下する。
Next, an editing process, an operation procedure, and a display screen example for the region image will be described.
For example, when editing the page image 70 shown in FIG. 18A, if there is a selection input of editing work from the user, a list display in a tree format showing the document structure as shown in FIG. Is displayed.
In this list display, an edit button is displayed on the right side of each area image displayed as a list image of area images in the page.
For example, when editing the region image 71, the user presses an edit button 72 located on the right side of the region image 71.

ここで、編集前のページ画像70のページ画像データとページ画像メタデータの内容は、図19に示すような内容であり、ページ画像70の領域画像71の領域画像データと領域画像メタデータの内容は、図20に示すような内容であるものとする。なお、図19及び図20において、この編集処理で利用しない各情報については記載を省略している。
編集ボタン72が押下されると、要求制御部21は、図20に示す領域画像71の領域画像メタデータの「画像タイプ」の「テキスト」を参照し、編集対象がテキストであることを認識すると、同じく領域画像71の領域画像メタデータの「キーテキスト」から「ABC」を読み出し、表示部20に、図21の(a)に示す編集ウインドウを表示する。
この編集ウインドウのテキストウインドウ73には、上記「ABC」を表示する。
Here, the contents of the page image data and the page image metadata of the page image 70 before editing are as shown in FIG. 19, and the contents of the area image data and the area image metadata of the area image 71 of the page image 70. The contents are as shown in FIG. In FIG. 19 and FIG. 20, information not used in the editing process is not shown.
When the edit button 72 is pressed, the request control unit 21 refers to “text” of “image type” in the region image metadata of the region image 71 shown in FIG. 20 and recognizes that the editing target is text. Similarly, “ABC” is read from “key text” of the region image metadata of the region image 71, and the editing window shown in FIG.
In the text window 73 of this editing window, the above “ABC” is displayed.

ここで、ユーザが、図21の(a)に示すテキストウインドウ73に表示されている「ABC」の文字列を削除し、図21の(b)に示すように、新たに「XYZ」の文字列を入力し、編集ウインドウ内の編集完了ボタン74を押下すると、要求制御部21は、図22に示すように、新たな領域画像メタデータとその領域画像メタデータに基づく領域画像データを作成し、それらを対応させて検索部22を介して格納部14に格納する。
この領域画像メタデータでは、「領域画像ID」に新たなIDを付与し、「保管場所」にテキスト「XYZ」の領域画像データの保管場所を格納し、「画像タイプ」に「テキスト」を格納し、「キーテキスト」に「XYZ」の文字列を格納している。上記テキスト「XYZ」の領域画像データは、上記キーテキストの「XYZ」から生成している。
一方、図21に示した編集ウインドウ内のキャンセルボタン75が押下されると、それまでに領域画像71に対して加えた変更は破棄され、編集前の領域画像71の状態に戻る。
Here, the user deletes the character string “ABC” displayed in the text window 73 shown in FIG. 21A, and newly displays the characters “XYZ” as shown in FIG. When a column is input and the edit completion button 74 in the edit window is pressed, the request control unit 21 creates new region image metadata and region image data based on the region image metadata as shown in FIG. These are stored in the storage unit 14 via the search unit 22 in association with each other.
In this region image metadata, a new ID is assigned to “region image ID”, the storage location of the region image data of the text “XYZ” is stored in “storage location”, and “text” is stored in “image type”. The character string “XYZ” is stored in the “key text”. The area image data of the text “XYZ” is generated from the key text “XYZ”.
On the other hand, when the cancel button 75 in the editing window shown in FIG. 21 is pressed, changes made to the area image 71 so far are discarded, and the state of the area image 71 before editing is restored.

編集完了ボタン74が押下された後、図23に示すような選択ダイアログ画面を表示し、その選択ダイアログ画面中の「反映する」ボタン76が押下されると、要求制御部21は、検索部22を介して格納部14に記憶されている編集前のページ画像データとページ画像メタデータとを書き換えるリンク処理を行う。
このリンク処理では、図19に示した編集前のページ画像メタデータの領域画像情報の領域画像ID「1001」と保管場所「repository/1001.pdf」を、領域画像メタデータの領域画像ID「1004」と保管場所「repository/1004.pdf」に書き換え、図19に示した編集前のページ画像データ内の編集前の領域画像も編集後の領域画像に書き換え、図24に示すような内容にする。
こうして、領域画像71に加えた編集結果は電子文書データの全体に反映される。
After the edit completion button 74 is pressed, a selection dialog screen as shown in FIG. 23 is displayed. When the “Reflect” button 76 in the selection dialog screen is pressed, the request control unit 21 searches the search unit 22. The link processing for rewriting the page image data before editing and the page image metadata stored in the storage unit 14 is performed.
In this linking process, the area image ID “1001” of the area image information of the page image metadata before editing shown in FIG. 19 and the storage location “repository / 1001.pdf” are stored in the area image ID “1004” of the area image metadata. ”And the storage location“ repository / 1004.pdf ”, and the area image before editing in the page image data before editing shown in FIG. 19 is also rewritten to the area image after editing to have contents as shown in FIG. .
Thus, the editing result added to the area image 71 is reflected in the entire electronic document data.

その結果、図25の(a)に示すようなページ画像78になり、図25の(b)に示すように、文書構造を示すツリー形式の一覧表示では、編集前の領域画像に代わって、編集後の領域画像79が表示される。
一方、図23に示した選択ダイアログ画面中の「反映しない」ボタン77が押下された場合には、編集結果は電子文書データの全体へは反映されず、編集前の領域画像71のままとなる。この場合は、ページ画像データとページ画像メタデータには変更は加えられない。
このようにして、領域画像に修正を加え、修正後の内容を電子文書データに反映させることができるので、電子文書データ中のテキストのみの編集や画像のみの編集が容易にでき、電子文書データの編集作業効率を高めることができる。また、電子文書データの利用性を高めることができる。
As a result, a page image 78 as shown in FIG. 25A is obtained, and as shown in FIG. 25B, in the tree format list display showing the document structure, instead of the region image before editing, The edited region image 79 is displayed.
On the other hand, when the “do not reflect” button 77 in the selection dialog screen shown in FIG. 23 is pressed, the editing result is not reflected in the entire electronic document data, and remains the region image 71 before editing. . In this case, the page image data and the page image metadata are not changed.
In this way, the region image can be modified and the modified content can be reflected in the electronic document data. Therefore, it is easy to edit only the text in the electronic document data or only the image, and the electronic document data. Can improve the editing work efficiency. In addition, the usability of electronic document data can be improved.

[ページ内の画像領域又は文字領域の画像データの置換処理]
図26は、この画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの置換処理を示すフローチャート図である。
図27は、画像データの置換処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。
図28は、置換前のページ画像データとページ画像メタデータを示す図である。
図29は、置換前の領域画像データと領域画像メタデータを示す図である。
[Replacement of image data in the image area or character area in the page]
FIG. 26 is a flowchart showing the replacement processing of the image data of the image area or the character area in the page image in this image processing apparatus.
FIG. 27 is a diagram showing a list screen representing a tree format showing the document structure of the electronic document at the time of image data replacement processing.
FIG. 28 is a diagram showing page image data and page image metadata before replacement.
FIG. 29 is a diagram showing area image data and area image metadata before replacement.

図30は、置換操作時に表示する置換ウインドウを示す図である。
図31は、置換操作時に表示する置換画像選択ダイアログウインドウを示す図である。
図32は、置換後の領域画像データと領域画像メタデータを示す図である。
図33は、置換後のページ画像データとページ画像メタデータの一例の図である。
図34は、置換後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
FIG. 30 is a diagram showing a replacement window displayed during the replacement operation.
FIG. 31 is a diagram showing a replacement image selection dialog window displayed during the replacement operation.
FIG. 32 is a diagram showing area image data and area image metadata after replacement.
FIG. 33 is a diagram of an example of page image data and page image metadata after replacement.
FIG. 34 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the contents after replacement are reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における置換処理は、図26に示すように、ステップ(図中「S」で示す)51で、置換対象の領域画像に対して表示されている置換ボタンの押下を検出すると、ステップ52で、押下された置換ボタンに対応する領域画像の置換ウインドウを表示し、ステップ53で、置換ウインドウ内のキャンセルボタンの押下を検出したか否かを判断し、押下を検出したら、この処理を終了するが、押下を検出しなかったら、ステップ54で、置換ウインドウ内の置換画像選択ボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ54の処理を繰り返す。   As shown in FIG. 26, the replacement processing in this image processing apparatus is performed when step (indicated by “S” in the figure) 51 detects that the replacement button displayed on the replacement target area image is pressed. In 52, a replacement window of the area image corresponding to the pressed replacement button is displayed. In step 53, it is determined whether or not the pressing of the cancel button in the replacement window is detected. If no pressing is detected, it is determined in step 54 whether or not the pressing of the replacement image selection button in the replacement window is detected. If the pressing is not detected, the process of step 54 is repeated.

一方、ステップ54の判断で置換画像選択ボタンの押下を検出したら、ステップ55で置換画像選択ダイアログウインドウを表示し、ステップ56で置換画像選択ダイアログウインドウ内で置換する領域画像データが選択されて開くボタンの押下を検出したか否かを判断し、置換する領域画像データが選択されて開くボタンの押下が検出されなければ、ステップ55へ戻り、置換する領域画像データが選択されて開くボタンの押下が検出されたら、ステップ57で、置換ウインドウに選択された置換する領域画像を表示し、ステップ58で置換ウインドウ内の置換実行ボタンの押下を検出したか否かを判断する。   On the other hand, if it is detected in step 54 that the replacement image selection button is pressed, a replacement image selection dialog window is displayed in step 55, and the area image data to be replaced is selected and opened in step 56 in the replacement image selection dialog window. If the pressing of the open button is not detected when the replacement area image data is selected and the opening button is not detected, the process returns to step 55 to select the replacement area image data and pressing the opening button. If detected, in step 57, the selected area image to be replaced is displayed in the replacement window, and in step 58, it is determined whether or not the pressing of the replacement execution button in the replacement window is detected.

ステップ58で置換実行ボタンの押下を検出しなかったと判断したら、ステップ57の処理へ戻り、置換実行ボタンの押下を検出したと判断したら、ステップ59で、選択された置換する領域画像の画像サイズと置換対象の領域画像の画像サイズとが異なるか否かを判断し、異なれば、ステップ60で選択された置換する領域画像の画像サイズを置換対象の領域画像の画像サイズと同じになるように置換する領域画像データに拡大又は縮小の処理を施して変換し、あるいは、トリミング処理を施して変換し、ステップ61へ進む。   If it is determined in step 58 that the pressing of the replacement execution button has not been detected, the process returns to step 57. If it is determined that the pressing of the replacement execution button has been detected, in step 59, the image size of the selected region image to be replaced is determined. It is determined whether or not the image size of the area image to be replaced is different. If it is different, the image size of the area image to be replaced selected in step 60 is replaced with the image size of the area image to be replaced. The region image data to be processed is converted by performing enlargement or reduction processing, or converted by performing trimming processing, and the process proceeds to step 61.

また、ステップ59で、選択された置換する領域画像の画像サイズと置換対象の領域画像の画像サイズとが異ならない(同じ)と判断したら、そのままステップ61へ進む。
ステップ61では、置換対象の領域画像データを上記選択された置換する領域画像データ(又は上記変換処理が施された領域画像データ)に置換し、置換後の領域画像データと領域画像メタデータを関連付けるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。
If it is determined in step 59 that the image size of the selected area image to be replaced and the image size of the area image to be replaced are not different (same), the process proceeds to step 61 as it is.
In step 61, the region image data to be replaced is replaced with the selected region image data to be replaced (or the region image data subjected to the conversion process), and the region image data after replacement and the region image metadata are associated with each other. As described above, the page image data and the page image metadata of the electronic document data are rewritten, and this process ends.

次に、領域画像の置換処理と操作手順と表示画面例について説明する。
例えば、図27の(a)に示すページ画像80内の領域画像を他の領域画像に置換する場合、ユーザからの置換作業の選択入力があると、図27の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、ページ内の領域画像の一覧画像で表示されている各領域画像の右隣にそれぞれ置換ボタンを表示する。
例えば、領域画像81を他の画像に置換する場合、ユーザは、領域画像81の右隣に位置する置換ボタン82を押下する。
Next, an area image replacement process, an operation procedure, and a display screen example will be described.
For example, when the area image in the page image 80 shown in FIG. 27A is replaced with another area image, a document as shown in FIG. Display a tree-like list of structures.
In this list display, a replacement button is displayed on the right side of each area image displayed as a list image of area images in the page.
For example, when replacing the region image 81 with another image, the user presses a replacement button 82 located on the right side of the region image 81.

ここで、置換前のページ画像80のページ画像データとページ画像メタデータの内容は、図28に示すような内容であり、ページ画像80の領域画像81の領域画像データと領域画像メタデータの内容は、図29に示すような内容であるものとする。なお、図28及び図29において、この置換処理で利用しない各情報については記載を省略している。
置換ボタン82が押下されると、要求制御部21は、図29に示す領域画像81の領域画像メタデータの「画像タイプ」の「図」を参照し、置換対象が図であることを認識すると、同じく領域画像81の領域画像メタデータの「保管場所」から領域画像データを読み出し、表示部20に、図30に示す置換ウインドウを表示する。
この置換ウインドウの左側の領域に、置換前の領域画像を表示する。
Here, the contents of the page image data and the page image metadata of the page image 80 before replacement are as shown in FIG. 28, and the contents of the area image data of the area image 81 of the page image 80 and the contents of the area image metadata. The contents are as shown in FIG. In FIG. 28 and FIG. 29, description of each piece of information that is not used in this replacement processing is omitted.
When the replace button 82 is pressed, the request control unit 21 refers to the “picture” of the “image type” of the area image metadata of the area image 81 shown in FIG. 29 and recognizes that the replacement target is a figure. Similarly, the area image data is read from the “storage location” of the area image metadata of the area image 81, and the replacement window shown in FIG. 30 is displayed on the display unit 20.
The area image before replacement is displayed in the area on the left side of the replacement window.

ここで、ユーザが、図30に示す置換ウインドウ内の置換画像選択ボタン83を押下すると、要求制御部21は、検索部22を介して格納部14から置換可能な領域画像データを検索し、表示情報生成部23を介して表示部20に図31に示すような置換画像選択ダイアログウインドウを表示する。
この置換画像選択ダイアログウインドウには、複数の置換可能な領域画像データのファイル名,サイズ,更新日時を含む情報の一覧を表示する。
Here, when the user presses the replacement image selection button 83 in the replacement window shown in FIG. 30, the request control unit 21 searches the storage unit 14 for area image data that can be replaced via the search unit 22 and displays it. A replacement image selection dialog window as shown in FIG. 31 is displayed on the display unit 20 via the information generation unit 23.
In this replacement image selection dialog window, a list of information including file names, sizes, and update dates / times of a plurality of replaceable area image data is displayed.

ユーザが、置換画像選択ダイアログウインドウの複数の置換可能な領域画像データの一覧から任意の領域画像データのファイル名を選択入力し、開くボタン85を押下すると、要求制御部21は検索部22を介して格納部14から上記選択入力されたファイル名の領域画像データを読み出して取得し、その領域画像データに基づいて表示情報生成部23を介して表示部20に表示した置換ウインドウ内の右側の領域に置換する領域画像を表示する。
また、キャンセルボタンが押下されたら、上記選択入力されたファイル名をクリアし、再度ファイル名の選択入力の画面に戻す。
When the user selects and inputs a file name of arbitrary area image data from a list of a plurality of replaceable area image data in the replacement image selection dialog window and presses an open button 85, the request control unit 21 passes the search unit 22. Then, the area image data of the file name selected and input from the storage unit 14 is read out and acquired, and the right area in the replacement window displayed on the display unit 20 via the display information generation unit 23 based on the area image data The area image to be replaced is displayed.
If the cancel button is pressed, the file name selected and input is cleared and the screen returns to the file name selection and input screen again.

置換画像選択ダイアログウインドウ内の開くボタン85の押下後、図30に示すような置換ウインドウ内の右側の領域に、置換する領域画像として、上記選択入力されたファイル名の領域画像データに基づく領域画像を表示する。
ここで、置換ウインドウ内のキャンセルボタンが押下されると、再度置換画像選択ダイアログウインドウを表示し、そこで選択されたファイル名の領域画像データに基づく領域画像を置換ウインドウに表示する
After pressing the open button 85 in the replacement image selection dialog window, a region image based on the region image data of the file name selected and input as a region image to be replaced in the region on the right side in the replacement window as shown in FIG. Is displayed.
Here, when the cancel button in the replacement window is pressed, the replacement image selection dialog window is displayed again, and the region image based on the region image data of the file name selected there is displayed in the replacement window.

ユーザが、置換ウインドウ内の置換実行ボタン84を押下すると、要求制御部21は、検索部22を介して格納部14に記憶されている置換前の領域画像データと領域画像メタデータと置換前のページ画像データとページ画像メタデータとを書き換える処理を行う。
ここで、置換対象となる領域画像81の画像サイズと置換する領域画像87の画像サイズが異なる場合、領域画像87の領域画像データに拡大、縮小、トリミングを含む処理を行い、置換対象の領域画像81と同じサイズになるように変換する。
When the user presses the replacement execution button 84 in the replacement window, the request control unit 21 stores the pre-replacement area image data, the area image metadata, and the pre-replacement image data stored in the storage unit 14 via the search unit 22. A process of rewriting page image data and page image metadata is performed.
Here, when the image size of the area image 87 to be replaced is different from the image size of the area image 87 to be replaced, the area image data of the area image 87 is subjected to processing including enlargement, reduction, and trimming, and the area image to be replaced Conversion to be the same size as 81.

上記書き換え処理では、図29に示した置換前の領域画像データを上記選択された領域画像データに置換し、図29に示した領域画像メタデータの領域画像ID「1005」と保管場所「repository/1005.pdf」を、領域画像メタデータの領域画像ID「1006」と保管場所「repository/1006.pdf」にそれぞれ書き換え、図32に示すような内容にする。
さらに、図28に示した置換前のページ画像メタデータの領域画像情報の領域画像ID「1005」と保管場所「repository/1005.pdf」を、領域画像ID「1006」と保管場所「repository/1006.pdf」に書き換え、置換前のページ画像データも上記選択された領域画像に置換した後の領域画像に書き換え、図33に示すような内容にする。
こうして、置換後の領域画像が電子文書データの全体に反映される。
In the rewriting process, the area image data before replacement shown in FIG. 29 is replaced with the selected area image data, and the area image ID “1005” of the area image metadata shown in FIG. 29 and the storage location “repository / “1005.pdf” is rewritten to the area image ID “1006” and the storage location “repository / 1006.pdf” of the area image metadata, respectively, so that the contents are as shown in FIG.
Furthermore, the area image ID “1005” and the storage location “repository / 1005.pdf” of the area image information of the page image metadata before replacement shown in FIG. 28, the area image ID “1006” and the storage location “repository / 1006”. .Pdf ", the page image data before replacement is also rewritten to the area image after replacement with the selected area image, and the contents are as shown in FIG.
In this way, the area image after replacement is reflected in the entire electronic document data.

その結果、図34の(a)に示すようなページ画像86になり、図34の(b)に示すように、文書構造を示すツリー形式の一覧表示では、置換前の領域画像に代わって、置換後の領域画像87が表示される。ここで、置換前の領域画像81をリンクを外した状態で表示するようにしても良い。
このようにして、格納部に格納した電子文書データ中の任意の領域画像を他の領域画像に置換することができるので、上記格納した電子文書データ中の領域画像についてのOCR認識不具合を修正することができる。また、ユーザが意図したデータを持つ文書を作成することができる。
As a result, a page image 86 as shown in FIG. 34 (a) is obtained. As shown in FIG. 34 (b), in the tree format list display showing the document structure, instead of the area image before replacement, The region image 87 after replacement is displayed. Here, the area image 81 before replacement may be displayed with the link removed.
In this way, an arbitrary region image in the electronic document data stored in the storage unit can be replaced with another region image, so that the OCR recognition defect for the region image in the stored electronic document data is corrected. be able to. It is also possible to create a document having data intended by the user.

[ページ内の画像領域又は文字領域の画像データの結合処理]
図35は、この画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの結合処理を示すフローチャート図である。
図36は、画像データの結合処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。
図37は、結合前のページ画像データとページ画像メタデータを示す図である。
図38は、結合する一方の領域画像の結合前の領域画像データと領域画像メタデータを示す図である。
図39は、結合するもう一方の領域画像の結合前の領域画像データと領域画像メタデータを示す図である。
[Combination of image data in the image area or character area in the page]
FIG. 35 is a flowchart showing a process for combining image data of image areas or character areas in a page image in the image processing apparatus.
FIG. 36 is a diagram showing a list screen representing a tree format showing the document structure of the electronic document at the time of image data combination processing.
FIG. 37 is a diagram showing page image data and page image metadata before combining.
FIG. 38 is a diagram showing region image data and region image metadata before combining one region image to be combined.
FIG. 39 is a diagram showing region image data and region image metadata before combining the other region image to be combined.

図40は、結合操作時に表示する結合ウインドウを示す図である。
図41は、結合後の領域画像データと領域画像メタデータを示す図である。
図42は、結合後のページ画像データとページ画像メタデータの一例の図である。
図43は、結合後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
FIG. 40 is a diagram showing a combination window displayed during the combination operation.
FIG. 41 is a diagram showing region image data and region image metadata after combination.
FIG. 42 is a diagram illustrating an example of page image data and page image metadata after combination.
FIG. 43 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the combined contents are reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における結合処理は、図35に示すように、ステップ(図中「S」で示す)71で、結合させる複数の領域画像が含まれるページ画像に対して表示されている結合ボタンの押下を検出すると、ステップ72で、押下された結合ボタンに対応するページ画像内の各領域画像についての結合ウインドウを表示し、ステップ73で、結合ウインドウ内の結合させる複数の領域画像が選択され、ステップ74で、キャンセルボタンの押下を検出したか否かを判断し、押下を検出したら、この処理を終了する。   As shown in FIG. 35, the combination processing in this image processing apparatus is performed at step 71 (indicated by “S” in the drawing) 71 of the combination button displayed for the page image including a plurality of region images to be combined. When the pressing is detected, in step 72, a combined window for each region image in the page image corresponding to the pressed combined button is displayed, and in step 73, a plurality of region images to be combined in the combined window are selected. In step 74, it is determined whether or not pressing of the cancel button is detected. If pressing is detected, this process is terminated.

ステップ74の判断でキャンセルボタンの押下を検出しなかったら、ステップ75で、結合ウインドウ内の結合実行ボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ75の処理を繰り返し、結合実行ボタンの押下を検出したら、ステップ76で結合ウインドウで選択された複数の領域画像を結合して1つの領域画像にし、その結合後の領域画像データと領域画像メタデータを作成して記憶して保管し、上記結合後の領域画像データと領域画像メタデータを関連付けるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。   If the pressing of the cancel button is not detected in the determination of step 74, it is determined in step 75 whether or not the pressing of the combining execution button in the combining window is detected. If the pressing is not detected, the process of step 75 is performed. If it is detected repeatedly that the combining execution button is pressed, a plurality of region images selected in the combining window are combined into one region image in step 76, and the combined region image data and region image metadata are created. The page image data and the page image metadata of the electronic document data are rewritten so as to be stored and stored, and the combined region image data and the region image metadata are associated with each other, and this process ends.

次に、領域画像の結合処理と操作手順と表示画面例について説明する。
例えば、図36の(a)に示すページ画像90内の複数の領域画像を1つに結合する場合、ユーザからの結合作業の選択入力があると、図36の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、電子文書一覧画像の各ページ画像の内、複数の領域画像が含まれるページ画像の右隣にそれぞれ結合ボタンを表示する。
例えば、ページ画像91に結合処理をする場合、ユーザは、ページ画像91の右隣に位置する結合ボタン92を押下する。
Next, region image combination processing, operation procedures, and display screen examples will be described.
For example, when a plurality of region images in the page image 90 shown in FIG. 36A are combined into one, if there is a selection input of a combining operation from the user, a document as shown in FIG. Display a tree-like list of structures.
In this list display, a combination button is displayed on the right side of each page image including a plurality of area images among the page images of the electronic document list image.
For example, when performing a combination process on the page image 91, the user presses a combination button 92 located on the right side of the page image 91.

ここで、結合前のページ画像90のページ画像データとページ画像メタデータの内容は、図37に示すような内容であり、ページ画像90内の結合する一方の領域画像の領域画像データと領域画像メタデータの内容は、図38に示すような内容であり、ページ画像90内の結合するもう一方の領域画像の領域画像データと領域画像メタデータの内容は、図39に示すような内容であるものとする。なお、図37乃至図39において、この結合処理で利用しない各情報については記載を省略している。
結合ボタン92が押下されると、要求制御部21は、図37に示すページ画像メタデータの領域画像情報を参照し、そのページ内の各領域画像の保管場所から領域画像データを読み出し、表示部20に、図40に示す結合ウインドウを表示する。
Here, the contents of the page image data and the page image metadata of the page image 90 before the combination are as shown in FIG. 37, and the region image data and the region image of one of the region images to be combined in the page image 90. The contents of the metadata are as shown in FIG. 38, and the area image data of the other area image to be combined in the page image 90 and the contents of the area image metadata are as shown in FIG. Shall. In FIG. 37 to FIG. 39, the description of each piece of information that is not used in this combining process is omitted.
When the join button 92 is pressed, the request control unit 21 refers to the region image information of the page image metadata shown in FIG. 37, reads the region image data from the storage location of each region image in the page, and displays the display unit. 20 displays the combined window shown in FIG.

この結合ウインドウには、ページ内の各領域画像がページ内の配置位置のままで表示されており、ここで、図40の(a)に示すように、図中点線枠で示す2つの領域画像を1つに結合する場合、一方の領域画像に表示された破線枠93を、図40の(b)に示すように、右隣の領域画像も含むように右方向まで広げる操作をした後、結合実行ボタン95を押下する。
結合実行ボタン95が押下されると、要求制御部21は、図38と図39にそれぞれ示した各領域画像を1つに結合した新たな領域画像データを作成する。
こうして、結合ウインドウで領域画像の4点の座標を新たに指定し、その4点の座標に基づく矩形領域を再定義して領域画像を抽出し直すことで、1つの新たな領域画像を作成する。
In this combined window, each area image in the page is displayed as it is in the arrangement position in the page. Here, as shown in FIG. 40 (a), two area images indicated by dotted line frames in the figure are displayed. , The broken line frame 93 displayed in one of the region images is expanded to the right so as to include the region image on the right as shown in FIG. A join execution button 95 is pressed.
When the join execution button 95 is pressed, the request control unit 21 creates new area image data obtained by combining the area images shown in FIGS. 38 and 39 into one.
Thus, by newly specifying the coordinates of the four points of the region image in the combined window, redefining the rectangular region based on the coordinates of the four points, and extracting the region image again, one new region image is created. .

そして、検索部22を介して格納部14に新たな領域画像データを格納し、その領域画像データに割り当てた領域画像IDと保管場所に基づいてその新たな領域画像データの領域画像メタデータを作成し、上記新たな領域画像データに対応させて記憶する。
さらに、要求制御部21は、検索部22を介して格納部14に記憶されている結合前のページ画像データとページ画像メタデータとを書き換える処理を行う。
上記結合処理で新たに作成された領域画像データと領域画像メタデータの内容は、図41に示すような内容であり、その領域画像メタデータには領域画像ID「1008」と、保管場所「repository/1008.pdf」と、画像タイプ「図」が格納されている。
Then, the new region image data is stored in the storage unit 14 via the search unit 22, and the region image metadata of the new region image data is created based on the region image ID assigned to the region image data and the storage location. Then, it is stored in correspondence with the new area image data.
Further, the request control unit 21 performs a process of rewriting the page image data and page image metadata before combination stored in the storage unit 14 via the search unit 22.
The contents of the area image data and area image metadata newly created by the above combination processing are as shown in FIG. 41. The area image metadata includes the area image ID “1008” and the storage location “repository”. /1008.pdf ”and the image type“ figure ”are stored.

また、上記書き換え処理では、図37に示した結合前のページ画像メタデータの領域画像情報の領域画像ID「1002」と保管場所「repository/1002.pdf」と領域画像ID「1007」と保管場所「repository/1007.pdf」を削除し、新たに領域画像ID「1008」と保管場所「repository/1008.pdf」を追加する書き換えを行い、結合前のページ画像データも上記結合された領域画像を含む領域画像に書き換え、図42に示すような内容にする。
こうして、結合後の領域画像が電子文書データの全体に反映される。
その結果、図43の(a)に示すようなページ画像96になり、図43の(b)に示すように、文書構造を示すツリー形式の一覧表示では、結合前のページ画像に代わって、結合後のページ画像97が表示され、領域画像一覧画像についても、結合前の2つの領域画像に代わって、それらが1つに結合された領域画像98が表示される。
In the rewriting process, the region image ID “1002”, the storage location “repository / 1002.pdf”, the region image ID “1007”, and the storage location of the region image information of the page image metadata before combining shown in FIG. The “repository / 1007.pdf” is deleted, the area image ID “1008” and the storage location “repository / 1008.pdf” are newly rewritten, and the page image data before combination is also replaced with the combined area image. It is rewritten to the area image including it, and it becomes the content as shown in FIG.
In this way, the combined region image is reflected in the entire electronic document data.
As a result, a page image 96 as shown in FIG. 43 (a) is obtained. As shown in FIG. 43 (b), in the tree-format list display showing the document structure, instead of the page image before the combination, The combined page image 97 is displayed, and the area image list image is also displayed as a combined area image 98 instead of the two area images before combining.

一方、結合ウインドウでキャンセルボタンを押下すると、それまでに領域画像に対して加えた変更は破棄され、結合前の状態に戻る。
このようにして、複数の領域画像同士を結合して、1つの新たな領域画像を作成して電子文書データの全体に反映させることができるので、OCR認識不具合を修正することができ、ユーザが意図したデータを作成することができる。
On the other hand, when the cancel button is pressed in the combination window, the changes made to the area image so far are discarded and the state before the combination is restored.
In this way, a plurality of region images can be combined to create one new region image and reflected in the entire electronic document data, so that the OCR recognition defect can be corrected and the user can The intended data can be created.

[ページ内の画像領域又は文字領域の画像データの分割処理]
図44は、この画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの分割処理を示すフローチャート図である。
図45は、画像データの分割処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。
図46は、分割操作時に表示する分割ウインドウを示す図である。
図47は、分割後の一方の領域画像データと領域画像メタデータを示す図である。
図48は、分割後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
[Division processing of image data in image area or character area in page]
FIG. 44 is a flowchart showing a process for dividing image data in an image area or a character area in a page image in this image processing apparatus.
FIG. 45 is a diagram showing a list screen representing a tree format indicating the document structure of the electronic document at the time of image data division processing.
FIG. 46 is a diagram showing a split window displayed during the split operation.
FIG. 47 is a diagram showing one area image data and area image metadata after division.
FIG. 48 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the contents after division are reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における分割処理は、図44に示すように、ステップ(図中「S」で示す)81で、分割させる領域画像が含まれるページ画像に対して表示されている分割ボタンの押下を検出すると、ステップ82で、押下された分割ボタンに対応するページ画像内の領域画像についての分割ウインドウを表示し、ステップ83で、分割ウインドウ内の分割させる領域画像が選択され、ステップ84で、キャンセルボタンの押下を検出したか否かを判断し、押下を検出したら、この処理を終了する。   As shown in FIG. 44, in the division processing in this image processing apparatus, in step (indicated by “S” in the figure) 81, the division button displayed on the page image including the region image to be divided is pressed. If detected, in step 82, a divided window for the area image in the page image corresponding to the pressed division button is displayed. In step 83, the area image to be divided in the divided window is selected. It is determined whether or not the pressing of the button is detected. When the pressing is detected, this process is terminated.

ステップ84の判断でキャンセルボタンの押下を検出しなかったら、ステップ85で、分割ウインドウ内の分割実行ボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ85の処理を繰り返し、分割実行ボタンの押下を検出したら、ステップ86で分割ウインドウで選択された領域画像を、指定された複数の領域で分割し、その分割後の各領域画像データと領域画像メタデータを作成して記憶して保管し、上記分割後の各領域画像データと領域画像メタデータを関連付けるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。   If it is determined in step 84 that the cancel button has not been pressed, it is determined in step 85 whether or not a split execution button in the split window has been pressed. If no press is detected, the processing in step 85 is performed. If it is detected repeatedly that the division execution button is pressed, the area image selected in the division window in step 86 is divided into a plurality of designated areas, and the divided area image data and area image metadata are created. The page image data and the page image metadata of the electronic document data are rewritten so as to associate the divided region image data with the region image metadata, and this process is terminated.

次に、領域画像の分割処理と操作手順と表示画面例について説明する。
例えば、図45の(a)に示すページ画像100内の領域画像を2つに分割する場合、ユーザからの分割作業の選択入力があると、図45の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、電子文書一覧画像の各ページ画像の内、領域画像が含まれるページ画像の右隣にそれぞれ分割ボタンを表示する。
例えば、ページ画像101に分割処理をする場合、ユーザは、ページ画像101の右隣に位置する分割ボタン102を押下する。
Next, an area image division process, an operation procedure, and a display screen example will be described.
For example, when the region image in the page image 100 shown in FIG. 45A is divided into two, if there is a selection input of the division work from the user, the document structure as shown in FIG. Displays a tree-format list display.
In this list display, a division button is displayed on the right side of the page image including the region image among the page images of the electronic document list image.
For example, when the division process is performed on the page image 101, the user presses the division button 102 located on the right side of the page image 101.

ここで、分割前のページ画像100のページ画像データとページ画像メタデータの内容は、図42に示すような内容であり、ページ画像100内の分割する領域画像の領域画像データと領域画像メタデータの内容は、図41に示すような内容であるものとする。
分割ボタン102が押下されると、要求制御部21は、図42に示すページ画像メタデータの領域画像情報を参照し、そのページ内の各領域画像の保管場所から領域画像データを読み出し、表示部20に、図46に示す分割ウインドウを表示する。
Here, the contents of the page image data and the page image metadata of the page image 100 before the division are as shown in FIG. 42, and the area image data and area image metadata of the area image to be divided in the page image 100. Assume that the contents of are as shown in FIG.
When the division button 102 is pressed, the request control unit 21 refers to the region image information of the page image metadata shown in FIG. 42, reads the region image data from the storage location of each region image in the page, and displays the display unit. 20 displays the divided window shown in FIG.

この分割ウインドウには、ページ内の各領域画像がページ内の配置位置のままで表示されており、ここで、図46の(a)に示すように、図中点線枠で示す領域画像を2つに分割する場合、図46の(b)に示すように、この領域画像に対して分割する領域を破線枠103と104で示すように指定する操作をした後、分割実行ボタン105を押下する。
分割実行ボタン105が押下されると、要求制御部21は、図41に示した領域画像データから上記指定された2つの領域の新たな領域画像データを作成する。
こうして、分割ウインドウで領域画像の4点の座標を新たに指定し、その4点の座標に基づく矩形領域を再定義して2つ以上の領域画像を抽出し直すことで、複数の新たな領域画像を作成する。
In this divided window, each area image in the page is displayed as it is in the arrangement position in the page. Here, as shown in FIG. 46 (a), two area images indicated by a dotted frame in the figure are displayed. In the case of dividing into two, as shown in FIG. 46B, after performing an operation of designating an area to be divided as indicated by broken line frames 103 and 104 for this area image, the division execution button 105 is pressed. .
When the division execution button 105 is pressed, the request control unit 21 creates new area image data of the two specified areas from the area image data shown in FIG.
In this way, by newly specifying the coordinates of the four points of the area image in the divided window, redefining the rectangular area based on the coordinates of the four points, and re-extracting two or more area images, a plurality of new areas Create an image.

そして、検索部22を介して格納部14に2つの新たな領域画像データを格納し、その各領域画像データに割り当てた領域画像IDと保管場所に基づいて、各新たな領域画像データの領域画像メタデータを作成し、上記各新たな領域画像データにそれぞれ対応させて記憶する。
さらに、要求制御部21は、検索部22を介して格納部14に記憶されている分割前のページ画像データとページ画像メタデータとを書き換える処理を行う。
Then, two new region image data are stored in the storage unit 14 via the search unit 22, and the region image of each new region image data is based on the region image ID assigned to each region image data and the storage location. Metadata is created and stored in association with each new area image data.
Further, the request control unit 21 performs a process of rewriting the page image data before division and the page image metadata stored in the storage unit 14 via the search unit 22.

上記分割処理で新たに作成された領域画像データと領域画像メタデータの内容は、一方は、図38に示すような内容であり、その領域画像メタデータには領域画像ID「1002」と、保管場所「repository/1002.pdf」と、画像タイプ「図」が格納されている。
また、もう一方は、図47に示すような内容であり、その領域画像メタデータには領域画像ID「1007」と、保管場所「repository/1007.pdf」と、画像タイプ「図」が格納されている。
One of the contents of the area image data and the area image metadata newly created by the division processing is as shown in FIG. 38, and the area image metadata includes an area image ID “1002” and a storage. The location “repository / 1002.pdf” and the image type “figure” are stored.
The other is the contents as shown in FIG. 47, and the area image metadata stores the area image ID “1007”, the storage location “repository / 1007.pdf”, and the image type “diagram”. ing.

また、上記書き換え処理では、図42に示した分割前のページ画像メタデータの領域画像情報の領域画像ID「1008」と保管場所「repository/1008.pdf」を削除し、新たに、領域画像ID「1002」と保管場所「repository/1002.pdf」、領域画像ID「1007」と保管場所「repository/1007.pdf」を追加する書き換えを行い、分割前のページ画像データも上記分割された領域画像を含む領域画像に書き換え、図37に示すような内容にする。
こうして、分割後の領域画像が電子文書データの全体に反映される。
In the rewriting process, the area image ID “1008” and the storage location “repository / 1008.pdf” of the area image information of the page image metadata before division shown in FIG. Rewriting is performed to add “1002” and storage location “repository / 1002.pdf”, region image ID “1007” and storage location “repository / 1007.pdf”, and the page image data before the division is also divided into the region images. Is rewritten into an area image including the contents shown in FIG.
Thus, the divided area image is reflected in the entire electronic document data.

その結果、図48の(a)に示すようなページ画像106になり、図48の(b)に示すように、文書構造を示すツリー形式の一覧表示では、分割前のページ画像に代わって、分割後のページ画像107が表示され、領域画像一覧画像についても、分割前の領域画像に代わって、それらが2つに分割された領域画像の領域画像108と109が表示される。   As a result, a page image 106 as shown in FIG. 48 (a) is obtained. As shown in FIG. 48 (b), in the tree format list display showing the document structure, instead of the page image before division, The divided page image 107 is displayed, and the area image list image also displays area images 108 and 109 of the area image obtained by dividing them into two instead of the area image before division.

一方、分割ウインドウでキャンセルボタンを押下すると、それまでに領域画像に対して加えた変更は破棄され、分割前の状態に戻る。
このようにして、1の領域画像を分割して、新たな複数の領域画像を作成して電子文書データの全体に反映させることができるので、OCR認識不具合を修正することができ、ユーザが意図したデータを作成することができる。
On the other hand, when the cancel button is pressed in the division window, the changes made to the area image so far are discarded and the state before division is restored.
In this way, since one area image can be divided and a plurality of new area images can be created and reflected in the entire electronic document data, the OCR recognition defect can be corrected and the user intends Data can be created.

[ページ内への画像領域又は文字領域の画像データの追加処理]
図49は、この画像処理装置におけるページ画像内への画像領域又は文字領域の画像データの追加処理を示すフローチャート図である。
図50は、画像データの追加処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。
[Adding image data of image area or character area to the page]
FIG. 49 is a flowchart showing the process of adding image data of the image area or character area to the page image in this image processing apparatus.
FIG. 50 is a diagram showing a list screen representing a tree format showing the document structure of the electronic document at the time of image data addition processing.

図51は、追加前のページ画像データとページ画像メタデータを示す図である。
図52は、追加操作時に表示する追加画像選択ダイアログウインドウを示す図である。
図53は、追加操作時に表示する全体画像表示画面を示す図である。
図54は、追加後のページ画像データとページ画像メタデータの一例の図である。
図55は、追加後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
FIG. 51 is a diagram showing page image data and page image metadata before addition.
FIG. 52 is a diagram showing an additional image selection dialog window displayed during the addition operation.
FIG. 53 is a diagram showing an entire image display screen displayed during the addition operation.
FIG. 54 is a diagram of an example of page image data and page image metadata after addition.
FIG. 55 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the contents after addition are reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における追加処理は、図49に示すように、ステップ(図中「S」で示す)91で、新たな領域画像を追加するページ画像に対して表示されている追加ボタンの押下を検出すると、ステップ92で、押下された追加ボタンに対応するページ画像内に新たに追加する領域画像を選択する追加画像選択ダイアログウインドウを表示し、ステップ93で、追加画像選択ダイアログウインドウにおいて追加する領域画像データの選択がされ、ステップ94で追加画像選択ダイアログウインドウ内のキャンセルボタンの押下を検出したか否かを判断し、押下を検出したら、この処理を終了するが、押下を検出しなかったら、ステップ95で、追加画像選択ダイアログウインドウ内の開くボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ94の処理を繰り返す。   As shown in FIG. 49, in the addition processing in this image processing apparatus, in step (indicated by “S” in the figure) 91, the addition button displayed on the page image for adding a new region image is pressed. If detected, in step 92, an additional image selection dialog window for selecting an area image to be newly added in the page image corresponding to the pressed add button is displayed, and in step 93, an area to be added in the additional image selection dialog window. In step 94, it is determined whether or not the pressing of the cancel button in the additional image selection dialog window has been detected. If the pressing is detected, the process ends. If the pressing is not detected, In step 95, it is determined whether or not pressing of the open button in the additional image selection dialog window is detected. If you are not out, it repeats the processing of step 94.

一方、ステップ94の判断で開くボタンの押下を検出したら、ステップ95で全体画像表示画面を表示し、その全体画像表示画面内において上記選択した領域画像の追加位置を決定し、ステップ97で全体画像表示画面内の追加実行ボタンの押下を検出したか否かを判断し、追加実行ボタンの押下が検出されなければ、ステップ97の処理を繰り返し、追加実行ボタンの押下が検出されたら、ステップ98で、追加する領域画像データの領域画像メタデータを作成し、追加する領域画像データとその領域画像メタデータを対応させて記憶し、追加する領域画像データとその領域画像メタデータを関連付けるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。   On the other hand, if the depression of the open button is detected in the determination in step 94, the entire image display screen is displayed in step 95, the addition position of the selected region image is determined in the entire image display screen, and the entire image is determined in step 97. It is determined whether or not the pressing of the additional execution button in the display screen is detected. If the pressing of the additional execution button is not detected, the process of step 97 is repeated, and if the pressing of the additional execution button is detected, the process proceeds to step 98. In order to create region image metadata for the region image data to be added, store the region image data to be added and the region image metadata in association with each other, and associate the region image data to be added with the region image metadata. The page image data and page image metadata of the document data are rewritten, and this process is terminated.

また、上記処理において、追加するものとして選択された領域画像の画像サイズをページ内に納めたり、他の領域画像のサイズに合わせたりするため、追加に指定された領域画像の画像サイズをユーザによって任意に指定されたサイズまで拡大又は縮小の処理を施して変換し、あるいは、トリミング処理を施して変換するようにしてもよい。   In addition, in the above processing, the image size of the region image selected for addition is stored in the page or matched with the size of another region image. Conversion may be performed by performing enlargement or reduction processing to an arbitrarily specified size, or by performing trimming processing.

次に、領域画像の追加処理と操作手順と表示画面例について説明する。
例えば、図50の(a)に示すページ画像110内に新たな領域画像を追加する場合、ユーザからの追加作業の選択入力があると、図50の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、電子文書一覧画像の各ページ画像の右隣にそれぞれ追加ボタンを表示する。
例えば、ページ画像111に追加処理をする場合、ユーザは、ページ画像111の右隣に位置する追加ボタン112を押下する。
Next, an area image addition process, an operation procedure, and a display screen example will be described.
For example, when a new area image is added to the page image 110 shown in FIG. 50A, if a user selects and inputs additional work, a document structure as shown in FIG. 50B is displayed. Display a list of trees.
In this list display, an add button is displayed on the right side of each page image of the electronic document list image.
For example, when an additional process is performed on the page image 111, the user presses the add button 112 located on the right side of the page image 111.

ここで、追加前のページ画像110のページ画像データとページ画像メタデータの内容は、図51に示すような内容である。なお、図51において、この追加処理で利用しない各情報については記載を省略している。
追加ボタン112が押下されると、要求制御部21は、検索部22によって格納部14に格納されている追加可能な領域画像データを検索し、表示部20に、図52に示す追加画像選択ダイアログウインドウを表示する。
この追加画像選択ダイアログウインドウには、複数の追加可能な領域画像データのファイル名,サイズ,更新日時を含む情報の一覧を表示する。
また、追加画像選択ダイアログウインドウ内のキャンセルボタンが押下されたら、上記選択入力されたファイル名をクリアし、再度ファイル名の選択入力の画面に戻す。
Here, the contents of the page image data and the page image metadata of the page image 110 before addition are as shown in FIG. In FIG. 51, the description of each piece of information that is not used in this additional process is omitted.
When the add button 112 is pressed, the request control unit 21 searches the addable area image data stored in the storage unit 14 by the search unit 22 and displays the additional image selection dialog shown in FIG. Display the window.
In this additional image selection dialog window, a list of information including file names, sizes, and update dates / times of a plurality of area image data that can be added is displayed.
If the cancel button in the additional image selection dialog window is pressed, the file name selected and input is cleared, and the file name selection input screen is displayed again.

ユーザが、追加画像選択ダイアログウインドウの複数の追加可能な領域画像データの一覧から任意の領域画像データのファイル名を選択入力し、開くボタン113を押下すると、要求制御部21は検索部22を介して格納部14から上記選択入力されたファイル名の領域画像データを読み出して取得し、さらに、上記押下された追加ボタン112に対応するページ画像のページ画像データとページ画像メタデータとに基づいて、表示情報生成部23を介して、図53に示すような全体画像表示画面を表示部20に表示する。   When the user selects and inputs a file name of arbitrary area image data from a list of a plurality of area image data that can be added in the additional image selection dialog window and presses the open button 113, the request control unit 21 passes through the search unit 22. The area image data of the file name selected and input from the storage unit 14 is read out and acquired, and further, based on the page image data and page image metadata of the page image corresponding to the pressed add button 112, An overall image display screen as shown in FIG. 53 is displayed on the display unit 20 via the display information generation unit 23.

この全体画像表示画面には、ページ画像内の各領域画像がそのままの配置で表示され、その余白部に上記選択された領域画像データに基づく領域画像を表示しており、ユーザによる操作によって、上記選択された領域画像データに基づく領域画像114が、ページ画像中の追加する位置に配置され、全体画像表示画面中の追加実行ボタン115が押下されると、上記選択された領域画像データの領域画像メタデータを作成し、上記選択された領域画像データにその領域画像メタデータを対応させて検索部22を介して格納部14に格納すると共に、上記選択された領域画像データにその領域画像メタデータに基づいて、格納部14に記憶されている追加前のページ画像データとページ画像メタデータとを書き換える処理を行う。
ここで、全体画像表示画面内のキャンセルボタンが押下されると、それまでにページ画像に対して加えた変更は破棄され、ページ画像は追加前の状態に戻る。
On this entire image display screen, each area image in the page image is displayed as it is arranged, and an area image based on the selected area image data is displayed in the margin part. When the area image 114 based on the selected area image data is arranged at a position to be added in the page image and the add execution button 115 in the entire image display screen is pressed, the area image of the selected area image data is displayed. Metadata is created, the region image metadata is associated with the selected region image data and stored in the storage unit 14 via the search unit 22, and the region image metadata is stored in the selected region image data. Based on the above, a process of rewriting the page image data before addition and page image metadata stored in the storage unit 14 is performed.
Here, when the cancel button in the entire image display screen is pressed, the changes made to the page image so far are discarded, and the page image returns to the state before the addition.

上記書き換え処理では、図51に示した追加前のページ画像メタデータの領域画像情報に、今回新たに追加された領域画像データの領域画像ID「1003」と保管場所「repository/1003.pdf」を追加するように書き換え、図54に示すような内容にする。
こうして、領域画像の追加が電子文書データの全体に反映される。
In the rewriting process, the area image ID “1003” and the storage location “repository / 1003.pdf” of the area image data newly added this time are added to the area image information of the page image metadata before addition shown in FIG. The content is rewritten as shown in FIG.
In this way, the addition of the area image is reflected in the entire electronic document data.

その結果、図55の(a)に示すようなページ画像116になり、図55の(b)に示すように、文書構造を示すツリー形式の一覧表示では、領域画像の追加前のページ画像に代わって、領域画像の追加後のページ画像117が表示される。さらに、そのページ画像内の領域画像一覧画像について、新たに追加された領域画像118がツリー形式で表示される。
このようにして、電子文書データに、選択した任意の領域画像を追加することにより、OCR認識不具合を修正することができる。また、ユーザが意図したデータを持つ電子文書データを作成することができる。
As a result, a page image 116 as shown in FIG. 55A is obtained, and as shown in FIG. 55B, in the list display in the tree format showing the document structure, the page image before the addition of the region image is displayed. Instead, the page image 117 after the addition of the region image is displayed. Further, the newly added region image 118 is displayed in a tree format for the region image list image in the page image.
In this way, the OCR recognition defect can be corrected by adding the selected arbitrary region image to the electronic document data. Also, electronic document data having data intended by the user can be created.

[ページ内の画像領域又は文字領域の画像データの削除処理]
図56は、この画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの削除処理を示すフローチャート図である。
図57は、画像データの削除処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。
図58は、削除操作時に表示する全体画像表示画面を示す図である。
図59は、削除後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。
なお、上記各図において、以下の説明で特に重要でないデータと一部の図の記載を省略している。
[Deleting image data in the image area or character area in the page]
FIG. 56 is a flowchart showing image data deletion processing of an image area or a character area in a page image in this image processing apparatus.
FIG. 57 is a diagram showing a list screen representing a tree format showing the document structure of the electronic document at the time of image data deletion processing.
FIG. 58 is a diagram showing an entire image display screen displayed during the deletion operation.
FIG. 59 is a diagram showing a tree-format list screen showing the document structure of the electronic document when the contents after deletion are reflected in the entire electronic document.
In each of the above drawings, data that is not particularly important in the following description and some drawings are omitted.

この画像処理装置における削除処理は、図56に示すように、ステップ(図中「S」で示す)101で、削除する領域画像に対して表示されている削除ボタンの押下を検出すると、ステップ102で、押下された削除ボタンに対応する領域画像を確認させるための全体画像表示画面を表示し、ステップ103で、全体画像表示画面中のキャンセルボタンの押下を検出したか否かを判断し、押下を検出したら、この処理を終了するが、押下を検出しなかったら、ステップ104で、全体画像表示画面内の削除実行ボタンの押下を検出したか否かを判断し、押下を検出しなかったら、ステップ104の処理を繰り返し、削除実行ボタンの押下を検出したら、ステップ105でページ画像中から上記選択された領域画像を削除し、その削除後の内容を反映させるように、電子文書データのページ画像データとページ画像メタデータとを書き換え、この処理を終了する。   As shown in FIG. 56, the deletion processing in this image processing apparatus is performed when step 101 (indicated by “S” in the figure) 101 detects that the delete button displayed on the area image to be deleted is pressed. Display an entire image display screen for confirming the region image corresponding to the pressed delete button, and in step 103, determine whether or not the pressing of the cancel button in the entire image display screen is detected. This process is terminated. However, if the pressing is not detected, it is determined in step 104 whether or not the pressing of the delete execution button in the entire image display screen is detected. If the pressing is not detected, When the process of step 104 is repeated and the pressing of the delete execution button is detected, the selected area image is deleted from the page image in step 105, and the content after the deletion As reflect rewrites the page image data and the page image metadata of the electronic document data, the process ends.

次に、領域画像の削除処理と操作手順と表示画面例について説明する。
例えば、図57の(a)に示すページ画像120内の領域画像を削除する場合、ユーザからの削除作業の選択入力があると、図57の(b)に示すような文書構造を示すツリー形式の一覧表示を表示する。
この一覧表示では、ページ内の領域画像の一覧画像で表示されている各領域画像の右隣にそれぞれ削除ボタンを表示する。
例えば、領域画像121を削除する場合、ユーザは、領域画像121の右隣に位置する削除ボタン122を押下する。
Next, an area image deletion process, an operation procedure, and a display screen example will be described.
For example, in the case of deleting the region image in the page image 120 shown in FIG. 57A, if there is a selection input for deletion work from the user, a tree format showing a document structure as shown in FIG. Display the list display.
In this list display, a delete button is displayed to the right of each area image displayed in the list image of area images in the page.
For example, when deleting the area image 121, the user presses the delete button 122 located on the right side of the area image 121.

ここで、削除前のページ画像120のページ画像データとページ画像メタデータの内容は、図19に示したような内容である。
削除ボタン122が押下されると、要求制御部21は、図19に示すページ画像メタデータの領域画像情報を参照し、このページ内の各領域画像データを読み出し、表示部20に、図58に示す全体画像表示画面を表示する。
この全体画像表示画面には、このページ画像内の各領域画像がそのままの配置で表示され、上記削除ボタン122に対応する領域画像123は削除対象として選択されたことを強調表示で示している。
Here, the contents of the page image data and the page image metadata of the page image 120 before deletion are as shown in FIG.
When the delete button 122 is pressed, the request control unit 21 refers to the region image information of the page image metadata shown in FIG. 19, reads each region image data in this page, and displays it on the display unit 20 as shown in FIG. The entire image display screen shown is displayed.
On the entire image display screen, the area images in the page image are displayed as they are, and the area image 123 corresponding to the delete button 122 is highlighted to indicate that it has been selected for deletion.

ユーザは、全体画像表示画面において、削除される領域画像123を確認し、削除実行ボタン124を押下すると、要求制御部21は、検索部22を介して格納部14に格納されているページ画像データとページ画像メタデータを書き換える。
この書き換え処理では、図19に示したページ画像メタデータの領域画像情報から、上記削除した領域画像の領域画像ID「1003」と保存場所「repository/1003.pdf」を削除し、ページ画像データも上記削除が指定された領域画像を削除した内容に書き換え、図51に示すような内容にする。
このようにして、ページ画像中から任意の領域画像を削除した内容が、電子文書データ全体に反映される。
When the user confirms the area image 123 to be deleted on the entire image display screen and presses the delete execution button 124, the request control unit 21 stores the page image data stored in the storage unit 14 via the search unit 22. And rewrite the page image metadata.
In this rewriting process, the area image ID “1003” and the storage location “repository / 1003.pdf” of the deleted area image are deleted from the area image information of the page image metadata shown in FIG. The area image designated to be deleted is rewritten with the deleted contents so as to have the contents as shown in FIG.
In this way, the contents obtained by deleting an arbitrary area image from the page image are reflected in the entire electronic document data.

その結果、図59の(a)に示すようなページ画像125になり、図59の(b)に示すように、文書構造を示すツリー形式の一覧表示では、領域画像の削除前のページ画像に代わって、領域画像の削除後のページ画像126が表示される。さらに、そのページ画像内の領域画像一覧画像について、削除された領域画像とその右隣に表示されていた削除ボタンが消去されている。
一方、全体画像表示画面でキャンセルボタンが押下されると、それまでにページ画像に対して加えた変更は破棄され、ページ画像は削除前の状態に戻る。
このようにして、電子文書データのページ画像から任意の領域画像を削除することにより、OCR認識不具合を修正することができる。また、ユーザが意図したデータを持つ電子文書データを作成することができる。
As a result, a page image 125 as shown in FIG. 59 (a) is obtained. As shown in FIG. 59 (b), in the list display in the tree format indicating the document structure, the page image before deletion of the region image is displayed. Instead, the page image 126 after the area image is deleted is displayed. Further, with respect to the region image list image in the page image, the deleted region image and the delete button displayed on the right side thereof are deleted.
On the other hand, when the cancel button is pressed on the entire image display screen, the changes made to the page image so far are discarded, and the page image returns to the state before deletion.
In this way, the OCR recognition defect can be corrected by deleting an arbitrary area image from the page image of the electronic document data. Also, electronic document data having data intended by the user can be created.

この発明による画像処理装置と画像処理方法とプログラムは、デスクトップパソコン,ノートブックパソコン等のパーソナルコンピュータにおいても適用することができる。   The image processing apparatus, the image processing method, and the program according to the present invention can also be applied to personal computers such as desktop personal computers and notebook personal computers.

この発明の実施例の画像処理装置の機能構成を示すブロック図である。It is a block diagram which shows the function structure of the image processing apparatus of the Example of this invention. 図1に示した登録部によって格納部へ登録される情報の詳しい説明図である。FIG. 3 is a detailed explanatory diagram of information registered in a storage unit by the registration unit illustrated in FIG. 1. 図2の続きの説明図である。It is explanatory drawing of a continuation of FIG. 図3の続きの説明図である。It is explanatory drawing of a continuation of FIG. 電子文書の文書構造を表示する画面例の説明図である。It is explanatory drawing of the example of a screen which displays the document structure of an electronic document.

同じく電子文書の文書構造を表示する画面例の説明図である。It is explanatory drawing of the example of a screen which similarly displays the document structure of an electronic document. 同じく電子文書の文書構造を表示する画面例の説明図である。It is explanatory drawing of the example of a screen which similarly displays the document structure of an electronic document. ページ一覧画面から文書ツリー画面に切り替えるときの処理を示すフローチャート図である。It is a flowchart figure which shows the process at the time of switching from a page list screen to a document tree screen. 領域画像のソートの説明図である。It is explanatory drawing of the sorting of a region image.

ツリー表示で展開中の領域画像を省略表示にする処理を示すフローチャート図である。It is a flowchart figure which shows the process which abbreviate | omits the area | region image currently expand | deployed by tree display. プレビュー画面の一例を示す図である。It is a figure which shows an example of a preview screen. ページ一覧画面からプレビュー画面に切り替える処理のフローチャート図である。It is a flowchart figure of the process which switches from a page list screen to a preview screen. プレビュー表示されたページの領域画像をドラッグ&ドロップする際の処理を示すフローチャート図である。FIG. 10 is a flowchart illustrating processing when dragging and dropping an area image of a page displayed as a preview.

ツリー形式以外の表示形式の説明図である。It is explanatory drawing of display formats other than a tree format. プレビュー画面におけるエリア強調表示例を示す説明図である。It is explanatory drawing which shows the example of area emphasis display on a preview screen. ツリー形式以外の表示形式の他の例の説明図である。It is explanatory drawing of the other example of display formats other than a tree format. この実施例の画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの編集処理を示すフローチャート図である。It is a flowchart figure which shows the edit process of the image data of the image area | region or character area | region in a page image in the image processing apparatus of this Example.

この実施例の画像処理装置における画像データの編集処理時の電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of the electronic document at the time of the edit process of the image data in the image processing apparatus of this Example. この実施例の画像処理装置における編集前のページ画像データとページ画像メタデータを示す図である。It is a figure which shows the page image data and page image metadata before editing in the image processing apparatus of this Example. この実施例の画像処理装置における編集前の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region image metadata before editing in the image processing apparatus of this Example.

この実施例の画像処理装置における編集操作時に表示する編集ウインドウを示す図である。It is a figure which shows the edit window displayed at the time of editing operation in the image processing apparatus of this Example. この実施例の画像処理装置における編集後の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region metadata after editing in the image processing apparatus of this Example. この実施例の画像処理装置における編集後の内容を電子文書データに反映させるか否かを選択する選択ダイアログ画面を示す図である。It is a figure which shows the selection dialog screen which selects whether the content after edit in the image processing apparatus of this Example is reflected in electronic document data.

この実施例の画像処理装置における編集後のページ画像データとページ画像メタデータの一例の図である。It is a figure of an example of the page image data after edit in the image processing apparatus of this Example, and page image metadata. この実施例の画像処理装置における編集後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after edit in the image processing apparatus of this Example is reflected in the whole electronic document. この実施例の画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの置換処理を示すフローチャート図である。It is a flowchart figure which shows the replacement process of the image data of the image area | region or character area | region in a page image in the image processing apparatus of this Example.

この実施例の画像処理装置における画像データの置換処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。It is a figure which shows the list screen showing the tree format which shows the document structure of the electronic document at the time of the replacement process of the image data in the image processing apparatus of this Example. この実施例の画像処理装置における置換前のページ画像データとページ画像メタデータを示す図である。It is a figure which shows the page image data and page image metadata before replacement in the image processing apparatus of this embodiment. この実施例の画像処理装置における置換前の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region image metadata before replacement in the image processing apparatus of this Example.

この実施例の画像処理装置における置換操作時に表示する置換ウインドウを示す図である。It is a figure which shows the replacement window displayed at the time of replacement operation in the image processing apparatus of this Example. この実施例の画像処理装置における置換操作時に表示する置換画像選択ダイアログウインドウを示す図である。It is a figure which shows the replacement image selection dialog window displayed at the time of replacement operation in the image processing apparatus of this embodiment. この実施例の画像処理装置における置換後の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region metadata after replacement in the image processing apparatus of this Example.

この実施例の画像処理装置における置換後のページ画像データとページ画像メタデータの一例の図である。It is a figure of an example of the page image data after replacement | exchange in the image processing apparatus of this Example, and page image metadata. この実施例の画像処理装置における置換後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after replacement in the image processing apparatus of this Example is reflected in the whole electronic document. この実施例の画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの結合処理を示すフローチャート図である。It is a flowchart figure which shows the combination process of the image data of the image area | region or character area | region in a page image in the image processing apparatus of this Example.

この実施例の画像処理装置における画像データの結合処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。It is a figure which shows the list screen showing the tree format which shows the document structure of the electronic document at the time of the joint process of the image data in the image processing apparatus of this Example. この実施例の画像処理装置における結合前のページ画像データとページ画像メタデータを示す図である。It is a figure which shows the page image data and page image metadata before the combination in the image processing apparatus of this embodiment. この実施例の画像処理装置における結合する一方の領域画像の結合前の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region image metadata before combining of the one area | region image to combine in the image processing apparatus of this Example.

この実施例の画像処理装置における結合するもう一方の領域画像の結合前の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region image metadata before the combination of the other area | region image to combine in the image processing apparatus of this Example. この実施例の画像処理装置における結合操作時に表示する結合ウインドウを示す図である。It is a figure which shows the joint window displayed at the time of the joint operation in the image processing apparatus of this Example. この実施例の画像処理装置における結合後の領域画像データと領域画像メタデータを示す図である。It is a figure which shows the area | region image data and area | region image metadata after a combination in the image processing apparatus of this Example.

この実施例の画像処理装置における結合後のページ画像データとページ画像メタデータの一例の図である。It is a figure of an example of the page image data and page image metadata after the combination in the image processing apparatus of this embodiment. この実施例の画像処理装置における結合後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after the combination in the image processing apparatus of this Example is reflected in the whole electronic document. この実施例の画像処理装置におけるこの画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの分割処理を示すフローチャート図である。It is a flowchart figure which shows the division | segmentation process of the image data of the image area | region or character area | region in a page image in this image processing apparatus in the image processing apparatus of this Example.

この実施例の画像処理装置における画像データの分割処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。It is a figure which shows the list screen showing the tree format which shows the document structure of the electronic document at the time of the division | segmentation process of the image data in the image processing apparatus of this Example. この実施例の画像処理装置における分割操作時に表示する分割ウインドウを示す図である。It is a figure which shows the division | segmentation window displayed at the time of the division | segmentation operation in the image processing apparatus of this Example. この実施例の画像処理装置における分割後の一方の領域画像データと領域画像メタデータを示す図である。It is a figure which shows one area | region image data and area | region image metadata after the division | segmentation in the image processing apparatus of this Example.

この実施例の画像処理装置における分割後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after the division | segmentation in the image processing apparatus of this Example is reflected in the whole electronic document. この実施例の画像処理装置におけるページ画像内への画像領域又は文字領域の画像データの追加処理を示すフローチャート図である。It is a flowchart figure which shows the addition process of the image data of the image area | region or character area | region in the page image in the image processing apparatus of this Example. この実施例の画像処理装置における画像データの追加処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。It is a figure which shows the list screen showing the tree format which shows the document structure of the electronic document at the time of the addition process of the image data in the image processing apparatus of this Example.

この実施例の画像処理装置における追加前のページ画像データとページ画像メタデータを示す図である。It is a figure which shows the page image data before addition and page image metadata in the image processing apparatus of this Example. この実施例の画像処理装置における追加操作時に表示する追加画像選択ダイアログウインドウを示す図である。It is a figure which shows the additional image selection dialog window displayed at the time of addition operation in the image processing apparatus of this Example. この実施例の画像処理装置における追加操作時に表示する全体画像表示画面を示す図である。It is a figure which shows the whole image display screen displayed at the time of addition operation in the image processing apparatus of this Example.

この実施例の画像処理装置における追加後のページ画像データとページ画像メタデータの一例の図である。It is a figure of an example of the page image data and page image metadata after the addition in the image processing apparatus of this embodiment. この実施例の画像処理装置における追加後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after the addition in the image processing apparatus of this Example is reflected in the whole electronic document. この実施例の画像処理装置におけるページ画像内の画像領域又は文字領域の画像データの削除処理を示すフローチャート図である。It is a flowchart figure which shows the deletion process of the image data of the image area | region or character area | region in a page image in the image processing apparatus of this Example.

この実施例の画像処理装置における画像データの削除処理時の電子文書の文書構造を示すツリー形式を表す一覧画面を示す図である。It is a figure which shows the list screen showing the tree format which shows the document structure of the electronic document at the time of the deletion process of the image data in the image processing apparatus of this Example. この実施例の画像処理装置における削除操作時に表示する全体画像表示画面を示す図である。It is a figure which shows the whole image display screen displayed at the time of deletion operation in the image processing apparatus of this Example. この実施例の画像処理装置における削除後の内容を電子文書全体に反映させたときの電子文書の文書構造を示すツリー形式の一覧画面を示す図である。It is a figure which shows the list screen of a tree format which shows the document structure of an electronic document when the content after deletion in the image processing apparatus of this Example is reflected in the whole electronic document.

符号の説明Explanation of symbols

1:登録処理部 2:検索表示部 10:文書入力部 11:領域抽出部 12:テキスト抽出部 13:登録部 14:格納部 20:表示部 21:要求制御部 22:検索部 23:表示情報生成部 30:電子文書データ 31:電子文書メタデータ 32:ページ画像データ 33:ページ画像メタデータ 34:領域画像データ 35:領域画像メタデータ 1: Registration processing unit 2: Search display unit 10: Document input unit 11: Area extraction unit 12: Text extraction unit 13: Registration unit 14: Storage unit 20: Display unit 21: Request control unit 22: Search unit 23: Display information Generation unit 30: electronic document data 31: electronic document metadata 32: page image data 33: page image metadata 34: area image data 35: area image metadata

Claims (18)

電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出手段と、前記電子文書データと前記電子文書データのページ画像データと該ページ画像データについて前記抽出手段によって抽出した画像データをそれぞれ関連付けて登録する登録手段と、該登録手段によって登録されたデータに基づいて前記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示手段とを備えた画像処理装置において、
前記画像データに編集を加える編集手段と、該編集手段によって編集された後の画像データを前記電子文書データのページ画像データと関連付けるか否かを選択する選択手段と、該選択手段によって関連付けると選択されたとき、前記電子文書データのページ画像データに関連付けられている画像データに代えて、前記編集手段によって編集された後の画像データを前記電子文書データのページ画像データと関連付ける手段とを設けたことを特徴とする画像処理装置。
Extraction means for extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, the electronic document data, and page image data of the electronic document data; Registration means for associating and registering the image data extracted by the extraction means for the page image data, and the page configuration of the electronic document data, the image area and the character area in the page based on the data registered by the registration means And an image processing apparatus including a display unit that displays a document structure including the area configuration of
Editing means for editing the image data, selection means for selecting whether or not to associate the image data edited by the editing means with the page image data of the electronic document data, and selecting when the selection means associates A means for associating the image data edited by the editing means with the page image data of the electronic document data, instead of the image data associated with the page image data of the electronic document data. An image processing apparatus.
前記編集手段は、前記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える手段であり、前記指定された他の画像データの画像の大きさが前記登録されている画像データの画像の大きさと異なる場合、前記指定された他の画像データの画像の大きさを、前記登録されている画像データの画像の大きさに合せる調整手段を設けたことを特徴とする請求項1記載の画像処理装置。   The editing means is means for adding editing for replacing image data registered in association with page image data of the electronic document data with other designated image data. When the image size is different from the image size of the registered image data, the adjustment is performed so that the image size of the specified other image data matches the image size of the registered image data. 2. The image processing apparatus according to claim 1, further comprising means. 前記編集手段は、前記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える手段であることを特徴とする請求項1記載の画像処理装置。   2. The editing unit according to claim 1, wherein the editing unit is a unit for adding a plurality of pieces of image data registered in association with page image data of the electronic document data to make one image data. Image processing device. 前記編集手段は、前記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える手段であることを特徴とする請求項1記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the editing unit is a unit that adds editing that divides image data registered in association with page image data of the electronic document data into a plurality of image data. 前記編集手段は、前記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える手段であることを特徴とする請求項1記載の画像処理装置。   2. The image processing apparatus according to claim 1, wherein the editing means is means for adding editing for adding new image data at a specified position in the page image data. 前記編集手段は、前記ページ画像データに関連付けて登録されている画像データを削除する編集を加える手段であることを特徴とする請求項1記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the editing unit is a unit that adds editing for deleting image data registered in association with the page image data. 電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出工程と、前記電子文書データと前記電子文書データのページ画像データと該ページ画像データについて前記抽出工程によって抽出した画像データをそれぞれ関連付けて登録する登録工程と、該登録工程によって登録されたデータに基づいて前記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示工程とからなる画像処理方法において、
前記画像データに編集を加える編集工程と、該編集工程によって編集された後の画像データを前記電子文書データのページ画像データと関連付けるか否かを選択する選択工程と、該選択工程によって関連付けると選択されたとき、前記電子文書データのページ画像データに関連付けられている画像データに代えて、前記編集工程によって編集された後の画像データを前記電子文書データのページ画像データと関連付ける工程とを設けたことを特徴とする画像処理方法。
An extraction step of extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, and the page image data of the electronic document data and the electronic document data; A registration step for registering the image data extracted in the extraction step in association with the page image data, and a page configuration of the electronic document data, an image region in the page, and a character region based on the data registered in the registration step In an image processing method comprising a display step for displaying a document structure consisting of
An editing step for editing the image data, a selection step for selecting whether or not the image data edited by the editing step is to be associated with the page image data of the electronic document data, and a selection when the selection is performed by the selection step And a step of associating the image data edited by the editing step with the page image data of the electronic document data, instead of the image data associated with the page image data of the electronic document data. An image processing method.
前記編集工程は、前記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える工程であり、前記指定された他の画像データの画像の大きさが前記登録されている画像データの画像の大きさと異なる場合、前記指定された他の画像データの画像の大きさを、前記登録されている画像データの画像の大きさに合せる調整工程を設けたことを特徴とする請求項7記載の画像処理方法。   The editing step is a step of adding editing for replacing the image data registered in association with the page image data of the electronic document data with the other designated image data. When the image size is different from the image size of the registered image data, the adjustment is performed so that the image size of the specified other image data matches the image size of the registered image data. The image processing method according to claim 7, further comprising a step. 前記編集工程は、前記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える工程であることを特徴とする請求項7記載の画像処理方法。   8. The editing step according to claim 7, wherein the editing step is a step of adding a plurality of pieces of image data registered in association with page image data of the electronic document data into one image data. Image processing method. 前記編集工程は、前記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える工程であることを特徴とする請求項7記載の画像処理方法。   8. The image processing method according to claim 7, wherein the editing step is a step of adding an edit for dividing image data registered in association with page image data of the electronic document data into a plurality of image data. 前記編集工程は、前記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える工程であることを特徴とする請求項7記載の画像処理方法。   8. The image processing method according to claim 7, wherein the editing step is a step of adding an edit for adding new image data at a designated position in the page image data. 前記編集工程は、前記ページ画像データに関連付けて登録されている画像データを削除する編集を加える工程であることを特徴とする請求項7記載の画像処理方法。   8. The image processing method according to claim 7, wherein the editing step is a step of adding an edit to delete image data registered in association with the page image data. コンピュータに、電子文書データのページ画像データから画像を含む画像領域の画像データと、文字列を含む文字領域の画像データとをそれぞれ抽出する抽出手順と、前記電子文書データと前記電子文書データのページ画像データと該ページ画像データについて前記抽出手順によって抽出した画像データをそれぞれ関連付けて登録する登録手順と、該登録手順によって登録されたデータに基づいて前記電子文書データのページ構成とページ中の画像領域と文字領域との領域構成とからなる文書構造を表示する表示手順とを実行させるためのプログラムにおいて、
前記画像データに編集を加える編集手順と、該編集手順によって編集された後の画像データを前記電子文書データのページ画像データと関連付けるか否かを選択する選択手順と、該選択手順によって関連付けると選択されたとき、前記電子文書データのページ画像データに関連付けられている画像データに代えて、前記編集手順によって編集された後の画像データを前記電子文書データのページ画像データと関連付ける手順とを実行させるためのプログラム。
An extraction procedure for extracting image data of an image area including an image and image data of a character area including a character string from page image data of the electronic document data, respectively, and a page of the electronic document data and the electronic document data A registration procedure for associating and registering image data and image data extracted by the extraction procedure for the page image data, and a page configuration of the electronic document data and an image area in the page based on the data registered by the registration procedure In a program for executing a display procedure for displaying a document structure consisting of an area configuration of a text area and a text area,
An editing procedure for editing the image data, a selection procedure for selecting whether or not the image data edited by the editing procedure is to be associated with the page image data of the electronic document data, and a selection to associate with the selection procedure And a step of associating the image data edited by the editing procedure with the page image data of the electronic document data, instead of the image data associated with the page image data of the electronic document data. Program for.
前記編集手順は、前記電子文書データのページ画像データに関連付けて登録されている画像データを、指定された他の画像データに置換する編集を加える手順であり、前記指定された他の画像データの画像の大きさが前記登録されている画像データの画像の大きさと異なる場合、前記指定された他の画像データの画像の大きさを、前記登録されている画像データの画像の大きさに合せる調整手順を実行させるための請求項13記載のプログラム。   The editing procedure is a procedure for adding editing for replacing image data registered in association with page image data of the electronic document data with other specified image data. When the image size is different from the image size of the registered image data, the adjustment is performed so that the image size of the specified other image data matches the image size of the registered image data. The program according to claim 13 for executing a procedure. 前記編集手順は、前記電子文書データのページ画像データに関連付けて登録されている複数の画像データを結合して1つの画像データにする編集を加える手順である請求項13記載のプログラム。   14. The program according to claim 13, wherein the editing procedure is a procedure for adding a plurality of pieces of image data registered in association with page image data of the electronic document data to make one image data. 前記編集手順は、前記電子文書データのページ画像データに関連付けて登録されている画像データを複数の画像データに分割する編集を加える手順である請求項13記載のプログラム。   The program according to claim 13, wherein the editing procedure is a procedure of adding an edit for dividing image data registered in association with page image data of the electronic document data into a plurality of image data. 前記編集手順は、前記ページ画像データ中の指定された位置に新たな画像データを追加する編集を加える手順である請求項13記載のプログラム。   The program according to claim 13, wherein the editing procedure is a procedure of adding editing for adding new image data at a specified position in the page image data. 前記編集手順は、前記ページ画像データに関連付けて登録されている画像データを削除する編集を加える手順である請求項13記載のプログラム。   The program according to claim 13, wherein the editing procedure is a procedure of adding an edit that deletes image data registered in association with the page image data.
JP2007244353A 2007-09-20 2007-09-20 Image processor, image processing method, and program Pending JP2009075879A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007244353A JP2009075879A (en) 2007-09-20 2007-09-20 Image processor, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007244353A JP2009075879A (en) 2007-09-20 2007-09-20 Image processor, image processing method, and program

Publications (1)

Publication Number Publication Date
JP2009075879A true JP2009075879A (en) 2009-04-09

Family

ID=40610780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007244353A Pending JP2009075879A (en) 2007-09-20 2007-09-20 Image processor, image processing method, and program

Country Status (1)

Country Link
JP (1) JP2009075879A (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011004356A (en) * 2009-06-22 2011-01-06 Kyocera Mita Corp Image forming apparatus
WO2012002551A1 (en) * 2010-06-29 2012-01-05 Ricoh Company, Ltd. Automatic attachment of a captured image to a document based on context
US8260051B2 (en) 2008-10-20 2012-09-04 Ricoh Company, Ltd. Image processing apparatus for generating and transmitting push-type data
WO2012121183A1 (en) * 2011-03-07 2012-09-13 Ricoh Company, Ltd. Generating page and document logs for electronic documents
US8555195B2 (en) 2010-06-29 2013-10-08 Ricoh Co., Ltd. Bookmark function for navigating electronic document pages
US9043219B2 (en) 2010-09-10 2015-05-26 Ricoh Co., Ltd. Automatic and semi-automatic selection of service or processing providers
US9058778B2 (en) 2010-06-29 2015-06-16 Ricoh Co., Ltd. Maintaining DC balance in electronic paper displays using contrast correction
JP2015517710A (en) * 2012-05-24 2015-06-22 マイクロソフト コーポレーション Techniques for automatically managing file descriptors
US9286581B2 (en) 2010-06-29 2016-03-15 Ricoh Co., Ltd. User interface with inbox mode and document mode for single input work flow routing
JP2018073420A (en) * 2016-10-26 2018-05-10 株式会社リコー Synchronization with change of portable document format print job of metadata
JP2018173781A (en) * 2017-03-31 2018-11-08 京セラドキュメントソリューションズ株式会社 Image forming apparatus

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260051B2 (en) 2008-10-20 2012-09-04 Ricoh Company, Ltd. Image processing apparatus for generating and transmitting push-type data
JP2011004356A (en) * 2009-06-22 2011-01-06 Kyocera Mita Corp Image forming apparatus
US8555195B2 (en) 2010-06-29 2013-10-08 Ricoh Co., Ltd. Bookmark function for navigating electronic document pages
US9058778B2 (en) 2010-06-29 2015-06-16 Ricoh Co., Ltd. Maintaining DC balance in electronic paper displays using contrast correction
CN103080980A (en) * 2010-06-29 2013-05-01 株式会社理光 Automatic attachment of a captured image to a document based on context
EP2589022A1 (en) * 2010-06-29 2013-05-08 Ricoh Company Ltd. Automatic attachment of a captured image to a document based on context
US9286581B2 (en) 2010-06-29 2016-03-15 Ricoh Co., Ltd. User interface with inbox mode and document mode for single input work flow routing
JP2013535710A (en) * 2010-06-29 2013-09-12 株式会社リコー Automatic attachment of captured images to documents based on context
WO2012002551A1 (en) * 2010-06-29 2012-01-05 Ricoh Company, Ltd. Automatic attachment of a captured image to a document based on context
EP2589022A4 (en) * 2010-06-29 2013-12-18 Ricoh Co Ltd Automatic attachment of a captured image to a document based on context
KR101443485B1 (en) * 2010-06-29 2014-09-22 가부시키가이샤 리코 Automatic attachment of a captured image to a document based on context
US9191612B2 (en) 2010-06-29 2015-11-17 Ricoh Co., Ltd. Automatic attachment of a captured image to a document based on context
US9043219B2 (en) 2010-09-10 2015-05-26 Ricoh Co., Ltd. Automatic and semi-automatic selection of service or processing providers
WO2012121183A1 (en) * 2011-03-07 2012-09-13 Ricoh Company, Ltd. Generating page and document logs for electronic documents
US8504907B2 (en) 2011-03-07 2013-08-06 Ricoh Co., Ltd. Generating page and document logs for electronic documents
JP2015517710A (en) * 2012-05-24 2015-06-22 マイクロソフト コーポレーション Techniques for automatically managing file descriptors
JP2018073420A (en) * 2016-10-26 2018-05-10 株式会社リコー Synchronization with change of portable document format print job of metadata
JP2018173781A (en) * 2017-03-31 2018-11-08 京セラドキュメントソリューションズ株式会社 Image forming apparatus

Similar Documents

Publication Publication Date Title
JP2009075879A (en) Image processor, image processing method, and program
US8584009B2 (en) Automatically propagating changes in document access rights for subordinate document components to superordinate document components
JP2004139466A (en) Electronic document printing program, and electronic document printing system
JP2005244301A (en) Image generating method, image generating apparatus, and image generating program
JP4961875B2 (en) Document management apparatus, document management method, and program
JP2007115131A (en) Information processor and its control method, information processing system, computer program, and storage medium
JPH05225185A (en) Document processor
JP4747986B2 (en) Image processing apparatus and program
US8190563B2 (en) Document management apparatus, document management method, and computer-readable encoding medium recorded with a computer program
JP2005339580A (en) Document data management device and program
JP2007115132A (en) Information processor and its control method, information processing system, computer program and storage medium
JP7154982B2 (en) Information processing device, control method, and program
JP2009064080A (en) Image processor, image processing method, and program
JP2001022828A (en) Method and device for optimally achieving job and result
JP2004086426A (en) Document management system, program for the same, and recording medium
JP4673335B2 (en) Structured document hyperlink method and hyperlink apparatus
JP5298484B2 (en) Document processing device
JP4220439B2 (en) Structured data conversion apparatus and method
JP7192206B2 (en) Information processing device and program
JP7119340B2 (en) Information processing device and program
JP4879866B2 (en) Image generating apparatus and image generating method
JP7135300B2 (en) Information processing device and program
JP7302146B2 (en) Information processing device, information processing system and program
JP2004164301A (en) Information processor, information processing method and program for making computer execute the method
JP2000315209A (en) Image filing device, image filing method and recording medium readable by computer in which program to make computer execute the method is recorded