JP5194995B2 - Document processing apparatus, document summary creation method, and document summary creation program - Google Patents

Document processing apparatus, document summary creation method, and document summary creation program Download PDF

Info

Publication number
JP5194995B2
JP5194995B2 JP2008115783A JP2008115783A JP5194995B2 JP 5194995 B2 JP5194995 B2 JP 5194995B2 JP 2008115783 A JP2008115783 A JP 2008115783A JP 2008115783 A JP2008115783 A JP 2008115783A JP 5194995 B2 JP5194995 B2 JP 5194995B2
Authority
JP
Japan
Prior art keywords
document
image
unit
reference line
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008115783A
Other languages
Japanese (ja)
Other versions
JP2009266009A (en
Inventor
浩次 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2008115783A priority Critical patent/JP5194995B2/en
Publication of JP2009266009A publication Critical patent/JP2009266009A/en
Application granted granted Critical
Publication of JP5194995B2 publication Critical patent/JP5194995B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Machine Translation (AREA)

Description

本発明は、文書処理装置、文書サマリ作成方法および文書サマリ作成プログラムに関し、特に、文書画像から当該文書画像のサマリを作成する文書処理装置、文書サマリ作成方法および文書サマリ作成プログラムに関する。   The present invention relates to a document processing device, a document summary creation method, and a document summary creation program, and more particularly, to a document processing device, a document summary creation method, and a document summary creation program for creating a summary of a document image from a document image.

紙原稿などに記載された文書を電子文書に変換して管理する文書管理システムが実用化されている。このような文書管理システムでは、スキャナ装置などを用いて原稿を読取ることで文書画像を生成し、これらの文書画像から電子文書を生成する。   2. Description of the Related Art A document management system that converts a document described on a paper manuscript into an electronic document and manages it has been put into practical use. In such a document management system, a document image is generated by reading a document using a scanner device or the like, and an electronic document is generated from these document images.

しかしながら、目次のない、または、目次頁が紛失された分厚いマニュアルなどの紙文書をスキャンした場合、解像度が荒い、あるいは、一度に見れる範囲が限定される、などのユーザインターフェイス上の理由から、一般的には、元の紙文書に比べ、電子文書から目的の場所を見つけるのは難しい。しかし、そういった文書画像についても、省スペースのために電子文書のまま保存しておきたいという要望もある。そのため、文書画像からすばやく目的の場所を探し出すための様々な方法が提案されている。   However, when scanning a paper document such as a thick manual with no table of contents or a table of contents lost, it is common for reasons of user interface such as poor resolution or limited viewable range at a time. Specifically, it is difficult to find a target location from an electronic document compared to the original paper document. However, there is also a demand for storing such document images as electronic documents in order to save space. For this reason, various methods for quickly finding a target location from a document image have been proposed.

たとえば、特許文献1には、原稿の文書画像から所望の文書要素の箇所のみを取り出して構成したサマリ文書画像や目次文書画像を作成する発明が開示されている。当該文献において、入力された文書画像が複数の矩形の領域(文書要素として意味のある塊)に分割され、分割された複数の領域から、所望の要素に対応する領域が抽出される。そして、抽出された領域の部分画像が所定の座標位置に順に配置される。   For example, Patent Document 1 discloses an invention for creating a summary document image or a table of contents document image configured by extracting only a desired document element portion from a document image of a document. In this document, an input document image is divided into a plurality of rectangular regions (meaningful chunks as document elements), and a region corresponding to a desired element is extracted from the plurality of divided regions. And the partial image of the extracted area | region is arrange | positioned in order at a predetermined coordinate position.

また、特許文献2には、多様な形態の印刷文書をOCR(Optical Character Recognition)解析して、そのような印刷文書からXMLやHTML等でタグ付けされた構造化文書を高精度に生成する発明が開示されている。当該文献において、見出しの階層レベルは、章見出しや箇条書きの先頭に付与される番号や記号の文字列を解析することにより判定される。
特開平5−342326号公報 特開2005−43990号公報
Patent Document 2 discloses an invention that performs OCR (Optical Character Recognition) analysis of various types of printed documents and generates a structured document tagged with XML or HTML from such a printed document with high accuracy. Is disclosed. In this document, the hierarchical level of headings is determined by analyzing the character strings of numbers and symbols given to the heads of chapter headings and bullets.
JP-A-5-342326 JP-A-2005-43990

しかしながら、特許文献1の発明では、切り出された部分画像(タイトルやアブストラクト)が順に配置されるのみで、見出しの階層レベルに対する考慮はなされていない。   However, in the invention of Patent Document 1, the clipped partial images (titles and abstracts) are only arranged in order, and no consideration is given to the hierarchy level of the headings.

また、特許文献2の発明では、見出しの階層レベルが考慮されているものの、見出しの階層レベルを判定しなければならず、処理が複雑となる。   In the invention of Patent Document 2, although the hierarchy level of the headline is taken into consideration, the hierarchy level of the headline has to be determined, and the processing becomes complicated.

あるいは、見出し等の階層レベルをインデント幅により簡便に判別しようとすることもできるが、そのような場合、頁間でスキャン位置がずれてしまうと、階層レベルを正確に判別できない恐れがある。   Alternatively, it is possible to easily determine the hierarchical level of a heading or the like based on the indent width. In such a case, if the scan position is shifted between pages, the hierarchical level may not be accurately determined.

本発明は、上記のような問題を解決するためになされたものであって、その目的は、見出し等の階層レベルの判定処理を行なうことなく、見出し等の階層レベルを反映したサマリ画像を生成することのできる文書処理装置、文書サマリ作成方法および文書サマリ作成プログラムを提供することである。   The present invention has been made to solve the above-described problems, and an object of the present invention is to generate a summary image reflecting a hierarchy level such as a heading without performing a hierarchy level determination process such as the heading. It is to provide a document processing apparatus, a document summary creation method, and a document summary creation program that can be used.

この発明のある局面に従う文書処理装置は、文書画像から文書画像のサマリを作成する文書処理装置であって、文書画像から、所定の種別の文書要素を抽出するための抽出手段と、文書画像から、頁ごとに段を検出するための検出手段と、段のレイアウトに基づいて、頁ごとに、段の行方向に垂直な方向の少なくとも1つのレイアウト基準線を設定するための線設定手段と、頁間でのレイアウト基準線のずれを補正するための処理を行なう補正処理手段と、抽出された所定の種別の文書要素に対応するサマリ領域を含む部分領域を、レイアウト基準線を基準として切出すための切出手段と、所定の画像に、画像における所定の要素基準線を基準として部分領域を配置することで、サマリを表わす画像であるサマリ画像を生成するためのサマリ生成手段とを備える。 A document processing apparatus according to an aspect of the present invention is a document processing apparatus that creates a summary of a document image from a document image, an extraction unit for extracting a document element of a predetermined type from the document image, and a document image Detecting means for detecting a stage for each page; line setting means for setting at least one layout reference line in a direction perpendicular to the row direction of the stage for each page based on the layout of the stage; A correction processing unit that performs processing for correcting a shift of the layout reference line between pages, and a partial area including a summary area corresponding to the extracted document element of a predetermined type are cut out using the layout reference line as a reference. And a summary for generating a summary image, which is an image representing a summary, by arranging a partial region in a predetermined image with reference to a predetermined element reference line in the predetermined image And a forming means.

好ましくは、切出手段は、レイアウト基準線を端部として部分領域を切出し、サマリ生成手段は、所定の要素基準線に沿って、部分領域を順に配置する。   Preferably, the cutout unit cuts out the partial region with the layout reference line as an end, and the summary generation unit arranges the partial regions in order along a predetermined element reference line.

あるいは、切出手段は、サマリ領域を含む最小矩形を部分領域として切出すとともに、部分領域とレイアウト基準線との距離を部分領域ごとに検出し、サマリ生成手段は、所定の要素基準線の位置から、検出された距離に応じて部分領域をシフトさせて画像に配置することが好ましい。   Alternatively, the cutting means cuts out the minimum rectangle including the summary area as a partial area, detects the distance between the partial area and the layout reference line for each partial area, and the summary generating means determines the position of the predetermined element reference line. Therefore, it is preferable to shift the partial area according to the detected distance and arrange it in the image.

好ましくは、補正処理手段は、頁間で、前記段における本文領域の基準位置を整合させるための整合手段を含む。   Preferably, the correction processing means includes alignment means for aligning the reference position of the text area in the stage between pages.

好ましくは、所定の条件に基づいて、頁ごとに、複数の段をグループ化して少なくとも1つの仮想矩形を設定するための矩形設定手段をさらに備え、線設定手段は、仮想矩形ごとにレイアウト基準線を設定する。   Preferably, the image processing apparatus further includes a rectangle setting unit configured to group at least one virtual rectangle and set at least one virtual rectangle for each page based on a predetermined condition, and the line setting unit includes a layout reference line for each virtual rectangle. Set.

好ましくは、線設定手段は、仮想矩形における行方向に垂直な、行頭側の辺をレイアウト基準線として設定する。   Preferably, the line setting means sets the side on the line head side perpendicular to the line direction in the virtual rectangle as a layout reference line.

好ましくは、文書画像を含む第1の電子文書と、サマリ画像を含む第2の電子文書とを別々に生成するための文書生成手段と、第1の電子文書および第2の電子文書を記憶するための記憶手段とをさらに備える。   Preferably, document generation means for separately generating a first electronic document including a document image and a second electronic document including a summary image, and the first electronic document and the second electronic document are stored. Storage means.

好ましくは、部分領域ごとに文書画像の対応する箇所と関連付けるための閲覧支援情報を生成して、閲覧支援情報をサマリ画像に付加するための付加手段をさらに備え、閲覧支援情報は、対応する第1の電子文書を特定するための文書特定情報、および、部分領域ごとの文書画像中の対応している箇所を示す位置情報を含む。   Preferably, the image forming apparatus further includes an adding means for generating browsing support information for associating with a corresponding portion of the document image for each partial region, and adding the browsing support information to the summary image. Document specifying information for specifying one electronic document and position information indicating a corresponding location in the document image for each partial area are included.

好ましくは、文書画像とサマリ画像とを含む電子文書を生成するための文書生成手段と、電子文書を記憶するための記憶手段とをさらに備える。   Preferably, the apparatus further includes document generation means for generating an electronic document including a document image and a summary image, and storage means for storing the electronic document.

好ましくは、部分領域ごとに文書画像の対応する箇所と関連付けるための閲覧支援情報を生成して、閲覧支援情報をサマリ画像に付加するための付加手段をさらに備え、閲覧支援情報は、部分領域ごとの文書画像中の対応している箇所を示す位置情報を含む。   Preferably, the image forming apparatus further includes an adding unit for generating browsing support information for associating with a corresponding portion of the document image for each partial area, and adding the browsing support information to the summary image. The position information indicating the corresponding location in the document image of is included.

好ましくは、ユーザからの指示に基づき、抽出手段により抽出された所定の種別の文書要素を修正するための修正手段をさらに備え、切出手段は、修正手段による修正後の文書要素の領域をサマリ領域として切出す。   Preferably, the image processing apparatus further includes correction means for correcting a document element of a predetermined type extracted by the extraction means based on an instruction from the user, and the extraction means summarizes the region of the document element corrected by the correction means. Cut out as an area.

好ましくは、修正手段は、文書画像よりユーザ所望の領域の指定を受付ける指定手段を含み、切出手段は、指定手段により指定された領域をサマリ領域として切出す。   Preferably, the correcting unit includes a specifying unit that receives specification of a user-desired region from the document image, and the cutting unit cuts out the region specified by the specifying unit as a summary region.

好ましくは、サマリ画像を文書画像とは別に出力するか、サマリ画像を文書画像と合成して出力するかの選択をユーザより受付けるための選択手段と、選択手段により別に出力することが選択された場合に、文書画像を含む第1の電子文書と、サマリ画像を含む第2の電子文書とを生成するための第1の文書生成手段と、選択手段により合成して出力することが選択された場合に、文書画像とサマリ画像とを合成して第3の電子文書を生成するための第2の文書生成手段とをさらに備える。   Preferably, selection means for accepting a selection from the user to output whether the summary image is output separately from the document image or the summary image is combined with the document image is selected to be output separately by the selection means. In this case, it is selected that the first electronic document including the document image and the first electronic document generating unit for generating the second electronic document including the summary image and the selecting unit are combined and output. In this case, the apparatus further includes second document generation means for generating a third electronic document by combining the document image and the summary image.

好ましくは、所定の種別は、表題、見出し、図、表、写真、段落の先頭の所定行、手書き注釈の対象、およびキャプションのうち少なくともいずれか1つを含む。   Preferably, the predetermined type includes at least one of a title, a headline, a figure, a table, a photograph, a predetermined line at the beginning of a paragraph, a target of handwritten annotation, and a caption.

この発明の他の局面に従う文書サマリ作成方法は、記憶部と演算処理部とを備えた文書処理装置において、文書画像から文書画像のサマリを作成する方法であって、演算処理部が、文書画像から、所定の種別の文書要素を抽出するステップと、演算処理部が、文書画像から、頁ごとに段を検出するステップと、演算処理部が、段のレイアウトに基づいて、頁ごとに、段の行方向に垂直な方向の少なくとも1つのレイアウト基準線を設定するステップと、演算処理部が、頁間でのレイアウト基準線のずれを補正するための処理を行なうステップと、演算処理部が、抽出された所定の種別の文書要素に対応するサマリ領域を含む部分領域を、レイアウト基準線を基準として切出すステップと、演算処理部が、所定の画像に、画像における所定の要素基準線を基準として部分領域を配置することで、サマリ画像を生成するステップとを備える。 A document summary creation method according to another aspect of the present invention is a method for creating a summary of a document image from a document image in a document processing apparatus including a storage unit and an arithmetic processing unit. A step of extracting a predetermined type of document element, a step of the arithmetic processing unit detecting a step for each page from the document image, and a step of the arithmetic processing unit for each page based on the step layout. A step of setting at least one layout reference line in a direction perpendicular to the row direction, a step of an arithmetic processing unit performing a process for correcting a shift of a layout reference line between pages, and an arithmetic processing unit, A step of cutting out a partial area including a summary area corresponding to the extracted document element of a predetermined type with reference to a layout reference line; By arranging the partial area relative to the reference line, and generating a summary image.

この発明のさらに他の局面に従う文書サマリ作成プログラムは、上記記載の文書サマリ作成方法をコンピュータに実行させる。   A document summary creation program according to still another aspect of the present invention causes a computer to execute the document summary creation method described above.

本発明によると、見出し等の階層レベルの判定処理を行なうことなく、見出し等の階層レベルを反映したサマリ画像を生成することができる。   According to the present invention, it is possible to generate a summary image reflecting a hierarchical level such as a heading without performing a determination process of the hierarchical level such as a heading.

本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。   Embodiments of the present invention will be described in detail with reference to the drawings. In the drawings, the same or corresponding parts are denoted by the same reference numerals and description thereof will not be repeated.

<構成について>
(全体システム構成)
図1は、本発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書処理装置は、MFPに限らず、PC(Personal Computer)、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
<About configuration>
(Overall system configuration)
FIG. 1 is a schematic configuration diagram of a system including a document processing apparatus according to an embodiment of the present invention. In the present embodiment, an MFP (Multi Function Peripheral) equipped with the document processing apparatus according to the present invention will be typically described. The document processing apparatus according to the present invention is not limited to an MFP, but can be applied to a PC (Personal Computer), a copier, a facsimile apparatus, a scanner apparatus, and the like.

図1を参照して、本実施の形態に従うMFP1は、原稿300を読取るための画像読取部104と、紙媒体などへの印刷処理を行なうためのプリント部106とを含む。   Referring to FIG. 1, MFP 1 according to the present embodiment includes an image reading unit 104 for reading a document 300 and a printing unit 106 for performing a printing process on a paper medium or the like.

特に、本実施の形態に従うMFP1は、画像読取部104で原稿300を読取ることで文書画像を取得し、この文書画像を含む電子文書を生成する。この際、MFP1は、読取った文書画像に含まれる文書要素のうち所定の種別の文書要素を切り出してサマリ画像を生成する。生成されたサマリ画像は、文書画像と一体化されてもよいし、文書画像とは別の電子文書に含まれてもよい。これらの電子文書400には、代表的に、PDF(Portable Document Format)などのフォーマットが採用できる。   In particular, MFP 1 according to the present embodiment acquires a document image by reading original document 300 with image reading unit 104, and generates an electronic document including the document image. At this time, the MFP 1 generates a summary image by cutting out a predetermined type of document element from among the document elements included in the read document image. The generated summary image may be integrated with the document image or may be included in an electronic document different from the document image. These electronic documents 400 typically employ a format such as PDF (Portable Document Format).

なお、「サマリ」とは、文書画像の要約あるいは目次を表わし、「サマリ画像」とは、文書画像のサマリを表わす画像(サマリとして機能する画像)である。また、「文書要素」とは、文書を構成する記述要素である。   Note that “summary” represents a summary or table of contents of a document image, and “summary image” is an image (image functioning as a summary) representing a summary of a document image. A “document element” is a description element that constitutes a document.

MFP1は、生成した電子文書400を自身の記憶部(図1において不図示)に格納する。また、記憶された電子文書400を、ネットワークを介してパーソナルコンピュータPC1,PC2,PC3(以下、「パーソナルコンピュータPC」とも総称する)に送信したりする。代表的な使用形態として、MFP1が設置されている同一のオフィス内に敷設されたネットワークであるLAN(Local Area Network)に接続されているパーソナルコンピュータPC1,PC2に対しては、MFP1から電子文書400が直接的に送信される。一方、LANとWAN(Wide Area Network)との接続点には、サーバ装置SRVが設けてあり、MFP1とは離れたオフィスにあるパーソナルコンピュータPC3などに対しては、MFP1からサーバ装置SRVを介して電子文書400が送信される。ここで、サーバ装置SRVは代表的に、メールサーバ、FTP(File Transfer Protocol)サーバ、Webサーバ、SMBサーバなどからなる。   The MFP 1 stores the generated electronic document 400 in its own storage unit (not shown in FIG. 1). In addition, the stored electronic document 400 is transmitted to personal computers PC1, PC2 and PC3 (hereinafter also collectively referred to as “personal computer PC”) via a network. As a typical usage pattern, the MFP 1 sends an electronic document 400 to the personal computers PC1 and PC2 connected to a local area network (LAN) that is a network laid in the same office where the MFP 1 is installed. Is sent directly. On the other hand, a server SRV is provided at a connection point between a LAN and a WAN (Wide Area Network). A personal computer PC3 or the like located in an office remote from the MFP 1 is connected from the MFP 1 via the server SRV. An electronic document 400 is transmitted. Here, the server SRV typically includes a mail server, an FTP (File Transfer Protocol) server, a Web server, an SMB server, and the like.

画像読取部104は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む(いずれも図示しない)。これにより、複数枚の原稿を連続的に読取って、一つの電子文書として生成することができる。   The image reading unit 104 includes a loading table for setting a document, a document table glass, a conveyance unit that automatically conveys the documents set on the loading table one by one to the document table glass, and a scanned document. And a discharge stand for discharging (both not shown). As a result, a plurality of documents can be continuously read and generated as one electronic document.

(MFP1の概略構成)
図2は、本発明の実施の形態に従うMFP1における概略の機能構成を示すブロック図である。
(Schematic configuration of MFP 1)
FIG. 2 is a block diagram showing a schematic functional configuration in MFP 1 according to the embodiment of the present invention.

図2を参照して、MFP1の機能構成としては、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、第1の操作パネル部110と、第2の操作パネル部111と、記憶部112とを含む。   Referring to FIG. 2, the functional configuration of MFP 1 includes a control unit 100, a memory unit 102, an image reading unit 104, a printing unit 106, a communication interface unit 108, a first operation panel unit 110, A second operation panel unit 111 and a storage unit 112 are included.

制御部100は、代表的にCPU(Central Processing Unit)などの演算装置から構成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部102は、代表的にDRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、制御部100で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部108は、代表的に、ネットワーク(たとえば、図1に示すLAN)を介してパーソナルコンピュータPC(図1)との間でデータを送受信するための部位であり、たとえば、LANアダプタおよびそれを制御するドライバソフトなどを含む。プリント部106は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。記憶部112は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部100の動作のためのプログラムや制御部100で生成された電子文書400などを格納する。   The control unit 100 is typically configured by an arithmetic device such as a CPU (Central Processing Unit), and implements document processing according to the present embodiment by executing a program. The memory unit 102 is typically a volatile storage device such as a DRAM (Dynamic Random Access Memory), and holds a program executed by the control unit 100 and data necessary for executing the program. The communication interface unit 108 is typically a part for transmitting and receiving data to and from a personal computer PC (FIG. 1) via a network (for example, the LAN shown in FIG. 1). Including driver software to control The print unit 106 is a part for performing print processing, and includes a control device for controlling the operation of each unit in addition to the hardware configuration related to print processing. The storage unit 112 is typically a nonvolatile storage device such as a hard disk device or a flash memory, and stores a program for the operation of the control unit 100, the electronic document 400 generated by the control unit 100, and the like.

第1および第2の操作パネル部110,111の外観例を図3に示す。図3(a)は、本発明の実施の形態に従うMFP1の第1の操作パネル部110の外観の一例を示す図であり、図3(b)は、本発明の実施の形態に従うMFP1の第2の操作パネル部111の外観の一例を示す図である。第1の操作パネル部110は、MFP1の基本的な処理の際に用いられる部位であり、第2の操作パネル部111は、後述する文書サマリ作成処理の際に用いられる部位である。   An example of the appearance of the first and second operation panel sections 110 and 111 is shown in FIG. 3A is a diagram showing an example of the appearance of first operation panel unit 110 of MFP 1 according to the embodiment of the present invention, and FIG. 3B is a diagram of MFP 1 according to the embodiment of the present invention. It is a figure which shows an example of the external appearance of the 2 operation panel part. The first operation panel unit 110 is a part used in basic processing of the MFP 1, and the second operation panel unit 111 is a part used in document summary creation processing described later.

図3(a)を参照して、第1の操作パネル部110は、液晶表示装置やタッチパネルなどから構成される表示パネル110aと、ストップボタン110bと、スタートボタン110cと、英数キーなどを含む操作ボタン110dとを備えている。   Referring to FIG. 3A, the first operation panel unit 110 includes a display panel 110a composed of a liquid crystal display device, a touch panel, etc., a stop button 110b, a start button 110c, an alphanumeric key, and the like. And an operation button 110d.

図3(b)を参照して、第2の操作パネル部111は、液晶表示装置やタッチパネルなどから構成される表示パネルである。第2の操作パネル部111は、サマリ画像等を表示するための表示領域111aと、カーソルボタンなどの操作ボタンを表示するための入力領域111bとを備えている。   Referring to FIG. 3B, the second operation panel unit 111 is a display panel configured by a liquid crystal display device, a touch panel, or the like. The second operation panel unit 111 includes a display area 111a for displaying summary images and the like, and an input area 111b for displaying operation buttons such as cursor buttons.

なお、本実施の形態では、文書サマリ作成処理のための第2の操作パネル部111を第1の操作パネル部110とは別に設けたが、一体型の操作パネル部を採用してもよい。   In this embodiment, the second operation panel unit 111 for document summary creation processing is provided separately from the first operation panel unit 110, but an integrated operation panel unit may be employed.

または、MFP1は、表示機能と指示の入力機能とを兼ね備えた第1および第2の操作パネル部110,111を備えることとしたが、これらに代えて、少なくとも1つの表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。   Alternatively, the MFP 1 includes the first and second operation panel units 110 and 111 having both a display function and an instruction input function. Instead, at least one display unit and hardware buttons are provided. It is good also as providing both the input part containing.

(パーソナルコンピュータの構成)
図4は、本発明の実施の形態に従うパーソナルコンピュータPCの概略のハードウェア構成を示す模式図である。
(Configuration of personal computer)
FIG. 4 is a schematic diagram showing a schematic hardware configuration of personal computer PC according to the embodiment of the present invention.

図4を参照して、パーソナルコンピュータPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit
)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には
、MFP1で生成された電子文書400を表示するための閲覧アプリケーションが記憶されており、このようなプログラムは、FDDドライブ217またはCD−ROMドライブ215によって、それぞれフレキシブルディスク217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られる。
Referring to FIG. 4, a personal computer PC is a CPU (Central Processing Unit) that executes various programs including an operating system (OS).
) 201, a memory unit 213 that temporarily stores data necessary for execution of the program by the CPU 201, and a hard disk unit (HDD: Hard Disk Drive) 211 that stores the program executed by the CPU 201 in a nonvolatile manner. . The hard disk unit 211 stores a browsing application for displaying the electronic document 400 generated by the MFP 1, and such a program is stored in the flexible disk 217 a by the FDD drive 217 or the CD-ROM drive 215, respectively. Alternatively, it is read from a CD-ROM (Compact Disk-Read Only Memory) 215a or the like.

CPU201は、キーボードやマウスなどからなる入力部209を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部205へ出力する。また、CPU201は、LANカードなどからなる通信インターフェイス部207を介して、LANやWANに接続されたMFP1やサーバ装置SRV(図1)から電子文書400を取得し、ハードディスク部211などに格納する。また、上述の各部は、内部バス203を介して相互にデータを授受する。   The CPU 201 receives an instruction from the user via the input unit 209 including a keyboard and a mouse, and outputs a screen output generated by executing the program to the display unit 205. Further, the CPU 201 acquires the electronic document 400 from the MFP 1 or server SRV (FIG. 1) connected to the LAN or WAN via the communication interface unit 207 including a LAN card and stores the electronic document 400 in the hard disk unit 211 or the like. Further, the above-described units exchange data with each other via the internal bus 203.

(MFPの機能構成)
図5は、本発明の実施の形態に従うMFP1の機能構成を示す機能ブロック図である。
(Functional configuration of MFP)
FIG. 5 is a functional block diagram showing a functional configuration of MFP 1 according to the embodiment of the present invention.

図5を参照して、制御部100は、出力形態選択部12と、画像バッファ部14と、サマリ要素抽出部16と、段検出部18と、要素修正部20と、部分領域切出部22と、サマリ画像生成部24と、出力データ生成部26と、しおり付与部28と、データ格納処理部30と、送信処理部32とを含む。   Referring to FIG. 5, the control unit 100 includes an output form selection unit 12, an image buffer unit 14, a summary element extraction unit 16, a stage detection unit 18, an element correction unit 20, and a partial region extraction unit 22. A summary image generation unit 24, an output data generation unit 26, a bookmark assignment unit 28, a data storage processing unit 30, and a transmission processing unit 32.

上述の画像読取部104は、原稿300を読取って文書画像を取得し、その文書画像を画像バッファ部14へ出力する。画像バッファ部14は、画像読取部104が逐次的に出力する文書画像のデータを一時的に格納する部位であり、一旦格納した文書画像をサマリ要素抽出部16および出力データ生成部26に出力する。なお、本実施の形態では、文書画像の圧縮処理を省略しているが、圧縮処理を行なうこととしてもよい。この場合、圧縮度合は、生成される電子文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよい。また、圧縮処理は非可逆変換であってもよい。   The image reading unit 104 described above reads the document 300 to obtain a document image, and outputs the document image to the image buffer unit 14. The image buffer unit 14 is a part that temporarily stores document image data sequentially output by the image reading unit 104, and outputs the temporarily stored document image to the summary element extraction unit 16 and the output data generation unit 26. . In this embodiment, the compression processing of the document image is omitted, but the compression processing may be performed. In this case, the degree of compression may be changed according to the size of the generated electronic document, the required resolution of the document image, and the like. The compression process may be irreversible conversion.

サマリ要素抽出部16は、画像バッファ部14から出力される文書画像に含まれる所定の種別の文書要素を抽出する。   The summary element extraction unit 16 extracts a predetermined type of document element included in the document image output from the image buffer unit 14.

「所定の種別」とは、サマリに含めるべき種別であり、少なくとも、「タイトル(表題)」および「見出し」のうちいずれかを含む。好ましくは、「タイトル」および「見出し」に加え、「図」、「表」、「写真」、「段落の先頭の所定行」、「手書き注釈の対象」、および「キャプション」をさらに含む。本実施の形態では、「所定の種別」は、上記の全ての種別を含むものとする。上記「手書き注釈の対象」とは、手書きの注釈が指し示すテキスト,図,表などを示す。   The “predetermined type” is a type to be included in the summary, and includes at least one of “title (title)” and “headline”. Preferably, in addition to “title” and “headline”, “drawing”, “table”, “photograph”, “predetermined line at the beginning of paragraph”, “target of handwritten annotation”, and “caption” are further included. In the present embodiment, the “predetermined type” includes all the types described above. The “handwritten annotation target” indicates text, a figure, a table, or the like indicated by the handwritten annotation.

なお、ここでは、サマリに含めるべき種別は、予め製造時に定められていることを前提にするが、後述する文書サマリ作成処理の前にユーザ所望の種別が予め選択されたものであってもよい。   Here, it is assumed that the types to be included in the summary are preliminarily determined at the time of manufacture. However, the user-desired types may be selected in advance before the document summary creation process described later. .

以下、「所定の種別の文書要素」を「サマリ要素」という。
サマリ要素抽出部16は、サマリ要素の抽出に先立ち、所定の種別以外の文書要素も抽出する。つまり、所定の種別を含む複数種別の文書要素を抽出する。その際、サマリ要素抽出部16は、各文書要素の文書画像内における位置も抽出する。抽出対象となる文書要素は、上述の所定の種別を有するものの他、たとえば、「本文」、「手書き文字」、「ヘッダ・フッダ」などの種別を有するものが含まれる。
Hereinafter, “a predetermined type of document element” is referred to as a “summary element”.
The summary element extraction unit 16 extracts document elements other than a predetermined type prior to extraction of summary elements. That is, a plurality of types of document elements including a predetermined type are extracted. At that time, the summary element extraction unit 16 also extracts the position of each document element in the document image. The document elements to be extracted include, for example, those having types such as “text”, “handwritten characters”, and “header / footer” in addition to those having the above-mentioned predetermined types.

サマリ要素抽出部16は、抽出したサマリ要素の種別およびその位置情報を要素修正部20に出力する。   The summary element extraction unit 16 outputs the extracted summary element type and its position information to the element correction unit 20.

段検出部18は、画像バッファ部14から出力される文書画像から、「段(段組)」を検出する。また、段検出部18は、各段の「行方向」、および、各段の「接続情報」を検出する。段はたとえば、「図書の電子のための文書認識技術(鎌田 博、藤本 克仁、黒川 浩司)、雑誌FUJITSU、VOL.49,No.6、1998」に開示された公知技術で検出することができる。各段の接続情報は、各段が、文脈等からどの段に接続されるべきかを示す情報(すなわち段の順序を示す情報)であり、たとえば特開平10−40248号公報に開示される公知の技術で検出することができる。行方向の検出は、周知の方法で検出することができる。段検出部18により検出された段、各段の行方向および各段の接続情報は、線設定部19に出力される。   The stage detection unit 18 detects “stage (column set)” from the document image output from the image buffer unit 14. Further, the stage detection unit 18 detects the “row direction” of each stage and the “connection information” of each stage. The dan can be detected by a known technique disclosed in, for example, “Document Recognition Technology for Books Electronic (Hiro Kamada, Katsuhito Fujimoto, Koji Kurokawa), Magazine FUJITSU, VOL.49, No.6, 1998”. . The connection information of each stage is information indicating which stage should be connected to each stage from the context or the like (that is, information indicating the order of the stages), and is disclosed in, for example, Japanese Patent Laid-Open No. 10-40248. It can be detected with the technology. The detection in the row direction can be detected by a known method. The stage detected by the stage detection unit 18, the row direction of each stage, and connection information of each stage are output to the line setting unit 19.

線設定部19は、検出された段のレイアウト(割付け)に基づいて、ページごとに少なくとも1つの「レイアウト基準線」を設定する。「レイアウト基準線」とは、各ページにおいてグループ化された段を含む最小矩形(「段レイアウト枠」という)の1辺に相当し、グループ化された段における行方向と垂直な行頭側の線である。段のグループ化の条件などについては後述する。設定されたレイアウト基準線の情報は、部分領域切出部22に出力される。   The line setting unit 19 sets at least one “layout reference line” for each page based on the detected layout (assignment) of the stage. The “layout reference line” corresponds to one side of a minimum rectangle (called “stage layout frame”) including the stages grouped on each page, and is a line on the line head side perpendicular to the line direction in the grouped stages. It is. The conditions for grouping the stages will be described later. Information on the set layout reference line is output to the partial region cutout unit 22.

要素修正部20は、第2の操作パネル部111に、抽出されたサマリ要素を表示する。また、要素修正部20は、第2の操作パネル部111に対し入力されたユーザからの指示に基づき、サマリ要素の修正を行なう。本実施の形態において、「修正」は、サマリ要素の範囲の変更、サマリ要素の削除、および、サマリ要素の追加を含むものとする。要素修正部20は、具体的には、ユーザからの指示に応じて、サマリ要素の位置情報を修正する。要素修正部20により修正された(あるいは修正されなかった)サマリ要素の位置情報は、部分領域切出部22に出力される。   The element correction unit 20 displays the extracted summary elements on the second operation panel unit 111. In addition, the element correction unit 20 corrects the summary element based on an instruction from the user input to the second operation panel unit 111. In the present embodiment, “correction” includes changing the range of summary elements, deleting summary elements, and adding summary elements. Specifically, the element correction unit 20 corrects the position information of the summary element in accordance with an instruction from the user. The position information of the summary element corrected (or not corrected) by the element correction unit 20 is output to the partial region extraction unit 22.

部分領域切出部22は、修正された後の領域(以下「サマリ要素領域」という)を含む部分領域(部分画像)を、設定されたレイアウト基準線に基づいて切出す。具体的には、部分領域切出部22は、レイアウト基準線が行頭側の端部となるように、サマリ要素領域を含む部分領域を切出す(すなわち、部分領域の位置情報を特定する)。切出された部分領域は、サマリ画像生成部24に出力される。切出される部分領域は、矩形の領域であることが好ましい。以下、切出される部分領域を「矩形領域」という。   The partial area cutout unit 22 cuts out a partial area (partial image) including the corrected area (hereinafter referred to as “summary element area”) based on the set layout reference line. Specifically, the partial region cutout unit 22 cuts out the partial region including the summary element region so that the layout reference line becomes the end portion on the line head side (that is, specifies the position information of the partial region). The cut out partial area is output to the summary image generation unit 24. The partial area to be cut out is preferably a rectangular area. Hereinafter, the cut out partial area is referred to as a “rectangular area”.

このようにして、レイアウト基準線を基準にして、サマリ要素領域を切出すので、処理対象の文書画像に存在する階層構造を保存したまま文書画像のサマリを作成することができる。   In this way, the summary element area is cut out based on the layout reference line, so that a summary of the document image can be created while maintaining the hierarchical structure existing in the document image to be processed.

なお、本実施の形態において、部分領域切出部22は、矩形領域の切出し処理の前に、さらに、ページ間のレイアウト基準線のずれを補正するための処理(以下「補正処理」という)を行なう。補正処理としては、頁間で、本文領域の基準位置を整合させる処理が行なわれる。このような補正処理の具体例については、後に詳述する。   In the present embodiment, the partial area cutout unit 22 further performs a process (hereinafter referred to as “correction process”) for correcting a shift of the layout reference line between pages before the rectangular area cutout process. Do. As the correction process, a process of matching the reference position of the text area between pages is performed. A specific example of such correction processing will be described in detail later.

サマリ画像生成部24は、所定の画像に、当該画像における所定の「要素基準線」を基準として矩形領域を配置することで、サマリ画像を生成する。つまり、矩形領域の位置情報に基づき、出力画像中に、所定の要素基準線を基準にして矩形領域を配置する。矩形領域は、所定の間隔で配置されることが好ましい。矩形領域を配置するための画像は、無地ページであってよく、また、元の文書画像のサイズと同サイズであってよい。また、矩形領域を配置する際に、全ての矩形領域を所定の割合だけ拡大または縮小してもよい。   The summary image generation unit 24 generates a summary image by arranging a rectangular area in a predetermined image with reference to a predetermined “element reference line” in the image. That is, based on the position information of the rectangular area, the rectangular area is arranged in the output image with reference to a predetermined element reference line. The rectangular regions are preferably arranged at a predetermined interval. The image for arranging the rectangular area may be a plain page or the same size as the original document image. Further, when arranging the rectangular areas, all the rectangular areas may be enlarged or reduced by a predetermined ratio.

所定の要素基準線は、配置する矩形領域の行方向に垂直な線であり、横書きの場合は、出力画像の左端から所定の距離に設定される縦方向の線である。この場合、サマリ画像生成部24は、矩形領域を、上から順に所定の間隔で配置する。これに対し、縦書きの場合には、所定の要素基準線は、出力画像の上端から所定の距離に設定される横方向の線である。この場合、サマリ画像生成部24は、矩形領域を、右から順に所定の間隔で配置する。なお、要素基準線は、行方向に垂直な直線であればよく、所定の画像の左端または上端に一致してもよい。また、所定の距離は、画像のページの大きさに応じて予め定められることとしてもよい。   The predetermined element reference line is a line perpendicular to the row direction of the rectangular region to be arranged, and in the case of horizontal writing, it is a vertical line set at a predetermined distance from the left end of the output image. In this case, the summary image generation unit 24 arranges the rectangular areas at predetermined intervals in order from the top. On the other hand, in the case of vertical writing, the predetermined element reference line is a horizontal line set at a predetermined distance from the upper end of the output image. In this case, the summary image generation unit 24 arranges the rectangular areas at predetermined intervals in order from the right. The element reference line may be a straight line perpendicular to the row direction, and may coincide with the left end or upper end of a predetermined image. The predetermined distance may be determined in advance according to the size of the page of the image.

このようにして生成されたサマリ画像は、出力データ生成部26に出力される。
出力形態選択部12は、サマリ画像の出力形態を「分離」および「合成」のうちいずれにするかについて、ユーザに選択させる。具体的には、出力形態選択部12は、第2の操作パネル部111に、「出力形態選択画面」を表示する。出力形態選択部12は、第2の操作パネル部111に対して入力されたユーザからの指示に基づき、出力形態を選択する。出力形態選択部12により選択された出力形態は、出力データ生成部26およびしおり付与部28に出力される。
The summary image generated in this way is output to the output data generation unit 26.
The output form selection unit 12 causes the user to select whether the output form of the summary image is “separation” or “combination”. Specifically, the output form selection unit 12 displays an “output form selection screen” on the second operation panel unit 111. The output form selection unit 12 selects an output form based on an instruction from the user input to the second operation panel unit 111. The output form selected by the output form selecting unit 12 is output to the output data generating unit 26 and the bookmark assigning unit 28.

出力データ生成部26は、出力形態選択部12により選択された出力形態に基づいて、出力データを生成する。より具体的には、ユーザにより「分離」が選択された場合に、文書画像を含む電子文書(以下「電子原稿文書」という)とは別に、サマリ画像を含む電子文書(以下「電子サマリ文書」という)を生成する。一方、ユーザにより「合成」が選択された場合には、文書画像とサマリ画像とを含む1つの電子文書(以下「電子合成文書」という)を生成する。言い換えると、出力データ生成部26は、元の文書画像データに、サマリ画像データを付加する。このようにして生成された出力データは、しおり付与部28に出力される。なお、上述の電子文書400は、電子原稿文書および電子サマリ文書と、電子合成文書とのうち少なくとも一方を含むものとする。   The output data generation unit 26 generates output data based on the output form selected by the output form selection unit 12. More specifically, when “separation” is selected by the user, an electronic document including a summary image (hereinafter referred to as “electronic summary document”) separate from an electronic document including a document image (hereinafter referred to as “electronic manuscript document”). Generated). On the other hand, when “composite” is selected by the user, one electronic document including a document image and a summary image (hereinafter referred to as “electronic composite document”) is generated. In other words, the output data generation unit 26 adds summary image data to the original document image data. The output data generated in this way is output to the bookmark giving unit 28. The electronic document 400 described above includes at least one of an electronic manuscript document, an electronic summary document, and an electronic composite document.

しおり付与部28は、出力形態選択部12により選択された出力形態に基づいて、閲覧支援情報を生成して、生成した閲覧支援情報をサマリ画像に付加(付与)する。なお、「閲覧支援情報」とは、矩形領域ごとに文書画像の対応する箇所と関連付けるための情報である。本明細書において、「閲覧支援情報」は、矩形領域の「元の文書画像内の位置」を示す情報を少なくとも含む「しおり」データであり、「しおり」の他に矩形領域についての補足的コメントをさらに含む「注釈」などであってもよい。   The bookmark giving unit 28 generates browsing support information based on the output mode selected by the output mode selection unit 12, and adds (provides) the generated browsing support information to the summary image. The “browsing support information” is information for associating each rectangular area with a corresponding portion of the document image. In this specification, “browsing support information” is “bookmark” data including at least information indicating the “position in the original document image” of the rectangular area. In addition to “bookmarks”, supplementary comments about the rectangular area It may be an “annotation” or the like further including

しおり付与部28は、しおりを付与した後の出力データ(電子原稿文書および電子サマリ文書と、電子合成文書とのうちいずれか一方)をデータ格納処理部30に出力する。   The bookmark assigning unit 28 outputs the output data (any one of the electronic manuscript document, the electronic summary document, and the electronic composite document) after giving the bookmark to the data storage processing unit 30.

データ格納処理部30は、しおり付与部28から入力された出力データを、記憶部112に格納する。   The data storage processing unit 30 stores the output data input from the bookmark giving unit 28 in the storage unit 112.

送信処理部32は、記憶部112に記憶された電子文書を外部に送信するための処理を行なう。具体的には、第1の操作パネル部110または第2の操作パネル部111に記憶部112に記憶された電子文書の一覧を表示し、ユーザに所望の電子文書を選択させる。そして、選択された電子文書を通信インターフェイス部108に出力する。なお、選択された電子文書が電子原稿文書であった場合には、送信処理部32は、電子原稿文書および電子サマリ文書の両方を通信インターフェイス部108に出力してもよい。通信インターフェイス部108に出力された電子文書(およびサマリ文書)400は、パーソナルコンピュータPC等に送信される。   The transmission processing unit 32 performs processing for transmitting the electronic document stored in the storage unit 112 to the outside. Specifically, a list of electronic documents stored in the storage unit 112 is displayed on the first operation panel unit 110 or the second operation panel unit 111, and the user is allowed to select a desired electronic document. Then, the selected electronic document is output to the communication interface unit 108. If the selected electronic document is an electronic original document, the transmission processing unit 32 may output both the electronic original document and the electronic summary document to the communication interface unit 108. The electronic document (and summary document) 400 output to the communication interface unit 108 is transmitted to a personal computer PC or the like.

なお、制御部100に含まれる各ブロックの動作は、メモリ部102中に格納されたソフトウェアを実行することで実現されてもよいし、これらのブロックのうち少なくとも1つについては、ハードウェアで実現されてもよい。   The operation of each block included in the control unit 100 may be realized by executing software stored in the memory unit 102, and at least one of these blocks is realized by hardware. May be.

また、本実施の形態では、要素修正部20によるサマリ要素の修正処理が行なわれるが、必ずしもそのような修正処理が行なわれなくてもよい。その場合、サマリ要素抽出部16によって抽出されたサマリ要素の情報は、部分領域切出部22に出力されるものとする。   Further, in the present embodiment, the summary element correction process is performed by the element correction unit 20, but such a correction process is not necessarily performed. In this case, the summary element information extracted by the summary element extraction unit 16 is output to the partial region extraction unit 22.

あるいは、本実施の形態では、出力データの形態をユーザが選択できることとするが、「合成」および「分離」のうちいずれか一方が予め定められていてもよい。   Alternatively, in the present embodiment, the user can select the form of the output data, but either “synthesis” or “separation” may be determined in advance.

<文書サマリ作成処理について>
以下に、本発明の実施の形態における文書サマリ作成処理について、図6〜図26を参照して説明する。
<About document summary creation processing>
The document summary creation process according to the embodiment of the present invention will be described below with reference to FIGS.

図6は、本発明の実施の形態における文書サマリ作成処理を示すフローチャートである。図6のフローチャートに示す処理は、予めプログラムとしてメモリ部102に格納されており、制御部100がこのプログラムを読み出して実行することにより、文書サマリ作成処理の機能が実現される。なお、以下に示す処理は、制御部100が、ユーザから、文書サマリ作成処理を開始させる旨の指示の入力を受付けた場合に開始されるものとする。   FIG. 6 is a flowchart showing document summary creation processing in the embodiment of the present invention. The processing shown in the flowchart of FIG. 6 is stored in advance in the memory unit 102 as a program, and the function of the document summary creation processing is realized by the control unit 100 reading and executing this program. Note that the processing shown below is started when the control unit 100 receives an input from the user to instruct to start the document summary creation processing.

はじめに、出力形態選択部12は、第2の操作パネル部111の表示領域111aに出力形態選択画面を表示する(ステップS102)。   First, the output form selection unit 12 displays an output form selection screen in the display area 111a of the second operation panel unit 111 (step S102).

図7は、出力形態選択画面の一例を示す図である。出力形態選択画面は、「合成」の指示を受付けるための“Unified”ボタン51および「分離」の指示を受付けるための“Separated”ボタン52を含む。   FIG. 7 is a diagram illustrating an example of an output form selection screen. The output form selection screen includes a “Unified” button 51 for receiving a “composite” instruction and a “Separated” button 52 for receiving a “separation” instruction.

次に、出力形態選択部12は、ユーザによる出力形態の選択を受付ける(ステップS104)。出力形態選択画面に表示されたボタン51,52のうちユーザにより選択された方のボタンが太枠にて強調表示される。   Next, the output form selection unit 12 accepts the selection of the output form by the user (step S104). Of the buttons 51 and 52 displayed on the output form selection screen, the button selected by the user is highlighted with a thick frame.

出力形態の選択が終わると、画像読取部104は、文書画像を読取る(S106)。読取られた文書画像は、画像バッファ部14に出力される。サマリ要素抽出部16は、画像バッファ部14内の文書画像から、サマリ要素を含む複数種別の文書要素を抽出する(ステップS108)。サマリ要素抽出部16は、抽出した文書要素のうちのサマリ要素に関する管理情報を「サマリ要素管理情報」としてメモリ部102に一時的に記録する。   When the selection of the output form is completed, the image reading unit 104 reads a document image (S106). The read document image is output to the image buffer unit 14. The summary element extraction unit 16 extracts a plurality of types of document elements including summary elements from the document image in the image buffer unit 14 (step S108). The summary element extraction unit 16 temporarily records management information related to the summary elements of the extracted document elements in the memory unit 102 as “summary element management information”.

図8は、文書画像に含まれる文書要素の抽出処理を説明するための図である。
図8(a)は、原稿300から生成される文書画像の一例を示す図であり、図8(b)は、図8(a)に示す文書画像に対して文書要素が抽出された状態の一例を示す図である。図8(a)を参照して、一例として、「・・・に関する報告書」の原稿300(5ページ)が画像読取部104で読取られると、画像バッファ部14には各ページに対応する文書画像が格納される。図8(b)に示すように、サマリ要素抽出部16は、このような文書画像に含まれる矩形の文書要素420を抽出する。なお、文書要素420の抽出については、公知の方法を用いることができるが、代表的に文字サイズや隣接する領域に対する間隔などに基づいて、各領域が抽出される。
FIG. 8 is a diagram for explaining extraction processing of document elements included in a document image.
FIG. 8A is a diagram illustrating an example of a document image generated from the document 300, and FIG. 8B is a state in which document elements are extracted from the document image illustrated in FIG. It is a figure which shows an example. Referring to FIG. 8A, as an example, when a document 300 (5 pages) of “Report on...” Is read by the image reading unit 104, a document corresponding to each page is stored in the image buffer unit 14. Images are stored. As shown in FIG. 8B, the summary element extraction unit 16 extracts a rectangular document element 420 included in such a document image. Note that a known method can be used for extracting the document element 420, but each area is typically extracted based on the character size, the interval between adjacent areas, and the like.

所定の種別の文書要素は、より具体的には、たとえば次のような方法で抽出される。「タイトル」は、文書画像内に配置される文字の文字サイズや隣接する領域との間隔に基づいて抽出することができる。「見出し」は、「本文」との関係(「本文」に先行する領域)や、文書画像内におけるオフセット位置やインデント位置などに基づいて抽出することができる。「図」は、テキストブロック以外の領域の2値パターンをとることにより抽出することができる。「表」は、罫線とテキストとの組み合わせなどに基づいて抽出することができる。「写真」は、カラーヒストグラムにおける画像の濃淡変化の度合いなどに基づいて抽出することができる。   More specifically, the document element of the predetermined type is extracted by the following method, for example. The “title” can be extracted based on the character size of the character arranged in the document image and the interval between adjacent regions. “Heading” can be extracted based on a relationship with “text” (an area preceding “text”), an offset position or an indent position in a document image, and the like. The “figure” can be extracted by taking a binary pattern of an area other than the text block. The “table” can be extracted based on a combination of ruled lines and text. The “photograph” can be extracted based on the degree of change in shading of the image in the color histogram.

また、「段落の先頭の所定行」は、テキストブロックのうちの字下げの位置、あるいは、後続するテキストブロックとの間の間隔などに基づいて抽出することができる。「手書き注釈の対象」は、字体や行の乱れ具合などに基づいて検出された手書き文字の近傍のテキストを検出することで抽出することができる。あるいは、手書き注釈の近傍にある手書きの線をたどることで抽出することができる。「キャプション」は、図,表,写真に対して上または下の近傍にある孤立したテキストブロックとして抽出することができる。   The “predetermined line at the beginning of a paragraph” can be extracted based on the indentation position in the text block or the interval between the text block and the subsequent text block. The “object of handwritten annotation” can be extracted by detecting the text in the vicinity of the handwritten character detected based on the disorder of the font or line. Alternatively, it can be extracted by following a handwritten line near the handwritten annotation. “Captions” can be extracted as isolated text blocks near the top or bottom of a diagram, table, or photo.

なお、文書画像内の共通の領域に対して、複数の文書要素が重複して抽出されてもよい。また、サマリ要素として抽出する種別は、上述のものに限られることなく、公知の認識技術を用いて様々な種別の文書要素を抽出することができる。   Note that a plurality of document elements may be extracted redundantly for a common area in the document image. The types extracted as summary elements are not limited to those described above, and various types of document elements can be extracted using a known recognition technique.

次に、上述のサマリ要素管理情報について説明する。
図9は、サマリ要素管理情報のデータ構造を示す図である。図9を参照して、メモリ部102には、サマリ要素ごとに、ページ番号、領域左上座標、領域右下座標および要素種別が記録される。ページ番号は、対応するサマリ要素が存在するページを特定するための位置情報である。また、領域左上座標および領域右下座標は、対応するサマリ要素のページ内での領域(矩形)を特定するための位置情報である。また、要素種別は、対応するサマリ要素の種別を特定するための情報である。
Next, the summary element management information described above will be described.
FIG. 9 is a diagram showing a data structure of summary element management information. Referring to FIG. 9, page number, region upper left coordinate, region lower right coordinate, and element type are recorded for each summary element in memory unit 102. The page number is position information for specifying the page on which the corresponding summary element exists. Further, the upper left region coordinates and the lower right region coordinates are position information for specifying the region (rectangle) in the page of the corresponding summary element. The element type is information for specifying the type of the corresponding summary element.

再び図6を参照して、ステップS108の処理が終わると、段検出部18は、画像バッファ部14内の文書画像から、段、段の接続、および各段の行方向を検出する(ステップS110)。段検出部18は、検出したこれらの情報をメモリ部102に一時的に記録する。   Referring to FIG. 6 again, when the process of step S108 is completed, the stage detection unit 18 detects the stage, the connection of the stages, and the row direction of each stage from the document image in the image buffer unit 14 (step S110). ). The stage detection unit 18 temporarily records the detected information in the memory unit 102.

図6のステップS110において検出された段に関する管理情報は、段管理情報としてメモリ部102に記録される。   The management information regarding the level detected in step S110 in FIG. 6 is recorded in the memory unit 102 as level management information.

図10は、段管理情報のデータ構造を示す図である。図10を参照して、メモリ部102には、段ごとに、段識別番号、ページ番号、段左上座標、段右下座標、前の段落、後の段落、および行方向が記録される。段識別番号は、各段を一意に特定するための識別情報である。ページ番号は、対応する段が存在するページを特定するための位置情報である。段左上座標および段右下座標は、対応する段のページ内での領域(矩形)を特定するための位置情報である。前の段落および後の段落は、各段の接続情報である。前の段落の欄には、対応する段の直前の段の識別番号が記録され、後の段落の欄には、対応する段の直後の段の識別番号が記録される。このような接続情報に基づいて、ページ内の段の順序を特定することができる。行方向は、対応する段の行方向を特定するための情報であり、「横書き」または「縦書き」が記録される。   FIG. 10 is a diagram illustrating a data structure of the column management information. Referring to FIG. 10, in the memory unit 102, a column identification number, a page number, a column upper left coordinate, a column lower right coordinate, a previous paragraph, a subsequent paragraph, and a line direction are recorded for each column. The stage identification number is identification information for uniquely identifying each stage. The page number is position information for specifying the page on which the corresponding stage exists. The upper left coordinates and the lower right coordinates are position information for specifying an area (rectangle) in the page of the corresponding stage. The previous paragraph and the subsequent paragraph are connection information of each stage. The identification number of the stage immediately before the corresponding stage is recorded in the column of the previous paragraph, and the identification number of the stage immediately after the corresponding stage is recorded in the column of the subsequent paragraph. Based on such connection information, the order of the steps in the page can be specified. The row direction is information for specifying the row direction of the corresponding stage, and “horizontal writing” or “vertical writing” is recorded.

なお、図6のフローチャートでは、ステップS108の処理とステップS110の処理とが直列的に行なわれる例を示したが、これらの処理は並列的に行なわれてもよい。また、直列的に行なわれる場合、これらの順序は問わない。   In the flowchart of FIG. 6, the example in which the process of step S108 and the process of step S110 are performed in series is shown, but these processes may be performed in parallel. Moreover, when performed in series, these orders are not ask | required.

次に、要素修正部20は、抽出されたサマリ要素の修正処理を実行する(ステップS111)。具体的には、要素修正部20は、まず「サマリ要素確認画面」を第2の操作パネル部111に表示する(ステップS302)。図11は、サマリ要素確認画面の一例を示す図である。   Next, the element correction part 20 performs the correction process of the extracted summary element (step S111). Specifically, the element correction unit 20 first displays a “summary element confirmation screen” on the second operation panel unit 111 (step S302). FIG. 11 is a diagram illustrating an example of the summary element confirmation screen.

図11を参照して、第2の操作パネル部111の表示領域111aには、抽出されたサマリ要素611および612が矩形枠で囲まれて表示される。表示領域111aの下部の領域111bには、削除ボタン621、要素追加ボタン622、範囲変更ボタン623、OKボタン624、前頁ボタン625、次頁ボタン626および上下左右のカーソルボタン627が表示される。カーソルボタン627およびOKボタン624を押下することで、ユーザ所望のサマリ要素が選択される。   Referring to FIG. 11, extracted summary elements 611 and 612 are displayed in a display area 111 a of second operation panel unit 111 surrounded by a rectangular frame. A delete button 621, an element addition button 622, a range change button 623, an OK button 624, a previous page button 625, a next page button 626, and up / down / left / right cursor buttons 627 are displayed in an area 111b below the display area 111a. By pressing the cursor button 627 and the OK button 624, a user-desired summary element is selected.

削除ボタン621は、選択されたサマリ要素を削除する指示を受付けるためのボタンである。このボタン621が押下されたことを検知すると、要素修正部20は、選択されているサマリ要素についての管理情報を、サマリ要素管理情報から削除する。   The delete button 621 is a button for accepting an instruction to delete the selected summary element. When detecting that the button 621 has been pressed, the element correction unit 20 deletes the management information for the selected summary element from the summary element management information.

要素追加ボタン622は、新たなサマリ要素をマニュアルで追加する指示を受け付けるためのボタンである。このボタン622が押下されると、要素修正部20は、たとえばデフォルトの矩形枠を領域111aに表示する。その後、カーソルボタン627が押下されると、その指示に応じて矩形枠を移動させる。次にOKボタン624が押下されると、要素追加ボタン622は、その矩形枠の左上の位置をサマリ要素の左上コーナーとして確定する。次に、カーソルボタン627が押下されると、その指示に応じて、矩形枠を拡大または縮小させる。さらにOKボタン624が押下されると、その矩形枠の右下の位置をサマリ要素の右下コーナーとして確定する。このようにして領域が確定すると、要素修正部20は、確定した領域の情報を新たなサマリ要素の情報として、メモリ部102に追加する。その際、要素修正部20は、要素種別の欄には「マニュアル」と記録する。本実施の形態において、「マニュアル」との種別は、サマリ画像に含めるべき種別であることが予め定められている。   The element addition button 622 is a button for accepting an instruction to manually add a new summary element. When the button 622 is pressed, the element correction unit 20 displays, for example, a default rectangular frame in the area 111a. Thereafter, when the cursor button 627 is pressed, the rectangular frame is moved according to the instruction. Next, when the OK button 624 is pressed, the element addition button 622 determines the upper left position of the rectangular frame as the upper left corner of the summary element. Next, when the cursor button 627 is pressed, the rectangular frame is enlarged or reduced according to the instruction. When the OK button 624 is further pressed, the lower right position of the rectangular frame is determined as the lower right corner of the summary element. When the region is determined in this way, the element correction unit 20 adds information on the determined region to the memory unit 102 as new summary element information. At that time, the element correction unit 20 records “manual” in the element type column. In the present embodiment, it is predetermined that the type “manual” is a type to be included in the summary image.

範囲変更ボタン623は、選択されたサマリ要素の範囲を変更する指示を受付けるためのボタンである。このボタン623が押下された後、カーソルボタン627が押下されると、その指示に応じて、選択されたサマリ要素の枠が拡大または縮小される。ユーザがOKボタン624を押下すると、要素修正部20は、確定した範囲に対応する位置情報を、領域左上座標および領域右下座標に上書きする。   The range change button 623 is a button for accepting an instruction to change the range of the selected summary element. When the cursor button 627 is pressed after the button 623 is pressed, the frame of the selected summary element is enlarged or reduced according to the instruction. When the user presses the OK button 624, the element correction unit 20 overwrites the position information corresponding to the determined range on the area upper left coordinates and area lower right coordinates.

前頁ボタン625および次頁ボタン626は、それぞれ、表示中のページを前ページおよび次ページに変更する指示を受付けるためのボタンである。これらのボタン625,626が押下されると、要素修正部20は、領域111aに指示に対応するページを表示する。   The previous page button 625 and the next page button 626 are buttons for receiving instructions to change the displayed page to the previous page and the next page, respectively. When these buttons 625 and 626 are pressed, the element correction unit 20 displays a page corresponding to the instruction in the area 111a.

要素修正部20は、ユーザからサマリ要素の修正に関する指示を受付けると、指示に応じてサマリ要素を修正する。また、そのような修正を反映する表示を行なう。最終的に、ユーザよりOKの指示が入力されるまで、上記したような修正・表示処理を繰返す。最終的にユーザよりOKの指示が入力されると、ステップS112に進む。   When the element correction unit 20 receives an instruction regarding correction of the summary element from the user, the element correction unit 20 corrects the summary element according to the instruction. In addition, a display reflecting such correction is performed. Finally, the correction / display processing as described above is repeated until an OK instruction is input from the user. When an OK instruction is finally input from the user, the process proceeds to step S112.

ステップS112において、部分領域切出部22は、部分領域切出処理を行なう(ステップS112)。部分領域切出処理については、図12のサブルーチンを参照して説明する。   In step S112, the partial area cutout unit 22 performs a partial area cutout process (step S112). The partial area extraction process will be described with reference to the subroutine of FIG.

(部分領域切出処理)
部分領域切出処理について、図12〜図19を参照して説明する。
(Partial area extraction processing)
The partial area cutting process will be described with reference to FIGS.

図12は、本発明の実施の形態における部分領域切出処理を示すフローチャートである。なお、このフローチャートには、全てのページの文書が横書きである場合を前提にした処理が示されているものとする。   FIG. 12 is a flowchart showing the partial area extraction processing in the embodiment of the present invention. In this flowchart, it is assumed that the processing is based on the assumption that all pages of the document are written horizontally.

図12を参照して、本実施の形態における部分領域切出部22は、はじめに前述の補正処理(ステップS202〜S210)を行なう。   Referring to FIG. 12, partial region cutout unit 22 in the present embodiment first performs the above-described correction processing (steps S202 to S210).

ステップS202において、部分領域切出部22は、各ページにおいて抽出された各段から本文部分の領域(以下「本文領域」という)を検出する。本文領域は、たとえば特開2005−71014号公報に開示されているように、行の高さおよび間隔が同じである行の集合として検出できる。なお、図6のステップS108で抽出された、本文を表わす文書要素の位置情報を利用してもよい。   In step S202, the partial area cutout unit 22 detects a body part region (hereinafter referred to as a “body region”) from each stage extracted in each page. The text region can be detected as a set of rows having the same row height and spacing as disclosed in, for example, Japanese Patent Application Laid-Open No. 2005-71014. Note that the position information of the document element representing the text extracted in step S108 in FIG. 6 may be used.

本文領域が検出されると、部分領域切出部22は、本文基準線を仮想的に設定する(ステップS204)。本文基準線は、各本文領域を囲う最小矩形(「本文枠」という)における1辺に相当し、行方向に対して垂直な、行頭側の線である。より具体的には、横書きの場合は本文枠の左上のコーナーを基準点とし、基準点を通り、かつ、行方向に直交する垂直方向の線が本文基準線として設定される。また、縦書きの場合は右上のコーナーを基準点とし、基準点を通り、かつ、行方向に直交する水平方向の線が本文基準線として設定される。   When the text area is detected, the partial area cutout unit 22 virtually sets the text reference line (step S204). The text reference line corresponds to one side of the smallest rectangle (referred to as “text frame”) that surrounds each text area, and is a line on the head side that is perpendicular to the row direction. More specifically, in horizontal writing, the upper left corner of the text frame is used as a reference point, and a vertical line passing through the reference point and orthogonal to the row direction is set as the text reference line. In the case of vertical writing, the upper right corner is set as a reference point, and a horizontal line passing through the reference point and orthogonal to the row direction is set as a text reference line.

図12のステップS204において設定された本文基準線に関する管理情報は、本文基準線管理情報としてメモリ部102に記録される。   The management information related to the text reference line set in step S204 in FIG. 12 is recorded in the memory unit 102 as the text reference line management information.

図13は、本文基準線管理情報のデータ構造を示す図である。図13を参照して、メモリ部102には、本文領域ごとに、段識別番号、本文領域左上座標、本文領域右下座標、および本文基準線位置が格納される。段識別番号は、対応する本文領域が属する段の識別番号の情報である。本文領域左上座標および本文領域右下座標は、対応する本文領域の位置情報である。本文基準線位置は、対応する本文領域の本文基準線の位置を示す情報である。なお、本文基準線の位置が特定できれば、本文基準線情報にこれらの全ての情報を含めなくてもよい。   FIG. 13 is a diagram illustrating a data structure of the text baseline management information. Referring to FIG. 13, the memory unit 102 stores a column identification number, a text area upper left coordinate, a text area lower right coordinate, and a text reference line position for each text area. The column identification number is information on the column identification number to which the corresponding text area belongs. The text region upper left coordinate and the text region lower right coordinate are position information of the corresponding text region. The text reference line position is information indicating the position of the text reference line in the corresponding text area. If the position of the text reference line can be specified, it is not necessary to include all these pieces of information in the text reference line information.

図14は、本文基準線について説明するための図である。図14(a)および図14(b)は、それぞれ、連続する2つのページの画像を示している。また、これらのページに含まれる段は全て横書きであるものと仮定する。   FIG. 14 is a diagram for explaining the text reference line. FIG. 14A and FIG. 14B show images of two consecutive pages, respectively. Further, it is assumed that all the levels included in these pages are horizontal writing.

図14(a)に示されるページの左側の領域には、上から順に段501a,502aが含まれる。また、同ページの右側の領域には段503が含まれる。段501aは、見出し(サマリ要素領域)561および本文領域501bを含む。段502aは、見出し(サマリ要素領域)562および本文領域502bを含む。段503は、本文領域のみを含むため、本文領域(503)と一致している。   The area on the left side of the page shown in FIG. 14A includes steps 501a and 502a in order from the top. The area on the right side of the page includes a step 503. The stage 501a includes a heading (summary element area) 561 and a text area 501b. The stage 502a includes a heading (summary element area) 562 and a text area 502b. Since the step 503 includes only the text area, it matches the text area (503).

図14(b)に示されるページの左側の領域には、段504aが含まれる。また、同ページの右側の領域には、段505,段506aが含まれる。段504aは、見出し(サマリ要素領域)563および本文領域504bを含む。段505は、本文領域のみを含むため、本文領域(505)と一致している。段506aは、見出しA(サマリ要素領域)564、見出しB(サマリ要素領域)565および本文領域506bを含む。   A region on the left side of the page shown in FIG. 14B includes a step 504a. Further, the area on the right side of the page includes a stage 505 and a stage 506a. The stage 504a includes a heading (summary element area) 563 and a text area 504b. Since the stage 505 includes only the text area, it matches the text area (505). The stage 506a includes a heading A (summary element region) 564, a heading B (summary element region) 565, and a text region 506b.

これらの図に示されるように、本文領域501b、502b、503、504b、505および506bそれぞれについて、本文領域の左端の直線(すなわち、本文枠の左端の辺)511,512,513,514,515,516が本文基準線として設定される。   As shown in these drawings, for each of the text areas 501b, 502b, 503, 504b, 505 and 506b, a straight line at the left end of the text area (that is, the left end side of the text frame) 511, 512, 513, 514, 515 , 516 are set as the text reference line.

再び図12を参照して、部分領域切出部22は、各ページにおいて本文基準線のグループを判別する(ステップS206)。具体的には、各ページにおいて、所定のしきい値内の近さにあり、かつ、同じ方向の本文基準線を1つのグループと判別する。ここでの「所定のしきい値」は、文書画像のページのサイズに対応して予め定められることとしてよい。   Referring again to FIG. 12, partial region cutout unit 22 determines a group of text reference lines in each page (step S206). Specifically, in each page, a text reference line that is close to a predetermined threshold value and in the same direction is determined as one group. Here, the “predetermined threshold value” may be determined in advance corresponding to the page size of the document image.

上記図14(a)を例にした場合、本文基準線511および本文基準線512が1つのグループと判断され、本文基準線513はそれ単体で1つのグループと判断される。また、上記図14(b)を例にした場合、本文基準線514それ単体で1つのグループと判断される。また、本文基準線515および本文基準線516が1つのグループと判断される。   In the case of FIG. 14A as an example, the text reference line 511 and the text reference line 512 are determined as one group, and the text reference line 513 is determined as a single group. In the case of FIG. 14B as an example, the text reference line 514 alone is determined as one group. Also, the text reference line 515 and the text reference line 516 are determined as one group.

各ページにおいてグループが判別されると、グループごとに本文グループ基準線が算出される(ステップS208)。具体的には、部分領域切出部22は、まず、本文基準線の平均の位置(横書きの場合は垂直方向の位置、縦書きの場合は水平方向の位置)を算出する。そして、元の基準線群と平行で平均の位置を通る線を本文グループ基準線として算出する。   When a group is determined on each page, a text group reference line is calculated for each group (step S208). Specifically, the partial area cutout unit 22 first calculates an average position of the text reference line (a vertical position for horizontal writing and a horizontal position for vertical writing). Then, a line parallel to the original reference line group and passing through the average position is calculated as a text group reference line.

図15は、処理ページにおける本文グループ基準線に基づいてページ間のレイアウトのずれを補正する例を示す図である。図15(a),(b)に示される2つのページは、それぞれ、図14(a),(b)に示した2つのページと同一であるものとする。   FIG. 15 is a diagram illustrating an example of correcting a layout shift between pages based on a text group reference line in a processing page. The two pages shown in FIGS. 15A and 15B are the same as the two pages shown in FIGS. 14A and 14B, respectively.

図15(a)に示したページには、本文基準線511および本文基準線512に基づく本文グループ基準線521と、本文基準線513に基づく本文グループ基準線522が設定される。   In the page shown in FIG. 15A, a text group reference line 521 based on the text reference line 511 and the text reference line 512 and a text group reference line 522 based on the text reference line 513 are set.

また、図15(b)に示したページには、本文基準線514に基づく本文グループ基準線523と、本文基準線515および本文基準線516に基づく本文グループ基準線524が設定される。   15B, a text group reference line 523 based on the text reference line 514 and a text group reference line 524 based on the text reference line 515 and the text reference line 516 are set.

本文グループ基準線が算出されると、部分領域切出部22は、本文グループ基準線に基づいてページ間のレイアウトのずれを補正する(ステップS210)。具体的には、2ページ目から順に、前ページに本文グループ基準線が合うように処理ページを順次、上下左右方向にシフトさせる。   When the text group reference line is calculated, the partial region cutout unit 22 corrects a layout shift between pages based on the text group reference line (step S210). Specifically, in order from the second page, the processing pages are sequentially shifted in the vertical and horizontal directions so that the body group reference line matches the previous page.

たとえば、図15(b)に示される処理ページの本文グループ基準線523が、図15(a)に示される前ページの本文グループ基準線521に整合するように、処理ページがシフトされる。また、処理ページの本文グループ基準線524が、前ページの本文グループ基準線522に整合するように、処理ページがシフトされる。   For example, the processing page is shifted so that the text group reference line 523 of the processing page shown in FIG. 15B matches the text group reference line 521 of the previous page shown in FIG. Further, the processing page is shifted so that the text group reference line 524 of the processing page matches the text group reference line 522 of the previous page.

処理ページのシフト量は、たとえば次のようにして求められる。すなわち、部分領域切出部22は、処理ページにおける各本文グループ基準線について、前ページに重ね合わせた場合に、所定の距離内で最も近い同一方向の本文グループ基準線を対応付ける。そして、対応付けられた本文グループ基準線同士の距離が最小となるようにたとえば最小二乗法によりシフト量を算出する。   The shift amount of the processed page is obtained as follows, for example. That is, the partial region cutout unit 22 associates each body group reference line in the processing page with the body group reference line closest in the same direction within a predetermined distance when the body group reference line is superimposed on the previous page. Then, the shift amount is calculated by, for example, the least square method so that the distance between the associated text group reference lines is minimized.

このように、部分領域を切出す前に、スキャンの際にずれたレイアウトを正規化することができる。その結果、サマリ画像において、見出し等の階層レベルを精度良く反映することができる。   In this manner, the layout shifted during scanning can be normalized before cutting out the partial area. As a result, hierarchical levels such as headings can be accurately reflected in the summary image.

なお、本実施の形態では、処理ページについて本文グループ基準線を求めてからページ間のレイアウトのずれを補正することとしたが、このような手法に限定されるものではない。図16は、処理ページにおける本文基準線に基づいてページ間のレイアウトのずれを補正する例を示す図である。この例によると、処理ページの本文基準線514が前ページの本文グループ基準線521に整合するように処理ページがシフトされる。また、処理ページの本文基準線515,516が前ページの本文グループ基準線522に整合するように処理ページがシフトされる。あるいは、本文グループ基準線を求めることなく本文基準線のみに基づいて、補正処理が行なわれてもよい。   In the present embodiment, the text group reference line is obtained for the processing page and then the layout shift between pages is corrected. However, the present invention is not limited to such a method. FIG. 16 is a diagram illustrating an example of correcting a layout shift between pages based on a text reference line in a processing page. According to this example, the processing page is shifted so that the text reference line 514 of the processing page matches the text group reference line 521 of the previous page. Further, the processing page is shifted so that the text reference lines 515 and 516 of the processing page are aligned with the text group reference line 522 of the previous page. Alternatively, the correction process may be performed based only on the text reference line without obtaining the text group reference line.

再び図12を参照して、以上のようにしてページ間のレイアウトのずれが補正されると、線設定部19は、各ページにおいて、行方向における両端位置が所定のしきい値内の段を、同一の段レイアウト枠に属すると判断する(ステップS212)。つまり、横書きの場合、左右双方の端位置が所定のしきい値内の近さにある段が、同一の段レイアウト枠に属すると判断される。また、縦書きの場合には、上下双方に端位置が所定のしきい値内の近さにある段が、同一の段レイアウト枠に属すると判断する。なお、段レイアウト枠は、段の行方向も考慮して判断されるものとする。   Referring to FIG. 12 again, when the layout shift between pages is corrected as described above, the line setting unit 19 sets the position where both end positions in the row direction are within a predetermined threshold in each page. It is determined that they belong to the same step layout frame (step S212). In other words, in the case of horizontal writing, it is determined that the stages whose left and right end positions are close to each other within the predetermined threshold value belong to the same stage layout frame. In the case of vertical writing, it is determined that the steps whose end positions are close to each other within a predetermined threshold value belong to the same step layout frame. Note that the column layout frame is determined in consideration of the row direction of the column.

ここでの「所定のしきい値」も、文書画像の文字サイズや行間隔で定められるのが好ましく、また、ページのサイズに対応して予め定められることとしてよい。または、線設定部19が、ページ内の段の幅に基づいて、段レイアウト枠の判断基準となる値を文書画像単位で算出してもよい。   The “predetermined threshold value” here is preferably determined based on the character size and line spacing of the document image, and may be determined in advance corresponding to the page size. Alternatively, the line setting unit 19 may calculate a value serving as a determination criterion for the step layout frame for each document image based on the step width in the page.

線設定部19は、段レイアウト枠ごとに、各段レイアウト枠に属すると判断された段を含む仮想矩形を設定する(ステップS214)。より具体的には、段レイアウト枠に属する段の位置情報に基づいて、同一の段レイアウト枠に属する段におけるすべての文書要素(サマリ要素領域以外も含む)を含む仮想矩形が設定される。   The line setting unit 19 sets a virtual rectangle including a step determined to belong to each step layout frame for each step layout frame (step S214). More specifically, based on the position information of the steps belonging to the step layout frame, a virtual rectangle including all document elements (including the summary element region) in the steps belonging to the same step layout frame is set.

図17は、図12のステップS214において設定される仮想矩形を示す図である。図17に示されるページは、図14(b),図15(b),図16(b)に示されたページと同一であるものとする。   FIG. 17 is a diagram illustrating the virtual rectangle set in step S214 of FIG. The page shown in FIG. 17 is the same as the page shown in FIG. 14B, FIG. 15B, and FIG.

図17を参照して、図14(b)に示した段504aは、段レイアウト枠についての条件を満たす他の段がないため、段504aのみで1つの仮想矩形531が設定される。したがって、段504aの領域と仮想矩形531の領域とは一致している。また、図14(b)に示した段505および段506aは、段レイアウト枠についての条件を満たしているためグループ化され、段505および段506aについて、仮想矩形532が設定される。   Referring to FIG. 17, since there is no other stage that satisfies the conditions for the stage layout frame in stage 504 a shown in FIG. 14B, one virtual rectangle 531 is set only by stage 504 a. Therefore, the area of the step 504a matches the area of the virtual rectangle 531. Further, the level 505 and the level 506a illustrated in FIG. 14B are grouped because the conditions for the level layout frame are satisfied, and a virtual rectangle 532 is set for the level 505 and the level 506a.

仮想矩形が設定されると、線設定部19は、仮想矩形の1辺であって、行方向に垂直な行頭側の線をレイアウト基準線として設定する(ステップS216)。横書きの場合、仮想矩形の左端の垂直線がレイアウト基準線として設定される。縦書きの場合には、仮想矩形の上端の水平線がレイアウト基準線として設定される。   When the virtual rectangle is set, the line setting unit 19 sets, as a layout reference line, a line that is one side of the virtual rectangle and is perpendicular to the line direction (step S216). In the case of horizontal writing, the vertical line at the left end of the virtual rectangle is set as the layout reference line. In the case of vertical writing, the horizontal line at the upper end of the virtual rectangle is set as the layout reference line.

上記図17においては、仮想矩形531の左端の垂直線541がレイアウト基準線として設定される。また、仮想矩形532の左端の垂直線542が、レイアウト基準線として設定される。   In FIG. 17, the leftmost vertical line 541 of the virtual rectangle 531 is set as the layout reference line. A vertical line 542 at the left end of the virtual rectangle 532 is set as a layout reference line.

図12のステップS216で設定されるレイアウト基準線に関する管理情報は、レイアウト基準線管理情報としてメモリ部102に記録される。   The management information related to the layout reference line set in step S216 in FIG. 12 is recorded in the memory unit 102 as layout reference line management information.

図18は、レイアウト基準線管理情報のデータ構造を示す図である。
図18を参照して、メモリ部102には、段レイアウト枠ごとに、段レイアウト枠識別番号、段識別番号、およびレイアウト基準線の位置が記録される。段レイアウト枠識別番号は、段レイアウト枠を一意に特定するための識別情報である。段識別番号の欄には、対応する段レイアウト枠に含まれる段の識別番号が記録される。レイアウト基準線の位置は、段レイアウト枠の位置を特定するための情報であり、位置情報として、たとえば、左上座標および右下座標が記録される。
FIG. 18 is a diagram illustrating a data structure of layout reference line management information.
Referring to FIG. 18, in memory unit 102, the stage layout frame identification number, the stage identification number, and the position of the layout reference line are recorded for each stage layout frame. The stage layout frame identification number is identification information for uniquely identifying the stage layout frame. In the column of the column identification number, the column identification number included in the corresponding column layout frame is recorded. The position of the layout reference line is information for specifying the position of the step layout frame. For example, the upper left coordinates and the lower right coordinates are recorded as the position information.

レイアウト基準線が設定されると、部分領域切出部22は、各サマリ要素領域について、レイアウト基準線を端部とする矩形領域を切出す(ステップS218)。より具体的には、横書きの場合には、サマリ要素領域が属する段に対応するレイアウト基準線と、サマリ要素領域の上下右端とを境界とする矩形領域を切出す。縦書きの場合には、レイアウト基準線と、サマリ要素領域の左右下端とを境界とする矩形領域を切出す。   When the layout reference line is set, the partial area cutout unit 22 cuts out a rectangular area having the layout reference line as an end for each summary element area (step S218). More specifically, in the case of horizontal writing, a rectangular area having a boundary between the layout reference line corresponding to the stage to which the summary element area belongs and the upper and lower right ends of the summary element area is cut out. In the case of vertical writing, a rectangular area whose boundary is the layout reference line and the left and right lower ends of the summary element area is cut out.

図19は、図12のステップS218において切出される矩形領域について説明するための図である。   FIG. 19 is a diagram for explaining the rectangular region cut out in step S218 of FIG.

図19を参照して、見出し563が、矩形領域571に含まれる。見出し564は、矩形領域572に含まれる。見出し565は、矩形領域573に含まれる。   Referring to FIG. 19, heading 563 is included in rectangular area 571. The heading 564 is included in the rectangular area 572. The heading 565 is included in the rectangular area 573.

見出し563および564は、それぞれの左端がレイアウト基準線541および542に一致している。そのため、矩形領域571および572は、見出し563および見出し564の領域とそれぞれ一致している。これに対し、見出し565の左端は、レイアウト基準線542と一致していない。この場合、矩形領域573の左端は、レイアウト基準線542となるように切出されている。   In the headings 563 and 564, the left ends of the headings 563 and 564 coincide with the layout reference lines 541 and 542, respectively. Therefore, the rectangular areas 571 and 572 match the areas of the heading 563 and the heading 564, respectively. On the other hand, the left end of the heading 565 does not coincide with the layout reference line 542. In this case, the left end of the rectangular area 573 is cut out so as to be the layout reference line 542.

ステップS218の処理が終わると、処理はメインルーチンに戻される。
再び図6を参照して、上述の部分領域切出処理が終わると、サマリ画像生成部24は、サマリ画像生成処理を行なう(ステップS114)。このサマリ画像生成処理については、図20のサブルーチンを参照して説明する。
When the process of step S218 ends, the process is returned to the main routine.
Referring to FIG. 6 again, when the partial area extraction process described above is completed, summary image generation unit 24 performs a summary image generation process (step S114). This summary image generation processing will be described with reference to the subroutine of FIG.

(サマリ画像生成処理)
サマリ画像生成処理について、図9、図10、図20〜図22を参照して説明する。
(Summary image generation processing)
The summary image generation process will be described with reference to FIGS. 9, 10, and 20 to 22.

図20は、本発明の実施の形態におけるサマリ画像生成処理を示すフローチャートである。   FIG. 20 is a flowchart showing a summary image generation process in the embodiment of the present invention.

図20を参照して、サマリ画像生成部24は、サマリ要素領域の順序を判定する(ステップS310)。具体的には、図9のサマリ要素管理情報における各サマリ文書領域の位置情報と、図10の段管理情報における段の位置情報および段の接続情報とに基づいて、サマリ要素領域の順序が判定される。   Referring to FIG. 20, summary image generation unit 24 determines the order of the summary element areas (step S310). Specifically, the order of the summary element areas is determined based on the position information of each summary document area in the summary element management information in FIG. 9 and the position information and stage connection information in the stage management information in FIG. Is done.

サマリ要素領域の順序が判定されると、サマリ画像生成部24は、所定の画像に、該画像中の所定の要素基準線に沿って、切出された矩形領域を順番に配置する(ステップS312)。横書きの場合、サマリ画像生成部24は、矩形領域を、上から順に所定の間隔で配置する。これに対し、縦書きの場合には、サマリ画像生成部24は、矩形領域を、右から順に所定の間隔で配置する。   When the order of the summary element regions is determined, the summary image generation unit 24 sequentially arranges the cut-out rectangular regions along a predetermined element reference line in the image on a predetermined image (step S312). ). In the case of horizontal writing, the summary image generation unit 24 arranges rectangular areas at predetermined intervals in order from the top. On the other hand, in the case of vertical writing, the summary image generating unit 24 arranges the rectangular areas at predetermined intervals in order from the right.

図21は、図20のステップS312において配置される矩形領域(サマリ要素領域)を説明するための図である。   FIG. 21 is a diagram for explaining the rectangular area (summary element area) arranged in step S312 of FIG.

図21を参照して、出力画像中の要素基準線710に沿って、切出された矩形領域711,712,713,714,715,…が上から順に所定の間隔で配置されている。   Referring to FIG. 21, the cut out rectangular regions 711, 712, 713, 714, 715,... Are arranged at predetermined intervals in order from the top along the element reference line 710 in the output image.

図22は、最終的に生成されたサマリ画像(1ページ)の一例を示す図である。本実施の形態では、サマリ要素領域は、レイアウト基準線からのインデントを維持したまま切出されるので、図22に示されるように、元の画像文書の階層をそのまま反映したサマリ画像を生成することができる。この図において、サマリ画像には、タイトルとして「…に関する報告書」が配置され、見出しとして「1.概要」,「2.背景」,「3....」,「A)...」,「B)...」,「4.今後の見通し」が配置されている。また、図としてグラフが配置され、マニュアルとして「結論としては....」というテキスト領域が配置されている。このように、本実施の形態によると、サマリ要素領域の階層を判定することなく、簡便にユーザ所望のサマリ画像を生成することができる。   FIG. 22 is a diagram illustrating an example of a finally generated summary image (one page). In this embodiment, the summary element area is cut out while maintaining the indent from the layout reference line, so that a summary image that directly reflects the hierarchy of the original image document is generated as shown in FIG. Can do. In this figure, the summary image has “Report on ...” as the title and “1. Outline”, “2. Background”, “3 ....”, “A) ...” as the headings. , “B) ...”, “4. Future outlook”. In addition, a graph is arranged as a figure, and a text area “Concluded as a conclusion ...” is arranged as a manual. As described above, according to the present embodiment, it is possible to easily generate a summary image desired by the user without determining the hierarchy of the summary element region.

ステップS312の処理が終わると、処理はメインルーチンに戻される。
(出力データ生成処理)
出力データ生成処理について、図6、図23〜図26を参照して説明する。
When the process of step S312 ends, the process returns to the main routine.
(Output data generation processing)
The output data generation process will be described with reference to FIGS. 6 and 23 to 26.

再び図6を参照して、サマリ画像生成処理が終わると、出力データ生成部26は、ステップS104において選択された出力形態が「分離」および「合成」のいずれであるかを判断する(S116)。   Referring to FIG. 6 again, when the summary image generation process is completed, output data generation unit 26 determines whether the output form selected in step S104 is “separation” or “combination” (S116). .

選択された出力形態が「分離」であった場合、ステップS126に進む。一方、選択された出力形態が「合成」であった場合には、ステップS118に進む。   If the selected output form is “separation”, the process proceeds to step S126. On the other hand, if the selected output form is “synthesis”, the process proceeds to step S118.

ステップS118において、まず、出力データ生成部26は、画像バッファ部14より入力された文書画像のデータの先頭に、サマリ画像生成部24より入力されたサマリ画像のデータを付加する。   In step S 118, the output data generation unit 26 first adds the summary image data input from the summary image generation unit 24 to the head of the document image data input from the image buffer unit 14.

また、しおり付与部28は、合成出力のためのしおりデータを生成する(ステップS120)。しおり付与部28は、ステップS118で生成された画像データ(「合成画像データ」という)に、生成したしおりデータを付加する(ステップS122)。合成画像データにしおりデータが付加されると、データ格納処理部30は、しおりが付加された合成画像データを電子合成文書4001として記憶部112に格納する(ステップS124)。   Further, the bookmark assigning unit 28 generates bookmark data for composite output (step S120). The bookmark assigning unit 28 adds the generated bookmark data to the image data generated in step S118 (referred to as “composite image data”) (step S122). When bookmark data is added to the composite image data, the data storage processing unit 30 stores the composite image data to which the bookmark is added in the storage unit 112 as an electronic composite document 4001 (step S124).

図23は、出力形態が「合成」の場合の電子文書(電子合成文書4001)のデータ構造の一例を示す図である。   FIG. 23 is a diagram illustrating an example of a data structure of an electronic document (electronic composite document 4001) when the output form is “composite”.

図23を参照して、電子合成文書4001は、ヘッダ部402と、サマリ画像部403と、しおりデータ部404と、文書画像部406と、フッタ部408とからなる。ヘッダ部402およびフッタ部408には、電子合成文書4001の属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。サマリ画像部403には、サマリ画像生成部24が生成したサマリ画像が格納される。しおりデータ部404には、サマリ画像に含まれるサマリ要素領域と元の文書画像におけるサマリ要素領域の位置とを対応付けるためのしおりデータが格納される。文書画像部406には、各ページに対応する文書画像が格納される。なお、この文書画像は、上述したように圧縮された状態で格納されてもよい。また、サマリ画像も、ページ数が多くなる場合などに圧縮された状態で格納されてもよい。   Referring to FIG. 23, an electronic composite document 4001 includes a header portion 402, a summary image portion 403, a bookmark data portion 404, a document image portion 406, and a footer portion 408. The header part 402 and the footer part 408 store information about the attributes of the electronic composite document 4001, such as creation date / time / creator / copyright information. The summary image unit 403 stores the summary image generated by the summary image generation unit 24. The bookmark data unit 404 stores bookmark data for associating the summary element area included in the summary image with the position of the summary element area in the original document image. A document image corresponding to each page is stored in the document image unit 406. The document image may be stored in a compressed state as described above. The summary image may also be stored in a compressed state when the number of pages increases.

図24は、出力形態が「合成」の場合のしおりデータのデータ構造の一例を示す図である。   FIG. 24 is a diagram illustrating an example of the data structure of bookmark data when the output form is “composite”.

図24を参照して、しおりデータには、各サマリ要素領域に対応付けて、サマリ画像のページ番号・領域左上座標・領域右下座標・要素種別と、元の文書画像のページ番号・領域左上座標・領域右下座標が含まれる。   Referring to FIG. 24, the bookmark data is associated with each summary element area, the page number of the summary image, the upper left area coordinates, the lower right area coordinates, the element type, the page number of the original document image, and the upper left area. Coordinate / region lower right coordinates are included.

サマリ画像のページ番号は、サマリ画像において、対応するサマリ要素領域が存在するページを特定するための位置情報である。また、サマリ画像の領域左上座標および領域右下座標は、サマリ画像において、対応するサマリ要素領域のページ内での領域(矩形)を特定するための位置情報である。   The page number of the summary image is position information for specifying the page where the corresponding summary element area exists in the summary image. Further, the region upper left coordinates and the region lower right coordinates of the summary image are position information for specifying the region (rectangle) in the page of the corresponding summary element region in the summary image.

なお、この位置情報は、切出されて配置された矩形領域の位置情報であってもよい。あるいは、位置情報により各サマリ要素領域が特定できればよいため、たとえば、矩形領域の近傍の領域の位置情報であってもよい。   The position information may be position information of a rectangular area that is cut out and arranged. Alternatively, since it is sufficient that each summary element area can be specified by the position information, for example, the position information of an area near the rectangular area may be used.

要素種別は、対応するサマリ要素領域に係る文書要素の種別を特定するための情報である。なお、要素種別は、しおりデータに含まれなくてもよい。   The element type is information for specifying the type of the document element related to the corresponding summary element area. The element type may not be included in the bookmark data.

元の文書画像のページ番号は、文書画像において、対応するサマリ要素領域が存在するページを特定するための位置情報である。また、サマリ画像の領域左上座標および領域右下座標は、文書画像において、対応するサマリ要素領域のページ内での領域(矩形)を特定するための位置情報である。   The page number of the original document image is position information for specifying the page in which the corresponding summary element area exists in the document image. Further, the region upper left coordinates and the region lower right coordinates of the summary image are position information for specifying the region (rectangle) in the page of the corresponding summary element region in the document image.

このように、配置された各サマリ要素領域に関連付けて、元の文書画像における対応する箇所を示すタグを、サマリ画像に埋め込む。その結果、ビューアソフトでサマリ画像中のサマリ要素領域を指示(クリックなど)した場合に、文書画像の対応する部分へジャンプして当該対応する部分を表示することが可能となる。   In this way, a tag indicating a corresponding portion in the original document image is embedded in the summary image in association with each arranged summary element region. As a result, when the summary element area in the summary image is designated (clicked or the like) by the viewer software, it is possible to jump to the corresponding part of the document image and display the corresponding part.

再び図6を参照して、ステップS126において、出力データ生成部26は、画像バッファ部14より入力された文書画像のデータとは別個に、サマリ画像生成部24より入力されたサマリ画像のデータを生成する。また、しおり付与部28は、分離出力のためのしおりデータを生成する(ステップS128)。しおり付与部28は、サマリ画像生成部24により生成されたサマリ画像データに、生成したしおりデータを付加する(ステップS130)。サマリ画像データにしおりデータが付加されると、データ格納処理部30は、文書画像データ、および、しおりデータが付加されたサマリ画像データを、それぞれ、電子原稿文書4002Aおよび電子サマリ文書4002Bとして記憶部112に格納する(ステップS132)。   Referring to FIG. 6 again, in step S126, the output data generation unit 26 receives the summary image data input from the summary image generation unit 24 separately from the document image data input from the image buffer unit 14. Generate. Further, the bookmark assigning unit 28 generates bookmark data for separation output (step S128). The bookmark giving unit 28 adds the generated bookmark data to the summary image data generated by the summary image generating unit 24 (step S130). When bookmark data is added to the summary image data, the data storage processing unit 30 stores the document image data and the summary image data to which the bookmark data is added as an electronic original document 4002A and an electronic summary document 4002B, respectively. 112 (step S132).

図25(a)は、出力形態が「分離」の場合の電子原稿文書4002Aのデータ構造の一例を示す図であり、図25(b)は、出力形態が「分離」の場合の電子サマリ文書4002Bのデータ構造の一例を示す図である。   FIG. 25A is a view showing an example of the data structure of the electronic original document 4002A when the output form is “separated”, and FIG. 25B is an electronic summary document when the output form is “separated”. It is a figure which shows an example of the data structure of 4002B.

図25(a)を参照して、電子原稿文書4002Aは、ヘッダ部402と、文書画像部406と、フッタ部408とからなる。図23に示した合成出力の場合の電子合成文書4001と比較すると、電子原稿文書4002Aは、サマリ画像部としおりデータ部とを含まない。   Referring to FIG. 25A, an electronic original document 4002A includes a header portion 402, a document image portion 406, and a footer portion 408. Compared with the electronic composite document 4001 in the case of the composite output shown in FIG. 23, the electronic original document 4002A does not include the summary data portion and the bookmark data portion.

図25(b)を参照して、電子サマリ文書4002Bは、ヘッダ部412と、サマリ画像部414と、しおりデータ部416と、フッタ部418とからなる。ヘッダ部412およびフッタ部408には、電子サマリ文書4002Bの属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。サマリ画像部414には、サマリ画像生成部24が生成したサマリ画像が格納される。しおりデータ部416には、サマリ画像に含まれるサマリ要素領域と元の文書画像におけるサマリ要素領域の位置とを対応付けるためのしおりデータが格納される。   Referring to FIG. 25B, the electronic summary document 4002B includes a header part 412, a summary image part 414, a bookmark data part 416, and a footer part 418. The header part 412 and the footer part 408 store information about the attributes of the electronic summary document 4002B, such as creation date / time / creator / copyright information. The summary image unit 414 stores the summary image generated by the summary image generation unit 24. The bookmark data unit 416 stores bookmark data for associating the summary element area included in the summary image with the position of the summary element area in the original document image.

図26は、出力形態が「分離」の場合のしおりデータのデータ構造の一例を示す図である。   FIG. 26 is a diagram illustrating an example of the data structure of bookmark data when the output form is “separated”.

図26を参照して、しおりデータには、各サマリ要素領域に対応付けて、サマリ画像のページ番号・領域左上座標・領域右下座標・要素種別と、元の文書画像のファイル名・ページ番号・領域左上座標・領域右下座標が含まれる。このように、図24に示した合成出力の場合のしおりデータと比較すると、分離出力の場合のしおりデータは、元の文書画像のファイル名を含む。なお、ここでは、サマリ要素領域ごとに元の文書画像のファイル名も格納することとしたが、ファイル名は全て同じであるため、ファイル名が特定できればこのような形態に限定されない。   Referring to FIG. 26, in the bookmark data, the summary image page number, the region upper left coordinate, the region lower right coordinate, the element type, the file name of the original document image, and the page number are associated with each summary element region. -The area upper left coordinates and area lower right coordinates are included. As described above, when compared with the bookmark data in the combined output shown in FIG. 24, the bookmark data in the separated output includes the file name of the original document image. Here, the file name of the original document image is also stored for each summary element area. However, since the file names are all the same, the file name is not limited to this form as long as the file name can be specified.

このように、配置された各サマリ要素領域に関連付けて、元の文書画像における対応する箇所を示すタグを、サマリ画像に埋め込む。その結果、分離出力の場合でも、ビューアソフトでサマリ画像中のサマリ要素領域を指示(クリックなど)した場合には、文書画像の対応する部分へジャンプして当該対応する部分を表示することが可能となる。   In this way, a tag indicating a corresponding portion in the original document image is embedded in the summary image in association with each arranged summary element region. As a result, even in the case of separate output, when the summary element area in the summary image is specified (clicked, etc.) with the viewer software, it is possible to jump to the corresponding part of the document image and display the corresponding part It becomes.

ステップS124またはステップS132の処理が終わると、この一連の文書サマリ作成処理は終了される。   When the process of step S124 or step S132 ends, the series of document summary creation processes ends.

<変形例>
次に、本発明の実施の形態の変形例に係るMFPについて説明する。
<Modification>
Next, an MFP according to a modification of the embodiment of the present invention will be described.

上記の実施の形態に係るMFP1では、レイアウト基準線を行頭側の端部としてサマリ要素領域を含む矩形領域を切出して、切出した矩形領域を、要素基準線に沿って所定の画像に配置した。そのため、サマリ画像において、元の文書画像での行方向の位置(インデント)が維持された。   In MFP 1 according to the above-described embodiment, a rectangular area including a summary element area is cut out with the layout reference line as an end portion on the line head side, and the cut out rectangular area is arranged in a predetermined image along the element reference line. Therefore, in the summary image, the position in the row direction (indent) in the original document image is maintained.

しかしながら、このようにインデント部分も含めてサマリ要素領域を切出す形態に限定されるものではない。   However, it is not limited to the form which cuts out a summary element area | region including an indent part in this way.

本実施の形態の変形例では、サマリ要素領域を囲う最小矩形を切出して、見出し等の階層レベルを反映させたサマリ画像を生成する。したがって、上記実施の形態とは、部分領域切出部の処理とサマリ画像生成部の処理とが異なる。その他の部分は同じである。したがって、ここでも上述のMFP1と同じ符号を用いて説明する。   In the modification of the present embodiment, a minimum rectangle surrounding the summary element area is cut out, and a summary image reflecting a hierarchical level such as a heading is generated. Therefore, the process of the partial area cutout unit and the process of the summary image generation unit are different from the above embodiment. The other parts are the same. Therefore, the same reference numerals as those of the MFP 1 described above will be used here.

以下、上記実施の形態と異なる部分のみ説明する。
本実施の形態の変形例におけるMFP1の制御部100は、実施の形態の部分領域切出部22およびサマリ画像生成部24それぞれに代えて、部分領域切出部22#およびサマリ画像生成部24#を含む。
Only the parts different from the above embodiment will be described below.
The control unit 100 of the MFP 1 according to the modification of the present embodiment replaces the partial region cutout unit 22 and the summary image generation unit 24 of the embodiment with the partial region cutout unit 22 # and the summary image generation unit 24 #. including.

部分領域切出部22#は、サマリ要素領域を囲む最小矩形のレイアウト基準線からのシフト量を検出する。また、検出したシフト量を、サマリ要素領域と対応付けてメモリ部102に記録する。   The partial area cutout unit 22 # detects the shift amount from the minimum rectangular layout reference line surrounding the summary element area. Further, the detected shift amount is recorded in the memory unit 102 in association with the summary element area.

図27は、本発明の実施の形態の変形例におけるサマリ要素管理情報のデータ構造を示す図である。図27を参照して、メモリ部102には、図9に示した情報に加え、サマリ要素(サマリ要素領域)ごとにシフト量がさらに記録される。   FIG. 27 is a diagram showing a data structure of summary element management information in a modification of the embodiment of the present invention. Referring to FIG. 27, in addition to the information shown in FIG. 9, the memory unit 102 further records a shift amount for each summary element (summary element region).

サマリ画像生成部24#は、サマリ要素領域ごとのシフト量を読み出し、読み出したシフト量の分だけ要素基準線からずらして、サマリ要素を出力画像に配置する。   The summary image generation unit 24 # reads the shift amount for each summary element region, shifts the shift amount from the element reference line by the read shift amount, and arranges the summary elements in the output image.

図28は、本発明の実施の形態の変形例における部分領域切出処理を示すフローチャートである。なお、図12のフローチャートと同じ処理については同じステップ番号を付してある。そのため、それらについての説明は繰返さない。   FIG. 28 is a flowchart showing a partial region extraction process in a modification of the embodiment of the present invention. The same processes as those in the flowchart of FIG. 12 are denoted by the same step numbers. Therefore, the description about them is not repeated.

図28を参照して、本実施の形態の変形例の部分領域切出処理においては、図12のステップS218に代えて、ステップS220およびS222の処理が実行される。   Referring to FIG. 28, in the partial region extraction process according to the modification of the present embodiment, processes in steps S220 and S222 are executed instead of step S218 in FIG.

ステップS220において、部分領域切出部22#は、サマリ要素領域ごとに、サマリ要素領域を囲む最小矩形のレイアウト基準線からのシフト量を検出する。つまり、サマリ要素の行頭側の端位置とレイアウト基準線との距離が算出される。具体的には、部分領域切出部22#は、サマリ要素領域の位置情報(図27参照)と、レイアウト基準線の位置情報(図18参照)とに基づいて、シフト量を算出する。   In step S220, the partial region cutout unit 22 # detects the shift amount from the minimum rectangular layout reference line surrounding the summary element region for each summary element region. That is, the distance between the end position on the line head side of the summary element and the layout reference line is calculated. Specifically, the partial area cutout unit 22 # calculates the shift amount based on the position information of the summary element area (see FIG. 27) and the position information of the layout reference line (see FIG. 18).

ステップS222において、部分領域切出部22#は、サマリ要素領域を囲む最小矩形を切出し、各サマリ要素領域に対応付けてシフト量をメモリ部102に記録する。   In step S222, the partial region cutout unit 22 # cuts out the minimum rectangle surrounding the summary element region, and records the shift amount in the memory unit 102 in association with each summary element region.

図29は、本発明の実施の形態の変形例におけるサマリ画像生成処理を示すフローチャートである。なお、図20のフローチャートと同じ処理については同じステップ番号を付してある。そのため、それ(ステップS310)についての説明は繰返さない。   FIG. 29 is a flowchart showing a summary image generation process in a modification of the embodiment of the present invention. The same processes as those in the flowchart of FIG. 20 are denoted by the same step numbers. Therefore, the description about it (step S310) will not be repeated.

図29を参照して、本実施の形態の変形例のサマリ画像生成処理においては、図20のステップS312に代えて、ステップS320の処理が実行される。   Referring to FIG. 29, in the summary image generation process according to the modification of the present embodiment, the process of step S320 is executed instead of step S312 of FIG.

ステップS320において、サマリ画像生成部24#は、メモリ部102からサマリ要素領域のシフト量を読み出し、ステップS310で判定した順序に従い、出力画像の要素基準線からシフト量だけずらしてサマリ要素領域(を囲む最小矩形)を配置する。   In step S320, the summary image generation unit 24 # reads the shift amount of the summary element area from the memory unit 102, and shifts the summary element area (() by shifting the shift amount from the element reference line of the output image according to the order determined in step S310. Place the minimum rectangle).

このように、本実施の形態の変形例のような処理を行なっても、図21に示した配置形態と同じ結果となる。したがって、変形例においても、見出し等の階層を判定することなく、元の文書の階層構造を反映したサマリ画像を作成することができる。   As described above, even if the process as in the modification of the present embodiment is performed, the same result as the arrangement form shown in FIG. 21 is obtained. Therefore, also in the modification, a summary image reflecting the hierarchical structure of the original document can be created without determining the hierarchy of headings and the like.

なお、この変形例では、検出されたシフト量の値そのものを記録し、その記録された値の分だけサマリ要素領域をずらして配置することとした。しかしながら、検出されたシフト量そのままの値分ずらして配置するものでなくてもよい。たとえば、検出されたシフト量の定数倍や量子化した値の分ずらして配置してもよい。この場合、メモリ部102に記録する際に、このような値を記録してもよいし、検出されたシフト量を記憶しておき、配置する際に所定の計算をすることで記録されたシフト量の定数倍や量子化した値の分ずらすこととしてもよい。   In this modification, the value of the detected shift amount itself is recorded, and the summary element area is shifted and arranged by the recorded value. However, the shift amount may not be shifted by the value as it is. For example, the shift amount may be shifted by a constant multiple of the detected shift amount or a quantized value. In this case, such a value may be recorded when recording in the memory unit 102, or the shift amount recorded by storing the detected shift amount and performing a predetermined calculation when arranging it. It may be shifted by a constant multiple of the amount or the quantized value.

あるいは、この変形例では、サマリ要素領域を囲む最小矩形を切出すこととして説明したが、サマリ要素領域の階層が反映できれば、必ずしも最小矩形である必要はない。たとえば、全てのサマリ要素領域について、行頭側に所定の距離分の余白を含めた矩形領域を切出すこととしてもよい。言い換えると、サマリ要素を囲む最小矩形の行頭側の辺を所定の距離だけ引き伸ばして切出してもよい。   Alternatively, in this modification, the minimum rectangle surrounding the summary element area is cut out, but the minimum rectangle is not necessarily required as long as the hierarchy of the summary element area can be reflected. For example, for all the summary element areas, a rectangular area including a margin for a predetermined distance may be cut out at the beginning of the line. In other words, the side of the smallest rectangle surrounding the summary element may be cut out by extending it by a predetermined distance.

なお、上述のように、本実施の形態およびその変形例では、サマリ要素領域を切出して配置することでサマリ画像を生成したが、サマリ要素領域以外の領域を消去して所定の間隔に詰めることでサマリ画像を生成してもよい。   As described above, in the present embodiment and its modifications, a summary image is generated by cutting out and arranging the summary element region. However, the region other than the summary element region is erased and packed at a predetermined interval. A summary image may be generated.

<他の変形例>
上述の実施の形態およびその変形例においては、本発明に係る処理がMFP1で実行される場合について説明したが、原稿300を読取るための画像読取機能を備えたコンピュータにおいて上記処理が実行されてもよい。この場合には、コンピュータを文書処理装置として機能させるための図5に示された処理機能を実行させるプログラムを提供することもできる。このようなプログラムは、CD−ROM(Compact Disk-Read Only Memory)などの光学媒体や、メモリカードなどのコンピュータ読取り可能な記録媒体にて記憶させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記憶媒体にて記憶させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
<Other variations>
In the above-described embodiment and its modification, the case where the processing according to the present invention is executed by the MFP 1 has been described. However, even if the above-described processing is executed in a computer having an image reading function for reading the document 300. Good. In this case, it is also possible to provide a program for executing the processing function shown in FIG. 5 for causing the computer to function as a document processing apparatus. Such a program can be stored in an optical medium such as a CD-ROM (Compact Disk-Read Only Memory) or a computer-readable recording medium such as a memory card and provided as a program product. Alternatively, the program can be provided by being stored in a storage medium such as a hard disk built in the computer. A program can also be provided by downloading via a network.

また、プログラムを記録しているたとえば光学媒体等をMFP1の駆動装置(図示せず)で読み出して、メモリ部102のプログラムをアップデートすることもできる。   Further, the program in the memory unit 102 can be updated by reading, for example, an optical medium in which the program is recorded with a driving device (not shown) of the MFP 1.

また、画像読取機能を他の装置またはコンピュータで実現した上で、生成された文書画像を受取って、上記のような処理に従ってサマリ画像を生成してもよい。また、サマリ画像と閲覧支援情報(しおりデータ)とが同一の文書に含まれる構成について例示したが、必ずしも同一の文書に閲覧支援情報を付加しなくてもよく、別のファイルとして出力してもよい。   Alternatively, the image reading function may be realized by another device or a computer, the generated document image may be received, and a summary image may be generated according to the above processing. Moreover, although the configuration in which the summary image and the browsing support information (bookmark data) are included in the same document has been illustrated, the browsing support information may not necessarily be added to the same document, and may be output as a separate file. Good.

なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。   The program according to the present invention is a program module that is provided as a part of a computer operating system (OS) and calls necessary modules in a predetermined arrangement at a predetermined timing to execute processing. Also good. In that case, the program itself does not include the module, and the process is executed in cooperation with the OS. A program that does not include such a module can also be included in the program according to the present invention.

また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。   The program according to the present invention may be provided by being incorporated in a part of another program. Even in this case, the program itself does not include the module included in the other program, and the process is executed in cooperation with the other program. Such a program incorporated in another program can also be included in the program according to the present invention.

提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記憶された記憶媒体とを含む。   The provided program product is installed in a program storage unit such as a hard disk and executed. Note that the program product includes the program itself and a storage medium in which the program is stored.

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。   The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.

本発明の実施の形態およびその変形例に従う文書処理装置(MFP)を含むシステムの概略構成図である。1 is a schematic configuration diagram of a system including a document processing apparatus (MFP) according to an embodiment of the present invention and a modification thereof. 本発明の実施の形態およびその変形例に従うMFPにおける概略の機能構成を示すブロック図である。FIG. 11 is a block diagram showing a schematic functional configuration in an MFP according to an embodiment of the present invention and a modification thereof. (a)は、本発明の実施の形態およびその変形例に従うMFPの第1の操作パネル部の外観の一例を示す図であり、(b)は、本発明の実施の形態およびその変形例に従うMFPの第2の操作パネル部の外観の一例を示す図である。(A) is a figure which shows an example of the external appearance of the 1st operation panel part of MFP according to embodiment and its modification of this invention, (b) is according to embodiment and its modification of this invention. 3 is a diagram illustrating an example of an appearance of a second operation panel unit of the MFP. FIG. 本発明の実施の形態およびその変形例に従うパーソナルコンピュータの概略のハードウェア構成を示す模式図である。It is a schematic diagram which shows the schematic hardware constitutions of the personal computer according to embodiment of this invention and its modification. 本発明の実施の形態およびその変形例に従うMFPの機能構成を示す機能ブロック図である。FIG. 5 is a functional block diagram showing a functional configuration of an MFP according to an embodiment of the present invention and a modification thereof. 本発明の実施の形態およびその変形例における文書サマリ作成処理を示すフローチャートである。It is a flowchart which shows the document summary creation process in embodiment of this invention and its modification. 出力形態選択画面の一例を示す図である。It is a figure which shows an example of an output form selection screen. 文書画像に含まれる文書要素の抽出処理を説明するための図であり、(a)は、原稿から生成される文書画像の一例を示す図であり、(b)は、(a)に示す文書画像に対して文書要素が抽出された状態の一例を示す図である。4A and 4B are diagrams for explaining extraction processing of document elements included in a document image, where FIG. 5A is a diagram illustrating an example of a document image generated from a document, and FIG. 5B is a document illustrated in FIG. It is a figure which shows an example of the state by which the document element was extracted with respect to the image. 本発明の実施の形態におけるサマリ要素管理情報のデータ構造を示す図である。It is a figure which shows the data structure of the summary element management information in embodiment of this invention. 本発明の実施の形態およびその変形例における段管理情報のデータ構造を示す図である。It is a figure which shows the data structure of the stage management information in embodiment of this invention and its modification. サマリ要素確認画面の一例を示す図である。It is a figure which shows an example of a summary element confirmation screen. 本発明の実施の形態における部分領域切出処理を示すフローチャートである。It is a flowchart which shows the partial region extraction process in embodiment of this invention. 本発明の実施の形態およびその変形例における本文基準線管理情報のデータ構造を示す図である。It is a figure which shows the data structure of the text reference line management information in embodiment of this invention and its modification. 本文基準線について説明するための図である。It is a figure for demonstrating a text reference line. 処理ページにおける本文グループ基準線に基づいてページ間のレイアウトのずれを補正する例を示す図である。It is a figure which shows the example which correct | amends the shift | offset | difference of the layout between pages based on the text group reference line in a process page. 処理ページにおける本文基準線に基づいてページ間のレイアウトのずれを補正する例を示す図である。It is a figure which shows the example which correct | amends the shift | offset | difference of the layout between pages based on the text reference line in a process page. 図12のステップS214において設定される仮想矩形を示す図である。It is a figure which shows the virtual rectangle set in step S214 of FIG. 本発明の実施の形態およびその変形例におけるレイアウト基準線管理情報のデータ構造を示す図である。It is a figure which shows the data structure of the layout reference line management information in embodiment of this invention and its modification. 図12のステップS218において切出される矩形領域について説明するための図である。It is a figure for demonstrating the rectangular area cut out in step S218 of FIG. 本発明の実施の形態におけるサマリ画像生成処理を示すフローチャートである。It is a flowchart which shows the summary image generation process in embodiment of this invention. 図20のステップS312において配置されるサマリ要素領域を説明するための図である。It is a figure for demonstrating the summary element area | region arrange | positioned in FIG.20 S312. 最終的に生成されたサマリ画像の一例を示す図である。It is a figure which shows an example of the summary image finally produced | generated. 出力形態が「合成」の場合の電子文書のデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of an electronic document in case an output form is "composite". 出力形態が「合成」の場合のしおりデータのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of bookmark data in case an output form is "composite". (a)は、出力形態が「分離」の場合の電子原稿文書のデータ構造の一例を示す図であり、(b)は、出力形態が「分離」の場合の電子サマリ文書のデータ構造の一例を示す図である。(A) is a figure which shows an example of the data structure of an electronic manuscript document when an output form is "separation", (b) is an example of the data structure of an electronic summary document when an output form is "separation" FIG. 出力形態が「分離」の場合のしおりデータのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of bookmark data in case an output form is "separation". 本発明の実施の形態の変形例におけるサマリ要素管理情報のデータ構造を示す図である。It is a figure which shows the data structure of the summary element management information in the modification of embodiment of this invention. 本発明の実施の形態の変形例における部分領域切出処理を示すフローチャートである。It is a flowchart which shows the partial area | region extraction process in the modification of embodiment of this invention. 本発明の実施の形態の変形例におけるサマリ画像生成処理を示すフローチャートである。It is a flowchart which shows the summary image generation process in the modification of embodiment of this invention.

符号の説明Explanation of symbols

1 MFP、12 出力形態選択部、14 画像バッファ部、16 サマリ要素抽出部、18 段検出部、19 線設定部、20 要素修正部、22 部分領域切出部、24 サマリ画像生成部、26 出力データ生成部、28 しおり付与部、30 データ格納処理部、32 送信処理部、100 制御部、102 メモリ部、104 画像読取部、106 プリント部、108 通信インターフェイス部、110,111 操作パネル部、112 記憶部、201 CPU、203 内部バス、205 ディスプレイ部、207 通信インターフェイス部、209 入力部、211 ハードディスク部、213 メモリ部、215 CD−ROMドライブ、215a CD−ROM、217 FDDドライブ、217a フレキシブルディスク、300 原稿、400 電子文書、402 ヘッダ部、403 サマリ画像部、404 しおりデータ部、406 文書画像部、408 フッタ部、412 ヘッダ部、414 サマリ画像部、416 データ部、418 フッタ部、420 文書要素、501a,502a,504a,506a 段、501b,502b,504b,506b 本文領域、503,505 段(本文領域)、511,512,513,514,515,516 本文基準線、521,522,523,524 本文グループ基準線、531,532 仮想矩形、541,542 レイアウト基準線、571,572,573 矩形領域、611,612 サマリ要素、621 削除ボタン、622 要素追加ボタン、623 範囲変更ボタン、624 OKボタン、625 前頁ボタン、626 次頁ボタン、627 カーソルボタン、710 要素基準線、711,712,713,714,715 矩形領域、4001 電子合成文書、4002A 電子原稿文書、4002B 電子サマリ文書、PC1,PC2,PC3 パーソナルコンピュータ、SRV サーバ装置。   1 MFP, 12 output form selection unit, 14 image buffer unit, 16 summary element extraction unit, 18 stage detection unit, 19 line setting unit, 20 element modification unit, 22 partial area extraction unit, 24 summary image generation unit, 26 output Data generation unit, 28 bookmark giving unit, 30 data storage processing unit, 32 transmission processing unit, 100 control unit, 102 memory unit, 104 image reading unit, 106 printing unit, 108 communication interface unit, 110, 111 operation panel unit, 112 Storage unit, 201 CPU, 203 internal bus, 205 display unit, 207 communication interface unit, 209 input unit, 211 hard disk unit, 213 memory unit, 215 CD-ROM drive, 215a CD-ROM, 217 FDD drive, 217a flexible disk, 300 manuscripts, 400 electronic document, 402 header part, 403 summary image part, 404 bookmark data part, 406 document image part, 408 footer part, 412 header part, 414 summary image part, 416 data part, 418 footer part, 420 document element, 501a, 502a, 504a, 506a stage, 501b, 502b, 504b, 506b text area, 503,505 stage (text area), 511, 512, 513, 514, 515, 516 text baseline, 521, 522, 523, 524 text group Reference line, 531 532 Virtual rectangle, 541, 542 Layout reference line, 571, 572, 573 Rectangular area, 611, 612 Summary element, 621 Delete button, 622 Add element button, 623 Change range button, 624 OK button, 625 Previous Page button, 26 Next page button, 627 Cursor button, 710 Element reference line, 711, 712, 713, 714, 715 Rectangular area, 4001 Electronic composite document, 4002A Electronic original document, 4002B Electronic summary document, PC1, PC2, PC3 Personal computer, SRV Server device.

Claims (16)

文書画像から前記文書画像のサマリを作成する文書処理装置であって、
前記文書画像から、所定の種別の文書要素を抽出するための抽出手段と、
前記文書画像から、頁ごとに段を検出するための検出手段と、
前記段のレイアウトに基づいて、頁ごとに、少なくとも1つのレイアウト基準線を設定するための線設定手段とを備え、
前記レイアウト基準線は、対応する前記段の行方向に垂直な方向の線であり、
頁間での前記レイアウト基準線のずれを補正するための処理を行なう補正処理手段と、
抽出された前記所定の種別の文書要素に対応するサマリ領域を含む部分領域を、前記レイアウト基準線を基準として切出すための切出手段と、
所定の画像に、前記画像における所定の要素基準線を基準として前記部分領域を配置することで、前記サマリを表わす画像であるサマリ画像を生成するためのサマリ生成手段とをさらに備える、文書処理装置。
A document processing apparatus for creating a summary of a document image from a document image,
Extraction means for extracting a predetermined type of document element from the document image;
Detection means for detecting a stage for each page from the document image;
Line setting means for setting at least one layout reference line for each page based on the layout of the stage;
The layout reference line is a line in a direction perpendicular to the row direction of the corresponding stage,
Correction processing means for performing processing for correcting a shift of the layout reference line between pages;
Cutting means for cutting out a partial area including a summary area corresponding to the extracted document element of the predetermined type with reference to the layout reference line;
A document processing apparatus, further comprising: a summary generation unit configured to generate a summary image, which is an image representing the summary, by disposing the partial area in a predetermined image with reference to a predetermined element reference line in the image. .
前記切出手段は、前記レイアウト基準線を端部として前記部分領域を切出し、
前記サマリ生成手段は、前記所定の要素基準線に沿って、前記部分領域を順に配置する、請求項1に記載の文書処理装置。
The cutting means cuts out the partial region with the layout reference line as an end,
The document processing apparatus according to claim 1, wherein the summary generation unit sequentially arranges the partial areas along the predetermined element reference line.
前記切出手段は、前記サマリ領域を含む最小矩形を前記部分領域として切出すとともに、前記部分領域と前記レイアウト基準線との距離を前記部分領域ごとに検出し、
前記サマリ生成手段は、前記所定の要素基準線の位置から、検出された距離に応じて前記部分領域をシフトさせて前記画像に配置する、請求項1に記載の文書処理装置。
The cutting means cuts out a minimum rectangle including the summary area as the partial area, and detects a distance between the partial area and the layout reference line for each partial area,
The document processing apparatus according to claim 1, wherein the summary generation unit shifts the partial area from the position of the predetermined element reference line according to the detected distance and arranges the partial area in the image.
前記補正処理手段は、頁間で、前記段における本文領域の基準位置を整合させるための整合手段を含む、請求項1〜3のいずれかに記載の文書処理装置。 Wherein the correction processing means, in between pages, including alignment means for aligning the reference position of the body region of the stage, the document processing apparatus according to claim 1. 所定の条件に基づいて、頁ごとに、複数の前記段をグループ化して少なくとも1つの仮想矩形を設定するための矩形設定手段をさらに備え、
前記線設定手段は、前記仮想矩形ごとに前記レイアウト基準線を設定する、請求項1〜3のいずれかに記載の文書処理装置。
Based on a predetermined condition, for each page, further comprising a rectangle setting means for grouping a plurality of the stages to set at least one virtual rectangle,
It said line setting means sets the layout reference line for each of the imaginary rectangle, the document processing apparatus according to claim 1.
前記線設定手段は、前記仮想矩形における行方向に垂直な、行頭側の辺を前記レイアウト基準線として設定する、請求項に記載の文書処理装置。 The document processing apparatus according to claim 5 , wherein the line setting unit sets a side on a line head side perpendicular to a line direction in the virtual rectangle as the layout reference line. 前記文書画像を含む第1の電子文書と、前記サマリ画像を含む第2の電子文書とを別々に生成するための文書生成手段と、
前記第1の電子文書および前記第2の電子文書を記憶するための記憶手段とをさらに備える、請求項1〜3のいずれかに記載の文書処理装置。
Document generating means for separately generating a first electronic document including the document image and a second electronic document including the summary image;
Further comprising a storage means for storing the first electronic document and the second electronic document, the document processing apparatus according to claim 1.
前記部分領域ごとに前記文書画像の対応する箇所と関連付けるための閲覧支援情報を生成して、前記閲覧支援情報を前記サマリ画像に付加するための付加手段をさらに備え、
前記閲覧支援情報は、対応する前記第1の電子文書を特定するための文書特定情報、および、前記部分領域ごとの前記文書画像中の対応している箇所を示す位置情報を含む、請求項に記載の文書処理装置。
Further comprising: adding means for generating browsing support information for associating with the corresponding portion of the document image for each partial area, and adding the browsing support information to the summary image;
The viewing support information, document identification information for identifying the first electronic document corresponding, and includes location information indicating a correspondence to that location in the document image for each of the partial regions, claim 7 Document processing apparatus described in 1.
前記文書画像と前記サマリ画像とを含む電子文書を生成するための文書生成手段と、
前記電子文書を記憶するための記憶手段とをさらに備える、請求項1〜3のいずれかに記載の文書処理装置。
Document generation means for generating an electronic document including the document image and the summary image;
Further comprising a storage means for storing the electronic document, the document processing apparatus according to claim 1.
前記部分領域ごとに前記文書画像の対応する箇所と関連付けるための閲覧支援情報を生成して、前記閲覧支援情報を前記サマリ画像に付加するための付加手段をさらに備え、
前記閲覧支援情報は、前記部分領域ごとの前記文書画像中の対応している箇所を示す位置情報を含む、請求項に記載の文書処理装置。
Further comprising: adding means for generating browsing support information for associating with the corresponding portion of the document image for each partial area, and adding the browsing support information to the summary image;
The document processing apparatus according to claim 9 , wherein the browsing support information includes position information indicating a corresponding location in the document image for each partial area.
ユーザからの指示に基づき、前記抽出手段により抽出された前記所定の種別の文書要素を修正するための修正手段をさらに備え、
前記切出手段は、前記修正手段による修正後の文書要素の領域を前記サマリ領域として切出す、請求項1〜3のいずれかに記載の文書処理装置。
A correction unit for correcting the document element of the predetermined type extracted by the extraction unit based on an instruction from the user;
Said cutting means cuts out a region of the document element after correction by said correction means as the summary area, the document processing apparatus according to claim 1.
前記修正手段は、前記文書画像よりユーザ所望の領域の指定を受付ける指定手段を含み、
前記切出手段は、前記指定手段により指定された領域を前記サマリ領域として切出す、請求項11に記載の文書処理装置。
The correction means includes designation means for accepting designation of an area desired by the user from the document image,
The document processing apparatus according to claim 11 , wherein the extraction unit extracts an area designated by the designation unit as the summary area.
前記サマリ画像を前記文書画像とは別に出力するか、前記サマリ画像を前記文書画像と合成して出力するかの選択をユーザより受付けるための選択手段と、
前記選択手段により別に出力することが選択された場合に、前記文書画像を含む第1の電子文書と、前記サマリ画像を含む第2の電子文書とを生成するための第1の文書生成手段と、
前記選択手段により合成して出力することが選択された場合に、前記文書画像と前記サマリ画像とを合成して第3の電子文書を生成するための第2の文書生成手段とをさらに備える、請求項1〜3のいずれかに記載の文書処理装置。
A selection means for accepting a selection from a user to output whether the summary image is output separately from the document image, or the summary image is combined with the document image and output;
First document generation means for generating a first electronic document including the document image and a second electronic document including the summary image when the selection means selects to output separately; ,
A second document generation unit configured to generate a third electronic document by combining the document image and the summary image when the selection unit selects to output the combined image; the document processing apparatus according to claim 1.
前記所定の種別は、表題、見出し、図、表、写真、段落の先頭の所定行、手書き注釈の対象、およびキャプションのうち少なくともいずれか1つを含む、請求項1〜13のいずれかに記載の文書処理装置。 Said predetermined type is title, headings, drawings, tables, photographs, a predetermined row of the beginning of the paragraph, the handwritten annotations of interest, and at least any one of captions, according to any of claims 1 to 13 Document processing device. 記憶部と演算処理部とを備えた文書処理装置において、文書画像から前記文書画像のサマリを作成する方法であって、
前記演算処理部が、前記文書画像から、所定の種別の文書要素を抽出するステップと、
前記演算処理部が、前記文書画像から、頁ごとに段を検出するステップと、
前記演算処理部が、前記段のレイアウトに基づいて、頁ごとに、前記段の行方向に垂直な方向の少なくとも1つのレイアウト基準線を設定するステップと、
前記演算処理部が、頁間での前記レイアウト基準線のずれを補正するための処理を行なうステップと、
前記演算処理部が、抽出された前記所定の種別の文書要素に対応するサマリ領域を含む部分領域を、前記レイアウト基準線を基準として切出すステップと、
前記演算処理部が、所定の画像に、前記画像における所定の要素基準線を基準として前記部分領域を配置することで、サマリ画像を生成するステップとを備える、文書サマリ作成方法。
In a document processing apparatus including a storage unit and an arithmetic processing unit, a method for creating a summary of the document image from a document image,
The arithmetic processing unit extracting a document element of a predetermined type from the document image;
The arithmetic processing unit detecting a step for each page from the document image;
The arithmetic processing unit sets, for each page, at least one layout reference line in a direction perpendicular to the row direction of the stage based on the layout of the stage;
The arithmetic processing unit performing a process for correcting a shift of the layout reference line between pages;
The arithmetic processing unit cutting out a partial area including a summary area corresponding to the extracted document element of the predetermined type with reference to the layout reference line;
And a step of generating a summary image by arranging the partial area in a predetermined image with reference to a predetermined element reference line in the image.
請求項15に記載の文書サマリ作成方法をコンピュータに実行させる、文書サマリ作成プログラム。 A document summary creation program for causing a computer to execute the document summary creation method according to claim 15 .
JP2008115783A 2008-04-25 2008-04-25 Document processing apparatus, document summary creation method, and document summary creation program Expired - Fee Related JP5194995B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008115783A JP5194995B2 (en) 2008-04-25 2008-04-25 Document processing apparatus, document summary creation method, and document summary creation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008115783A JP5194995B2 (en) 2008-04-25 2008-04-25 Document processing apparatus, document summary creation method, and document summary creation program

Publications (2)

Publication Number Publication Date
JP2009266009A JP2009266009A (en) 2009-11-12
JP5194995B2 true JP5194995B2 (en) 2013-05-08

Family

ID=41391772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008115783A Expired - Fee Related JP5194995B2 (en) 2008-04-25 2008-04-25 Document processing apparatus, document summary creation method, and document summary creation program

Country Status (1)

Country Link
JP (1) JP5194995B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4957821B2 (en) * 2010-03-18 2012-06-20 コニカミノルタビジネステクノロジーズ株式会社 CONFERENCE SYSTEM, INFORMATION PROCESSING DEVICE, DISPLAY METHOD, AND DISPLAY PROGRAM
US11514228B2 (en) * 2014-05-23 2022-11-29 Microsoft Technology Licensing, Llc Guides on a content generation system
WO2017149711A1 (en) * 2016-03-02 2017-09-08 株式会社日立製作所 Document management device and document management method
CN109934209B (en) * 2019-05-17 2019-07-30 上海肇观电子科技有限公司 Printed page analysis method, reading aids, circuit and medium
CN113835791A (en) * 2020-06-23 2021-12-24 北京字节跳动网络技术有限公司 Method and device for presenting hierarchical relation of view components

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3178483B2 (en) * 1992-06-09 2001-06-18 富士ゼロックス株式会社 Document processing device
JP3313519B2 (en) * 1994-09-19 2002-08-12 シャープ株式会社 Image processing device

Also Published As

Publication number Publication date
JP2009266009A (en) 2009-11-12

Similar Documents

Publication Publication Date Title
JP4369785B2 (en) System, MFP, collective server and method for managing multimedia documents
JP4405831B2 (en) Image processing apparatus, control method therefor, and program
US7739583B2 (en) Multimedia document sharing method and apparatus
JP5111268B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
JP4533273B2 (en) Image processing apparatus, image processing method, and program
KR102403964B1 (en) Image processing apparatus, image processing method, and storage medium
JP4785655B2 (en) Document processing apparatus and document processing method
JP2006178973A (en) Document separator page
JP2005295564A (en) Document management method
JP5194995B2 (en) Document processing apparatus, document summary creation method, and document summary creation program
US8587817B2 (en) Image processing apparatus, image processing method, and computer readable medium storing program
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US8854635B2 (en) Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings
JP5176416B2 (en) Document processing apparatus, document processing method, and document processing program
JP2009169675A (en) Document processing apparatus, document processing method and document processing program
JP2008052496A (en) Image display device, method, program and recording medium
JP4811133B2 (en) Image forming apparatus and image processing apparatus
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP5098614B2 (en) Method for controlling sentence processing apparatus and sentence processing apparatus
JP4827519B2 (en) Image processing apparatus, image processing method, and program
JP2006333248A (en) Image processing apparatus, image processing method, program and storage medium
JP5205821B2 (en) Document processing method, document processing program, and document processing apparatus
US20230273952A1 (en) Image processing apparatus, image processing method, and storage medium
JP2010061623A (en) Document processor, document processing method, and document processing program
JP2008244612A (en) Image processing apparatus and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees