JP6545573B2 - Image processing apparatus, image forming apparatus, and chapter division processing method - Google Patents

Image processing apparatus, image forming apparatus, and chapter division processing method Download PDF

Info

Publication number
JP6545573B2
JP6545573B2 JP2015166217A JP2015166217A JP6545573B2 JP 6545573 B2 JP6545573 B2 JP 6545573B2 JP 2015166217 A JP2015166217 A JP 2015166217A JP 2015166217 A JP2015166217 A JP 2015166217A JP 6545573 B2 JP6545573 B2 JP 6545573B2
Authority
JP
Japan
Prior art keywords
chapter
character string
extracted
unit
page
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015166217A
Other languages
Japanese (ja)
Other versions
JP2017045203A (en
Inventor
松本 学
学 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2015166217A priority Critical patent/JP6545573B2/en
Publication of JP2017045203A publication Critical patent/JP2017045203A/en
Application granted granted Critical
Publication of JP6545573B2 publication Critical patent/JP6545573B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

本発明は、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置、画像形成装置及び章分け処理方法に関する。   The present invention relates to an image processing apparatus, an image forming apparatus, and a chapter division processing method which perform processing of sorting document image data relating to documents of a plurality of pages into chapters.

従来、複数ページからなり、複数の章からなる原稿を読み取り、読み取った原稿画像データから印刷物、電子文書を作成できる画像形成装置が開示されている。   2. Description of the Related Art Conventionally, an image forming apparatus capable of reading a document consisting of a plurality of pages and having a plurality of chapters and creating printed matter and an electronic document from the read document image data is disclosed.

例えば、特許文献1においては、章分け箇所の候補を、以下の1つ以上の条件の組み合わせで抽出する画像形成装置が開示されている。
(1)原稿画像内の行の文字サイズがユーザの指定した文字サイズより大きいときに、該行を章分け箇所の候補とする。
(2)原稿画像内の空白行数がユーザの指定した空白行数より大きいときに、空白行の次の行を章分け箇所の候補とする。
(3)ユーザの指定したページ番号に合致した原稿画像内の先頭行を章分け箇所の候補とする。
(4)原稿画像内の行の文字列にユーザの指定した文字列含むときに、当該行を章分け箇所の候補とする。
(5)原稿画像内のユーザの指定した行を章分け箇所の候補とする。
For example, Patent Document 1 discloses an image forming apparatus that extracts candidates for chapter division locations under a combination of one or more of the following conditions.
(1) When the character size of the line in the document image is larger than the character size designated by the user, the line is made a chapter division candidate.
(2) When the number of blank lines in the document image is larger than the number of blank lines specified by the user, the line following the blank line is set as a candidate for division into chapters.
(3) The first line in the document image matching the page number designated by the user is set as a chapter division candidate.
(4) When the character string of the line in the document image includes the character string designated by the user, the line is set as a chapter division candidate.
(5) A line designated by the user in the document image is used as a chapter division candidate.

特開2010−109420号公報JP, 2010-109420, A

しかしながら、特許文献1の画像形成装置は、何れの条件においてもユーザが条件を設定する必要があり、ユーザ使用性、利便性として煩雑さを伴うが故、ユーザが簡易に使用することが難しいという問題がある。   However, in the image forming apparatus of Patent Document 1, the user needs to set the conditions under any conditions, and although it is complicated as user usability and convenience, it is difficult for the user to use easily. There's a problem.

また、特許文献1の画像形成装置は、章分けを行う処理を開示するのみであって、章分けした結果の利用については、言及されていない。   Further, the image forming apparatus of Patent Document 1 only discloses the process of dividing a chapter, and does not mention the use of the result of dividing the chapter.

本発明は、斯かる事情に鑑みてなされたものであり、その目的とするところは、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う場合において、該原稿に係る原稿画像データに対して、簡単、かつ、適確に、章毎に分別する章分けの処理を行うことが出来る画像処理装置、画像形成装置及び章分け処理方法を提供することにある。   The present invention has been made in view of such circumstances, and the object of the present invention is to separate original image data relating to a plurality of pages of an original image data into chapters in the case of performing sorting for each chapter. It is an object of the present invention to provide an image processing apparatus, an image forming apparatus, and a chapter division processing method capable of performing processing of chapter division for sorting into chapters easily and appropriately with respect to such document image data.

本発明に係る画像処理装置は、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部と、前記最大文字サイズを有する文字列を抽出する文字列抽出部と、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部と、前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部とを備え、前記記憶部は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。   The image processing apparatus according to the present invention performs character recognition processing on the document image data in an image processing apparatus that performs processing to separate document image data related to documents of a plurality of pages for each chapter, and the maximum character size A character size detection unit that detects a size, a character string extraction unit that extracts a character string having the maximum character size, and a storage unit that stores a chapter number pattern representing a chapter division on a chapter start page And a chapter information acquisition unit which extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data; The storage unit is characterized by storing the extracted character string and the page number in association with the extracted number.

本発明に係る画像処理装置は、抽出された数字が複数である場合、前記章情報取得部によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求め、抜け数字を補完する抜け補完部を備えることを特徴とする。   In the image processing apparatus according to the present invention, when there are a plurality of extracted numbers, the number of missing numbers in the ascending and descending order is obtained based on the numbers and page numbers acquired by the chapter information acquiring unit, and the missing numbers are complemented. It has a missing part complementing part.

本発明に係る画像処理装置は、前記抜け補完部は、抽出された数字が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行うことを特徴とする。   In the image processing apparatus according to the present invention, when the number of extracted numerals is one, the missing complement unit complements the missing numerals with respect to a range defined by the page number and the final page number of the document. It is characterized by doing.

本発明に係る画像処理装置は、前記文字サイズ検出部は、各ページの一行目の文字列に対してのみ前記検出を行うことを特徴とする。   The image processing apparatus according to the present invention is characterized in that the character size detection unit performs the detection only for the character string on the first line of each page.

本発明に係る画像処理装置は、前記文字列抽出部は、各ページの一行目の文字列に対してのみ前記抽出を行うことを特徴とする。   The image processing apparatus according to the present invention is characterized in that the character string extraction unit performs the extraction only on the character string on the first line of each page.

本発明に係る画像処理装置は、前記章情報取得部は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする。   In the image processing apparatus according to the present invention, the chapter information acquisition unit searches for an extracted character string in which the first one or more characters of the extracted character strings match the pattern, and the extracted character string is searched , And a digit corresponding to the chapter number included in the corresponding pattern is extracted.

本発明に係る画像形成装置は、請求項1から6の何れか一つに記載の画像処理装置と、シート状の記録媒体に画像形成を行う画像形成部と、特定紙が収容されたトレイと、前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部とを備えることを特徴とする。   An image forming apparatus according to the present invention comprises an image processing apparatus according to any one of claims 1 to 6, an image forming section for forming an image on a sheet-like recording medium, and a tray containing specific paper. The method is characterized in that, when performing the image formation, an insertion section for inserting a specific sheet is provided to switch the chapter based on the result of the processing.

本発明に係る画像形成装置は、前記画像形成部は、前記章情報取得部によって取得された抽出文字列に係る数字、ページ番号を該抽出文字列に対応付けて、前記原稿に係る目次の画像形成を行うことを特徴とする。   In the image forming apparatus according to the present invention, the image forming unit associates the number and page number related to the extracted character string acquired by the chapter information acquiring unit with the extracted character string, and the image of the table of contents related to the document It is characterized by performing formation.

本発明に係る章分け処理方法は、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部を備えており、複数ページの原稿に係る原稿画像データに対する画像処理を行う画像処理装置にて、章毎に分別する処理を行う章分け処理方法において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記最大文字サイズを有する文字列を抽出し、前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。   A chapter division processing method according to the present invention includes a storage unit storing a chapter number pattern representing division of a chapter on a page at the beginning of a chapter, and performs image processing on document image data related to a plurality of pages of documents In the chapter division processing method of performing classification processing for each chapter in an image processing apparatus for performing character recognition, character recognition processing is performed on the document image data to detect a maximum character size, and a character string having the maximum character size Are extracted, a number is extracted from the extracted character string based on the pattern stored in the storage unit, a page number related to the extracted character string is obtained from the document image data, and the extracted number is extracted. And storing the extracted character string and the page number.

本発明によれば、原稿画像データに対して、簡単、かつ、適確に、章分けの処理を行うことが出来る。   According to the present invention, it is possible to perform chapter division processing easily and properly on original image data.

本実施の形態に係るデジタルカラー複写機の構成を示す縦断面図である。FIG. 1 is a longitudinal sectional view showing a configuration of a digital color copying machine according to an embodiment of the present invention. 本実施の形態に係る複写機の装置全体の各部を制御する制御系を説明する機能ブロック図である。FIG. 2 is a functional block diagram for explaining a control system that controls each part of the entire copying machine according to the present embodiment. 本実施の形態に係る複写機における、原稿画像データの読み取り処理及び章分けの処理を説明するフローチャートである。FIG. 6 is a flowchart for describing reading processing of document image data and chapter division processing in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、ハードディスクに記憶された章表示文字列のパターン、章番号文字数テーブル、及び最終 Letter Indexテーブルを概念的に表す概念図である。FIG. 8 is a conceptual diagram conceptually showing the chapter display character string pattern, chapter number character count table, and final Letter Index table stored in the hard disk in the copying machine according to the present embodiment. 本実施の形態に係る複写機において、文字サイズ検出部によって行われる最大文字サイズ検出の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating processing of maximum character size detection performed by the character size detection unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、文字列抽出部によって行われる文字列抽出の処理を説明するフローチャートである。In the copying machine concerning this embodiment, it is a flow chart explaining processing of character string extraction performed by a character string extraction part. 本実施の形態に係る複写機において、章情報取得部によって行われる章情報取得の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating a chapter information acquisition process performed by the chapter information acquisition unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、章情報取得部によって行われる章文字パターンの検索の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating a chapter character pattern search process performed by the chapter information acquisition unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、章情報取得部によって行われる章番号文字合致照合の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating a chapter number character matching process performed by the chapter information acquisition unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、抜け補完部によって行われる抜け補完の処理を説明するフローチャートである。FIG. 7 is a flow chart for explaining the process of missing complementation performed by the missing supplement unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、抜け補完部によって行われる抜け補完の処理を説明するフローチャートである。FIG. 7 is a flow chart for explaining the process of missing complementation performed by the missing supplement unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、抜け補完部によって行われる第1補完の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating processing of a first complementation performed by a missing part complementation unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、抜け補完部によって行われる第1補完の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating processing of a first complementation performed by a missing part complementation unit in the copying machine according to the present embodiment. FIG. 本実施の形態に係る複写機において、抜け補完部によって行われる第2補完の処理を説明するフローチャートである。FIG. 7 is a flowchart illustrating processing of second complementation performed by the missing part complementing unit in the copying machine according to the present embodiment. FIG.

以下に、本発明の実施の形態に係る画像処理装置及び画像形成装置を、いわゆる複写機に適用した場合を例として、図面に基づいて詳述する。   Hereinafter, an image processing apparatus and an image forming apparatus according to an embodiment of the present invention will be described in detail based on the drawings, taking as an example a case where it is applied to a so-called copying machine.

(実施の形態1)
図1は本実施の形態に係るデジタルカラー複写機の構成を示す縦断面図である。複写機1の上面には、原稿台111及び後述する操作パネルが設けられ、複写機1の内部に画像読取部110及び画像形成部210が設けられている。
Embodiment 1
FIG. 1 is a longitudinal sectional view showing the configuration of a digital color copying machine according to the present embodiment. A document table 111 and an operation panel to be described later are provided on the upper surface of the copying machine 1, and an image reading unit 110 and an image forming unit 210 are provided inside the copying machine 1.

原稿台111の上面には該原稿台111に対して開閉可能な状態で支持され、両面自動原稿送り装置(RADF;Reversing Automatic Document Feeder)112が装着されている。 A double-sided automatic document feeder (RADF) 112 is mounted on the upper surface of the document table 111 so as to be openable / closable relative to the document table 111.

さらに、両面自動原稿送り装置112は、まず、原稿の一方の面が原稿台111の所定位置において画像読取部110に対向するよう原稿を搬送し、この際、斯かる面の画像の読み取りが行われる。この一方の面についての画像読み取りが終了した後、両面自動原稿送り装置112は他方の面が原稿台111の所定位置において画像読取部110に対向するよう原稿を反転し、原稿台111の所定位置に向かって搬送し、斯かる面に対する画像形成が行われる。そして、両面自動原稿送り装置112は、1枚の原稿について両面の画像読み取りが終わった後、この原稿を排出し、次の原稿についても同様に両面搬送動作を実行する。以上の両面自動原稿送り装置112の動作は、複写機全体の動作に関連して制御されるものである。   Furthermore, the double-sided automatic document feeder 112 first conveys the document so that one side of the document faces the image reading unit 110 at a predetermined position of the document table 111. At this time, reading of the image on the side is performed. It will be. After the image reading on the one side is completed, the double-sided automatic document feeder 112 reverses the document so that the other side faces the image reading unit 110 at a predetermined position of the document table 111 and the predetermined position of the document table 111 And image formation on such a surface is performed. Then, after the double-sided automatic document feeding device 112 completes the double-sided image reading of one sheet of document, it discharges this document, and similarly executes the double-sided conveyance operation for the next document. The operation of the above-described duplex automatic document feeder 112 is controlled in relation to the operation of the entire copying machine.

画像読取部110は、両面自動原稿送り装置112により原稿台111上の所定位置に搬送される原稿の画像を読み取るために、原稿台111の下方に配置されている。また、画像読取部110は該原稿台111の下面に沿って平行に往復移動する(原稿台111上に置かれた原稿を読み取る場合)原稿走査体113、114と、光学レンズ115と、光電変換素子であるCCDラインセンサ116とを有している。   The image reading unit 110 is disposed below the document table 111 in order to read an image of a document conveyed to a predetermined position on the document table 111 by the duplex automatic document feeder 112. Further, the image reading unit 110 reciprocates in parallel along the lower surface of the document table 111 (when reading a document placed on the document table 111) document scanning bodies 113 and 114, an optical lens 115, and photoelectric conversion And a CCD line sensor 116 which is an element.

原稿走査体113、114は、第1の走査ユニット113と第2の走査ユニット114とから構成されている。第1の走査ユニット113は原稿の表面を露光する露光ランプと、原稿からの反射光像を所定の方向に向かって偏向する第1ミラーとを有し、原稿台111上に原稿が置かれた場合には、原稿台111の下面に対して一定の距離を保ちながら所定の走査速度で平行に往復移動するものである。また、両面自動原稿送り装置112にて原稿が搬送され、原稿が読み取られる場合には、所定位置で停止している。   The document scanning bodies 113 and 114 are composed of a first scanning unit 113 and a second scanning unit 114. The first scanning unit 113 has an exposure lamp for exposing the surface of the document, and a first mirror for deflecting a reflected light image from the document toward a predetermined direction, and the document is placed on the document table 111 In this case, it reciprocates in parallel at a predetermined scanning speed while maintaining a fixed distance from the lower surface of the document table 111. Further, when the original is conveyed by the duplex automatic document feeder 112 and the original is read, the document is stopped at a predetermined position.

第2の走査ユニット114は、第1の走査ユニット113の前記第1ミラーにより偏向された原稿からの反射光像をさらに所定の方向に向かって偏向する第2及び第3ミラーとを有し、原稿台111上に原稿が置かれた場合には、第1の走査ユニット113と一定の速度関係を保って平行に往復移動する。   The second scanning unit 114 has second and third mirrors for further deflecting the reflected light image from the document deflected by the first mirror of the first scanning unit 113 in a predetermined direction, When an original is placed on the original table 111, the original is reciprocated in parallel with the first scanning unit 113 while maintaining a constant speed relationship.

光学レンズ115は、第2の走査ユニット114の前記第3ミラーにより偏向された原稿からの反射光像を縮小し、縮小された光像をCCDラインセンサ116上の所定位置に結像させる。   The optical lens 115 reduces the reflected light image from the document deflected by the third mirror of the second scanning unit 114, and forms the reduced light image at a predetermined position on the CCD line sensor 116.

CCDラインセンサ116は、結像された光像を順次光電変換して電気信号として出力する。CCDラインセンサ116は、白黒画像又はカラー画像を読み取り、R(赤)、G(緑)、B(青)の各色成分に色分解したラインデータを出力することのできる3ラインのカラーCCDである。   The CCD line sensor 116 photoelectrically converts the formed light image sequentially and outputs it as an electric signal. The CCD line sensor 116 is a 3-line color CCD that can read black and white images or color images and output line data separated into color components of R (red), G (green) and B (blue). .

次に、画像形成部210の構成、及び画像形成部210に係わる各部の構成について説明する。
画像形成部210の下方には、用紙トレイ内に積載収容されている記録用紙Pを1枚ずつ分離して画像形成部210に向かって供給する給紙機構211a〜211cが設けられている。そして1枚ずつ分離供給された記録用紙Pは、画像形成部210の手前に配置された一対のレジストローラ212によりタイミングが制御されて画像形成部210に搬送される。さらに、片面に画像が形成された記録用紙Pは、画像形成部210の画像形成にタイミングを合わせて画像形成部210に再供給搬送される。
Next, the configuration of the image forming unit 210 and the configuration of each unit related to the image forming unit 210 will be described.
Below the image forming unit 210, sheet feeding mechanisms 211a to 211c are provided which separate the recording sheets P stacked and accommodated in the sheet tray one by one and supply the recording sheets P toward the image forming unit 210. The recording paper P separated and supplied one by one is conveyed to the image forming unit 210 with its timing controlled by a pair of registration rollers 212 arranged in front of the image forming unit 210. Further, the recording sheet P on which the image is formed on one side is re-supplied and conveyed to the image forming unit 210 in timing with the image formation of the image forming unit 210.

また、画像形成部210の下方には、転写搬送ベルト機構213が配置されている。転写搬送ベルト機構213は、駆動ローラ214と従動ローラ215との間に略平行に伸びるように張架された転写搬送ベルト216に記録用紙Pを静電吸着させて搬送する。そして、転写搬送ベルト216の下側に近接して、パターン画像検出ユニットが設けられている。 Further, below the image forming unit 210, a transfer conveyance belt mechanism 213 is disposed. The transfer conveyance belt mechanism 213 electrostatically attracts the recording sheet P to the transfer conveyance belt 216 stretched so as to extend substantially in parallel between the driving roller 214 and the driven roller 215 and conveys the recording sheet P. A pattern image detection unit is provided in proximity to the lower side of the transfer conveyance belt 216.

さらに、用紙搬送路における転写搬送ベルト機構213の下流側には、記録用紙P上に転写形成されたトナー像を記録用紙P上に定着させるための定着装置217が配置されている。この定着装置217の一対の定着ローラ間を通過した記録用紙Pは、搬送方向切り換えゲート218を経て、排出ローラ219により複写機1の外側に取り付けられている排紙トレイ220上に排出される。 Further, on the downstream side of the transfer conveyance belt mechanism 213 in the sheet conveyance path, a fixing device 217 for fixing the toner image transferred and formed on the recording sheet P on the recording sheet P is disposed. The recording sheet P having passed between the pair of fixing rollers of the fixing device 217 passes through the conveyance direction switching gate 218 and is discharged onto the sheet discharge tray 220 attached to the outside of the copying machine 1 by the discharge roller 219.

切り換えゲート218は、定着後の記録用紙Pの搬送経路を、排紙トレイ220へ記録用紙Pを排出する経路と、画像形成部210に向かって記録用紙Pを再供給する経路との間で選択的に切り換えるものである。切り換えゲート218により再び画像形成部210に向かって搬送方向が切り換えられた記録用紙Pは、スイッチバック搬送経路221を介して表裏反転された後、画像形成部210へと再度供給される。   The switching gate 218 selects the transport path of the recording sheet P after fixing, between the path for discharging the recording sheet P to the sheet discharge tray 220 and the path for resupplying the recording sheet P toward the image forming unit 210. Switching. The recording sheet P whose transport direction has been switched back to the image forming unit 210 by the switching gate 218 is reversed over the front and back through the switchback transport path 221, and then supplied again to the image forming unit 210.

また、画像形成部210における転写搬送ベルト216の上方には、転写搬送ベルト216に近接して、第1の画像形成ステーションPa、第2の画像形成ステーションPb、第3の画像形成ステーションPc、及び第4の画像形成ステーションPdが、用紙搬送経路の上流側から順に並設されている。   The first image forming station Pa, the second image forming station Pb, the third image forming station Pc, and the image forming station 210 are located above the transfer conveying belt 216 in the image forming unit 210 and close to the transfer conveying belt 216. The fourth image forming station Pd is juxtaposed in order from the upstream side of the sheet conveyance path.

転写搬送ベルト216は駆動ローラ214によって、図1において矢印Zで示す方向に摩擦駆動され、上述したように給紙機構211a〜211cを通じて給送される記録用紙Pを担持し、記録用紙Pを画像形成ステーションPa〜Pdへと順次搬送する。   The transfer conveyance belt 216 is frictionally driven by the drive roller 214 in the direction indicated by the arrow Z in FIG. 1, and carries the recording sheet P fed through the sheet feeding mechanisms 211a to 211c as described above. The sheet is sequentially transported to the forming stations Pa to Pd.

各画像ステーションPa〜Pdは、実質的に同一の構成を有している。各画像ステーションPa、Pb、Pc、Pdは、図1に示す矢印F方向に回転駆動される感光体ドラム222a、222b、222c、及び222dを夫々含んでいる。 Each of the image stations Pa to Pd has substantially the same configuration. Each of the image stations Pa, Pb, Pc, and Pd includes photosensitive drums 222a, 222b, 222c, and 222d which are rotationally driven in the direction of arrow F shown in FIG.

各感光体ドラム222a〜222dの周辺には、感光体ドラム222a〜222dを夫々一様に帯電する帯電器223a、223b、223c、223dと、感光体ドラム222a〜222d上に形成された静電潜像を夫々現像する現像装置224a、224b、224c、224dと、現像された感光体ドラム222a〜222d上のトナー像を記録用紙Pへ転写する転写用放電器225a、225b、225c、225dと、感光体ドラム222a〜222d上に残留するトナーを除去するクリーニング装置226a、226b、226c、226dとが感光体ドラム222a〜222dの回転方向に沿って順次配置されている。 Around the photosensitive drums 222a to 222d, charging devices 223a, 223b, 223c, and 223d for uniformly charging the photosensitive drums 222a to 222d, respectively, and electrostatic latent formed on the photosensitive drums 222a to 222d are provided. Developing devices 224a, 224b, 224c and 224d for developing the image, and dischargers for transfer 225a, 225b, 225c and 225d for transferring the toner image on the photosensitive drums 222a to 222d to which the image was developed, and photosensitive Cleaning devices 226a, 226b, 226c and 226d for removing the toner remaining on the body drums 222a to 222d are sequentially arranged along the rotational direction of the photosensitive drums 222a to 222d.

また、各感光体ドラム222a〜222dの上方には、レーザビームスキャナユニット227a、227b、227c、227dが夫々設けられている。レーザビームスキャナユニット227a〜227dは、画像データに応じて変調されたドット光を発する半導体レーザ素子(図示せず)、半導体レーザ素子からのレーザビームを主走査方向に偏向させるためのポリゴンミラー240a〜240dと、ポリゴンミラー240a〜240dにより偏向されたレーザビームを感光体ドラム222a〜222d表面に結像させるためのfθレンズ241a〜241d、ミラー242a〜242d、243a〜243dなどから構成されている。   Laser beam scanner units 227a, 227b, 227c, and 227d are provided above the photosensitive drums 222a to 222d, respectively. The laser beam scanner units 227a to 227d are semiconductor laser elements (not shown) that emit dot light modulated according to image data, and polygon mirrors 240a to 240a for deflecting laser beams from the semiconductor laser elements in the main scanning direction. 240 d, fθ lenses 241 a to 241 d for forming laser beams deflected by the polygon mirrors 240 a to 240 d on the surfaces of the photosensitive drums 222 a to 222 d, mirrors 242 a to 242 d, 243 a to 243 d, and the like.

レーザビームスキャナ227aにはカラー原稿画像の黒色成分像に対応する画素信号が、レーザビームスキャナ227bにはカラー原稿画像のシアン色成分像に対応する画素信号が、レーザビームスキャナ227cにはカラー原稿画像のマゼンタ色成分像に対応する画素信号が、そして、レーザビームスキャナ227dにはカラー原稿画像のイエロー色成分像に対応する画素信号が夫々入力される。   The laser beam scanner 227a has a pixel signal corresponding to the black component image of the color original image, the laser beam scanner 227b has a pixel signal corresponding to the cyan color component image of the color original image, and the laser beam scanner 227c has a color original image And the pixel signal corresponding to the yellow color component image of the color original image are input to the laser beam scanner 227d.

これにより色変換された原稿画像情報に対応する静電潜像が各感光体ドラム222a〜222d上に形成される。そして、現像装置224aには黒色のトナーが、現像装置224bにはシアン色のトナーが、現像装置224cにはマゼンタ色のトナーが、現像装置224dにはイエロー色のトナーが夫々収容されており、感光体ドラム222a〜222d上の静電潜像は、これら各色のトナーにより現像される。これにより、画像形成部210にて色変換された原稿画像情報が各色のトナー像として再現される。   Thus, electrostatic latent images corresponding to the color-converted original image information are formed on the respective photosensitive drums 222a to 222d. The black toner is stored in the developing device 224a, the cyan toner is stored in the developing device 224b, the magenta toner is stored in the developing device 224c, and the yellow toner is stored in the developing device 224d. The electrostatic latent images on the photosensitive drums 222a to 222d are developed with the toners of the respective colors. As a result, the original image information color-converted by the image forming unit 210 is reproduced as a toner image of each color.

また、第1の画像形成ステーションPaと給紙機構211aとの間には用紙吸着用帯電器228が設けられており、この吸着用帯電器228は転写搬送ベルト216の表面を帯電させ、給紙機構211aから供給された記録用紙Pは、転写搬送ベルト216上に確実に吸着させた状態で第1の画像形成ステーションPaから第4の画像形成ステーションPdの間をずれることなく搬送させる。   In addition, a sheet adsorbing charger 228 is provided between the first image forming station Pa and the sheet feeding mechanism 211a, and the adsorbing charger 228 charges the surface of the transfer conveyance belt 216 to feed the sheet. The recording paper P supplied from the mechanism 211 a is transported without deviation between the first image forming station Pa and the fourth image forming station Pd in a state where the recording paper P is securely attracted onto the transfer conveying belt 216.

一方、第4の画像ステーションPdと定着装置217との間で駆動ローラ214のほぼ真上部には除電器229が設けられている。除電器229には搬送ベルト216に静電吸着されている記録用紙Pを転写搬送ベルト216から分離するための交流電流が印加されている。 On the other hand, a static eliminator 229 is provided almost immediately above the driving roller 214 between the fourth image station Pd and the fixing device 217. An alternating current for separating the recording sheet P electrostatically attracted to the conveyance belt 216 from the transfer conveyance belt 216 is applied to the static eliminator 229.

上記構成の複写機1においては、記録用紙Pとしてカットシート状の紙が使用される。この記録用紙Pは、給紙トレイから送り出されて給紙機構211a〜211cの給紙搬送経路のガイド内に供給されると、その記録用紙Pの先端部分がセンサ(図示せず)にて検知され、このセンサから出力される検知信号に基づいて一対のレジストローラ212により一旦停止される。 In the copying machine 1 configured as described above, cut sheet-like paper is used as the recording paper P. When the recording sheet P is fed out of the sheet feeding tray and fed into the guide of the sheet feeding conveyance path of the sheet feeding mechanisms 211a to 211c, a leading end portion of the recording sheet P is detected by a sensor (not shown). And is temporarily stopped by the pair of registration rollers 212 based on the detection signal output from this sensor.

そして、記録用紙Pは各画像ステーションPa〜Pdとタイミングをとって図1の矢印Z方向に回転している転写搬送ベルト216上に送られる。このとき転写搬送ベルト216には前述したように吸着用帯電器228により所定の帯電が施されているので、記録用紙Pは、各画像ステーションPa〜Pdを通過する間、安定して搬送供給が行われるようになる。 Then, the recording sheet P is sent onto the transfer conveyance belt 216 rotating in the direction of the arrow Z in FIG. 1 in timing with each of the image stations Pa to Pd. At this time, since the transfer conveyance belt 216 is charged by the suction charger 228 as described above, the recording paper P is stably conveyed and supplied while passing through the image stations Pa to Pd. It will be done.

各画像ステーションPa〜Pdにおいては、各色のトナー像が、夫々形成され、転写搬送ベルト216により静電吸着されて搬送される記録用紙Pの支持面上で重ね合わされる。第4の画像ステーションPdによる画像の転写が完了すると、記録用紙Pは、その先端部分から順次、除電用放電器により転写搬送ベルト216上から剥離され、定着装置217へと導かれる。最後に、トナー画像が定着された記録用紙Pは、用紙排出口(図示せず)から排紙トレイ220上へと排出される。   In each of the image stations Pa to Pd, toner images of the respective colors are respectively formed, and are superimposed on the supporting surface of the recording paper P which is electrostatically attracted and conveyed by the transfer conveyance belt 216. When the transfer of the image by the fourth image station Pd is completed, the recording paper P is peeled off from the transfer conveyance belt 216 sequentially by the discharging device from the leading end portion, and is guided to the fixing device 217. Finally, the recording sheet P on which the toner image is fixed is discharged onto the discharge tray 220 from a sheet discharge port (not shown).

なお、上述の説明ではレーザビームスキャナユニット227a〜227dによって、レーザビームを走査して露光することにより、感光体への光書き込みを行なう。しかし、レーザビームスキャナユニットの代わりに、発光ダイオードアレイと結像レンズアレイからなる書き込み光学系(LEDヘッド)を用いても良い。LEDヘッドはレーザビームスキャナユニットに比べ、サイズも小さく、また可動部分がなく無音である。よって、複数個の光書き込みユニットを必要とするタンデム方式のデジタルカラー複写機などの画像形成装置では、好適に用いることができる。   In the above description, the laser beam is scanned and exposed by the laser beam scanner units 227a to 227d to write light on the photosensitive member. However, instead of the laser beam scanner unit, a writing optical system (LED head) comprising a light emitting diode array and an imaging lens array may be used. The LED head is smaller in size than the laser beam scanner unit, and has no moving parts and is silent. Therefore, it can be suitably used in an image forming apparatus such as a tandem digital color copying machine which requires a plurality of light writing units.

図2は本実施の形態に係る複写機1の装置全体の各部を制御する制御系を説明する機能ブロック図である。複写機1は制御部4を備えており、制御部4は、CPU40(挿入部)と、RADF制御部41と、スキャナ制御部42と、画像準備制御部43と、画像形成制御部44と、給紙トレイ制御部45と、後処理制御部46、文字サイズ検出部47、文字列抽出部48、章情報取得部49、及び、抜け補完部50とを有している。   FIG. 2 is a functional block diagram for explaining a control system that controls each part of the entire apparatus of the copying machine 1 according to the present embodiment. The copying machine 1 includes a control unit 4. The control unit 4 includes a CPU 40 (insertion unit), a RADF control unit 41, a scanner control unit 42, an image preparation control unit 43, and an image formation control unit 44. A paper feed tray control unit 45, a post-processing control unit 46, a character size detection unit 47, a character string extraction unit 48, a chapter information acquisition unit 49, and a omission complement unit 50 are provided.

画像準備制御部43は、原稿読み取り部110の制御を行うスキャナ制御部42、一時的に印刷すべき画像を記憶する画像メモリ53、レーザビームスキャナユニット227a〜227dの制御を行う露光制御部51、画像データ蓄積用のハードディスク55など、複写機1を構成する印刷画像準備用の各ユニットをシーケンス制御により管理すると共に、フィルタ処理、変倍処理、マスキング処理、ガンマ処理などの画像処理を行う。また、画像形成制御部44と通信を行い、連携することで印刷ジョブの実行を行う。   The image preparation control unit 43 controls the document reading unit 110. The image control unit 53 stores an image to be printed temporarily. The exposure control unit 51 controls the laser beam scanner units 227a to 227d. The units for print image preparation constituting the copying machine 1, such as the hard disk 55 for image data storage, are managed by sequence control, and image processing such as filter processing, scaling processing, masking processing, and gamma processing is performed. Further, communication with the image formation control unit 44 is performed to cooperate with the image formation control unit 44 to execute a print job.

さらに画像形成制御部44には、給紙機構211a、211b、211cの制御を行う給紙トレイ制御部45、後処理の制御を行う後処理制御部46と相互通信可能な状態で接続されており、エンジン負荷部56のセンサを入力し、モーター等を出力制御し、各所を統轄的にシーケンス制御することで、印刷画像を形成するように動作している。   Further, the image formation control unit 44 is connected in a mutually communicable state with the paper feed tray control unit 45 that controls the paper feed mechanisms 211 a, 211 b, and 211 c and the post processing control unit 46 that controls the post processing. The sensor of the engine load unit 56 is input to control the output of the motor and the like, and the sequence control of various places is performed to form a print image.

スキャナ制御部42は、CCDラインセンサ116から原稿画像信号を受け取り、画像準備制御部43に送るともに、両面自動原稿送り装置(RADF)と通信し、原稿送り制御を行わせる。また、スキャナ制御部42は、原稿読み取り部110のモーター、ソレノイド等からなるスキャナ負荷部52に対するシーケンス制御を行うための制御信号を出力するとともに、表示部、該表示部を覆うタッチパネル、テンキー等からなる操作パネルを構成する操作基板ユニット54と通信を行って、操作状況のモニタ、各種の表示制御を行う。   The scanner control unit 42 receives a document image signal from the CCD line sensor 116, sends it to the image preparation control unit 43, and communicates with a double-sided automatic document feeder (RADF) to perform document feed control. The scanner control unit 42 outputs a control signal for performing sequence control to the scanner load unit 52 including a motor, a solenoid, etc. of the document reading unit 110, and a display unit, a touch panel covering the display unit, ten keys, etc. Communication is performed with the operation board unit 54 constituting the operation panel to monitor the operation situation and perform various display controls.

複写機1全体の処理の流れを両面自動原稿送り装置112を使用したコピーの場合を例にとり説明する。   The flow of processing of the entire copying machine 1 will be described by taking the case of copying using the duplex automatic document feeder 112 as an example.

ユーザは、複写機1の両面自動原稿送り装置112に原稿を載置し、前記操作パネルを適宜操作することにより、コピーに係る設定を受け付ける設定画面を前記表示部に表示させ、コピー枚数等を設定した後、スタートキーを操作することによりコピーの開始を指示する。   The user places an original on the duplex automatic document feeder 112 of the copying machine 1 and operates the operation panel appropriately to display a setting screen for receiving settings relating to copying on the display unit, and to display the number of copies, etc. After setting, the start key is instructed by operating the start key.

スキャナ制御部42は、画像読取部110の第1の走査ユニット113を両面自動原稿送り装置112から搬送される原稿を読み取るための所定位置へ移動させ、両面自動原稿送り装置112により搬送される原稿の読み取りを開始する。   The scanner control unit 42 moves the first scanning unit 113 of the image reading unit 110 to a predetermined position for reading the document conveyed from the double-sided automatic document feeder 112, and the document conveyed by the double-sided automatic document feeder 112 Start reading.

この際、CCDラインセンサ116では、それを色分解してRGBのアナログ画像信号を得る。更に該アナログ画像信号に対して、スキャナ制御部42でデジタル信号への変換を行う。スキャナ制御部42に送られ、デジタル信号に変換された画像データ(原稿画像データ)は、画像準備制御部43へ送られ、画像メモリ53へ格納され、画像メモリ53へ格納された画像データは順次ハードディスク55へ一旦格納される。また、これと同時に、画像準備制御部43は、印刷のための画像データ(印刷画像データ)が格納されたことを画像形成制御部44へ順次通知する。   At this time, the CCD line sensor 116 performs color separation to obtain an RGB analog image signal. Further, the scanner control unit 42 converts the analog image signal into a digital signal. Image data (original image data) sent to the scanner control unit 42 and converted into digital signals is sent to the image preparation control unit 43, stored in the image memory 53, and the image data stored in the image memory 53 are sequentially It is temporarily stored in the hard disk 55. At the same time, the image preparation control unit 43 sequentially notifies the image formation control unit 44 that the image data (print image data) for printing is stored.

画像形成制御部44は、印刷を行うための印刷画像データの要求を画像準備制御部43に対し順次行い、画像準備制御部43は、要求された印刷画像データをハードディスク55から順次読み出し、画像メモリ53へ格納後、フィルタ処理、変倍処理、マスキング処理、ガンマ処理、多値化処理という順に画像処理を行う。この後、画像準備制御部43は露光制御部51へ印刷画像データを転送し、画像形成制御部44へ印刷を行うための印刷画像データが転送完了したことを通知する。   The image formation control unit 44 sequentially requests the image preparation control unit 43 for the print image data for printing, and the image preparation control unit 43 sequentially reads the requested print image data from the hard disk 55, and the image memory After storing in 53, image processing is performed in the order of filter processing, scaling processing, masking processing, gamma processing, and multilevel processing. Thereafter, the image preparation control unit 43 transfers the print image data to the exposure control unit 51, and notifies the image formation control unit 44 that the transfer of the print image data for printing is completed.

画像形成制御部44は、画像準備制御部43からの印刷画像データの転送完了の通知を受け、印字を開始する。画像形成部210の印字処理スピードが、画像読取部110の原稿読み取り速度より遅くなる場合においては、ハードディスク55に読み取られた画像データが格納されて行くだけで、印刷処理に伴って、順次画像データがハードディスク55から読み出され、画像処理された後に印刷が行われることになる。   The image formation control unit 44 receives the notification of transfer completion of the print image data from the image preparation control unit 43, and starts printing. When the print processing speed of the image forming unit 210 is slower than the document reading speed of the image reading unit 110, the image data read sequentially in the hard disk 55 is sequentially stored along with the print processing. Are read out from the hard disk 55, and printed after image processing.

文字サイズ検出部47は前記原稿画像データに対してページ毎に文字認識処理を施し、該原稿画像データの最大文字サイズを検出する。また、文字サイズ検出部47は該原稿画像データに対してページ毎に、公知のOCR処理を施し、パターン・マッチング法によって、原稿画像データの各ページの文字認識を行う。この際、文字サイズ検出部47は、前記原稿画像データ(以下、原稿とも言う。)の各ページの一行目の文字列に対してのみ、最大文字サイズの検出を行う。   The character size detection unit 47 performs character recognition processing for each page of the document image data, and detects the maximum character size of the document image data. Further, the character size detection unit 47 performs known OCR processing on the document image data for each page, and performs character recognition of each page of the document image data by the pattern matching method. At this time, the character size detection unit 47 detects the maximum character size only for the character string on the first line of each page of the document image data (hereinafter, also referred to as a document).

すなわち、一般に、章初めのページには、斯かる章の区分を表す章番号及びタイトルが含まれた見出しが、当該章を表す章表示文字列として、最上側に、大きな文字にて記載されている。斯かる章表示文字列としては、例えば、「第X章○○○○」、「ChapterX○○○○」、「#X○○○○」、「X;○○○○」、「X.○○○○」等が例に挙げられる。ここで、「X」は、整数を表す文字であり、例えば、アラビア数字、漢数字、ローマ数字等を含む。なお、「○○○○」は当該章のタイトルである。   That is, generally, on the beginning of a chapter, a heading including a chapter number representing the division of the chapter and a title is described in large letters at the top of the chapter display character string representing the chapter. There is. As such chapter display character strings, for example, “Chapter X XX”, “Chapter X XX”, “# X XX”, “X; XXX”, “X. "○○○○" etc. may be mentioned as an example. Here, “X” is a letter representing an integer, and includes, for example, Arabic numerals, Chinese numerals, Roman numerals and the like. Note that "○○○○" is the title of the chapter.

従って、このように、各ページの一行目の文字列に対してのみ、斯かる検出を行うことによって、一層効率的に、後述する章表示文字列の抽出、章分けの処理等を行うことが出来る。   Therefore, as described above, by performing such detection only for the character string on the first line of each page, it is possible to more efficiently extract the chapter display character string to be described later, perform chapter division processing, etc. It can.

文字列抽出部48は、前記原稿画像データから、文字サイズ検出部47によって検出された最大文字サイズを有する文字列を、前記章表示文字列の候補として、抽出する。より詳しくは、文字列抽出部48は、前記原稿画像データの各ページの一行目の文字列に対してのみ、最大文字サイズを有する文字列の抽出を行い、抽出された章表示文字列の候補(以下、候補文字列と言う。)をハードディスク55に記憶する。従って、各ページの全ての文字列に対して、斯かる抽出を行う場合に比べ、上述したように、効率的に章表示文字列の抽出、章分けの処理等が可能となる。   The character string extraction unit 48 extracts, from the document image data, a character string having the maximum character size detected by the character size detection unit 47 as a candidate for the chapter display character string. More specifically, the character string extraction unit 48 extracts the character string having the maximum character size only for the character string on the first line of each page of the document image data, and the extracted chapter display character string candidate The hard disk 55 stores (hereinafter referred to as a candidate character string). Therefore, as described above, chapter display character string extraction, chapter division processing, and the like can be performed more efficiently than when such extraction is performed on all character strings of each page.

章情報取得部49は前記候補文字列に含まれる数字を割り出し(抽出)、該候補文字列が記載されているページ番号(以下、章ページ番号)を前記原稿画像データから取得する。このような処理は、章表示文字列に含まれる章番号のパターンに基づいて行われ、該章番号のパターンはハードディスク55に記憶されている。   The chapter information acquisition unit 49 determines (extracts) a number included in the candidate character string, and acquires a page number (hereinafter, chapter page number) on which the candidate character string is described from the document image data. Such processing is performed based on the chapter number pattern included in the chapter display character string, and the chapter number pattern is stored in the hard disk 55.

より詳しくは、章情報取得部49は、先ず、文字列抽出部48によって抽出された候補文字列のうち、冒頭の一つ又は複数の文字が前記章番号のパターンと一致する候補文字列を検出する。次に、章情報取得部49は、検出された候補文字列から、該候補文字列に対応する前記章番号のパターンに係る章番号と一致する数字を章番号として割り出す。章情報取得部49は、このように割り出した章番号をIndexとし、該章番号に関連付けて斯かる文字列及び対応する章ページ番号をハードディスク55に記憶する。以下においては、前記章番号、該章番号に対応する文字列(以下、章文字列とも言う)、及び章ページ番号を章情報ともいう。また、前記章番号のパターンについては、後で詳しく説明する。   More specifically, the chapter information acquisition unit 49 first detects a candidate character string in which one or more characters at the beginning of the candidate character strings extracted by the character string extraction unit 48 match the pattern of the chapter number. Do. Next, the chapter information acquisition unit 49 determines, from the detected candidate character string, a number matching the chapter number relating to the pattern of the chapter number corresponding to the candidate character string as a chapter number. The chapter information acquisition unit 49 sets the chapter number thus identified as an index, and stores the character string and the corresponding chapter page number in the hard disk 55 in association with the chapter number. In the following, the chapter number, a character string corresponding to the chapter number (hereinafter, also referred to as a chapter string), and a chapter page number are also referred to as chapter information. Also, the pattern of the chapter number will be described in detail later.

また、抜け補完部50は、各ページの一行目以外の箇所に、章表示文字列(章番号)が存在するかを確認することにより、検出が出来なかった章表示文字列(章番号)があれば補完を行う。より詳しくは、抜け補完部50は、先ず、章情報取得部49によって割り出された数字(章番号)が、1つであるか、複数であるかの判断を行う。次に、抜け補完部50は、割り出された数字が複数である場合、昇順又は降順における抜け数字、すなわち、抜けた章番号(以下、抜け章番号と言う。)の数を求め、抜け章番号を補完(抜け数字の補完)する処理を行う。以下、斯かる処理を抜け補完の処理とも言う。また、抜け補完部50は、割り出された数字(章番号)が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、抜け章番号の補完を行う。   In addition, the missing-completion unit 50 checks the presence of a chapter display character string (chapter number) in a place other than the first line of each page, and the chapter display character string (chapter number) that could not be detected is displayed. If there is a complement. More specifically, the missing part complementing unit 50 first determines whether the number (chapter number) calculated by the chapter information acquiring unit 49 is one or more than one. Next, when there are a plurality of numbers determined, the missing part complement unit 50 determines the number of missing numbers in ascending or descending order, that is, the number of missing chapter numbers (hereinafter referred to as missing chapter numbers), and missing chapters. Perform the process of complementing the numbers (completing of the missing numbers). Hereinafter, such processing is also referred to as processing for missing and complementing. Further, when the number (chapter number) determined is one, the missing part complementing the missing chapter number with respect to the range defined by the page number and the final page number of the document.

CPU40は、ROM(図示せず)に予め格納されている制御プログラムをRAM(図示せず)上にロードして実行することによって、上述した各種ハードウェアの制御を行ない、装置全体を本発明の複写機1として動作させる。   The CPU 40 controls the various hardware described above by loading a control program stored in advance in the ROM (not shown) onto the RAM (not shown) to execute the control of the various hardware described above. The copying machine 1 is operated.

以上のような構成を有する複写機1は、例えば、一つ又は複数の章を含む複数ページからなる原稿の原稿画像データを読み取り、章毎に分別する章分け処理を行うことが出来る。以下、詳しく説明する。   The copying machine 1 having the above-described configuration can read, for example, document image data of a document including a plurality of pages including one or a plurality of chapters, and can perform a chapter division process of sorting into chapters. Details will be described below.

図3は本実施の形態に係る複写機1における、原稿画像データの読み取り処理及び章分けの処理を説明するフローチャートである。以下においては、ハードディスク55には前記章番号のパターン(以下、章番号パターンとも言う)、章番号文字数テーブル、及び最終 Letter Indexテーブルが記憶されているものとする。   FIG. 3 is a flow chart for explaining reading processing of document image data and chapter division processing in the copying machine 1 according to the present embodiment. In the following, it is assumed that the hard disk 55 stores the chapter number pattern (hereinafter also referred to as a chapter number pattern), a chapter number character number table, and a final Letter Index table.

図4は本実施の形態に係る複写機1において、ハードディスク55に記憶された章番号のパターン、章番号文字数テーブル、及び最終 Letter Indexテーブルを概念的に表す概念図である。図4A、図4B及び図4Cは夫々章番号のパターン(章番号パターン)、章番号文字数テーブル及び最終 Letter Indexテーブルを示す。   FIG. 4 is a conceptual diagram conceptually showing the chapter number pattern, chapter number character number table, and final Letter Index table stored in the hard disk 55 in the copying machine 1 according to the present embodiment. FIG. 4A, FIG. 4B and FIG. 4C respectively show a chapter number pattern (chapter number pattern), a chapter number character table and a final Letter Index table.

ここで、章番号文字数テーブルは章表示文字列に含まれている章番号の構成文字数を前記章番号パターンに関連付けて列挙したものである。また、前記章番号パターンにおいては、章番号に該当する数文字が、例えば、昇順に複数パターン列挙されている。前記章番号パターンは「Chapter Pattern Index」によって確定され、該数文字は、例えば、「1」、「I」、「i」、「一」等のパターンを有する。   Here, the chapter number character table is a list of the number of characters of the chapter number contained in the chapter display character string in association with the chapter number pattern. In the chapter number pattern, several characters corresponding to the chapter number are listed, for example, in ascending order. The chapter number pattern is determined by "Chapter Pattern Index", and the several characters have, for example, patterns of "1", "I", "i", "one" and the like.

以下においては、昇順に列挙された各数文字が、「Letter Index」によって特定される。また、前記最終 Letter Indexテーブルには、各章番号パターンにおける最終の「Letter Index」が記載されている。なお、「Letter Index」は「0」から始まるものとする。   In the following, each few characters listed in ascending order are identified by "Letter Index". Further, the final "Letter Index" in each chapter number pattern is described in the final Letter Index table. Note that “Letter Index” starts from “0”.

また、以下の説明においては、説明の便宜上、全100ページであって、10章にて構成されている原稿の読み込みを行う場合であって、該原稿に章表示文字列として「第X章○○○○」が含まれているものとする。   Further, in the following description, for the sake of convenience of explanation, it is a case of reading an original consisting of 100 pages and consisting of 10 chapters. "○○○" shall be included.

まず、ユーザは、複写機1の両面自動原稿送り装置112に前記原稿を載置し、前記操作パネルを適宜操作することにより、斯かる原稿のコピーを指示する。この際、CPU40は前記操作パネルを介してユーザからコピーの指示を受け付ける。   First, the user places the original on the double-sided automatic original feeding device 112 of the copying machine 1 and operates the operation panel to instruct copying of the original. At this time, the CPU 40 receives a copy instruction from the user via the operation panel.

スキャナ制御部42はCPU40からの指示に応じて画像読取部110を制御して、前記原稿を一枚ずつ読み込み、該原稿に対する原稿画像データが得られる。このように得られた原稿画像データに対して、OCR処理が施される。   The scanner control unit 42 controls the image reading unit 110 according to an instruction from the CPU 40, reads the document one by one, and obtains document image data for the document. An OCR process is performed on the document image data obtained in this manner.

次いで、文字サイズ検出部47は、前記原稿画像データに対して最大文字サイズの検出を行う(ステップS101)。以下、最大文字サイズの検出の処理について詳しく説明する。   Next, the character size detection unit 47 detects the maximum character size for the document image data (step S101). The process of detecting the maximum character size will be described in detail below.

図5は本実施の形態に係る複写機1において、文字サイズ検出部47によって行われる最大文字サイズ検出の処理を説明するフローチャートである。以下、最大文字サイズ検出の処理について詳しく説明する。   FIG. 5 is a flow chart for explaining the process of detecting the maximum character size performed by the character size detection unit 47 in the copying machine 1 according to the present embodiment. The process of maximum character size detection will be described in detail below.

先ず、文字サイズ検出部47は変数の初期化を行う(ステップS201)。より詳しくは、原稿のページを表す変数「Page」を「1」に、最大文字サイズを表す変数「Letter Size」を「0」に初期化する。   First, the character size detection unit 47 initializes a variable (step S201). More specifically, the variable “Page” representing the page of the document is initialized to “1”, and the variable “Letter Size” representing the maximum character size is initialized to “0”.

次いで、文字サイズ検出部47は前記原稿画像データに基づいて、前記原稿の全ページ数を取得する(ステップS202)。   Next, the character size detection unit 47 acquires the total number of pages of the document based on the document image data (step S202).

また、文字サイズ検出部47は、前記原稿画像データから、現在の「Page」に該当するページの画像データを取得し(ステップS203)、取得された所定ページの画像データに対して、一行目の文字列の最初文字の文字サイズを検出する(ステップS204)。   Further, the character size detection unit 47 acquires the image data of the page corresponding to the current "Page" from the document image data (step S203), and the acquired image data of the predetermined page is displayed on the first line. The character size of the first character of the character string is detected (step S204).

続いて、文字サイズ検出部47は検出された文字サイズが「Letter Size」に対応する文字サイズより大きいか判定を行う(ステップS205)。   Subsequently, the character size detection unit 47 determines whether the detected character size is larger than the character size corresponding to "Letter Size" (step S205).

文字サイズ検出部47は検出された文字サイズが「Letter Size」に対応する文字サイズより大きいと判定した場合(ステップS205:YES)、「Letter Size」に対応する文字サイズを検出された文字サイズに置き換える(ステップS206)。   If the character size detection unit 47 determines that the detected character size is larger than the character size corresponding to “Letter Size” (step S 205: YES), the character size corresponding to “Letter Size” is detected as the detected character size Replace (step S206).

ステップS206の処理後、又は、検出された文字サイズが「Letter Size」に対応する文字サイズより大きくないと判定した場合(ステップS205:NO)、文字サイズ検出部47は現在の「Page」に該当する数字が前記原稿の全ページ数と等しいか判定する(ステップS207)。   After the process of step S206, or when it is determined that the detected character size is not larger than the character size corresponding to "Letter Size" (step S205: NO), the character size detection unit 47 corresponds to the current "Page". It is determined whether the number to be processed is equal to the total number of pages of the original (step S207).

現在の「Page」に該当する数字が前記原稿の全ページ数と等しくないと判定した場合(ステップS207:NO)、文字サイズ検出部47は、現在の「Page」に「1」を加算した数字を新たに「Page」とし(ステップS208)、処理を再びステップS203に戻す。   If it is determined that the number corresponding to the current "Page" is not equal to the total page number of the document (step S207: NO), the character size detection unit 47 adds "1" to the current "Page" Is newly set to "Page" (step S208), and the process returns to step S203.

一方、文字サイズ検出部47によって現在の「Page」に該当する数字が前記原稿の全ページ数と等しいと判定された場合(ステップS207:YES)、最大文字サイズ検出の処理は終了する。   On the other hand, when it is determined by the character size detection unit 47 that the number corresponding to the current "Page" is equal to the total number of pages of the document (step S207: YES), the maximum character size detection process ends.

以上の最大文字サイズ検出の処理によって、前記原稿画像データにおける、最大文字サイズ、即ち「Letter Size」が検出される。   By the above-described processing of the maximum character size detection, the maximum character size, that is, “Letter Size” in the document image data is detected.

再び、図3に基づく説明に戻る。   Returning to the explanation based on FIG. 3 again.

このようにして、ステップS101にて最大文字サイズが検出されると、続いて、文字列抽出部48は、文字サイズ検出部47によって検出された最大文字サイズを有する文字列を、章表示文字列の候補として、抽出する(ステップS102)。   Thus, when the maximum character size is detected in step S101, subsequently, the character string extraction unit 48 displays the character string having the maximum character size detected by the character size detection unit 47 as a chapter display character string Are extracted as candidates (step S102).

図6は本実施の形態に係る複写機1において、文字列抽出部48によって行われる文字列抽出の処理を説明するフローチャートである。以下、文字列抽出の処理について詳しく説明する。   FIG. 6 is a flow chart for explaining the character string extraction process performed by the character string extraction unit 48 in the copying machine 1 according to the present embodiment. Hereinafter, the process of character string extraction will be described in detail.

文字列抽出部48は変数の初期化を行う(ステップS301)。より詳しくは、原稿のページを表す変数「Page」を「1」にし、変数「Index」を「0」に初期化する。   The character string extraction unit 48 initializes a variable (step S301). More specifically, the variable “Page” representing the page of the document is set to “1”, and the variable “Index” is initialized to “0”.

次いで、文字列抽出部48は前記原稿画像データから、現在の「Page」に該当するページの画像データを取得し(ステップS302)、取得された所定ページの画像データに対して、一行目の文字列の最初文字の文字サイズを検出する(ステップS303)。   Next, the character string extraction unit 48 acquires the image data of the page corresponding to the current "Page" from the document image data (step S302), and the character of the first line is acquired for the acquired image data of the predetermined page. The character size of the first character of the column is detected (step S303).

続いて、文字列抽出部48は、検出された文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか否かの判定を行う(ステップS304)。   Subsequently, the character string extraction unit 48 determines whether the detected character size is equal to the character size corresponding to the predetermined maximum character size “Letter Size” (step S304).

文字列抽出部48によって、検出された文字サイズが最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS304:NO)、処理はステップS309に進む。   If the character string extraction unit 48 determines that the detected character size is not equal to the character size corresponding to the maximum character size “Letter Size” (step S304: NO), the process proceeds to step S309.

一方、文字列抽出部48は、検出された文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS304:YES)、斯かる画像データから、一行目の文字列を抽出する(ステップS305)。   On the other hand, when the character string extraction unit 48 determines that the detected character size is equal to the character size corresponding to the already determined maximum character size “Letter Size” (step S 304: YES), from such image data, The character string of the first line is extracted (step S305).

次いで、文字列抽出部48は、抽出された文字列(以下、抽出文字列とも言う)を前記変数「Index」に関連付けて、例えば、ハードディスク55に記憶し(ステップS306)、現在のページ番号、すなわち現在の「Page」に対応する数字を、該「Index」に関連付けて、例えば、ハードディスク55に記憶する(ステップS307)。続けて、文字列抽出部48は現在の「Index」に「1」を加算し、これを新たな「Index」とする(ステップS308)。換言すれば、ハードディスク55には各「Index」に対応付けて抽出文字列及び当該ページ番号が記憶されている。   Next, the character string extraction unit 48 associates the extracted character string (hereinafter, also referred to as an extracted character string) with the variable “Index”, and stores it in, for example, the hard disk 55 (step S306). That is, a number corresponding to the current "Page" is associated with the "Index" and stored, for example, in the hard disk 55 (step S307). Subsequently, the character string extraction unit 48 adds “1” to the current “Index” and sets it as a new “Index” (step S308). In other words, the extracted character string and the page number are stored in the hard disk 55 in association with each “Index”.

ステップS308の後、文字列抽出部48は、現在の「Page」に該当する数字が前記原稿の全ページ数と等しいか判定する(ステップS309)。   After step S308, the character string extraction unit 48 determines whether the number corresponding to the current "Page" is equal to the total number of pages of the document (step S309).

現在の「Page」に該当する数字が前記原稿の全ページ数と等しくないと判定した場合(ステップS309:NO)、文字列抽出部48は、現在の「Page」に「1」を加算した数字を新たに「Page」とし(ステップS310)、処理を再びステップS302に戻す。   When it is determined that the number corresponding to the current "Page" is not equal to the total number of pages of the document (step S309: NO), the character string extraction unit 48 adds "1" to the current "Page". Is newly set to "Page" (step S310), and the process returns to step S302 again.

一方、文字サイズ検出部47によって現在の「Page」に該当する数字が前記原稿の全ページ数と等しいと判定された場合(ステップS309:YES)、文字列抽出の処理は終了する。   On the other hand, when it is determined by the character size detection unit 47 that the number corresponding to the current "Page" is equal to the total number of pages of the document (step S309: YES), the character string extraction process ends.

以上の最大文字サイズ検出の処理により、前記原稿画像データにおいて、最大文字サイズ「Letter Size」を有する文字列が抽出される。   By the above-described processing of maximum character size detection, a character string having the maximum character size “Letter Size” is extracted from the document image data.

再び、図3に基づく説明に戻る。   Returning to the explanation based on FIG. 3 again.

以上のようにして、最大文字サイズが検出され、検出された最大文字サイズを有する文字列が抽出された後、章情報取得部49は前記章情報を取得する処理を行う(ステップS103)。   As described above, after the maximum character size is detected and the character string having the detected maximum character size is extracted, the chapter information acquisition unit 49 performs processing for acquiring the chapter information (step S103).

図7は本実施の形態に係る複写機1において、章情報取得部49によって行われる章情報取得の処理を説明するフローチャートである。以下、章情報取得の処理について詳しく説明する。   FIG. 7 is a flowchart for explaining chapter information acquisition processing performed by the chapter information acquisition unit 49 in the copying machine 1 according to the present embodiment. The following describes the chapter information acquisition process in detail.

章情報取得部49は変数の初期化を行う(ステップS401)。より詳しくは、文字列抽出の処理に係る「Index」(ステップS308参照)から「1」を引いた数値を「最終Index」とする。また、変数「Chapter Pattern」を「0」に初期化し、変数「Index」を「0」に初期化し、Error Flagをリセットする。   The chapter information acquisition unit 49 initializes the variable (step S401). More specifically, a value obtained by subtracting "1" from "Index" (see step S308) related to the character string extraction process is taken as "final index". Also, the variable “Chapter Pattern” is initialized to “0”, the variable “Index” is initialized to “0”, and the Error Flag is reset.

次いで、章情報取得部49は、現在の「Index」に対応する抽出文字列をハードディスク55から読み出し(ステップS402)、章文字パターンの検索の処理を行う(ステップS403)。   Next, the chapter information acquisition unit 49 reads the extracted character string corresponding to the current "Index" from the hard disk 55 (step S402), and performs a chapter character pattern search process (step S403).

図8は本実施の形態に係る複写機1において、章情報取得部49によって行われる章文字パターンの検索の処理を説明するフローチャートである。以下、章文字パターンの検索の処理について詳しく説明する。   FIG. 8 is a flow chart for explaining a chapter character pattern search process performed by the chapter information acquisition unit 49 in the copying machine 1 according to the present embodiment. The processing of the chapter character pattern search will be described in detail below.

先ず、章情報取得部49は、変数の初期化を行う(ステップS601)。より詳しくは、章情報取得部49は「Chapter Pattern」及び「Chapter Pattern Index」(図4A参照)を夫々「1」及び「0」に初期化する。   First, the chapter information acquisition unit 49 initializes a variable (step S601). More specifically, the chapter information acquisition unit 49 initializes “Chapter Pattern” and “Chapter Pattern Index” (see FIG. 4A) to “1” and “0”, respectively.

次いで、章情報取得部49は、ステップS402にて読み出された抽出文字列の最初文字を抽出する(ステップS602)。また、章情報取得部49はハードディスク55に記憶された前記章番号パターンから、現在の「Chapter Pattern」に対応する「章番号に係る数文字」(図4A参照)を読み出す(ステップS603)。   Next, the chapter information acquisition unit 49 extracts the first character of the extracted character string read in step S402 (step S602). Also, the chapter information acquisition unit 49 reads “several characters related to chapter number” (see FIG. 4A) corresponding to the current “Chapter Pattern” from the chapter number pattern stored in the hard disk 55 (step S603).

章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しいか否かを判定する(ステップS604)。すなわち、前記章表示文字列として「X.○○○○」のような記載が存在する場合、最初文字「X」と、前記「章番号に係る数文字」とを比較する。   The chapter information acquisition unit 49 determines whether the extracted first character is equal to the read “several characters related to chapter number” (step S604). That is, when a description such as “X. ○ ○ ○” is present as the chapter display character string, the first character “X” is compared with the “several characters relating to the chapter number”.

章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しいと判定した場合(ステップS604:YES)、斯かる「Index」及び「Chapter Pattern」を関連付けて記憶して、章文字パターンの検索の処理を終了する。   When the chapter information acquisition unit 49 determines that the extracted first character is equal to the read "several characters related to the chapter number" (step S604: YES), the "Index" and "Chapter Pattern" are associated with each other. , And the processing of the chapter character pattern search ends.

一方、章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しくないと判定した場合(ステップS604:NO)、現在の「Chapter Pattern」に「1」を加算した数字を新たに「Chapter Pattern」とする(ステップS605)。   On the other hand, when the chapter information acquisition unit 49 determines that the extracted first character is not equal to the read "several characters related to the chapter number" (step S604: NO), the current "Chapter Pattern" is "1. The number obtained by adding "" is newly set as "Chapter Pattern" (step S605).

次いで、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であるか否かの判定を行う(ステップS606)。章情報取得部49は、現在の「Chapter Pattern Index」が「5」でないと判定した場合(ステップS606:NO)、現在の「Chapter Pattern Index」に「1」を加算した数字を新たに「Chapter Pattern Index」とする(ステップS607)。以降、処理はステップS603に戻る。   Next, the chapter information acquisition unit 49 determines whether the current "Chapter Pattern Index" is "5" (step S606). If the chapter information acquisition unit 49 determines that the current "Chapter Pattern Index" is not "5" (step S606: NO), the chapter information acquisition unit 49 adds a "1" to the current "Chapter Pattern Index" to newly add "Chapter". It is set as "Pattern Index" (step S607). Thereafter, the process returns to step S603.

一方、章情報取得部49によって、現在の「Chapter Pattern Index」が「5」であると判定した場合(ステップS606:YES)、換言すれば、最初文字に対応する「章番号に係る数文字」が見つからなかった場合は、前記章表示文字列として「第X章○○○○」のような記載が存在する場合を想定した処理が行われる。すなわち、第2番目の文字に対して、章文字パターンの検索の処理を行う。   On the other hand, when it is determined by the chapter information acquisition unit 49 that the current "Chapter Pattern Index" is "5" (step S606: YES), in other words, "several characters related to chapter number" corresponding to the first character Is not found, processing is performed on the assumption that there is a description such as "Chapter X XX" as the chapter display character string. That is, the processing of the chapter character pattern search is performed on the second character.

章情報取得部49は、ステップS606にて「YES」と判定した場合、再び「Chapter Pattern Index」を「0」に初期化する(ステップS608)。   When the chapter information acquisition unit 49 determines “YES” in step S606, the chapter information acquisition unit 49 initializes “Chapter Pattern Index” to “0” again (step S608).

次いで、章情報取得部49は、ステップS402にて読み出された抽出文字列の第2番目文字を抽出する(ステップS609)。また、章情報取得部49は現在の「Chapter Pattern」に対応する「章番号に係る数文字」(図4A参照)を読み出す(ステップS610)。   Next, the chapter information acquisition unit 49 extracts the second character of the extracted character string read in step S402 (step S609). Also, the chapter information acquisition unit 49 reads out “several characters related to the chapter number” (see FIG. 4A) corresponding to the current “Chapter Pattern” (step S610).

章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しいか否かを判定する(ステップS611)。章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しいと判定した場合(ステップS611:YES)、斯かる「Index」及び「Chapter Pattern」を関連付けて記憶して、章文字パターンの検索の処理を終了する。   The chapter information acquisition unit 49 determines whether the extracted second character is equal to the read “several characters related to chapter number” (step S611). If the chapter information acquisition unit 49 determines that the extracted second character is equal to the read “several characters related to the chapter number” (step S 611: YES), such “Index” and “Chapter Pattern” It associates and stores, and ends the processing of the chapter character pattern search.

一方、章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しくないと判定した場合(ステップS611:NO)、現在の「Chapter Pattern」に「1」を加算した数字を新たに「Chapter Pattern」とする(ステップS612)。   On the other hand, when the chapter information acquiring unit 49 determines that the extracted second character is not equal to the read "several characters related to the chapter number" (step S611: NO), the current "Chapter Pattern" is " A number obtained by adding "1" is newly set as "Chapter Pattern" (step S612).

次いで、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であるか否かの判定を行う(ステップS613)。章情報取得部49は、現在の「Chapter Pattern Index」が「5」でないと判定した場合(ステップS613:NO)、現在の「Chapter Pattern Index」に「1」を加算した数字を新たに「Chapter Pattern Index」とする(ステップS614)。以降、処理はステップS610に戻る。   Next, the chapter information acquisition unit 49 determines whether the current "Chapter Pattern Index" is "5" (step S613). When the chapter information acquisition unit 49 determines that the current "Chapter Pattern Index" is not "5" (step S613: NO), the chapter information acquisition unit 49 adds a "1" to the current "Chapter Pattern Index" to "Chapter". It is set as "Pattern Index" (step S614). Thereafter, the process returns to step S610.

一方、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であると判定した場合(ステップS613:YES)、換言すれば、第2番目文字に対応する「章番号に係る数文字」も見つからなかった場合は、その旨ハードディスク55に記憶する(ステップS615)。詳しくは、章情報取得部49は「Chapter Pattern」が「0」であると記憶することにより、ステップS402で読み出された抽出文字列に対応する「章番号に係る数文字」が存在しない旨記憶する。   On the other hand, when the chapter information acquisition unit 49 determines that the current "Chapter Pattern Index" is "5" (step S613: YES), in other words, "the number related to the chapter number corresponding to the second character If no character is found, the fact is stored in the hard disk 55 (step S615). Specifically, the chapter information acquisition unit 49 stores that “Chapter Pattern” is “0”, thereby indicating that “several characters relating to the chapter number” corresponding to the extracted character string read in step S402 does not exist. Remember.

再び、図7に基づく説明に戻る。   It returns to the explanation based on FIG. 7 again.

このようにして、読み出された抽出文字列に対する、章文字パターンの検索の処理後、章情報取得部49は、「Chapter Pattern」が「0」であるか否かの判定を行う(ステップS404)。   In this manner, after the chapter character pattern search process is performed on the extracted extracted character string, the chapter information acquisition unit 49 determines whether “Chapter Pattern” is “0” (step S404). ).

章情報取得部49は、「Chapter Pattern」が「0」であると判定した場合(ステップS404:YES)、すなわち、合致する「章番号に係る数文字」がない場合、現在の「Index」が前記「最終Index」と等しいか否かの判定を行う(ステップS415)。   If the chapter information acquisition unit 49 determines that "Chapter Pattern" is "0" (step S404: YES), that is, if there is no matching "several characters related to the chapter number", the current "Index" is It is determined whether it is equal to the "final Index" (step S415).

章情報取得部49は現在の「Index」が前記「最終Index」と等しいと判定した場合(ステップS415:YES)、Error Flagをセットする(ステップS416)。すなわち、全ての抽出文字列が、前記「章番号に係る数文字」の何れとも合致しない場合、Error Flagをセットすることにより、その旨記憶する。   If the chapter information acquisition unit 49 determines that the current "Index" is equal to the "final Index" (step S415: YES), it sets an error flag (step S416). That is, when all the extracted character strings do not match any of the "several characters related to chapter number", the fact is stored by setting the Error Flag.

一方、 章情報取得部49は現在の「Index」が前記「最終Index」と等しくないと判定した場合(ステップS415:NO)、現在の「Index」に「1」を加算した数字を新たに「Index」とし(ステップS417)、処理をステップS402に戻し、次の「Index」に対しても上述した処理を施す。   On the other hand, when the chapter information acquisition unit 49 determines that the current "Index" is not equal to the "final Index" (step S415: NO), the number obtained by adding "1" to the current "Index" is newly added. In step S417, the process returns to step S402, and the above-described process is performed on the next "index".

しかし、章情報取得部49は、「Chapter Pattern」が「0」でないと判定した場合(ステップS404:NO)、変数「Chapter Number Next Index」を「0」に設定し(ステップS405)、「Chapter data」を初期化する(ステップS406)。ここで「Chapter data」はいわゆる2次元データである。
However, when the chapter information acquisition unit 49 determines that “Chapter Pattern” is not “0” (step S404: NO), the variable “Chapter Number Next Index” is set to “0” (step S405), and “Chapter "data" is initialized (step S406). Here, “Chapter data” is so-called two-dimensional data.

次いで、章情報取得部49は、現在の「Index」に対応する抽出文字列をハードディスク55から再び読み出し(ステップS407)、章番号文字合致照合の処理を行う(ステップS408)。   Next, the chapter information acquisition unit 49 again reads out the extracted character string corresponding to the current "Index" from the hard disk 55 (step S407), and performs chapter number character matching verification processing (step S408).

章情報取得部49は、斯かる章番号文字合致照合の処理において、前記章番号パターンに基づいて、章表示文字列に含まれている章番号を割り出し、該章番号をIndexとして対応する章文字列及び章ページ番号を関連付けて記憶する。   The chapter information acquisition unit 49 determines the chapter number included in the chapter display character string based on the chapter number pattern in the chapter number character matching process, and the chapter number corresponding to the chapter number as an index. Associate and store column and chapter page numbers.

図9は本実施の形態に係る複写機1において、章情報取得部49によって行われる章番号文字合致照合の処理を説明するフローチャートである。以下、章番号文字合致照合の処理について詳しく説明する。   FIG. 9 is a flow chart for explaining the chapter number character matching process performed by the chapter information acquisition unit 49 in the copying machine 1 according to the present embodiment. The process of chapter number character matching will be described in detail below.

先ず、章情報取得部49は変数の設定を行う(ステップS701)。より詳しくは、章情報取得部49は変数「Chapter Number」を「0」に設定し、変数「Letter Index」に「Chapter Number Next Index」を代入する。   First, the chapter information acquisition unit 49 sets a variable (step S701). More specifically, the chapter information acquisition unit 49 sets the variable “Chapter Number” to “0”, and substitutes “Chapter Number Next Index” for the variable “Letter Index”.

ここで「Letter Index」は、図4Aに示した章番号パターンの「章番号に係る数文字」における、数文字の列挙順を示すものであり、該列挙順は昇順である。また、「Chapter Number Next Index」は「0」から始まる。   Here, “Letter Index” indicates the order of enumeration of several characters in “several characters related to chapter number” of the chapter number pattern shown in FIG. 4A, and the enumeration order is in ascending order. Also, "Chapter Number Next Index" starts from "0".

章情報取得部49は、図7のステップS403にて行われた章文字パターンの検索の処理結果に基づき、当該抽出文字列に対して、「Chapter Pattern」が「6」以下であるか否かの判定を行う(ステップS702)。すなわち、最初文字が章番号に該当するか、第2番目文字が章番号に該当するかの判定を行う。   The chapter information acquisition unit 49 determines whether or not “Chapter Pattern” is “6 or less” for the extracted character string based on the processing result of the chapter character pattern search performed in step S 403 of FIG. 7. The determination is made (step S702). That is, it is determined whether the first character corresponds to the chapter number and the second character corresponds to the chapter number.

章情報取得部49は、当該抽出文字列に対して、「Chapter Pattern」が「6」以下であると判定した場合(ステップS702:YES)、すなわち、最初文字が章番号に該当する場合、当該「Chapter Pattern」から「1」を引いた数を「Chapter Pattern Index」に代入し(ステップS703)、該「Chapter Pattern Index」及び「Letter Index」に対応する、図4Bに示す「章番号の構成文字数」をハードディスク55から読み出す(ステップS704)。   If the chapter information acquisition unit 49 determines that “Chapter Pattern” is “6” or less for the extracted character string (step S 702: YES), that is, if the first character corresponds to the chapter number, The number obtained by subtracting "1" from "Chapter Pattern" is substituted for "Chapter Pattern Index" (step S703), and the "Chapter Number Configuration" shown in FIG. 4B corresponding to the "Chapter Pattern Index" and "Letter Index". The number of characters is read out from the hard disk 55 (step S704).

章情報取得部49は、当該抽出文字列に対して、前記「章番号の構成文字数」に基づいて、最初の文字から1つ又は2つの文字を抜き出す(ステップS705)。   The chapter information acquisition unit 49 extracts one or two characters from the first character of the extracted character string based on the "number of characters constituting the chapter number" (step S705).

一方、章情報取得部49は、当該抽出文字列に対して、「Chapter Pattern」が「6」以下でないと判定した場合(ステップS702:NO)、すなわち、第2番目文字が章番号に該当する場合、当該「Chapter Pattern」から「7」を引いた数を「Chapter Pattern Index」に代入し(ステップS709)、該「Chapter Pattern Index」及び「Letter Index」に対応する、図4Bに示す「章番号の構成文字数」をハードディスク55から読み出す(ステップS710)。   On the other hand, when the chapter information acquisition unit 49 determines that “Chapter Pattern” is not less than “6” for the extracted character string (step S702: NO), that is, the second character corresponds to the chapter number. In this case, the number obtained by subtracting "7" from the "Chapter Pattern" is substituted for "Chapter Pattern Index" (step S709), and the "chapter" shown in FIG. 4B corresponding to the "Chapter Pattern Index" and "Letter Index". The number of characters constituting the number is read out from the hard disk 55 (step S710).

章情報取得部49は、当該抽出文字列に対して、前記「章番号の構成文字数」に基づいて、第2番目の文字から1つ又は2つの文字を抜き出す(ステップS711)。以下においては、ステップS705又はステップS711にて抜き出された1つ又は2つの文字を抜き出し文字と言う。   The chapter information acquisition unit 49 extracts one or two characters from the second character based on the “number of characters constituting the chapter number” for the extracted character string (step S711). Hereinafter, one or two characters extracted in step S705 or step S711 are referred to as extracted characters.

ステップS705又はステップS711の処理後、章情報取得部49は、当該「Chapter Pattern Index」及び前記「Letter Index」に対応する、前記章番号パターンの「章番号に係る数文字」を読み出す(ステップS706)。また、章情報取得部49は、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しいか否かを判定する(ステップS707)。   After the process of step S705 or step S711, the chapter information acquisition unit 49 reads out "several characters related to chapter number" of the chapter number pattern corresponding to the "Chapter Pattern Index" and the "Letter Index" (step S706). ). Further, the chapter information acquisition unit 49 determines whether or not the read “several characters related to chapter number” is equal to the extracted character (step S 707).

章情報取得部49は、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しいと判定した場合(ステップS707:YES)、現在の「Letter Index」に「1」を加算した数を「Chapter Number」として代入する(ステップS708)。これによって、章番号が割り出すことが出来る。   When the chapter information acquisition unit 49 determines that the “several characters related to the chapter number” and the extracted characters are equal (step S 707: YES), “1” is added to the current “Letter Index”. A number is substituted as "Chapter Number" (step S708). The chapter number can be determined by this.

一方、 章情報取得部49によって、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しくないと判定された場合(ステップS707:NO)、次の章番号と一致するか確認を行う。   On the other hand, when it is determined by the chapter information acquisition unit 49 that the read “several characters related to chapter number” is not equal to the extracted character (step S 707: NO), confirmation is made as to whether it matches the next chapter number. I do.

すなわち、章情報取得部49は、図4Cの最終 Letter Indexテーブルをハードディスク55から読み出し(ステップS712)、該最終 Letter Indexテーブルに基づいて、現在の「Letter Index」が最終Letter Indexと等しいか否かの判定を行う(ステップS713)。   That is, the chapter information acquisition unit 49 reads the final Letter Index table of FIG. 4C from the hard disk 55 (step S 712), and based on the final Letter Index table, whether the current “Letter Index” is equal to the final Letter Index The determination is made (step S713).

章情報取得部49は、現在の「Letter Index」が最終Letter Indexと等しくないと判定した場合(ステップS713:NO)、現在の「Letter Index」に「1」を加算した数を新たな「Letter Index」として代入し(ステップS714)、処理をステップS702に戻す。   If the chapter information acquisition unit 49 determines that the current "Letter Index" is not equal to the final Letter Index (step S713: NO), the number "Letter Index" plus "1" is added to the new "Letter". It substitutes as "Index" (step S714), and returns a process to step S702.

一方、 章情報取得部49は、現在の「Letter Index」が最終Letter Indexと等しいと判定した場合(ステップS713:YES)、すなわち、章番号の割り出しが出来なかった場合、「Chapter Number」を「0」のままにして斯かる章番号文字合致照合の処理を終了する。   On the other hand, if the chapter information acquisition unit 49 determines that the current "Letter Index" is equal to the final Letter Index (step S713: YES), that is, if the chapter number can not be determined, "Chapter Number" End the process of such chapter number character matching by leaving 0 ".

再び、図7に基づく説明に戻る。   It returns to the explanation based on FIG. 7 again.

このようにして、読み出された抽出文字列に対する、章番号文字合致照合の処理後、章情報取得部49は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS409)。章情報取得部49は、「Chapter Number」が「0」であると判定した場合(ステップS409:YES)、処理をステップS413に進める。   Thus, after the chapter number character matching collation process on the extracted extracted character string, the chapter information acquiring unit 49 determines whether "Chapter Number" is "0" (step S409). ). When the chapter information acquisition unit 49 determines that “Chapter Number” is “0” (step S409: YES), the process proceeds to step S413.

一方、章情報取得部49は、「Chapter Number」が「0」でないと判定した場合(ステップS409:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS410)。   On the other hand, when the chapter information acquisition unit 49 determines that “Chapter Number” is not “0” (Step S 409: NO), “Chapter Number” is substituted for “Chapter Number Next Index”, and the variable “Chapter Index” A numerical value obtained by subtracting "1" from "Chapter Number" is substituted for (Step S410).

次いで、章情報取得部49は、「Chapter Index」に対応付けて、ステップS407にて読み出された抽出文字列を章文字列として、例えば、ハードディスク55に記憶し(ステップS411)、また、「Chapter Index」に対応付けて、前記抽出文字列に係るページ番号(章ページ番号)をハードディスク55に記憶する(ステップS412)。   Next, the chapter information acquisition unit 49 stores the extracted character string read in step S407 as a chapter character string in, for example, the hard disk 55 in association with "Chapter Index" (step S411), The page number (chapter page number) relating to the extracted character string is stored in the hard disk 55 in association with "Chapter Index" (step S412).

また、章情報取得部49は現在の「Index」が「最終Index」と等しいか否かの判定を行う(ステップS413)。   Also, the chapter information acquisition unit 49 determines whether the current "Index" is equal to the "final Index" (step S413).

章情報取得部49は現在の「Index」が前記「最終Index」と等しくないと判定した場合(ステップS413:NO)、現在の「Index」に「1」を加算した数字を新たに「Index」とし(ステップS414)、処理をステップS407に戻す。   When the chapter information acquisition unit 49 determines that the current "Index" is not equal to the "final Index" (step S413: NO), the number obtained by adding "1" to the current "Index" is newly added to the "Index". Then (step S414), the process returns to step S407.

一方、章情報取得部49は現在の「Index」が前記「最終Index」と等しいと判定した場合(ステップS413:YES)、処理を終了する。
以上の処理によって、章番号、該章番号に対応する章文字列及び章ページ番号を含む章情報が取得される。
On the other hand, when the chapter information acquisition unit 49 determines that the current "Index" is equal to the "final Index" (step S413: YES), the process is ended.
By the above processing, chapter information including a chapter number, a chapter character string corresponding to the chapter number, and a chapter page number is acquired.

再び、図3に基づく説明に戻る。   Returning to the explanation based on FIG. 3 again.

以上のようにして、章情報取得部49により、前記章情報を取得する処理がされた後、CPU40は、エラーが発生したか否かを判定する(ステップS104)。   As described above, after the chapter information acquisition unit 49 performs the process of acquiring the chapter information, the CPU 40 determines whether an error has occurred (step S104).

前記ステップS103にて、Error Flagがセットされていれば、CPU40はエラーが発生したと判定し(ステップS104:YES)、章情報がない旨を前記表示部に表示する(ステップS108)。以降、処理は終了する。   If the error flag is set in step S103, the CPU 40 determines that an error has occurred (step S104: YES), and displays on the display unit that there is no chapter information (step S108). Thereafter, the process ends.

前記ステップS103にて、Error Flagがセットされていなければ、CPU40はエラーが発生していないと判定し(ステップS104:NO)、抜け補完部50が前記抜け補完の処理を行う(ステップS105)。   If the Error Flag is not set in step S103, the CPU 40 determines that an error has not occurred (step S104: NO), and the missing complement unit 50 performs the missing complement processing (step S105).

図10及び図11は本実施の形態に係る複写機1において、抜け補完部50によって行われる抜け補完の処理を説明するフローチャートである。以下、抜け補完の処理について詳しく説明する。   FIG. 10 and FIG. 11 are flowcharts for explaining the process of the dropout complementation performed by the dropout complement unit 50 in the copying machine 1 according to the present embodiment. Hereinafter, the process of the missing complement will be described in detail.

抜け補完部50は変数の初期化を行う(ステップS501)。より詳しくは、最後の章を示す「Last Chapter Index」に「Chapter Index」を代入し、「Chapter Index」に「1」を設定する。また、「Start Chapter Number Index」に「1」を代入する。   The missing complement unit 50 initializes the variable (step S501). More specifically, "Chapter Index" is substituted for "Last Chapter Index" indicating the last chapter, and "1" is set for "Chapter Index". Also, substitute “1” for “Start Chapter Number Index”.

次いで、抜け補完部50は、前記「Last Chapter Index」が「0」であるか否かを判定する(ステップS502)。すなわち、ステップS410にて「Chapter Index」は「Chapter Number」から「1」を引いた値であることから、斯かる判定は、斯かる原稿が章を1つ含むか又は複数含むかが判定される。   Next, the missing complement unit 50 determines whether the "Last Chapter Index" is "0" (step S502). That is, since “Chapter Index” is a value obtained by subtracting “1” from “Chapter Number” in step S410, such determination determines whether such a document includes one or more chapters. Ru.

抜け補完部50は、前記「Last Chapter Index」が「0」であると判定した場合(ステップS502:YES)、すなわち、章が1つである場合、処理をステップS515に進める。   If it is determined that the “Last Chapter Index” is “0” (step S 502: YES), that is, if there is one chapter, the dropout complementing unit 50 advances the process to step S 515.

抜け補完部50は、前記「Last Chapter Index」が「0」でないと判定した場合(ステップS502:NO)、すなわち、章が複数である場合、抜け補完部50は現在の「Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS503)。   If it is determined that the “Last Chapter Index” is not “0” (step S 502: NO), that is, if there are a plurality of chapters, the missing complement unit 50 corresponds to the current “Chapter Index”. The chapter page number to be read is read out from the hard disk 55 (step S503).

次いで、抜け補完部50は読み出した章ページ番号が「0」に等しいか否かの判定を行う(ステップS504)。換言すれば、抜け補完部50は、現在の「Chapter Index」に係る章番号に対応する章ページ番号が存在するか否かを判定する。   Next, the missing part complement unit 50 determines whether the chapter page number read out is equal to "0" (step S504). In other words, the missing part complement unit 50 determines whether or not there is a chapter page number corresponding to the chapter number according to the current "Chapter Index".

抜け補完部50は読み出した章ページ番号が「0」に等しくないと判定した場合(ステップS504:NO)、現在の「Chapter Index」が前記「Last Chapter Index」と等しいか否かの判定を行う(ステップS505)。   If it is determined that the chapter page number read out is not equal to "0" (step S504: NO), it is determined whether or not the current "Chapter Index" is equal to the "Last Chapter Index". (Step S505).

抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定した場合(ステップS505:YES)、処理をステップS515に進める。   When it is determined that the current “Chapter Index” is equal to the “Last Chapter Index” (step S505: YES), the missing part complement unit 50 proceeds the process to step S515.

一方、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しくないと判定した場合(ステップS505:NO)、変数「Chapter Page Start」に当該章ページ番号を代入し(ステップS506)、現在の「Chapter Index」に「1」を加算した数字を新たに「Chapter Index」とし、かつ、「Start Chapter Number Index」に「Chapter Index」を代入する(ステップS507)。以降、処理はステップS503に戻る。   On the other hand, when it is determined that the current "Chapter Index" is not equal to the "Last Chapter Index" (step S505: NO), the missing completion unit 50 substitutes the chapter page number for the variable "Chapter Page Start" Step S506) A number obtained by adding “1” to the current “Chapter Index” is newly set as “Chapter Index”, and “Chapter Index” is substituted for “Start Chapter Number Index” (Step S507). Thereafter, the process returns to step S503.

しかし、ステップS504にて、抜け補完部50は、読み出した章ページ番号が「0」に等しいと判定した場合(ステップS504:YES)、換言すれば、章番号の抜けがある場合、抜けている章番号の数を表す変数「Adjust Chapter Number」に「0」を設定する(ステップS508)。   However, if it is determined in step S504 that the missing chapter complementing section 50 determines that the read chapter page number is equal to "0" (step S504: YES), in other words, if there is a missing chapter number, it is missing. The variable "Adjust Chapter Number" representing the number of chapter numbers is set to "0" (step S508).

次いで、抜け補完部50は、現在の「Adjust Chapter Number」に「1」を加算した数字を新たに「Adjust Chapter Number」とし(ステップS509)、また、現在の「Chapter Index」に「1」を加算した数字を新たに「Chapter Index」とする(ステップS510)。   Next, the missing completion unit 50 newly sets a number obtained by adding "1" to the current "Adjust Chapter Number" as "Adjust Chapter Number" (step S509), and "1" in the current "Chapter Index". The added number is newly set as "Chapter Index" (step S510).

また、抜け補完部50は現在の「Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS511)。   Further, the missing part complement unit 50 reads out the chapter page number corresponding to the current "Chapter Index" from the hard disk 55 (step S511).

次いで、抜け補完部50は読み出した章ページ番号が「0」に等しいか否かの判定を行う(ステップS512)。換言すれば、抜け補完部50は、現在の「Chapter Index」に係る章番号に対応する章ページ番号が存在するか否かを判定する。   Next, the missing part complement unit 50 determines whether the read chapter page number is equal to "0" (step S512). In other words, the missing part complement unit 50 determines whether or not there is a chapter page number corresponding to the chapter number according to the current "Chapter Index".

抜け補完部50は、読み出した章ページ番号が「0」に等しいと判定した場合(ステップS512:YES)、処理をステップS509に戻し、昇順において抜けている章番号の算出を続ける。   If it is determined that the chapter page number read out is equal to “0” (step S 512: YES), the process is returned to step S 509, and calculation of the chapter number missing in ascending order is continued.

一方、抜け補完部50は、読み出した章ページ番号が「0」に等しくないと判定した場合(ステップS512:NO)、前記抜け補完に係る第1補完処理を行う(ステップS513)。   On the other hand, when it is determined that the chapter page number read out is not equal to “0” (step S 512: NO), the missing part complementing unit 50 performs the first complementation processing relating to the missing complement (step S 513).

図12及び図13は本実施の形態に係る複写機1において、抜け補完部50によって行われる第1補完の処理を説明するフローチャートである。以下、該第1補完の処理について詳しく説明する。   12 and 13 are flowcharts for explaining the process of the first complementation performed by the missing part complementing unit 50 in the copying machine 1 according to the present embodiment. Hereinafter, the process of the first complement will be described in detail.

抜け補完部50は変数の初期化を行う(ステップS801)。より詳しくは、抜け補完部50は変数「Page Index」に章の初めのページ番号である「Chapter Page Start」を代入し、最後のページを表す「Page End Index」には、次の章に係る章ページ番号から「1」を引く「Chapter Page‐1」を代入する。また、抜け補完部50は、次の章を指す「Chapter Number Next Index」に「Start Chapter Number Index」を代入する。   The missing complement unit 50 initializes a variable (step S801). More specifically, the missing completion unit 50 substitutes the variable "Page Index" for the first page number "Chapter Page Start" in the chapter, and the last page "Page End Index" for the next chapter. Substitute "Chapter Page-1" by subtracting "1" from the chapter page number. In addition, the missing completion unit 50 substitutes “Start Chapter Number Index” into “Chapter Number Next Index” that indicates the next chapter.

抜け補完部50は、前記原稿画像データから現在の「Page Index」に対応するページの画像データを読み出して、該画像データにおける行数の検出を行う(ステップS802)。   The missing part complement unit 50 reads out the image data of the page corresponding to the current "Page Index" from the document image data, and detects the number of lines in the image data (step S802).

次いで、抜け補完部50は、最終行を示す「Line End Index」に、検出された行数から「1」を引いた数値を代入し(ステップS803)、また、「Line Index」に「1」を代入する(ステップS804)。すなわち、章文字列を除いて2行目から斯かる処理が行われる。   Next, the missing part complement unit 50 substitutes a numerical value obtained by subtracting “1” from the detected number of lines into “Line End Index” indicating the final line (step S 803), and “1” in “Line Index”. Is substituted (step S804). That is, such processing is performed from the second line except for the chapter character string.

また、抜け補完部50は現在の「Page Index」に対応するページの画像データを読み出して現在の「Line Index」に対応する行に係る文字列データを抽出する(ステップS805)。   Also, the missing part complement unit 50 reads out the image data of the page corresponding to the current "Page Index", and extracts the character string data related to the line corresponding to the current "Line Index" (step S805).

抜け補完部50は、抽出された文字列データの文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか判定を行う(ステップS806)。   The missing character complementing unit 50 determines whether the character size of the extracted character string data is equal to the character size corresponding to the predetermined maximum character size “Letter Size” (step S806).

抜け補完部50によって、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS806:NO)、処理はステップS814に進む。   If it is determined that the character size of the extracted character string data is not equal to the character size corresponding to the maximum character size “Letter Size” (step S806: NO), the process proceeds to step S814 .

一方、抜け補完部50は、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS806:YES)、抽出された文字列データに対して章情報取得部49が前記章番号文字合致照合の処理を行う(ステップS807)。章情報取得部49による章番号文字合致照合の処理については、図9にて既に説明しており、詳しい説明を省略する。   On the other hand, when it is determined that the character size of the extracted character string data is equal to the character size corresponding to the maximum character size “Letter Size” (step S806: YES), the missing character complementing unit 50 extracts the extracted character string data The chapter information acquisition unit 49 performs the chapter number character matching check process (step S807). The processing of the chapter number character matching by the chapter information acquisition unit 49 has already been described in FIG. 9, and the detailed description will be omitted.

このように、章番号文字合致照合の処理後、抜け補完部50は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS808)。抜け補完部50は、「Chapter Number」が「0」であると判定した場合(ステップS808:YES)、処理をステップS814に進める。   Thus, after the chapter number character matching process, the missing character complementing unit 50 determines whether the "Chapter Number" is "0" (step S808). When it is determined that the "Chapter Number" is "0" (step S808: YES), the missing part complement unit 50 proceeds with the process to step S814.

一方、抜け補完部50は、「Chapter Number」が「0」でないと判定した場合(ステップS808:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS809)。   On the other hand, when it is determined that the "Chapter Number" is not "0" (Step S808: NO), the missing completion unit 50 substitutes "Chapter Number" for the "Chapter Number Next Index", and sets the variable "Chapter Index". The value of "Chapter Number" minus "1" is substituted (Step S809).

次いで、抜け補完部50は、「Chapter Index」に対応付けて、ステップS805にて読み出された文字列データを章文字列として、例えば、ハードディスク55に記憶し(ステップS810)、また、「Chapter Index」に対応付けて、現在の「Page Index」に「1」を加算した数値を、章ページ番号として、ハードディスク55に記憶する(ステップS811)。   Next, the missing complement unit 50 stores the character string data read in step S805 as a chapter character string, for example, in the hard disk 55, in association with "Chapter Index" (step S810). A numerical value obtained by adding “1” to the current “Page Index” in association with “Index” is stored in the hard disk 55 as a chapter page number (step S811).

以上の処理によって、抜けた章(抜け章番号)が1箇所検出されたので、前記「Adjust Chapter Number」から「1」を引いた数値を新たな「Adjust Chapter Number」に代入する(ステップS812)。   Since one missing chapter (missing chapter number) is detected by the above processing, the numerical value obtained by subtracting "1" from the "Adjust Chapter Number" is substituted for a new "Adjust Chapter Number" (step S812). .

次いで、抜け補完部50は現在の「Adjust Chapter Number」が「0」か否かの判定を行う(ステップS813)。抜け補完部50によって現在の「Adjust Chapter Number」が「0」であると判定された場合(ステップS813:YES)、抜け章番号はないので、第1補完の処理は終了する。   Next, the missing part complement unit 50 determines whether the current "Adjust Chapter Number" is "0" (step S813). If it is determined by the missing complement unit 50 that the current "Adjust Chapter Number" is "0" (step S813: YES), since there is no missing chapter number, the processing of the first complement is ended.

抜け補完部50は、現在の「Adjust Chapter Number」が「0」でないと判定された場合(ステップS813:NO)、現在の「Line Index」が前記「Line End Index」と等しいか否かの判定を行う(ステップS814)。   If it is determined that the current "Adjust Chapter Number" is not "0" (step S813: NO), the missing complement unit 50 determines whether the current "Line Index" is equal to the "Line End Index". (Step S814).

抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しくないと判定をした場合(ステップS814:NO)、現在の「Line Index」に「1」を加算した数字を新たに「Line Index」とし(ステップS815)、再び、処理をステップS805に戻す。   When it is determined that the current "Line Index" is not equal to the "Line End Index" (step S814: NO), the missing part complement unit 50 newly adds a number obtained by adding "1" to the current "Line Index". To “Line Index” (step S815), and the process returns to step S805 again.

一方、抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいと判定した場合(ステップS814:YES)、すなわち、現在の「Page Index」に係るページ画像データに対する処理が終わった場合、再び、現在の「Page Index」が前記「Page End Index」と等しいか否かの判定を行う(ステップS816)。   On the other hand, when it is determined that the current "Line Index" is equal to the "Line End Index" (step S814: YES), the missing complement unit 50 processes the page image data related to the current "Page Index". If it has ended, it is judged again whether or not the current "Page Index" is equal to the "Page End Index" (step S816).

抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しくないと判定をした場合(ステップS816:NO)、現在の「Page Index」に「1」を加算した数字を新たに「Page Index」とし(ステップS817)、処理をステップS802に戻す。すなわち、次のページに対して同様の処理を施す。   When it is determined that the current “Page Index” is not equal to the “Page End Index” (step S 816: NO), the missing complement unit 50 newly adds a number obtained by adding “1” to the current “Page Index”. To “Page Index” (step S 817), and the process returns to step S 802. That is, the same process is performed on the next page.

一方、抜け補完部50は、現在の「Page Index」が前記「Page End Index」と等しいと判定した場合(ステップS816:YES)、Error Flagをセットし(ステップS818)、第1補完の処理を終了する。すなわち、補完できてない抜け章番号が存在する旨記憶する。   On the other hand, when it is determined that the current "Page Index" is equal to the "Page End Index" (Step S816: YES), the missing complement unit 50 sets an Error Flag (Step S818), and performs the first complement processing. finish. That is, it stores that there is a missing chapter number that can not be complemented.

再び、図10及び図11の説明に戻る。   It returns to the explanation of FIG. 10 and FIG. 11 again.

このように、第1補完の処理が終了した後、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいか否かの判定を行う(ステップS514)。   As described above, after the process of the first complement is completed, the missing complement unit 50 determines whether the current "Chapter Index" is equal to the "Last Chapter Index" (step S514).

抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しくないと判定した場合(ステップS514:NO)、再び、処理をステップS506に戻す。   When it is determined that the current "Chapter Index" is not equal to the "Last Chapter Index" (step S514: NO), the missing complement unit 50 returns the process to step S506 again.

また、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定した場合(ステップS514:YES)、処理をステップS515に進める。   Further, when it is determined that the current “Chapter Index” is equal to the “Last Chapter Index” (step S514: YES), the missing part complement unit 50 advances the process to step S515.

すなわち、ステップS514で、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定された場合、又は、ステップS502で、前記「Last Chapter Index」が「0」であると判定した場合、最終の章(章が1つのみの場合を含む。)内において、抜け章番号の補完の処理を行う。   That is, if it is determined in step S514 that the current "Chapter Index" is equal to the "Last Chapter Index", or if it is determined in step S502 that the "Last Chapter Index" is "0". In the final chapter (including the case where there is only one chapter), handle the completion of the missing chapter number.

抜け補完部50は、前記原稿画像データに基づいて、最終ページ番号を取得する(ステップS515)。   The missing part complement unit 50 acquires the final page number based on the document image data (step S515).

次いで、抜け補完部50は、「Chapter Page」に「Chapter Page」に「1」を加算した値を設定し、前記「Adjust Chapter Number」を「0」に設定する(ステップS516)。また、抜け補完部50は「Last Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS517)。   Next, the missing part complement unit 50 sets a value obtained by adding “1” to “Chapter Page” in “Chapter Page”, and sets “Adjust Chapter Number” to “0” (step S516). Also, the missing part complement unit 50 reads out the chapter page number corresponding to “Last Chapter Index” from the hard disk 55 (step S517).

以降、抜け補完部50は、前記抜け補完に係る第2補完処理を行う(ステップS518)。   Thereafter, the missing part complementing unit 50 performs the second complementing process related to the missing part complementation (step S518).

図14は本実施の形態に係る複写機1において、抜け補完部50によって行われる第2補完の処理を説明するフローチャートである。以下、該第2補完の処理について詳しく説明する。   FIG. 14 is a flowchart for explaining the process of the second complementation performed by the missing part complementing unit 50 in the copying machine 1 according to the present embodiment. Hereinafter, the process of the second complement will be described in detail.

抜け補完部50は変数の初期化を行う(ステップS901)。この処理は図12のステップS801の処理と同様であり、詳しい説明を省略する。また、抜け補完部50は、前記原稿画像データから現在の「Page Index」に対応するページの画像データを読み出し、該画像データにおける行数を検出する(ステップS902)。   The missing complement unit 50 initializes a variable (step S901). This process is the same as the process of step S801 in FIG. 12, and thus the detailed description is omitted. Further, the missing part complementing unit 50 reads the image data of the page corresponding to the current "Page Index" from the document image data, and detects the number of lines in the image data (step S902).

次いで、抜け補完部50、最終行を示す「Line End Index」に、検出された行数から「1」を引いた数値を代入し(ステップS903)、「Line Index」に「1」を代入する(ステップS904)。   Next, the missing complement unit 50 substitutes a numerical value obtained by subtracting "1" from the detected number of lines into "Line End Index" indicating the final line (step S903), and substitutes "1" into "Line Index". (Step S904).

また、抜け補完部50は現在の「Page Index」に対応するページの画像データを読み出して現在の「Line Index」に対応する行に係る文字列データを抽出する(ステップS905)。抜け補完部50は、抽出された文字列データの文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか判定を行う(ステップS906)。   Also, the missing part complement unit 50 reads the image data of the page corresponding to the current "Page Index", and extracts the character string data related to the line corresponding to the current "Line Index" (step S905). The missing character complementing unit 50 determines whether the character size of the extracted character string data is equal to the character size corresponding to the predetermined maximum character size “Letter Size” (step S 906).

抜け補完部50によって、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS906:NO)、処理はステップS912に進む。   If it is determined that the character size of the extracted character string data is not equal to the character size corresponding to the maximum character size “Letter Size” (step S 906: NO), the process proceeds to step S 912. .

一方、抜け補完部50は、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS906:YES)、抽出された文字列データに対して章情報取得部49が前記章番号文字合致照合の処理を行う(ステップS907)。   On the other hand, when it is determined that the character size of the extracted character string data is equal to the character size corresponding to the maximum character size "Letter Size" (step S906: YES), the missing character complementing unit 50 extracts the extracted character string data The chapter information acquisition unit 49 executes the chapter number character matching collation process (step S 907).

このように、章番号文字合致照合の処理後、抜け補完部50は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS908)。抜け補完部50は、「Chapter Number」が「0」であると判定した場合(ステップS908:YES)、処理をステップS912に進める。   As described above, after the chapter number character matching process, the missing character complementing unit 50 determines whether "Chapter Number" is "0" (step S908). When it is determined that the "Chapter Number" is "0" (step S908: YES), the missing part complement unit 50 proceeds the process to step S912.

一方、抜け補完部50は、「Chapter Number」が「0」でないと判定した場合(ステップS908:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS909)。   On the other hand, when it is determined that “Chapter Number” is not “0” (Step S 908: NO), the missing completion unit 50 substitutes “Chapter Number” for the “Chapter Number Next Index”, and sets “Chapter Index” for the variable. The value of “Chapter Number” minus “1” is substituted (Step S 909).

次いで、抜け補完部50は、「Chapter Index」に対応付けて、ステップS905にて読み出された文字列データを章文字列として記憶し(ステップS910)、また、「Chapter Index」に対応付けて、現在の「Page Index」に「1」を加算した数値を、章ページ番号として記憶する(ステップS911)。   Next, the missing completion unit 50 stores the character string data read in step S 905 as a chapter character string in association with “Chapter Index” (step S 910), and in association with “Chapter Index”. A numerical value obtained by adding "1" to the current "Page Index" is stored as a chapter page number (step S911).

抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいか否かの判定を行う(ステップS912)。抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しくないと判定をした場合(ステップS912:NO)、現在の「Line Index」に「1」を加算した数字を新たに「Line Index」とし(ステップS913)、処理をステップS905に戻す。   The missing part complement unit 50 determines whether the current "Line Index" is equal to the "Line End Index" (step S912). When it is determined that the current "Line Index" is not equal to the "Line End Index" (step S912: NO), the missing part complement unit 50 newly adds a number obtained by adding "1" to the current "Line Index". To "Line Index" (step S913), and the process returns to step S905.

一方、抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいと判定した場合(ステップS912:YES)、再び、現在の「Page Index」が前記「 Page End Index」と等しいか否かの判定を行う(ステップS914)。   On the other hand, when it is determined that the current “Line Index” is equal to the “Line End Index” (step S 912: YES), the missing complement unit 50 again sets the current “Page Index” as the “Page End Index”. It is determined whether they are equal (step S914).

抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しくないと判定をした場合(ステップS914:NO)、現在の「Page Index」に「1」を加算した数字を新たに「Page Index」とし(ステップS915)、処理をステップS902に戻す。   When it is determined that the current “Page Index” is not equal to the “Page End Index” (step S 914: NO), the missing complement unit 50 newly adds a number obtained by adding “1” to the current “Page Index”. To "Page Index" (step S915), and the process returns to step S902.

一方、抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しいと判定した場合(ステップS914:YES)、斯かる第2補完の処理を終了する。   On the other hand, when it is determined that the current “Page Index” is equal to the “Page End Index” (step S 914: YES), the missing complement unit 50 ends the processing of the second complement.

以上の処理を行うことにより、図10及び図11に示した、抜け補完の処理が終了する。   By performing the above process, the process of the missing complementation shown in FIGS. 10 and 11 is completed.

再び、図3に基づく説明に戻る。   Returning to the explanation based on FIG. 3 again.

以上のようにして、抜け補完部50により、前記抜け補完の処理がされた後、CPU40は、エラーが発生したか否かを判定する(ステップS106)。   As described above, after the process of the missing complementation is performed by the missing complement unit 50, the CPU 40 determines whether an error has occurred (step S106).

例えば、前記ステップS105にて、Error Flagがセットされていれれば、CPU40はエラーが発生したと判定し(ステップS106:YES)、章抜けがある旨を前記表示部に表示する(ステップS107)。以降、処理は終了する。   For example, if the error flag is set in step S105, the CPU 40 determines that an error has occurred (step S106: YES), and displays on the display unit that there is a missing chapter (step S107). Thereafter, the process ends.

前記ステップS105にて、Error Flagがセットされていなければ、CPU40はエラーが発生していないと判定し(ステップS106:NO)、本実施の形態に係る章分けの処理は終了する。   If the error flag is not set in step S105, the CPU 40 determines that an error has not occurred (step S106: NO), and the chapter division processing according to the present embodiment ends.

以上に記載した処理によって、本実施の形態においては、斯かる原稿画像データに対して、簡単、かつ、適確に、章毎に章情報(章番号、章文字列、章ページ番号等を含む。)を分けて格納することにより、章分けの処理を行うことが出来る。   According to the processing described above, in the present embodiment, the chapter image information (chapter number, chapter character string, chapter page number, etc. is included for each chapter easily and appropriately for such manuscript image data). Can be divided into chapters and stored.

更に、本発明においては、このように、章毎に分けられた章情報を用い、斯かる原稿の原稿画像データに基づく印刷(画像形成)を行う際、章と章との切り替わりに、いわゆる合い紙(特定紙)を挿入して、ユーザによる章の区別を容易にすることもできる。この際、CPU40がいわゆる挿入部としての役割をなすように構成すれば良い。また、読み取られた原稿画像データを章毎に分けて記憶し、以降における、章毎の印刷指示に対応することができる。   Furthermore, in the present invention, when printing (image formation) based on the document image data of such a document using chapter information divided into chapters in this manner, so-called matching between chapters and chapters is made. Paper (specific paper) can be inserted to facilitate user distinction of the chapters. At this time, the CPU 40 may be configured to play a role as a so-called insertion unit. Further, the read document image data can be divided into chapters and stored, and can correspond to the printing instruction for each chapter in the following.

なお、章毎に分けられた章情報を用い、章毎の題名が記載された目次を作成することも可能である。   In addition, it is also possible to create a table of contents in which titles of each chapter are described using chapter information divided into chapters.

(実施の形態2)
実施の形態1においては、最大文字サイズの検出が行われ(ステップS101)、検出された最大文字サイズを有する文字列が章表示文字列の候補として抽出され(ステップS102)、抽出された文字列から前記章情報が取得される処理を行ってから(ステップS103)、前記抜け補完の処理が施される(ステップS105)ことについて記載されている。
Second Embodiment
In the first embodiment, detection of the maximum character size is performed (step S101), and a character string having the detected maximum character size is extracted as a chapter display character string candidate (step S102), and the extracted character string The chapter information is acquired (step S103) and then the missing complement process is performed (step S105).

しかし、本発明はこれに限るものでなく、前記抜け補完の処理を省いても良い。前記抜け補完の処理を省いても、斯かる章分けの処理の妨げにならず、むしろ処理が短くなり、装置側の負担を減らすことが出来る。   However, the present invention is not limited to this, and the process of the missing complement may be omitted. Even if the omission complementing process is omitted, the chapter division process is not impeded, and the process is shortened and the burden on the apparatus can be reduced.

(実施の形態3)
また、実施の形態2においては、前記抜け補完の処理を省くことについて説明したが、本発明は以上の記載に限るものでない。
Third Embodiment
In the second embodiment, the omission of the process of the missing complement is described, but the present invention is not limited to the above description.

例えば、全Nの章からなる原稿の場合、前記抜け補完の処理は、最初の章からN−1番目章までの各ページに対する抜け補完の処理(ステップS503〜ステップS514)と、N番目(最終)章の各ページに対する抜け補完の処理(ステップS515〜ステップS518)とを含む。   For example, in the case of an original consisting of all N chapters, the missing complement process is the missing complement process (steps S503 to S514) for each page from the first chapter to the N-1th chapter, and the Nth (final And the process of missing complementation (steps S515 to S518) for each page of the chapter.

しかし、これに限るものでなく、「ステップS503〜ステップS514」の処理と、「ステップS515〜ステップS518」の処理との何れか一方、例えば、「ステップS503〜ステップS514」の処理のみを施すように構成しても良い。   However, the present invention is not limited to this, and any one of the processing of "step S503 to step S514" and the processing of "step S515 to step S518", for example, only the processing of "step S503 to step S514" You may configure it.

これによって、実施の形態3においては、処理の短縮による装置側の負担軽減と共に、章抜けの対策を図ることが出来る。   As a result, in the third embodiment, it is possible to reduce the burden on the apparatus side by shortening the processing and to take measures against the chapter omission.

本発明の実施態様1においては、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置1において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部47と、前記最大文字サイズを有する文字列を抽出する文字列抽出部48と、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部55と、前記文字列抽出部48によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部49とを備え、前記記憶部55は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。   In the first embodiment of the present invention, in the image processing apparatus 1 which performs processing of sorting document image data for documents of a plurality of pages into chapters, character recognition processing is performed on the document image data, and A character size detection unit 47 for detecting character size, a character string extraction unit 48 for extracting a character string having the maximum character size, and a chapter number pattern representing chapter division on a chapter start page A chapter information acquisition for extracting a number based on the pattern from the storage unit 55 and the extracted character string extracted by the character string extraction unit 48 and acquiring a page number related to the extracted character string from the document image data The storage unit 55 is characterized by storing the extracted character string and the page number in association with the extracted number.

本発明によれば、前記文字サイズ検出部が前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記文字列抽出部が前記最大文字サイズを有する文字列を抽出し、前記章情報取得部が前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号が記憶される。   According to the present invention, the character size detection unit performs character recognition processing on the document image data to detect a maximum character size, and the character string extraction unit extracts a character string having the maximum character size. The chapter information acquisition unit extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data and is extracted The extracted character string and the page number are stored in association with numbers.

本発明の実施態様2においては、抽出された数字が複数である場合、前記章情報取得部49によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求め、抜け数字を補完する抜け補完部50を備えることを特徴とする。   In the second embodiment of the present invention, when there are a plurality of extracted numbers, the number of missing numbers in the ascending and descending order is determined based on the numbers and page numbers acquired by the chapter information acquiring unit 49, and the remaining numbers are calculated. A feature of the present invention is to provide a missing complement unit 50 that complements.

本発明によれば、抽出された数字が複数である場合、抜け補完部は、前記章情報取得部によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求めて抜け数字を補完する。   According to the present invention, when there are a plurality of extracted numbers, the missing complement unit determines the number of the missing digits in the ascending / descending order based on the numbers and the page numbers acquired by the chapter information acquiring unit and determines the missing digits. To complement.

本発明の実施態様3においては、前記抜け補完部50は、抽出された数字が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行うことを特徴とする。   In the third embodiment of the present invention, when the number extracted is one, the missing part complementing the missing number with respect to the range defined by the page number and the final page number of the document. It is characterized by doing.

本発明によれば、抽出された数字が1つである場合、前記抜け補完部は、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行う。   According to the present invention, when the number extracted is one, the missing portion complements the missing number in a range defined by the page number and the final page number of the document.

本発明の実施態様4においては、前記文字サイズ検出部47は、各ページの一行目の文字列に対してのみ前記検出を行うことを特徴とする。   In the fourth embodiment of the present invention, the character size detection unit 47 performs the detection only on the character string on the first line of each page.

本発明によれば、前記文字サイズ検出部は、各ページの一行目の文字列に対してのみ最大文字サイズを検出する処理を行う。   According to the present invention, the character size detection unit performs processing of detecting the maximum character size only for the character string on the first line of each page.

本発明の実施態様5においては、前記文字列抽出部48は、各ページの一行目の文字列に対してのみ前記抽出を行うことを特徴とする。   In the fifth embodiment of the present invention, the character string extraction unit 48 performs the extraction only on the character string on the first line of each page.

本発明によれば、前記文字列抽出部は、各ページの一行目の文字列に対してのみ最大文字サイズを有する文字列を抽出する処理を行う。   According to the present invention, the character string extraction unit performs processing of extracting a character string having the maximum character size only for the character string on the first line of each page.

本発明の実施態様6においては、前記章情報取得部49は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする。   In the sixth embodiment of the present invention, the chapter information acquiring unit 49 searches for an extracted character string in which the first one or more characters of the extracted character string match the pattern, and the extracted character searched It is characterized in that a digit is extracted from the column that matches the chapter number included in the corresponding pattern.

本発明によれば、前記章情報取得部は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記章番号のパターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を章番号として抽出する。   According to the present invention, the chapter information acquisition unit searches for an extracted character string in which the first one or more characters of the extracted character strings match the pattern of the chapter number, and the extracted character string searched for From this, the numbers matching the chapter numbers included in the corresponding pattern are extracted as chapter numbers.

本発明の実施態様7においては、前記実施態様の何れか一つに記載の画像処理装置と、シート状の記録媒体に画像形成を行う画像形成部と、特定紙が収容されたトレイと、前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部とを備えることを特徴とする。   In an embodiment 7 of the present invention, the image processing apparatus according to any one of the above-mentioned embodiments, an image forming unit for forming an image on a sheet-like recording medium, a tray containing specific paper, and At the time of performing image formation, it is characterized by including an inserting section for inserting a specific sheet at chapter switching based on the result of the process.

本発明によれば、前記画像形成を行う際、前記挿入部は前記画像処理装置による章分別の処理の結果に基づいて、章の切り替わりに、前記トレイに収容された特定紙を挿入する   According to the present invention, when performing the image formation, the insertion unit inserts the specific sheet stored in the tray at the switching of the chapter based on the result of the chapter classification process by the image processing apparatus.

本発明の実施態様8においては、前記画像形成部は、前記章情報取得部49によって取得された抽出文字列に係る数字、ページ番号を該抽出文字列に対応付けて、前記原稿に係る目次の画像形成を行うことを特徴とする。   In the eighth embodiment of the present invention, the image forming unit associates the numeral and page number of the extracted character string acquired by the chapter information acquiring unit 49 with the extracted character string, and It is characterized in that image formation is performed.

本発明によれば、前記画像形成部は、前記原稿に係る目次の画像形成を行う。すなわち、前記章情報取得部によって取得された抽出文字列に係る数字、ページ番号が該抽出文字列に対応付けられ、目次として画像形成される。   According to the present invention, the image forming unit forms an image of a table of contents relating to the document. That is, the numbers and page numbers related to the extracted character string acquired by the chapter information acquiring unit are associated with the extracted character string, and an image is formed as a table of contents.

本発明の実施態様9においては、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部55を備えており、複数ページの原稿に係る原稿画像データに対する画像処理を行う画像処理装置1にて、章毎に分別する処理を行う章分け処理方法において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記最大文字サイズを有する文字列を抽出し、前記記憶部55に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出示文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。   In the ninth embodiment of the present invention, a storage unit 55 storing a chapter number pattern representing division of chapters at the beginning of a chapter page is provided, and image processing is performed on document image data related to a plurality of pages of documents. In the chapter division processing method of performing classification processing for each chapter in the image processing apparatus 1 for performing character recognition, character recognition processing is performed on the document image data to detect the maximum character size, and the character having the maximum character size A row is extracted, a digit is extracted from the extracted extracted character string based on the pattern stored in the storage unit 55, a page number related to the extracted indication character string is acquired from the document image data, and extracted The extracted character string and the page number are stored in association with the designated number.

本発明によれば、画像処理装置において、前記原稿画像データに対して文字認識処理が施されて最大文字サイズが検出され、前記最大文字サイズを有する文字列が抽出され、前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字が抽出され、該抽出示文字列に係るページ番号が前記原稿画像データから取得され、抽出された数字に対応付けて、前記抽出文字列及びページ番号が記憶される。   According to the present invention, in the image processing apparatus, character recognition processing is performed on the document image data to detect a maximum character size, and a character string having the maximum character size is extracted and stored in the storage unit. Based on the current pattern, a number is extracted from the extracted extracted character string, a page number related to the extracted indication character string is acquired from the document image data, and the extracted character string is associated with the extracted digit. And the page number is stored.

1 複写機
40 CPU
44 画像形成制御部
47 文字サイズ検出部
48 文字列抽出部
49 章情報取得部
50 抜け補完部
55 ハードディスク
210 画像形成部
43 画像準備制御部
1 copier 40 CPU
44 image formation control unit 47 character size detection unit 48 character string extraction unit 49 chapter information acquisition unit 50 missing complement unit 55 hard disk 210 image formation unit 43 image preparation control unit

Claims (9)

複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置において、
前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部と、
前記最大文字サイズを有する文字列を抽出する文字列抽出部と、
章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部と、
前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部とを備え、
前記記憶部は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする画像処理装置。
In an image processing apparatus that performs processing of sorting document image data related to documents of a plurality of pages for each chapter,
A character size detection unit that performs character recognition processing on the document image data and detects a maximum character size;
A character string extraction unit that extracts a character string having the maximum character size;
A storage section that stores a chapter number pattern representing a chapter division on the chapter start page,
And a chapter information acquisition unit that extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data;
The image processing apparatus, wherein the storage unit stores the extracted character string and the page number in association with the extracted number.
抽出された数字が複数である場合、前記章情報取得部によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求め、抜け数字を補完する抜け補完部を備えることを特徴とする請求項1に記載の画像処理装置。   When the number extracted is plural, the number of missing numbers in the ascending and descending order is obtained based on the numbers and page numbers acquired by the chapter information acquiring portion, and a missing value complementing portion that complements the missing numbers is provided. The image processing apparatus according to claim 1, wherein 前記抜け補完部は、抽出された数字が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行うことを特徴とする請求項2に記載の画像処理装置。   The missing part complementing part performs complementing of the missing number with respect to a range defined by the page number and the last page number of the document when the extracted number is one. The image processing apparatus according to claim 1. 前記文字サイズ検出部は、各ページの一行目の文字列に対してのみ前記検出を行うことを特徴とする請求項1から3の何れか一つに記載の画像処理装置。   The image processing apparatus according to any one of claims 1 to 3, wherein the character size detection unit performs the detection only on the character string on the first line of each page. 前記文字列抽出部は、各ページの一行目の文字列に対してのみ前記抽出を行うことを特徴とする請求項1から4の何れか一つに記載の画像処理装置。   The image processing apparatus according to any one of claims 1 to 4, wherein the character string extraction unit performs the extraction only on the character string on the first line of each page. 前記章情報取得部は、
前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、
検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする請求項1から5の何れか一つに記載の画像処理装置。
The chapter information acquisition unit
Searching for an extracted character string in which the first one or more characters of the extracted character string match the pattern;
The image processing apparatus according to any one of claims 1 to 5, wherein a number matching the chapter number included in the corresponding pattern is extracted from the extracted extracted character string.
請求項1から6の何れか一つに記載の画像処理装置と、
シート状の記録媒体に画像形成を行う画像形成部と、
特定紙が収容されたトレイと、
前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部と
を備えることを特徴とする画像形成装置。
An image processing apparatus according to any one of claims 1 to 6.
An image forming unit for forming an image on a sheet-like recording medium;
A tray containing specific paper,
An image forming apparatus comprising: an inserting section for inserting a specific sheet at chapter switching based on a result of the processing when forming the image.
前記画像形成部は、前記章情報取得部によって取得された抽出文字列に係る数字、ページ番号を該抽出文字列に対応付けて、前記原稿に係る目次の画像形成を行うことを特徴とする請求項7に記載の画像形成装置。   The image forming unit performs image formation of a table of contents related to the document by associating numbers and page numbers related to the extracted character string acquired by the chapter information acquiring unit with the extracted character string. Item 8. An image forming apparatus according to item 7. 章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部を備えており、複数ページの原稿に係る原稿画像データに対する画像処理を行う画像処理装置にて、章毎に分別する処理を行う章分け処理方法において、
前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、
前記最大文字サイズを有する文字列を抽出し、
前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、
抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする章分け処理方法。
The image processing apparatus is provided with a storage unit that stores a chapter number pattern indicating chapter divisions at the beginning of a chapter page, and performs image processing on original image data related to a plurality of pages of original In the chapter division processing method that performs processing to separate
Character recognition processing is performed on the document image data to detect a maximum character size,
Extract a string having the maximum character size,
Based on the pattern stored in the storage unit, a number is extracted from the extracted extracted character string, and a page number related to the extracted character string is acquired from the document image data,
And storing the extracted character string and the page number in association with the extracted number.
JP2015166217A 2015-08-25 2015-08-25 Image processing apparatus, image forming apparatus, and chapter division processing method Active JP6545573B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015166217A JP6545573B2 (en) 2015-08-25 2015-08-25 Image processing apparatus, image forming apparatus, and chapter division processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015166217A JP6545573B2 (en) 2015-08-25 2015-08-25 Image processing apparatus, image forming apparatus, and chapter division processing method

Publications (2)

Publication Number Publication Date
JP2017045203A JP2017045203A (en) 2017-03-02
JP6545573B2 true JP6545573B2 (en) 2019-07-17

Family

ID=58210212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015166217A Active JP6545573B2 (en) 2015-08-25 2015-08-25 Image processing apparatus, image forming apparatus, and chapter division processing method

Country Status (1)

Country Link
JP (1) JP6545573B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6638830B2 (en) * 2017-07-03 2020-01-29 京セラドキュメントソリューションズ株式会社 Document reading device

Also Published As

Publication number Publication date
JP2017045203A (en) 2017-03-02

Similar Documents

Publication Publication Date Title
JP7309416B2 (en) Image forming apparatus, image forming method, and program
JP7309417B2 (en) Image forming apparatus, image forming method, and program
JP2024029230A (en) Image forming device and information processing device
JP2013074609A (en) File name creation apparatus and file name creation program
US5940583A (en) Image forming apparatus
US11570310B2 (en) Inspection device for correcting read image data that does not satisfy predetermined criterion, image forming apparatus, and non-transitory computer readable medium storing inspection
US10063742B2 (en) Integrated circuit, image processing apparatus, and image forming apparatus that selects density conversion information according to a selected image processing method
JP6545573B2 (en) Image processing apparatus, image forming apparatus, and chapter division processing method
US7933034B2 (en) Image data processing circuit and image forming apparatus having the same
JP2016149600A (en) Image forming apparatus
US11997234B2 (en) Inspection device for inspecting quality of printed images
US20090303503A1 (en) Image forming apparatus performing image formation suitable for adding information in handwriting or the like
JP3850220B2 (en) Image forming method, recording medium, and image forming apparatus
JP2002288169A (en) Image forming device
US20150373220A1 (en) Image processing apparatus and image processing system
JP2008206069A (en) Image data retrieving method and system therefor
JP4791032B2 (en) Image forming apparatus and image forming method
JP2011004356A (en) Image forming apparatus
JP7421376B2 (en) Image forming device and information processing device
JP4282026B2 (en) Image forming apparatus
JP3953720B2 (en) Image forming apparatus
JP5802782B2 (en) Mark detection device
JP2013211708A (en) Image forming device
JP2020106554A (en) Printing device
JP2021045922A (en) Image forming apparatus, information processing method and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180323

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190619

R150 Certificate of patent or registration of utility model

Ref document number: 6545573

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150