JP6545573B2 - Image processing apparatus, image forming apparatus, and chapter division processing method - Google Patents
Image processing apparatus, image forming apparatus, and chapter division processing method Download PDFInfo
- Publication number
- JP6545573B2 JP6545573B2 JP2015166217A JP2015166217A JP6545573B2 JP 6545573 B2 JP6545573 B2 JP 6545573B2 JP 2015166217 A JP2015166217 A JP 2015166217A JP 2015166217 A JP2015166217 A JP 2015166217A JP 6545573 B2 JP6545573 B2 JP 6545573B2
- Authority
- JP
- Japan
- Prior art keywords
- chapter
- character string
- extracted
- unit
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
本発明は、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置、画像形成装置及び章分け処理方法に関する。 The present invention relates to an image processing apparatus, an image forming apparatus, and a chapter division processing method which perform processing of sorting document image data relating to documents of a plurality of pages into chapters.
従来、複数ページからなり、複数の章からなる原稿を読み取り、読み取った原稿画像データから印刷物、電子文書を作成できる画像形成装置が開示されている。 2. Description of the Related Art Conventionally, an image forming apparatus capable of reading a document consisting of a plurality of pages and having a plurality of chapters and creating printed matter and an electronic document from the read document image data is disclosed.
例えば、特許文献1においては、章分け箇所の候補を、以下の1つ以上の条件の組み合わせで抽出する画像形成装置が開示されている。
(1)原稿画像内の行の文字サイズがユーザの指定した文字サイズより大きいときに、該行を章分け箇所の候補とする。
(2)原稿画像内の空白行数がユーザの指定した空白行数より大きいときに、空白行の次の行を章分け箇所の候補とする。
(3)ユーザの指定したページ番号に合致した原稿画像内の先頭行を章分け箇所の候補とする。
(4)原稿画像内の行の文字列にユーザの指定した文字列含むときに、当該行を章分け箇所の候補とする。
(5)原稿画像内のユーザの指定した行を章分け箇所の候補とする。
For example,
(1) When the character size of the line in the document image is larger than the character size designated by the user, the line is made a chapter division candidate.
(2) When the number of blank lines in the document image is larger than the number of blank lines specified by the user, the line following the blank line is set as a candidate for division into chapters.
(3) The first line in the document image matching the page number designated by the user is set as a chapter division candidate.
(4) When the character string of the line in the document image includes the character string designated by the user, the line is set as a chapter division candidate.
(5) A line designated by the user in the document image is used as a chapter division candidate.
しかしながら、特許文献1の画像形成装置は、何れの条件においてもユーザが条件を設定する必要があり、ユーザ使用性、利便性として煩雑さを伴うが故、ユーザが簡易に使用することが難しいという問題がある。
However, in the image forming apparatus of
また、特許文献1の画像形成装置は、章分けを行う処理を開示するのみであって、章分けした結果の利用については、言及されていない。
Further, the image forming apparatus of
本発明は、斯かる事情に鑑みてなされたものであり、その目的とするところは、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う場合において、該原稿に係る原稿画像データに対して、簡単、かつ、適確に、章毎に分別する章分けの処理を行うことが出来る画像処理装置、画像形成装置及び章分け処理方法を提供することにある。 The present invention has been made in view of such circumstances, and the object of the present invention is to separate original image data relating to a plurality of pages of an original image data into chapters in the case of performing sorting for each chapter. It is an object of the present invention to provide an image processing apparatus, an image forming apparatus, and a chapter division processing method capable of performing processing of chapter division for sorting into chapters easily and appropriately with respect to such document image data.
本発明に係る画像処理装置は、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部と、前記最大文字サイズを有する文字列を抽出する文字列抽出部と、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部と、前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部とを備え、前記記憶部は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。 The image processing apparatus according to the present invention performs character recognition processing on the document image data in an image processing apparatus that performs processing to separate document image data related to documents of a plurality of pages for each chapter, and the maximum character size A character size detection unit that detects a size, a character string extraction unit that extracts a character string having the maximum character size, and a storage unit that stores a chapter number pattern representing a chapter division on a chapter start page And a chapter information acquisition unit which extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data; The storage unit is characterized by storing the extracted character string and the page number in association with the extracted number.
本発明に係る画像処理装置は、抽出された数字が複数である場合、前記章情報取得部によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求め、抜け数字を補完する抜け補完部を備えることを特徴とする。 In the image processing apparatus according to the present invention, when there are a plurality of extracted numbers, the number of missing numbers in the ascending and descending order is obtained based on the numbers and page numbers acquired by the chapter information acquiring unit, and the missing numbers are complemented. It has a missing part complementing part.
本発明に係る画像処理装置は、前記抜け補完部は、抽出された数字が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行うことを特徴とする。 In the image processing apparatus according to the present invention, when the number of extracted numerals is one, the missing complement unit complements the missing numerals with respect to a range defined by the page number and the final page number of the document. It is characterized by doing.
本発明に係る画像処理装置は、前記文字サイズ検出部は、各ページの一行目の文字列に対してのみ前記検出を行うことを特徴とする。 The image processing apparatus according to the present invention is characterized in that the character size detection unit performs the detection only for the character string on the first line of each page.
本発明に係る画像処理装置は、前記文字列抽出部は、各ページの一行目の文字列に対してのみ前記抽出を行うことを特徴とする。 The image processing apparatus according to the present invention is characterized in that the character string extraction unit performs the extraction only on the character string on the first line of each page.
本発明に係る画像処理装置は、前記章情報取得部は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする。 In the image processing apparatus according to the present invention, the chapter information acquisition unit searches for an extracted character string in which the first one or more characters of the extracted character strings match the pattern, and the extracted character string is searched , And a digit corresponding to the chapter number included in the corresponding pattern is extracted.
本発明に係る画像形成装置は、請求項1から6の何れか一つに記載の画像処理装置と、シート状の記録媒体に画像形成を行う画像形成部と、特定紙が収容されたトレイと、前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部とを備えることを特徴とする。
An image forming apparatus according to the present invention comprises an image processing apparatus according to any one of
本発明に係る画像形成装置は、前記画像形成部は、前記章情報取得部によって取得された抽出文字列に係る数字、ページ番号を該抽出文字列に対応付けて、前記原稿に係る目次の画像形成を行うことを特徴とする。 In the image forming apparatus according to the present invention, the image forming unit associates the number and page number related to the extracted character string acquired by the chapter information acquiring unit with the extracted character string, and the image of the table of contents related to the document It is characterized by performing formation.
本発明に係る章分け処理方法は、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部を備えており、複数ページの原稿に係る原稿画像データに対する画像処理を行う画像処理装置にて、章毎に分別する処理を行う章分け処理方法において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記最大文字サイズを有する文字列を抽出し、前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。 A chapter division processing method according to the present invention includes a storage unit storing a chapter number pattern representing division of a chapter on a page at the beginning of a chapter, and performs image processing on document image data related to a plurality of pages of documents In the chapter division processing method of performing classification processing for each chapter in an image processing apparatus for performing character recognition, character recognition processing is performed on the document image data to detect a maximum character size, and a character string having the maximum character size Are extracted, a number is extracted from the extracted character string based on the pattern stored in the storage unit, a page number related to the extracted character string is obtained from the document image data, and the extracted number is extracted. And storing the extracted character string and the page number.
本発明によれば、原稿画像データに対して、簡単、かつ、適確に、章分けの処理を行うことが出来る。 According to the present invention, it is possible to perform chapter division processing easily and properly on original image data.
以下に、本発明の実施の形態に係る画像処理装置及び画像形成装置を、いわゆる複写機に適用した場合を例として、図面に基づいて詳述する。 Hereinafter, an image processing apparatus and an image forming apparatus according to an embodiment of the present invention will be described in detail based on the drawings, taking as an example a case where it is applied to a so-called copying machine.
(実施の形態1)
図1は本実施の形態に係るデジタルカラー複写機の構成を示す縦断面図である。複写機1の上面には、原稿台111及び後述する操作パネルが設けられ、複写機1の内部に画像読取部110及び画像形成部210が設けられている。
FIG. 1 is a longitudinal sectional view showing the configuration of a digital color copying machine according to the present embodiment. A document table 111 and an operation panel to be described later are provided on the upper surface of the
原稿台111の上面には該原稿台111に対して開閉可能な状態で支持され、両面自動原稿送り装置(RADF;Reversing Automatic Document Feeder)112が装着されている。 A double-sided automatic document feeder (RADF) 112 is mounted on the upper surface of the document table 111 so as to be openable / closable relative to the document table 111.
さらに、両面自動原稿送り装置112は、まず、原稿の一方の面が原稿台111の所定位置において画像読取部110に対向するよう原稿を搬送し、この際、斯かる面の画像の読み取りが行われる。この一方の面についての画像読み取りが終了した後、両面自動原稿送り装置112は他方の面が原稿台111の所定位置において画像読取部110に対向するよう原稿を反転し、原稿台111の所定位置に向かって搬送し、斯かる面に対する画像形成が行われる。そして、両面自動原稿送り装置112は、1枚の原稿について両面の画像読み取りが終わった後、この原稿を排出し、次の原稿についても同様に両面搬送動作を実行する。以上の両面自動原稿送り装置112の動作は、複写機全体の動作に関連して制御されるものである。
Furthermore, the double-sided
画像読取部110は、両面自動原稿送り装置112により原稿台111上の所定位置に搬送される原稿の画像を読み取るために、原稿台111の下方に配置されている。また、画像読取部110は該原稿台111の下面に沿って平行に往復移動する(原稿台111上に置かれた原稿を読み取る場合)原稿走査体113、114と、光学レンズ115と、光電変換素子であるCCDラインセンサ116とを有している。
The
原稿走査体113、114は、第1の走査ユニット113と第2の走査ユニット114とから構成されている。第1の走査ユニット113は原稿の表面を露光する露光ランプと、原稿からの反射光像を所定の方向に向かって偏向する第1ミラーとを有し、原稿台111上に原稿が置かれた場合には、原稿台111の下面に対して一定の距離を保ちながら所定の走査速度で平行に往復移動するものである。また、両面自動原稿送り装置112にて原稿が搬送され、原稿が読み取られる場合には、所定位置で停止している。
The
第2の走査ユニット114は、第1の走査ユニット113の前記第1ミラーにより偏向された原稿からの反射光像をさらに所定の方向に向かって偏向する第2及び第3ミラーとを有し、原稿台111上に原稿が置かれた場合には、第1の走査ユニット113と一定の速度関係を保って平行に往復移動する。
The
光学レンズ115は、第2の走査ユニット114の前記第3ミラーにより偏向された原稿からの反射光像を縮小し、縮小された光像をCCDラインセンサ116上の所定位置に結像させる。
The
CCDラインセンサ116は、結像された光像を順次光電変換して電気信号として出力する。CCDラインセンサ116は、白黒画像又はカラー画像を読み取り、R(赤)、G(緑)、B(青)の各色成分に色分解したラインデータを出力することのできる3ラインのカラーCCDである。
The
次に、画像形成部210の構成、及び画像形成部210に係わる各部の構成について説明する。
画像形成部210の下方には、用紙トレイ内に積載収容されている記録用紙Pを1枚ずつ分離して画像形成部210に向かって供給する給紙機構211a〜211cが設けられている。そして1枚ずつ分離供給された記録用紙Pは、画像形成部210の手前に配置された一対のレジストローラ212によりタイミングが制御されて画像形成部210に搬送される。さらに、片面に画像が形成された記録用紙Pは、画像形成部210の画像形成にタイミングを合わせて画像形成部210に再供給搬送される。
Next, the configuration of the
Below the
また、画像形成部210の下方には、転写搬送ベルト機構213が配置されている。転写搬送ベルト機構213は、駆動ローラ214と従動ローラ215との間に略平行に伸びるように張架された転写搬送ベルト216に記録用紙Pを静電吸着させて搬送する。そして、転写搬送ベルト216の下側に近接して、パターン画像検出ユニットが設けられている。
Further, below the
さらに、用紙搬送路における転写搬送ベルト機構213の下流側には、記録用紙P上に転写形成されたトナー像を記録用紙P上に定着させるための定着装置217が配置されている。この定着装置217の一対の定着ローラ間を通過した記録用紙Pは、搬送方向切り換えゲート218を経て、排出ローラ219により複写機1の外側に取り付けられている排紙トレイ220上に排出される。
Further, on the downstream side of the transfer
切り換えゲート218は、定着後の記録用紙Pの搬送経路を、排紙トレイ220へ記録用紙Pを排出する経路と、画像形成部210に向かって記録用紙Pを再供給する経路との間で選択的に切り換えるものである。切り換えゲート218により再び画像形成部210に向かって搬送方向が切り換えられた記録用紙Pは、スイッチバック搬送経路221を介して表裏反転された後、画像形成部210へと再度供給される。
The switching
また、画像形成部210における転写搬送ベルト216の上方には、転写搬送ベルト216に近接して、第1の画像形成ステーションPa、第2の画像形成ステーションPb、第3の画像形成ステーションPc、及び第4の画像形成ステーションPdが、用紙搬送経路の上流側から順に並設されている。
The first image forming station Pa, the second image forming station Pb, the third image forming station Pc, and the
転写搬送ベルト216は駆動ローラ214によって、図1において矢印Zで示す方向に摩擦駆動され、上述したように給紙機構211a〜211cを通じて給送される記録用紙Pを担持し、記録用紙Pを画像形成ステーションPa〜Pdへと順次搬送する。
The
各画像ステーションPa〜Pdは、実質的に同一の構成を有している。各画像ステーションPa、Pb、Pc、Pdは、図1に示す矢印F方向に回転駆動される感光体ドラム222a、222b、222c、及び222dを夫々含んでいる。
Each of the image stations Pa to Pd has substantially the same configuration. Each of the image stations Pa, Pb, Pc, and Pd includes
各感光体ドラム222a〜222dの周辺には、感光体ドラム222a〜222dを夫々一様に帯電する帯電器223a、223b、223c、223dと、感光体ドラム222a〜222d上に形成された静電潜像を夫々現像する現像装置224a、224b、224c、224dと、現像された感光体ドラム222a〜222d上のトナー像を記録用紙Pへ転写する転写用放電器225a、225b、225c、225dと、感光体ドラム222a〜222d上に残留するトナーを除去するクリーニング装置226a、226b、226c、226dとが感光体ドラム222a〜222dの回転方向に沿って順次配置されている。
Around the
また、各感光体ドラム222a〜222dの上方には、レーザビームスキャナユニット227a、227b、227c、227dが夫々設けられている。レーザビームスキャナユニット227a〜227dは、画像データに応じて変調されたドット光を発する半導体レーザ素子(図示せず)、半導体レーザ素子からのレーザビームを主走査方向に偏向させるためのポリゴンミラー240a〜240dと、ポリゴンミラー240a〜240dにより偏向されたレーザビームを感光体ドラム222a〜222d表面に結像させるためのfθレンズ241a〜241d、ミラー242a〜242d、243a〜243dなどから構成されている。
Laser
レーザビームスキャナ227aにはカラー原稿画像の黒色成分像に対応する画素信号が、レーザビームスキャナ227bにはカラー原稿画像のシアン色成分像に対応する画素信号が、レーザビームスキャナ227cにはカラー原稿画像のマゼンタ色成分像に対応する画素信号が、そして、レーザビームスキャナ227dにはカラー原稿画像のイエロー色成分像に対応する画素信号が夫々入力される。
The
これにより色変換された原稿画像情報に対応する静電潜像が各感光体ドラム222a〜222d上に形成される。そして、現像装置224aには黒色のトナーが、現像装置224bにはシアン色のトナーが、現像装置224cにはマゼンタ色のトナーが、現像装置224dにはイエロー色のトナーが夫々収容されており、感光体ドラム222a〜222d上の静電潜像は、これら各色のトナーにより現像される。これにより、画像形成部210にて色変換された原稿画像情報が各色のトナー像として再現される。
Thus, electrostatic latent images corresponding to the color-converted original image information are formed on the respective
また、第1の画像形成ステーションPaと給紙機構211aとの間には用紙吸着用帯電器228が設けられており、この吸着用帯電器228は転写搬送ベルト216の表面を帯電させ、給紙機構211aから供給された記録用紙Pは、転写搬送ベルト216上に確実に吸着させた状態で第1の画像形成ステーションPaから第4の画像形成ステーションPdの間をずれることなく搬送させる。
In addition, a
一方、第4の画像ステーションPdと定着装置217との間で駆動ローラ214のほぼ真上部には除電器229が設けられている。除電器229には搬送ベルト216に静電吸着されている記録用紙Pを転写搬送ベルト216から分離するための交流電流が印加されている。
On the other hand, a
上記構成の複写機1においては、記録用紙Pとしてカットシート状の紙が使用される。この記録用紙Pは、給紙トレイから送り出されて給紙機構211a〜211cの給紙搬送経路のガイド内に供給されると、その記録用紙Pの先端部分がセンサ(図示せず)にて検知され、このセンサから出力される検知信号に基づいて一対のレジストローラ212により一旦停止される。
In the copying
そして、記録用紙Pは各画像ステーションPa〜Pdとタイミングをとって図1の矢印Z方向に回転している転写搬送ベルト216上に送られる。このとき転写搬送ベルト216には前述したように吸着用帯電器228により所定の帯電が施されているので、記録用紙Pは、各画像ステーションPa〜Pdを通過する間、安定して搬送供給が行われるようになる。
Then, the recording sheet P is sent onto the
各画像ステーションPa〜Pdにおいては、各色のトナー像が、夫々形成され、転写搬送ベルト216により静電吸着されて搬送される記録用紙Pの支持面上で重ね合わされる。第4の画像ステーションPdによる画像の転写が完了すると、記録用紙Pは、その先端部分から順次、除電用放電器により転写搬送ベルト216上から剥離され、定着装置217へと導かれる。最後に、トナー画像が定着された記録用紙Pは、用紙排出口(図示せず)から排紙トレイ220上へと排出される。
In each of the image stations Pa to Pd, toner images of the respective colors are respectively formed, and are superimposed on the supporting surface of the recording paper P which is electrostatically attracted and conveyed by the
なお、上述の説明ではレーザビームスキャナユニット227a〜227dによって、レーザビームを走査して露光することにより、感光体への光書き込みを行なう。しかし、レーザビームスキャナユニットの代わりに、発光ダイオードアレイと結像レンズアレイからなる書き込み光学系(LEDヘッド)を用いても良い。LEDヘッドはレーザビームスキャナユニットに比べ、サイズも小さく、また可動部分がなく無音である。よって、複数個の光書き込みユニットを必要とするタンデム方式のデジタルカラー複写機などの画像形成装置では、好適に用いることができる。
In the above description, the laser beam is scanned and exposed by the laser
図2は本実施の形態に係る複写機1の装置全体の各部を制御する制御系を説明する機能ブロック図である。複写機1は制御部4を備えており、制御部4は、CPU40(挿入部)と、RADF制御部41と、スキャナ制御部42と、画像準備制御部43と、画像形成制御部44と、給紙トレイ制御部45と、後処理制御部46、文字サイズ検出部47、文字列抽出部48、章情報取得部49、及び、抜け補完部50とを有している。
FIG. 2 is a functional block diagram for explaining a control system that controls each part of the entire apparatus of the copying
画像準備制御部43は、原稿読み取り部110の制御を行うスキャナ制御部42、一時的に印刷すべき画像を記憶する画像メモリ53、レーザビームスキャナユニット227a〜227dの制御を行う露光制御部51、画像データ蓄積用のハードディスク55など、複写機1を構成する印刷画像準備用の各ユニットをシーケンス制御により管理すると共に、フィルタ処理、変倍処理、マスキング処理、ガンマ処理などの画像処理を行う。また、画像形成制御部44と通信を行い、連携することで印刷ジョブの実行を行う。
The image
さらに画像形成制御部44には、給紙機構211a、211b、211cの制御を行う給紙トレイ制御部45、後処理の制御を行う後処理制御部46と相互通信可能な状態で接続されており、エンジン負荷部56のセンサを入力し、モーター等を出力制御し、各所を統轄的にシーケンス制御することで、印刷画像を形成するように動作している。
Further, the image
スキャナ制御部42は、CCDラインセンサ116から原稿画像信号を受け取り、画像準備制御部43に送るともに、両面自動原稿送り装置(RADF)と通信し、原稿送り制御を行わせる。また、スキャナ制御部42は、原稿読み取り部110のモーター、ソレノイド等からなるスキャナ負荷部52に対するシーケンス制御を行うための制御信号を出力するとともに、表示部、該表示部を覆うタッチパネル、テンキー等からなる操作パネルを構成する操作基板ユニット54と通信を行って、操作状況のモニタ、各種の表示制御を行う。
The
複写機1全体の処理の流れを両面自動原稿送り装置112を使用したコピーの場合を例にとり説明する。
The flow of processing of the entire copying
ユーザは、複写機1の両面自動原稿送り装置112に原稿を載置し、前記操作パネルを適宜操作することにより、コピーに係る設定を受け付ける設定画面を前記表示部に表示させ、コピー枚数等を設定した後、スタートキーを操作することによりコピーの開始を指示する。
The user places an original on the duplex
スキャナ制御部42は、画像読取部110の第1の走査ユニット113を両面自動原稿送り装置112から搬送される原稿を読み取るための所定位置へ移動させ、両面自動原稿送り装置112により搬送される原稿の読み取りを開始する。
The
この際、CCDラインセンサ116では、それを色分解してRGBのアナログ画像信号を得る。更に該アナログ画像信号に対して、スキャナ制御部42でデジタル信号への変換を行う。スキャナ制御部42に送られ、デジタル信号に変換された画像データ(原稿画像データ)は、画像準備制御部43へ送られ、画像メモリ53へ格納され、画像メモリ53へ格納された画像データは順次ハードディスク55へ一旦格納される。また、これと同時に、画像準備制御部43は、印刷のための画像データ(印刷画像データ)が格納されたことを画像形成制御部44へ順次通知する。
At this time, the
画像形成制御部44は、印刷を行うための印刷画像データの要求を画像準備制御部43に対し順次行い、画像準備制御部43は、要求された印刷画像データをハードディスク55から順次読み出し、画像メモリ53へ格納後、フィルタ処理、変倍処理、マスキング処理、ガンマ処理、多値化処理という順に画像処理を行う。この後、画像準備制御部43は露光制御部51へ印刷画像データを転送し、画像形成制御部44へ印刷を行うための印刷画像データが転送完了したことを通知する。
The image
画像形成制御部44は、画像準備制御部43からの印刷画像データの転送完了の通知を受け、印字を開始する。画像形成部210の印字処理スピードが、画像読取部110の原稿読み取り速度より遅くなる場合においては、ハードディスク55に読み取られた画像データが格納されて行くだけで、印刷処理に伴って、順次画像データがハードディスク55から読み出され、画像処理された後に印刷が行われることになる。
The image
文字サイズ検出部47は前記原稿画像データに対してページ毎に文字認識処理を施し、該原稿画像データの最大文字サイズを検出する。また、文字サイズ検出部47は該原稿画像データに対してページ毎に、公知のOCR処理を施し、パターン・マッチング法によって、原稿画像データの各ページの文字認識を行う。この際、文字サイズ検出部47は、前記原稿画像データ(以下、原稿とも言う。)の各ページの一行目の文字列に対してのみ、最大文字サイズの検出を行う。
The character
すなわち、一般に、章初めのページには、斯かる章の区分を表す章番号及びタイトルが含まれた見出しが、当該章を表す章表示文字列として、最上側に、大きな文字にて記載されている。斯かる章表示文字列としては、例えば、「第X章○○○○」、「ChapterX○○○○」、「#X○○○○」、「X;○○○○」、「X.○○○○」等が例に挙げられる。ここで、「X」は、整数を表す文字であり、例えば、アラビア数字、漢数字、ローマ数字等を含む。なお、「○○○○」は当該章のタイトルである。 That is, generally, on the beginning of a chapter, a heading including a chapter number representing the division of the chapter and a title is described in large letters at the top of the chapter display character string representing the chapter. There is. As such chapter display character strings, for example, “Chapter X XX”, “Chapter X XX”, “# X XX”, “X; XXX”, “X. "○○○○" etc. may be mentioned as an example. Here, “X” is a letter representing an integer, and includes, for example, Arabic numerals, Chinese numerals, Roman numerals and the like. Note that "○○○○" is the title of the chapter.
従って、このように、各ページの一行目の文字列に対してのみ、斯かる検出を行うことによって、一層効率的に、後述する章表示文字列の抽出、章分けの処理等を行うことが出来る。 Therefore, as described above, by performing such detection only for the character string on the first line of each page, it is possible to more efficiently extract the chapter display character string to be described later, perform chapter division processing, etc. It can.
文字列抽出部48は、前記原稿画像データから、文字サイズ検出部47によって検出された最大文字サイズを有する文字列を、前記章表示文字列の候補として、抽出する。より詳しくは、文字列抽出部48は、前記原稿画像データの各ページの一行目の文字列に対してのみ、最大文字サイズを有する文字列の抽出を行い、抽出された章表示文字列の候補(以下、候補文字列と言う。)をハードディスク55に記憶する。従って、各ページの全ての文字列に対して、斯かる抽出を行う場合に比べ、上述したように、効率的に章表示文字列の抽出、章分けの処理等が可能となる。
The character
章情報取得部49は前記候補文字列に含まれる数字を割り出し(抽出)、該候補文字列が記載されているページ番号(以下、章ページ番号)を前記原稿画像データから取得する。このような処理は、章表示文字列に含まれる章番号のパターンに基づいて行われ、該章番号のパターンはハードディスク55に記憶されている。
The chapter
より詳しくは、章情報取得部49は、先ず、文字列抽出部48によって抽出された候補文字列のうち、冒頭の一つ又は複数の文字が前記章番号のパターンと一致する候補文字列を検出する。次に、章情報取得部49は、検出された候補文字列から、該候補文字列に対応する前記章番号のパターンに係る章番号と一致する数字を章番号として割り出す。章情報取得部49は、このように割り出した章番号をIndexとし、該章番号に関連付けて斯かる文字列及び対応する章ページ番号をハードディスク55に記憶する。以下においては、前記章番号、該章番号に対応する文字列(以下、章文字列とも言う)、及び章ページ番号を章情報ともいう。また、前記章番号のパターンについては、後で詳しく説明する。
More specifically, the chapter
また、抜け補完部50は、各ページの一行目以外の箇所に、章表示文字列(章番号)が存在するかを確認することにより、検出が出来なかった章表示文字列(章番号)があれば補完を行う。より詳しくは、抜け補完部50は、先ず、章情報取得部49によって割り出された数字(章番号)が、1つであるか、複数であるかの判断を行う。次に、抜け補完部50は、割り出された数字が複数である場合、昇順又は降順における抜け数字、すなわち、抜けた章番号(以下、抜け章番号と言う。)の数を求め、抜け章番号を補完(抜け数字の補完)する処理を行う。以下、斯かる処理を抜け補完の処理とも言う。また、抜け補完部50は、割り出された数字(章番号)が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、抜け章番号の補完を行う。
In addition, the missing-
CPU40は、ROM(図示せず)に予め格納されている制御プログラムをRAM(図示せず)上にロードして実行することによって、上述した各種ハードウェアの制御を行ない、装置全体を本発明の複写機1として動作させる。
The
以上のような構成を有する複写機1は、例えば、一つ又は複数の章を含む複数ページからなる原稿の原稿画像データを読み取り、章毎に分別する章分け処理を行うことが出来る。以下、詳しく説明する。
The copying
図3は本実施の形態に係る複写機1における、原稿画像データの読み取り処理及び章分けの処理を説明するフローチャートである。以下においては、ハードディスク55には前記章番号のパターン(以下、章番号パターンとも言う)、章番号文字数テーブル、及び最終 Letter Indexテーブルが記憶されているものとする。
FIG. 3 is a flow chart for explaining reading processing of document image data and chapter division processing in the copying
図4は本実施の形態に係る複写機1において、ハードディスク55に記憶された章番号のパターン、章番号文字数テーブル、及び最終 Letter Indexテーブルを概念的に表す概念図である。図4A、図4B及び図4Cは夫々章番号のパターン(章番号パターン)、章番号文字数テーブル及び最終 Letter Indexテーブルを示す。
FIG. 4 is a conceptual diagram conceptually showing the chapter number pattern, chapter number character number table, and final Letter Index table stored in the
ここで、章番号文字数テーブルは章表示文字列に含まれている章番号の構成文字数を前記章番号パターンに関連付けて列挙したものである。また、前記章番号パターンにおいては、章番号に該当する数文字が、例えば、昇順に複数パターン列挙されている。前記章番号パターンは「Chapter Pattern Index」によって確定され、該数文字は、例えば、「1」、「I」、「i」、「一」等のパターンを有する。 Here, the chapter number character table is a list of the number of characters of the chapter number contained in the chapter display character string in association with the chapter number pattern. In the chapter number pattern, several characters corresponding to the chapter number are listed, for example, in ascending order. The chapter number pattern is determined by "Chapter Pattern Index", and the several characters have, for example, patterns of "1", "I", "i", "one" and the like.
以下においては、昇順に列挙された各数文字が、「Letter Index」によって特定される。また、前記最終 Letter Indexテーブルには、各章番号パターンにおける最終の「Letter Index」が記載されている。なお、「Letter Index」は「0」から始まるものとする。 In the following, each few characters listed in ascending order are identified by "Letter Index". Further, the final "Letter Index" in each chapter number pattern is described in the final Letter Index table. Note that “Letter Index” starts from “0”.
また、以下の説明においては、説明の便宜上、全100ページであって、10章にて構成されている原稿の読み込みを行う場合であって、該原稿に章表示文字列として「第X章○○○○」が含まれているものとする。 Further, in the following description, for the sake of convenience of explanation, it is a case of reading an original consisting of 100 pages and consisting of 10 chapters. "○○○" shall be included.
まず、ユーザは、複写機1の両面自動原稿送り装置112に前記原稿を載置し、前記操作パネルを適宜操作することにより、斯かる原稿のコピーを指示する。この際、CPU40は前記操作パネルを介してユーザからコピーの指示を受け付ける。
First, the user places the original on the double-sided automatic
スキャナ制御部42はCPU40からの指示に応じて画像読取部110を制御して、前記原稿を一枚ずつ読み込み、該原稿に対する原稿画像データが得られる。このように得られた原稿画像データに対して、OCR処理が施される。
The
次いで、文字サイズ検出部47は、前記原稿画像データに対して最大文字サイズの検出を行う(ステップS101)。以下、最大文字サイズの検出の処理について詳しく説明する。
Next, the character
図5は本実施の形態に係る複写機1において、文字サイズ検出部47によって行われる最大文字サイズ検出の処理を説明するフローチャートである。以下、最大文字サイズ検出の処理について詳しく説明する。
FIG. 5 is a flow chart for explaining the process of detecting the maximum character size performed by the character
先ず、文字サイズ検出部47は変数の初期化を行う(ステップS201)。より詳しくは、原稿のページを表す変数「Page」を「1」に、最大文字サイズを表す変数「Letter Size」を「0」に初期化する。
First, the character
次いで、文字サイズ検出部47は前記原稿画像データに基づいて、前記原稿の全ページ数を取得する(ステップS202)。
Next, the character
また、文字サイズ検出部47は、前記原稿画像データから、現在の「Page」に該当するページの画像データを取得し(ステップS203)、取得された所定ページの画像データに対して、一行目の文字列の最初文字の文字サイズを検出する(ステップS204)。
Further, the character
続いて、文字サイズ検出部47は検出された文字サイズが「Letter Size」に対応する文字サイズより大きいか判定を行う(ステップS205)。
Subsequently, the character
文字サイズ検出部47は検出された文字サイズが「Letter Size」に対応する文字サイズより大きいと判定した場合(ステップS205:YES)、「Letter Size」に対応する文字サイズを検出された文字サイズに置き換える(ステップS206)。
If the character
ステップS206の処理後、又は、検出された文字サイズが「Letter Size」に対応する文字サイズより大きくないと判定した場合(ステップS205:NO)、文字サイズ検出部47は現在の「Page」に該当する数字が前記原稿の全ページ数と等しいか判定する(ステップS207)。
After the process of step S206, or when it is determined that the detected character size is not larger than the character size corresponding to "Letter Size" (step S205: NO), the character
現在の「Page」に該当する数字が前記原稿の全ページ数と等しくないと判定した場合(ステップS207:NO)、文字サイズ検出部47は、現在の「Page」に「1」を加算した数字を新たに「Page」とし(ステップS208)、処理を再びステップS203に戻す。
If it is determined that the number corresponding to the current "Page" is not equal to the total page number of the document (step S207: NO), the character
一方、文字サイズ検出部47によって現在の「Page」に該当する数字が前記原稿の全ページ数と等しいと判定された場合(ステップS207:YES)、最大文字サイズ検出の処理は終了する。
On the other hand, when it is determined by the character
以上の最大文字サイズ検出の処理によって、前記原稿画像データにおける、最大文字サイズ、即ち「Letter Size」が検出される。 By the above-described processing of the maximum character size detection, the maximum character size, that is, “Letter Size” in the document image data is detected.
再び、図3に基づく説明に戻る。 Returning to the explanation based on FIG. 3 again.
このようにして、ステップS101にて最大文字サイズが検出されると、続いて、文字列抽出部48は、文字サイズ検出部47によって検出された最大文字サイズを有する文字列を、章表示文字列の候補として、抽出する(ステップS102)。
Thus, when the maximum character size is detected in step S101, subsequently, the character
図6は本実施の形態に係る複写機1において、文字列抽出部48によって行われる文字列抽出の処理を説明するフローチャートである。以下、文字列抽出の処理について詳しく説明する。
FIG. 6 is a flow chart for explaining the character string extraction process performed by the character
文字列抽出部48は変数の初期化を行う(ステップS301)。より詳しくは、原稿のページを表す変数「Page」を「1」にし、変数「Index」を「0」に初期化する。
The character
次いで、文字列抽出部48は前記原稿画像データから、現在の「Page」に該当するページの画像データを取得し(ステップS302)、取得された所定ページの画像データに対して、一行目の文字列の最初文字の文字サイズを検出する(ステップS303)。
Next, the character
続いて、文字列抽出部48は、検出された文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか否かの判定を行う(ステップS304)。
Subsequently, the character
文字列抽出部48によって、検出された文字サイズが最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS304:NO)、処理はステップS309に進む。
If the character
一方、文字列抽出部48は、検出された文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS304:YES)、斯かる画像データから、一行目の文字列を抽出する(ステップS305)。
On the other hand, when the character
次いで、文字列抽出部48は、抽出された文字列(以下、抽出文字列とも言う)を前記変数「Index」に関連付けて、例えば、ハードディスク55に記憶し(ステップS306)、現在のページ番号、すなわち現在の「Page」に対応する数字を、該「Index」に関連付けて、例えば、ハードディスク55に記憶する(ステップS307)。続けて、文字列抽出部48は現在の「Index」に「1」を加算し、これを新たな「Index」とする(ステップS308)。換言すれば、ハードディスク55には各「Index」に対応付けて抽出文字列及び当該ページ番号が記憶されている。
Next, the character
ステップS308の後、文字列抽出部48は、現在の「Page」に該当する数字が前記原稿の全ページ数と等しいか判定する(ステップS309)。
After step S308, the character
現在の「Page」に該当する数字が前記原稿の全ページ数と等しくないと判定した場合(ステップS309:NO)、文字列抽出部48は、現在の「Page」に「1」を加算した数字を新たに「Page」とし(ステップS310)、処理を再びステップS302に戻す。
When it is determined that the number corresponding to the current "Page" is not equal to the total number of pages of the document (step S309: NO), the character
一方、文字サイズ検出部47によって現在の「Page」に該当する数字が前記原稿の全ページ数と等しいと判定された場合(ステップS309:YES)、文字列抽出の処理は終了する。
On the other hand, when it is determined by the character
以上の最大文字サイズ検出の処理により、前記原稿画像データにおいて、最大文字サイズ「Letter Size」を有する文字列が抽出される。 By the above-described processing of maximum character size detection, a character string having the maximum character size “Letter Size” is extracted from the document image data.
再び、図3に基づく説明に戻る。 Returning to the explanation based on FIG. 3 again.
以上のようにして、最大文字サイズが検出され、検出された最大文字サイズを有する文字列が抽出された後、章情報取得部49は前記章情報を取得する処理を行う(ステップS103)。
As described above, after the maximum character size is detected and the character string having the detected maximum character size is extracted, the chapter
図7は本実施の形態に係る複写機1において、章情報取得部49によって行われる章情報取得の処理を説明するフローチャートである。以下、章情報取得の処理について詳しく説明する。
FIG. 7 is a flowchart for explaining chapter information acquisition processing performed by the chapter
章情報取得部49は変数の初期化を行う(ステップS401)。より詳しくは、文字列抽出の処理に係る「Index」(ステップS308参照)から「1」を引いた数値を「最終Index」とする。また、変数「Chapter Pattern」を「0」に初期化し、変数「Index」を「0」に初期化し、Error Flagをリセットする。
The chapter
次いで、章情報取得部49は、現在の「Index」に対応する抽出文字列をハードディスク55から読み出し(ステップS402)、章文字パターンの検索の処理を行う(ステップS403)。
Next, the chapter
図8は本実施の形態に係る複写機1において、章情報取得部49によって行われる章文字パターンの検索の処理を説明するフローチャートである。以下、章文字パターンの検索の処理について詳しく説明する。
FIG. 8 is a flow chart for explaining a chapter character pattern search process performed by the chapter
先ず、章情報取得部49は、変数の初期化を行う(ステップS601)。より詳しくは、章情報取得部49は「Chapter Pattern」及び「Chapter Pattern Index」(図4A参照)を夫々「1」及び「0」に初期化する。
First, the chapter
次いで、章情報取得部49は、ステップS402にて読み出された抽出文字列の最初文字を抽出する(ステップS602)。また、章情報取得部49はハードディスク55に記憶された前記章番号パターンから、現在の「Chapter Pattern」に対応する「章番号に係る数文字」(図4A参照)を読み出す(ステップS603)。
Next, the chapter
章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しいか否かを判定する(ステップS604)。すなわち、前記章表示文字列として「X.○○○○」のような記載が存在する場合、最初文字「X」と、前記「章番号に係る数文字」とを比較する。
The chapter
章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しいと判定した場合(ステップS604:YES)、斯かる「Index」及び「Chapter Pattern」を関連付けて記憶して、章文字パターンの検索の処理を終了する。
When the chapter
一方、章情報取得部49は、抽出した最初文字が、読み出された「章番号に係る数文字」と等しくないと判定した場合(ステップS604:NO)、現在の「Chapter Pattern」に「1」を加算した数字を新たに「Chapter Pattern」とする(ステップS605)。
On the other hand, when the chapter
次いで、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であるか否かの判定を行う(ステップS606)。章情報取得部49は、現在の「Chapter Pattern Index」が「5」でないと判定した場合(ステップS606:NO)、現在の「Chapter Pattern Index」に「1」を加算した数字を新たに「Chapter Pattern Index」とする(ステップS607)。以降、処理はステップS603に戻る。
Next, the chapter
一方、章情報取得部49によって、現在の「Chapter Pattern Index」が「5」であると判定した場合(ステップS606:YES)、換言すれば、最初文字に対応する「章番号に係る数文字」が見つからなかった場合は、前記章表示文字列として「第X章○○○○」のような記載が存在する場合を想定した処理が行われる。すなわち、第2番目の文字に対して、章文字パターンの検索の処理を行う。
On the other hand, when it is determined by the chapter
章情報取得部49は、ステップS606にて「YES」と判定した場合、再び「Chapter Pattern Index」を「0」に初期化する(ステップS608)。
When the chapter
次いで、章情報取得部49は、ステップS402にて読み出された抽出文字列の第2番目文字を抽出する(ステップS609)。また、章情報取得部49は現在の「Chapter Pattern」に対応する「章番号に係る数文字」(図4A参照)を読み出す(ステップS610)。
Next, the chapter
章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しいか否かを判定する(ステップS611)。章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しいと判定した場合(ステップS611:YES)、斯かる「Index」及び「Chapter Pattern」を関連付けて記憶して、章文字パターンの検索の処理を終了する。
The chapter
一方、章情報取得部49は、抽出した2番目文字が、読み出された「章番号に係る数文字」と等しくないと判定した場合(ステップS611:NO)、現在の「Chapter Pattern」に「1」を加算した数字を新たに「Chapter Pattern」とする(ステップS612)。
On the other hand, when the chapter
次いで、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であるか否かの判定を行う(ステップS613)。章情報取得部49は、現在の「Chapter Pattern Index」が「5」でないと判定した場合(ステップS613:NO)、現在の「Chapter Pattern Index」に「1」を加算した数字を新たに「Chapter Pattern Index」とする(ステップS614)。以降、処理はステップS610に戻る。
Next, the chapter
一方、章情報取得部49は、現在の「Chapter Pattern Index」が「5」であると判定した場合(ステップS613:YES)、換言すれば、第2番目文字に対応する「章番号に係る数文字」も見つからなかった場合は、その旨ハードディスク55に記憶する(ステップS615)。詳しくは、章情報取得部49は「Chapter Pattern」が「0」であると記憶することにより、ステップS402で読み出された抽出文字列に対応する「章番号に係る数文字」が存在しない旨記憶する。
On the other hand, when the chapter
再び、図7に基づく説明に戻る。 It returns to the explanation based on FIG. 7 again.
このようにして、読み出された抽出文字列に対する、章文字パターンの検索の処理後、章情報取得部49は、「Chapter Pattern」が「0」であるか否かの判定を行う(ステップS404)。
In this manner, after the chapter character pattern search process is performed on the extracted extracted character string, the chapter
章情報取得部49は、「Chapter Pattern」が「0」であると判定した場合(ステップS404:YES)、すなわち、合致する「章番号に係る数文字」がない場合、現在の「Index」が前記「最終Index」と等しいか否かの判定を行う(ステップS415)。
If the chapter
章情報取得部49は現在の「Index」が前記「最終Index」と等しいと判定した場合(ステップS415:YES)、Error Flagをセットする(ステップS416)。すなわち、全ての抽出文字列が、前記「章番号に係る数文字」の何れとも合致しない場合、Error Flagをセットすることにより、その旨記憶する。
If the chapter
一方、 章情報取得部49は現在の「Index」が前記「最終Index」と等しくないと判定した場合(ステップS415:NO)、現在の「Index」に「1」を加算した数字を新たに「Index」とし(ステップS417)、処理をステップS402に戻し、次の「Index」に対しても上述した処理を施す。
On the other hand, when the chapter
しかし、章情報取得部49は、「Chapter Pattern」が「0」でないと判定した場合(ステップS404:NO)、変数「Chapter Number Next Index」を「0」に設定し(ステップS405)、「Chapter data」を初期化する(ステップS406)。ここで「Chapter data」はいわゆる2次元データである。
However, when the chapter
次いで、章情報取得部49は、現在の「Index」に対応する抽出文字列をハードディスク55から再び読み出し(ステップS407)、章番号文字合致照合の処理を行う(ステップS408)。
Next, the chapter
章情報取得部49は、斯かる章番号文字合致照合の処理において、前記章番号パターンに基づいて、章表示文字列に含まれている章番号を割り出し、該章番号をIndexとして対応する章文字列及び章ページ番号を関連付けて記憶する。
The chapter
図9は本実施の形態に係る複写機1において、章情報取得部49によって行われる章番号文字合致照合の処理を説明するフローチャートである。以下、章番号文字合致照合の処理について詳しく説明する。
FIG. 9 is a flow chart for explaining the chapter number character matching process performed by the chapter
先ず、章情報取得部49は変数の設定を行う(ステップS701)。より詳しくは、章情報取得部49は変数「Chapter Number」を「0」に設定し、変数「Letter Index」に「Chapter Number Next Index」を代入する。
First, the chapter
ここで「Letter Index」は、図4Aに示した章番号パターンの「章番号に係る数文字」における、数文字の列挙順を示すものであり、該列挙順は昇順である。また、「Chapter Number Next Index」は「0」から始まる。 Here, “Letter Index” indicates the order of enumeration of several characters in “several characters related to chapter number” of the chapter number pattern shown in FIG. 4A, and the enumeration order is in ascending order. Also, "Chapter Number Next Index" starts from "0".
章情報取得部49は、図7のステップS403にて行われた章文字パターンの検索の処理結果に基づき、当該抽出文字列に対して、「Chapter Pattern」が「6」以下であるか否かの判定を行う(ステップS702)。すなわち、最初文字が章番号に該当するか、第2番目文字が章番号に該当するかの判定を行う。
The chapter
章情報取得部49は、当該抽出文字列に対して、「Chapter Pattern」が「6」以下であると判定した場合(ステップS702:YES)、すなわち、最初文字が章番号に該当する場合、当該「Chapter Pattern」から「1」を引いた数を「Chapter Pattern Index」に代入し(ステップS703)、該「Chapter Pattern Index」及び「Letter Index」に対応する、図4Bに示す「章番号の構成文字数」をハードディスク55から読み出す(ステップS704)。
If the chapter
章情報取得部49は、当該抽出文字列に対して、前記「章番号の構成文字数」に基づいて、最初の文字から1つ又は2つの文字を抜き出す(ステップS705)。
The chapter
一方、章情報取得部49は、当該抽出文字列に対して、「Chapter Pattern」が「6」以下でないと判定した場合(ステップS702:NO)、すなわち、第2番目文字が章番号に該当する場合、当該「Chapter Pattern」から「7」を引いた数を「Chapter Pattern Index」に代入し(ステップS709)、該「Chapter Pattern Index」及び「Letter Index」に対応する、図4Bに示す「章番号の構成文字数」をハードディスク55から読み出す(ステップS710)。
On the other hand, when the chapter
章情報取得部49は、当該抽出文字列に対して、前記「章番号の構成文字数」に基づいて、第2番目の文字から1つ又は2つの文字を抜き出す(ステップS711)。以下においては、ステップS705又はステップS711にて抜き出された1つ又は2つの文字を抜き出し文字と言う。
The chapter
ステップS705又はステップS711の処理後、章情報取得部49は、当該「Chapter Pattern Index」及び前記「Letter Index」に対応する、前記章番号パターンの「章番号に係る数文字」を読み出す(ステップS706)。また、章情報取得部49は、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しいか否かを判定する(ステップS707)。
After the process of step S705 or step S711, the chapter
章情報取得部49は、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しいと判定した場合(ステップS707:YES)、現在の「Letter Index」に「1」を加算した数を「Chapter Number」として代入する(ステップS708)。これによって、章番号が割り出すことが出来る。
When the chapter
一方、 章情報取得部49によって、読み出された「章番号に係る数文字」と前記抜き出し文字とが等しくないと判定された場合(ステップS707:NO)、次の章番号と一致するか確認を行う。
On the other hand, when it is determined by the chapter
すなわち、章情報取得部49は、図4Cの最終 Letter Indexテーブルをハードディスク55から読み出し(ステップS712)、該最終 Letter Indexテーブルに基づいて、現在の「Letter Index」が最終Letter Indexと等しいか否かの判定を行う(ステップS713)。
That is, the chapter
章情報取得部49は、現在の「Letter Index」が最終Letter Indexと等しくないと判定した場合(ステップS713:NO)、現在の「Letter Index」に「1」を加算した数を新たな「Letter Index」として代入し(ステップS714)、処理をステップS702に戻す。
If the chapter
一方、 章情報取得部49は、現在の「Letter Index」が最終Letter Indexと等しいと判定した場合(ステップS713:YES)、すなわち、章番号の割り出しが出来なかった場合、「Chapter Number」を「0」のままにして斯かる章番号文字合致照合の処理を終了する。
On the other hand, if the chapter
再び、図7に基づく説明に戻る。 It returns to the explanation based on FIG. 7 again.
このようにして、読み出された抽出文字列に対する、章番号文字合致照合の処理後、章情報取得部49は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS409)。章情報取得部49は、「Chapter Number」が「0」であると判定した場合(ステップS409:YES)、処理をステップS413に進める。
Thus, after the chapter number character matching collation process on the extracted extracted character string, the chapter
一方、章情報取得部49は、「Chapter Number」が「0」でないと判定した場合(ステップS409:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS410)。
On the other hand, when the chapter
次いで、章情報取得部49は、「Chapter Index」に対応付けて、ステップS407にて読み出された抽出文字列を章文字列として、例えば、ハードディスク55に記憶し(ステップS411)、また、「Chapter Index」に対応付けて、前記抽出文字列に係るページ番号(章ページ番号)をハードディスク55に記憶する(ステップS412)。
Next, the chapter
また、章情報取得部49は現在の「Index」が「最終Index」と等しいか否かの判定を行う(ステップS413)。
Also, the chapter
章情報取得部49は現在の「Index」が前記「最終Index」と等しくないと判定した場合(ステップS413:NO)、現在の「Index」に「1」を加算した数字を新たに「Index」とし(ステップS414)、処理をステップS407に戻す。
When the chapter
一方、章情報取得部49は現在の「Index」が前記「最終Index」と等しいと判定した場合(ステップS413:YES)、処理を終了する。
以上の処理によって、章番号、該章番号に対応する章文字列及び章ページ番号を含む章情報が取得される。
On the other hand, when the chapter
By the above processing, chapter information including a chapter number, a chapter character string corresponding to the chapter number, and a chapter page number is acquired.
再び、図3に基づく説明に戻る。 Returning to the explanation based on FIG. 3 again.
以上のようにして、章情報取得部49により、前記章情報を取得する処理がされた後、CPU40は、エラーが発生したか否かを判定する(ステップS104)。
As described above, after the chapter
前記ステップS103にて、Error Flagがセットされていれば、CPU40はエラーが発生したと判定し(ステップS104:YES)、章情報がない旨を前記表示部に表示する(ステップS108)。以降、処理は終了する。
If the error flag is set in step S103, the
前記ステップS103にて、Error Flagがセットされていなければ、CPU40はエラーが発生していないと判定し(ステップS104:NO)、抜け補完部50が前記抜け補完の処理を行う(ステップS105)。
If the Error Flag is not set in step S103, the
図10及び図11は本実施の形態に係る複写機1において、抜け補完部50によって行われる抜け補完の処理を説明するフローチャートである。以下、抜け補完の処理について詳しく説明する。
FIG. 10 and FIG. 11 are flowcharts for explaining the process of the dropout complementation performed by the
抜け補完部50は変数の初期化を行う(ステップS501)。より詳しくは、最後の章を示す「Last Chapter Index」に「Chapter Index」を代入し、「Chapter Index」に「1」を設定する。また、「Start Chapter Number Index」に「1」を代入する。
The missing
次いで、抜け補完部50は、前記「Last Chapter Index」が「0」であるか否かを判定する(ステップS502)。すなわち、ステップS410にて「Chapter Index」は「Chapter Number」から「1」を引いた値であることから、斯かる判定は、斯かる原稿が章を1つ含むか又は複数含むかが判定される。
Next, the missing
抜け補完部50は、前記「Last Chapter Index」が「0」であると判定した場合(ステップS502:YES)、すなわち、章が1つである場合、処理をステップS515に進める。
If it is determined that the “Last Chapter Index” is “0” (step S 502: YES), that is, if there is one chapter, the
抜け補完部50は、前記「Last Chapter Index」が「0」でないと判定した場合(ステップS502:NO)、すなわち、章が複数である場合、抜け補完部50は現在の「Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS503)。
If it is determined that the “Last Chapter Index” is not “0” (step S 502: NO), that is, if there are a plurality of chapters, the missing
次いで、抜け補完部50は読み出した章ページ番号が「0」に等しいか否かの判定を行う(ステップS504)。換言すれば、抜け補完部50は、現在の「Chapter Index」に係る章番号に対応する章ページ番号が存在するか否かを判定する。
Next, the missing
抜け補完部50は読み出した章ページ番号が「0」に等しくないと判定した場合(ステップS504:NO)、現在の「Chapter Index」が前記「Last Chapter Index」と等しいか否かの判定を行う(ステップS505)。 If it is determined that the chapter page number read out is not equal to "0" (step S504: NO), it is determined whether or not the current "Chapter Index" is equal to the "Last Chapter Index". (Step S505).
抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定した場合(ステップS505:YES)、処理をステップS515に進める。
When it is determined that the current “Chapter Index” is equal to the “Last Chapter Index” (step S505: YES), the missing
一方、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しくないと判定した場合(ステップS505:NO)、変数「Chapter Page Start」に当該章ページ番号を代入し(ステップS506)、現在の「Chapter Index」に「1」を加算した数字を新たに「Chapter Index」とし、かつ、「Start Chapter Number Index」に「Chapter Index」を代入する(ステップS507)。以降、処理はステップS503に戻る。
On the other hand, when it is determined that the current "Chapter Index" is not equal to the "Last Chapter Index" (step S505: NO), the
しかし、ステップS504にて、抜け補完部50は、読み出した章ページ番号が「0」に等しいと判定した場合(ステップS504:YES)、換言すれば、章番号の抜けがある場合、抜けている章番号の数を表す変数「Adjust Chapter Number」に「0」を設定する(ステップS508)。
However, if it is determined in step S504 that the missing
次いで、抜け補完部50は、現在の「Adjust Chapter Number」に「1」を加算した数字を新たに「Adjust Chapter Number」とし(ステップS509)、また、現在の「Chapter Index」に「1」を加算した数字を新たに「Chapter Index」とする(ステップS510)。
Next, the
また、抜け補完部50は現在の「Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS511)。
Further, the missing
次いで、抜け補完部50は読み出した章ページ番号が「0」に等しいか否かの判定を行う(ステップS512)。換言すれば、抜け補完部50は、現在の「Chapter Index」に係る章番号に対応する章ページ番号が存在するか否かを判定する。
Next, the missing
抜け補完部50は、読み出した章ページ番号が「0」に等しいと判定した場合(ステップS512:YES)、処理をステップS509に戻し、昇順において抜けている章番号の算出を続ける。 If it is determined that the chapter page number read out is equal to “0” (step S 512: YES), the process is returned to step S 509, and calculation of the chapter number missing in ascending order is continued.
一方、抜け補完部50は、読み出した章ページ番号が「0」に等しくないと判定した場合(ステップS512:NO)、前記抜け補完に係る第1補完処理を行う(ステップS513)。
On the other hand, when it is determined that the chapter page number read out is not equal to “0” (step S 512: NO), the missing
図12及び図13は本実施の形態に係る複写機1において、抜け補完部50によって行われる第1補完の処理を説明するフローチャートである。以下、該第1補完の処理について詳しく説明する。
12 and 13 are flowcharts for explaining the process of the first complementation performed by the missing
抜け補完部50は変数の初期化を行う(ステップS801)。より詳しくは、抜け補完部50は変数「Page Index」に章の初めのページ番号である「Chapter Page Start」を代入し、最後のページを表す「Page End Index」には、次の章に係る章ページ番号から「1」を引く「Chapter Page‐1」を代入する。また、抜け補完部50は、次の章を指す「Chapter Number Next Index」に「Start Chapter Number Index」を代入する。
The missing
抜け補完部50は、前記原稿画像データから現在の「Page Index」に対応するページの画像データを読み出して、該画像データにおける行数の検出を行う(ステップS802)。
The missing
次いで、抜け補完部50は、最終行を示す「Line End Index」に、検出された行数から「1」を引いた数値を代入し(ステップS803)、また、「Line Index」に「1」を代入する(ステップS804)。すなわち、章文字列を除いて2行目から斯かる処理が行われる。
Next, the missing
また、抜け補完部50は現在の「Page Index」に対応するページの画像データを読み出して現在の「Line Index」に対応する行に係る文字列データを抽出する(ステップS805)。
Also, the missing
抜け補完部50は、抽出された文字列データの文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか判定を行う(ステップS806)。
The missing
抜け補完部50によって、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS806:NO)、処理はステップS814に進む。 If it is determined that the character size of the extracted character string data is not equal to the character size corresponding to the maximum character size “Letter Size” (step S806: NO), the process proceeds to step S814 .
一方、抜け補完部50は、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS806:YES)、抽出された文字列データに対して章情報取得部49が前記章番号文字合致照合の処理を行う(ステップS807)。章情報取得部49による章番号文字合致照合の処理については、図9にて既に説明しており、詳しい説明を省略する。
On the other hand, when it is determined that the character size of the extracted character string data is equal to the character size corresponding to the maximum character size “Letter Size” (step S806: YES), the missing
このように、章番号文字合致照合の処理後、抜け補完部50は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS808)。抜け補完部50は、「Chapter Number」が「0」であると判定した場合(ステップS808:YES)、処理をステップS814に進める。
Thus, after the chapter number character matching process, the missing
一方、抜け補完部50は、「Chapter Number」が「0」でないと判定した場合(ステップS808:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS809)。
On the other hand, when it is determined that the "Chapter Number" is not "0" (Step S808: NO), the
次いで、抜け補完部50は、「Chapter Index」に対応付けて、ステップS805にて読み出された文字列データを章文字列として、例えば、ハードディスク55に記憶し(ステップS810)、また、「Chapter Index」に対応付けて、現在の「Page Index」に「1」を加算した数値を、章ページ番号として、ハードディスク55に記憶する(ステップS811)。
Next, the missing
以上の処理によって、抜けた章(抜け章番号)が1箇所検出されたので、前記「Adjust Chapter Number」から「1」を引いた数値を新たな「Adjust Chapter Number」に代入する(ステップS812)。 Since one missing chapter (missing chapter number) is detected by the above processing, the numerical value obtained by subtracting "1" from the "Adjust Chapter Number" is substituted for a new "Adjust Chapter Number" (step S812). .
次いで、抜け補完部50は現在の「Adjust Chapter Number」が「0」か否かの判定を行う(ステップS813)。抜け補完部50によって現在の「Adjust Chapter Number」が「0」であると判定された場合(ステップS813:YES)、抜け章番号はないので、第1補完の処理は終了する。
Next, the missing
抜け補完部50は、現在の「Adjust Chapter Number」が「0」でないと判定された場合(ステップS813:NO)、現在の「Line Index」が前記「Line End Index」と等しいか否かの判定を行う(ステップS814)。
If it is determined that the current "Adjust Chapter Number" is not "0" (step S813: NO), the missing
抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しくないと判定をした場合(ステップS814:NO)、現在の「Line Index」に「1」を加算した数字を新たに「Line Index」とし(ステップS815)、再び、処理をステップS805に戻す。
When it is determined that the current "Line Index" is not equal to the "Line End Index" (step S814: NO), the missing
一方、抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいと判定した場合(ステップS814:YES)、すなわち、現在の「Page Index」に係るページ画像データに対する処理が終わった場合、再び、現在の「Page Index」が前記「Page End Index」と等しいか否かの判定を行う(ステップS816)。
On the other hand, when it is determined that the current "Line Index" is equal to the "Line End Index" (step S814: YES), the missing
抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しくないと判定をした場合(ステップS816:NO)、現在の「Page Index」に「1」を加算した数字を新たに「Page Index」とし(ステップS817)、処理をステップS802に戻す。すなわち、次のページに対して同様の処理を施す。
When it is determined that the current “Page Index” is not equal to the “Page End Index” (step S 816: NO), the missing
一方、抜け補完部50は、現在の「Page Index」が前記「Page End Index」と等しいと判定した場合(ステップS816:YES)、Error Flagをセットし(ステップS818)、第1補完の処理を終了する。すなわち、補完できてない抜け章番号が存在する旨記憶する。
On the other hand, when it is determined that the current "Page Index" is equal to the "Page End Index" (Step S816: YES), the missing
再び、図10及び図11の説明に戻る。 It returns to the explanation of FIG. 10 and FIG. 11 again.
このように、第1補完の処理が終了した後、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいか否かの判定を行う(ステップS514)。
As described above, after the process of the first complement is completed, the missing
抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しくないと判定した場合(ステップS514:NO)、再び、処理をステップS506に戻す。
When it is determined that the current "Chapter Index" is not equal to the "Last Chapter Index" (step S514: NO), the missing
また、抜け補完部50は、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定した場合(ステップS514:YES)、処理をステップS515に進める。
Further, when it is determined that the current “Chapter Index” is equal to the “Last Chapter Index” (step S514: YES), the missing
すなわち、ステップS514で、現在の「Chapter Index」が前記「Last Chapter Index」と等しいと判定された場合、又は、ステップS502で、前記「Last Chapter Index」が「0」であると判定した場合、最終の章(章が1つのみの場合を含む。)内において、抜け章番号の補完の処理を行う。 That is, if it is determined in step S514 that the current "Chapter Index" is equal to the "Last Chapter Index", or if it is determined in step S502 that the "Last Chapter Index" is "0". In the final chapter (including the case where there is only one chapter), handle the completion of the missing chapter number.
抜け補完部50は、前記原稿画像データに基づいて、最終ページ番号を取得する(ステップS515)。
The missing
次いで、抜け補完部50は、「Chapter Page」に「Chapter Page」に「1」を加算した値を設定し、前記「Adjust Chapter Number」を「0」に設定する(ステップS516)。また、抜け補完部50は「Last Chapter Index」に対応する章ページ番号をハードディスク55から読み出す(ステップS517)。
Next, the missing
以降、抜け補完部50は、前記抜け補完に係る第2補完処理を行う(ステップS518)。
Thereafter, the missing
図14は本実施の形態に係る複写機1において、抜け補完部50によって行われる第2補完の処理を説明するフローチャートである。以下、該第2補完の処理について詳しく説明する。
FIG. 14 is a flowchart for explaining the process of the second complementation performed by the missing
抜け補完部50は変数の初期化を行う(ステップS901)。この処理は図12のステップS801の処理と同様であり、詳しい説明を省略する。また、抜け補完部50は、前記原稿画像データから現在の「Page Index」に対応するページの画像データを読み出し、該画像データにおける行数を検出する(ステップS902)。
The missing
次いで、抜け補完部50、最終行を示す「Line End Index」に、検出された行数から「1」を引いた数値を代入し(ステップS903)、「Line Index」に「1」を代入する(ステップS904)。
Next, the missing
また、抜け補完部50は現在の「Page Index」に対応するページの画像データを読み出して現在の「Line Index」に対応する行に係る文字列データを抽出する(ステップS905)。抜け補完部50は、抽出された文字列データの文字サイズが既に定められた最大文字サイズ「Letter Size」に対応する文字サイズと等しいか判定を行う(ステップS906)。
Also, the missing
抜け補完部50によって、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しくないと判定された場合(ステップS906:NO)、処理はステップS912に進む。 If it is determined that the character size of the extracted character string data is not equal to the character size corresponding to the maximum character size “Letter Size” (step S 906: NO), the process proceeds to step S 912. .
一方、抜け補完部50は、抽出された文字列データの文字サイズが前記最大文字サイズ「Letter Size」に対応する文字サイズと等しいと判定した場合(ステップS906:YES)、抽出された文字列データに対して章情報取得部49が前記章番号文字合致照合の処理を行う(ステップS907)。
On the other hand, when it is determined that the character size of the extracted character string data is equal to the character size corresponding to the maximum character size "Letter Size" (step S906: YES), the missing
このように、章番号文字合致照合の処理後、抜け補完部50は、「Chapter Number」が「0」であるか否かの判定を行う(ステップS908)。抜け補完部50は、「Chapter Number」が「0」であると判定した場合(ステップS908:YES)、処理をステップS912に進める。
As described above, after the chapter number character matching process, the missing
一方、抜け補完部50は、「Chapter Number」が「0」でないと判定した場合(ステップS908:NO)、前記「Chapter Number Next Index」に「Chapter Number」を代入し、変数「Chapter Index」には「Chapter Number」から「1」を引いた数値を代入する(ステップS909)。
On the other hand, when it is determined that “Chapter Number” is not “0” (Step S 908: NO), the
次いで、抜け補完部50は、「Chapter Index」に対応付けて、ステップS905にて読み出された文字列データを章文字列として記憶し(ステップS910)、また、「Chapter Index」に対応付けて、現在の「Page Index」に「1」を加算した数値を、章ページ番号として記憶する(ステップS911)。
Next, the
抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいか否かの判定を行う(ステップS912)。抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しくないと判定をした場合(ステップS912:NO)、現在の「Line Index」に「1」を加算した数字を新たに「Line Index」とし(ステップS913)、処理をステップS905に戻す。
The missing
一方、抜け補完部50は、現在の「Line Index」が前記「Line End Index」と等しいと判定した場合(ステップS912:YES)、再び、現在の「Page Index」が前記「 Page End Index」と等しいか否かの判定を行う(ステップS914)。
On the other hand, when it is determined that the current “Line Index” is equal to the “Line End Index” (step S 912: YES), the missing
抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しくないと判定をした場合(ステップS914:NO)、現在の「Page Index」に「1」を加算した数字を新たに「Page Index」とし(ステップS915)、処理をステップS902に戻す。
When it is determined that the current “Page Index” is not equal to the “Page End Index” (step S 914: NO), the missing
一方、抜け補完部50は、現在の「Page Index」が前記「 Page End Index」と等しいと判定した場合(ステップS914:YES)、斯かる第2補完の処理を終了する。
On the other hand, when it is determined that the current “Page Index” is equal to the “Page End Index” (step S 914: YES), the missing
以上の処理を行うことにより、図10及び図11に示した、抜け補完の処理が終了する。 By performing the above process, the process of the missing complementation shown in FIGS. 10 and 11 is completed.
再び、図3に基づく説明に戻る。 Returning to the explanation based on FIG. 3 again.
以上のようにして、抜け補完部50により、前記抜け補完の処理がされた後、CPU40は、エラーが発生したか否かを判定する(ステップS106)。
As described above, after the process of the missing complementation is performed by the missing
例えば、前記ステップS105にて、Error Flagがセットされていれれば、CPU40はエラーが発生したと判定し(ステップS106:YES)、章抜けがある旨を前記表示部に表示する(ステップS107)。以降、処理は終了する。
For example, if the error flag is set in step S105, the
前記ステップS105にて、Error Flagがセットされていなければ、CPU40はエラーが発生していないと判定し(ステップS106:NO)、本実施の形態に係る章分けの処理は終了する。
If the error flag is not set in step S105, the
以上に記載した処理によって、本実施の形態においては、斯かる原稿画像データに対して、簡単、かつ、適確に、章毎に章情報(章番号、章文字列、章ページ番号等を含む。)を分けて格納することにより、章分けの処理を行うことが出来る。 According to the processing described above, in the present embodiment, the chapter image information (chapter number, chapter character string, chapter page number, etc. is included for each chapter easily and appropriately for such manuscript image data). Can be divided into chapters and stored.
更に、本発明においては、このように、章毎に分けられた章情報を用い、斯かる原稿の原稿画像データに基づく印刷(画像形成)を行う際、章と章との切り替わりに、いわゆる合い紙(特定紙)を挿入して、ユーザによる章の区別を容易にすることもできる。この際、CPU40がいわゆる挿入部としての役割をなすように構成すれば良い。また、読み取られた原稿画像データを章毎に分けて記憶し、以降における、章毎の印刷指示に対応することができる。
Furthermore, in the present invention, when printing (image formation) based on the document image data of such a document using chapter information divided into chapters in this manner, so-called matching between chapters and chapters is made. Paper (specific paper) can be inserted to facilitate user distinction of the chapters. At this time, the
なお、章毎に分けられた章情報を用い、章毎の題名が記載された目次を作成することも可能である。 In addition, it is also possible to create a table of contents in which titles of each chapter are described using chapter information divided into chapters.
(実施の形態2)
実施の形態1においては、最大文字サイズの検出が行われ(ステップS101)、検出された最大文字サイズを有する文字列が章表示文字列の候補として抽出され(ステップS102)、抽出された文字列から前記章情報が取得される処理を行ってから(ステップS103)、前記抜け補完の処理が施される(ステップS105)ことについて記載されている。
Second Embodiment
In the first embodiment, detection of the maximum character size is performed (step S101), and a character string having the detected maximum character size is extracted as a chapter display character string candidate (step S102), and the extracted character string The chapter information is acquired (step S103) and then the missing complement process is performed (step S105).
しかし、本発明はこれに限るものでなく、前記抜け補完の処理を省いても良い。前記抜け補完の処理を省いても、斯かる章分けの処理の妨げにならず、むしろ処理が短くなり、装置側の負担を減らすことが出来る。 However, the present invention is not limited to this, and the process of the missing complement may be omitted. Even if the omission complementing process is omitted, the chapter division process is not impeded, and the process is shortened and the burden on the apparatus can be reduced.
(実施の形態3)
また、実施の形態2においては、前記抜け補完の処理を省くことについて説明したが、本発明は以上の記載に限るものでない。
Third Embodiment
In the second embodiment, the omission of the process of the missing complement is described, but the present invention is not limited to the above description.
例えば、全Nの章からなる原稿の場合、前記抜け補完の処理は、最初の章からN−1番目章までの各ページに対する抜け補完の処理(ステップS503〜ステップS514)と、N番目(最終)章の各ページに対する抜け補完の処理(ステップS515〜ステップS518)とを含む。 For example, in the case of an original consisting of all N chapters, the missing complement process is the missing complement process (steps S503 to S514) for each page from the first chapter to the N-1th chapter, and the Nth (final And the process of missing complementation (steps S515 to S518) for each page of the chapter.
しかし、これに限るものでなく、「ステップS503〜ステップS514」の処理と、「ステップS515〜ステップS518」の処理との何れか一方、例えば、「ステップS503〜ステップS514」の処理のみを施すように構成しても良い。 However, the present invention is not limited to this, and any one of the processing of "step S503 to step S514" and the processing of "step S515 to step S518", for example, only the processing of "step S503 to step S514" You may configure it.
これによって、実施の形態3においては、処理の短縮による装置側の負担軽減と共に、章抜けの対策を図ることが出来る。 As a result, in the third embodiment, it is possible to reduce the burden on the apparatus side by shortening the processing and to take measures against the chapter omission.
本発明の実施態様1においては、複数ページの原稿に係る原稿画像データに対して、章毎に分別する処理を行う画像処理装置1において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部47と、前記最大文字サイズを有する文字列を抽出する文字列抽出部48と、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部55と、前記文字列抽出部48によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部49とを備え、前記記憶部55は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。
In the first embodiment of the present invention, in the
本発明によれば、前記文字サイズ検出部が前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記文字列抽出部が前記最大文字サイズを有する文字列を抽出し、前記章情報取得部が前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号が記憶される。 According to the present invention, the character size detection unit performs character recognition processing on the document image data to detect a maximum character size, and the character string extraction unit extracts a character string having the maximum character size. The chapter information acquisition unit extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data and is extracted The extracted character string and the page number are stored in association with numbers.
本発明の実施態様2においては、抽出された数字が複数である場合、前記章情報取得部49によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求め、抜け数字を補完する抜け補完部50を備えることを特徴とする。
In the second embodiment of the present invention, when there are a plurality of extracted numbers, the number of missing numbers in the ascending and descending order is determined based on the numbers and page numbers acquired by the chapter
本発明によれば、抽出された数字が複数である場合、抜け補完部は、前記章情報取得部によって取得された数字及びページ番号に基づいて、昇降順における抜け数字の数を求めて抜け数字を補完する。 According to the present invention, when there are a plurality of extracted numbers, the missing complement unit determines the number of the missing digits in the ascending / descending order based on the numbers and the page numbers acquired by the chapter information acquiring unit and determines the missing digits. To complement.
本発明の実施態様3においては、前記抜け補完部50は、抽出された数字が1つである場合、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行うことを特徴とする。 In the third embodiment of the present invention, when the number extracted is one, the missing part complementing the missing number with respect to the range defined by the page number and the final page number of the document. It is characterized by doing.
本発明によれば、抽出された数字が1つである場合、前記抜け補完部は、前記ページ番号及び前記原稿の最終ページ番号によって定められる範囲に対して、前記抜け数字の補完を行う。 According to the present invention, when the number extracted is one, the missing portion complements the missing number in a range defined by the page number and the final page number of the document.
本発明の実施態様4においては、前記文字サイズ検出部47は、各ページの一行目の文字列に対してのみ前記検出を行うことを特徴とする。
In the fourth embodiment of the present invention, the character
本発明によれば、前記文字サイズ検出部は、各ページの一行目の文字列に対してのみ最大文字サイズを検出する処理を行う。 According to the present invention, the character size detection unit performs processing of detecting the maximum character size only for the character string on the first line of each page.
本発明の実施態様5においては、前記文字列抽出部48は、各ページの一行目の文字列に対してのみ前記抽出を行うことを特徴とする。
In the fifth embodiment of the present invention, the character
本発明によれば、前記文字列抽出部は、各ページの一行目の文字列に対してのみ最大文字サイズを有する文字列を抽出する処理を行う。 According to the present invention, the character string extraction unit performs processing of extracting a character string having the maximum character size only for the character string on the first line of each page.
本発明の実施態様6においては、前記章情報取得部49は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする。
In the sixth embodiment of the present invention, the chapter
本発明によれば、前記章情報取得部は、前記抽出文字列のうち、最初の一つ又は複数の文字が前記章番号のパターンと一致する抽出文字列を検索し、検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を章番号として抽出する。 According to the present invention, the chapter information acquisition unit searches for an extracted character string in which the first one or more characters of the extracted character strings match the pattern of the chapter number, and the extracted character string searched for From this, the numbers matching the chapter numbers included in the corresponding pattern are extracted as chapter numbers.
本発明の実施態様7においては、前記実施態様の何れか一つに記載の画像処理装置と、シート状の記録媒体に画像形成を行う画像形成部と、特定紙が収容されたトレイと、前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部とを備えることを特徴とする。
In an
本発明によれば、前記画像形成を行う際、前記挿入部は前記画像処理装置による章分別の処理の結果に基づいて、章の切り替わりに、前記トレイに収容された特定紙を挿入する According to the present invention, when performing the image formation, the insertion unit inserts the specific sheet stored in the tray at the switching of the chapter based on the result of the chapter classification process by the image processing apparatus.
本発明の実施態様8においては、前記画像形成部は、前記章情報取得部49によって取得された抽出文字列に係る数字、ページ番号を該抽出文字列に対応付けて、前記原稿に係る目次の画像形成を行うことを特徴とする。
In the eighth embodiment of the present invention, the image forming unit associates the numeral and page number of the extracted character string acquired by the chapter
本発明によれば、前記画像形成部は、前記原稿に係る目次の画像形成を行う。すなわち、前記章情報取得部によって取得された抽出文字列に係る数字、ページ番号が該抽出文字列に対応付けられ、目次として画像形成される。 According to the present invention, the image forming unit forms an image of a table of contents relating to the document. That is, the numbers and page numbers related to the extracted character string acquired by the chapter information acquiring unit are associated with the extracted character string, and an image is formed as a table of contents.
本発明の実施態様9においては、章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部55を備えており、複数ページの原稿に係る原稿画像データに対する画像処理を行う画像処理装置1にて、章毎に分別する処理を行う章分け処理方法において、前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、前記最大文字サイズを有する文字列を抽出し、前記記憶部55に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出示文字列に係るページ番号を前記原稿画像データから取得し、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする。
In the ninth embodiment of the present invention, a
本発明によれば、画像処理装置において、前記原稿画像データに対して文字認識処理が施されて最大文字サイズが検出され、前記最大文字サイズを有する文字列が抽出され、前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字が抽出され、該抽出示文字列に係るページ番号が前記原稿画像データから取得され、抽出された数字に対応付けて、前記抽出文字列及びページ番号が記憶される。 According to the present invention, in the image processing apparatus, character recognition processing is performed on the document image data to detect a maximum character size, and a character string having the maximum character size is extracted and stored in the storage unit. Based on the current pattern, a number is extracted from the extracted extracted character string, a page number related to the extracted indication character string is acquired from the document image data, and the extracted character string is associated with the extracted digit. And the page number is stored.
1 複写機
40 CPU
44 画像形成制御部
47 文字サイズ検出部
48 文字列抽出部
49 章情報取得部
50 抜け補完部
55 ハードディスク
210 画像形成部
43 画像準備制御部
1
44 image
Claims (9)
前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出する文字サイズ検出部と、
前記最大文字サイズを有する文字列を抽出する文字列抽出部と、
章の始まりのページにて章の区分を表す章番号のパターンを記憶している記憶部と、
前記文字列抽出部によって抽出された抽出文字列から、前記パターンに基づいて数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得する章情報取得部とを備え、
前記記憶部は、抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする画像処理装置。 In an image processing apparatus that performs processing of sorting document image data related to documents of a plurality of pages for each chapter,
A character size detection unit that performs character recognition processing on the document image data and detects a maximum character size;
A character string extraction unit that extracts a character string having the maximum character size;
A storage section that stores a chapter number pattern representing a chapter division on the chapter start page,
And a chapter information acquisition unit that extracts a number based on the pattern from the extracted character string extracted by the character string extraction unit, and acquires a page number related to the extracted character string from the document image data;
The image processing apparatus, wherein the storage unit stores the extracted character string and the page number in association with the extracted number.
前記抽出文字列のうち、最初の一つ又は複数の文字が前記パターンと一致する抽出文字列を検索し、
検索された抽出文字列から、対応するパターンに含まれる章番号と一致する数字を抽出することを特徴とする請求項1から5の何れか一つに記載の画像処理装置。 The chapter information acquisition unit
Searching for an extracted character string in which the first one or more characters of the extracted character string match the pattern;
The image processing apparatus according to any one of claims 1 to 5, wherein a number matching the chapter number included in the corresponding pattern is extracted from the extracted extracted character string.
シート状の記録媒体に画像形成を行う画像形成部と、
特定紙が収容されたトレイと、
前記画像形成を行う際、前記処理の結果に基づいて、章の切り替わりに、特定紙を挿入する挿入部と
を備えることを特徴とする画像形成装置。 An image processing apparatus according to any one of claims 1 to 6.
An image forming unit for forming an image on a sheet-like recording medium;
A tray containing specific paper,
An image forming apparatus comprising: an inserting section for inserting a specific sheet at chapter switching based on a result of the processing when forming the image.
前記原稿画像データに対して文字認識処理を施し、最大文字サイズを検出し、
前記最大文字サイズを有する文字列を抽出し、
前記記憶部に記憶されているパターンに基づいて、抽出された抽出文字列から数字を抽出し、該抽出文字列に係るページ番号を前記原稿画像データから取得し、
抽出された数字に対応付けて、前記抽出文字列及びページ番号を記憶することを特徴とする章分け処理方法。 The image processing apparatus is provided with a storage unit that stores a chapter number pattern indicating chapter divisions at the beginning of a chapter page, and performs image processing on original image data related to a plurality of pages of original In the chapter division processing method that performs processing to separate
Character recognition processing is performed on the document image data to detect a maximum character size,
Extract a string having the maximum character size,
Based on the pattern stored in the storage unit, a number is extracted from the extracted extracted character string, and a page number related to the extracted character string is acquired from the document image data,
And storing the extracted character string and the page number in association with the extracted number.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015166217A JP6545573B2 (en) | 2015-08-25 | 2015-08-25 | Image processing apparatus, image forming apparatus, and chapter division processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015166217A JP6545573B2 (en) | 2015-08-25 | 2015-08-25 | Image processing apparatus, image forming apparatus, and chapter division processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017045203A JP2017045203A (en) | 2017-03-02 |
JP6545573B2 true JP6545573B2 (en) | 2019-07-17 |
Family
ID=58210212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015166217A Active JP6545573B2 (en) | 2015-08-25 | 2015-08-25 | Image processing apparatus, image forming apparatus, and chapter division processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6545573B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6638830B2 (en) * | 2017-07-03 | 2020-01-29 | 京セラドキュメントソリューションズ株式会社 | Document reading device |
-
2015
- 2015-08-25 JP JP2015166217A patent/JP6545573B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017045203A (en) | 2017-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7309416B2 (en) | Image forming apparatus, image forming method, and program | |
JP7309417B2 (en) | Image forming apparatus, image forming method, and program | |
JP2024029230A (en) | Image forming device and information processing device | |
JP2013074609A (en) | File name creation apparatus and file name creation program | |
US5940583A (en) | Image forming apparatus | |
US11570310B2 (en) | Inspection device for correcting read image data that does not satisfy predetermined criterion, image forming apparatus, and non-transitory computer readable medium storing inspection | |
US10063742B2 (en) | Integrated circuit, image processing apparatus, and image forming apparatus that selects density conversion information according to a selected image processing method | |
JP6545573B2 (en) | Image processing apparatus, image forming apparatus, and chapter division processing method | |
US7933034B2 (en) | Image data processing circuit and image forming apparatus having the same | |
JP2016149600A (en) | Image forming apparatus | |
US11997234B2 (en) | Inspection device for inspecting quality of printed images | |
US20090303503A1 (en) | Image forming apparatus performing image formation suitable for adding information in handwriting or the like | |
JP3850220B2 (en) | Image forming method, recording medium, and image forming apparatus | |
JP2002288169A (en) | Image forming device | |
US20150373220A1 (en) | Image processing apparatus and image processing system | |
JP2008206069A (en) | Image data retrieving method and system therefor | |
JP4791032B2 (en) | Image forming apparatus and image forming method | |
JP2011004356A (en) | Image forming apparatus | |
JP7421376B2 (en) | Image forming device and information processing device | |
JP4282026B2 (en) | Image forming apparatus | |
JP3953720B2 (en) | Image forming apparatus | |
JP5802782B2 (en) | Mark detection device | |
JP2013211708A (en) | Image forming device | |
JP2020106554A (en) | Printing device | |
JP2021045922A (en) | Image forming apparatus, information processing method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6545573 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |