JP2010109420A - Image-forming device - Google Patents

Image-forming device Download PDF

Info

Publication number
JP2010109420A
JP2010109420A JP2008276518A JP2008276518A JP2010109420A JP 2010109420 A JP2010109420 A JP 2010109420A JP 2008276518 A JP2008276518 A JP 2008276518A JP 2008276518 A JP2008276518 A JP 2008276518A JP 2010109420 A JP2010109420 A JP 2010109420A
Authority
JP
Japan
Prior art keywords
chapter division
line
image
chapter
button
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008276518A
Other languages
Japanese (ja)
Other versions
JP4934124B2 (en
Inventor
Seitsugu Innan
誠嗣 院南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2008276518A priority Critical patent/JP4934124B2/en
Publication of JP2010109420A publication Critical patent/JP2010109420A/en
Application granted granted Critical
Publication of JP4934124B2 publication Critical patent/JP4934124B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimiles In General (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image-forming device for setting places for chapter division desired by users in read original images, and storing electronic documents of originals, where link information is added to the places for chapter division. <P>SOLUTION: The image-forming device can create electronic documents by reading originals having a plurality of pages. In the image-forming device, candidate lines of the places for chapter division are extracted to temporarily mark the images of the candidate lines based on conditions given by users from character strings of line units extracted by performing character recognition to the read original images, the images of pages including the temporarily marked candidate lines are displayed, the candidate lines are decided as the places for chapter division based on users' instructions, the decided places for chapter division are marked to correct the original images, outline data, which include the link information for correlating the character strings extracted from the lines of the places for chapter division with the places for chapter division, are generated, and the electronic documents having the link information are generated from all original images and the outline data. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、章分け機能を搭載した画像形成装置に関する。   The present invention relates to an image forming apparatus equipped with a chapter division function.

最近の画像形成装置では、デジタル化した原稿画像を一度画像メモリに蓄積し、種々の加工を施した後、記録媒体に印刷できるようにしている。
このような画像形成装置には、大量の印刷に章分けなどの区切り処置を行う章分け機能を搭載したものがある。
この章分け機能は、両面印刷において指定されたページを、それが偶数番ページ(通常は記録用紙の裏面に印刷される)であっても記録用紙の表面に印刷して次ページを該記録用紙の裏面に印刷するものである。
In recent image forming apparatuses, a digitized document image is once stored in an image memory, and after various processing, it can be printed on a recording medium.
Some of these image forming apparatuses are equipped with a chapter division function for performing a separation process such as chapter division for a large amount of printing.
This chaptering function prints the specified page in double-sided printing on the front side of the recording paper even if it is an even-numbered page (usually printed on the back side of the recording paper) and the next page on the recording paper. It prints on the back side.

特許文献1では、ユーザが章ごとの先頭ページおよびタイトル情報を指定して、読み取った原稿画像を指定された章ごとの先頭ページで章分けするとともに、章番号付きのタイトルを合成して印刷している。これにより、章ごとに視認性の高い記録用紙を出力することができる。   In Patent Document 1, the user specifies the first page and title information for each chapter, divides the read original image into chapters by the first page for each specified chapter, and synthesizes and prints titles with chapter numbers. ing. Thereby, it is possible to output a highly visible recording sheet for each chapter.

また、近年、パーソナルコンピュータの高機能化、低価格化に伴い、オフィスにおける文書の電子ファイル化が急速に進んでいる。文書を電子化して閲覧するためのフォーマットとして、現在、最も普及しているフォーマットは、米国アドビ社が開発したPDF(Portable Document Format)形式である。このPDF形式の文書は、ハードウェアに依存することなしに、常に同じ態様で閲覧や印刷を行うことができるという特徴をもち、この形式は標準的な閲覧フォーマットの地位を確立している。   In recent years, with the increase in functionality and price of personal computers, the creation of electronic files for documents in offices is rapidly progressing. As a format for digitizing and browsing a document, the most popular format at present is a PDF (Portable Document Format) format developed by Adobe in the United States. This PDF document has a feature that it can always be browsed and printed in the same manner without depending on hardware, and this format has established the status of a standard browsing format.

このPDF形式では、表示装置上で閲覧中に特定のページや項目へと即座に表示内容を変えるリンク機能を付加することも可能になっており、PDF形式で作成された電子文書には、リンク情報をもった索引や目次が用意されるのが一般的である。
特開2007−25797号公報
In this PDF format, it is also possible to add a link function that immediately changes the display contents to a specific page or item while browsing on a display device. An electronic document created in the PDF format is linked. Generally, an index or table of contents with information is prepared.
JP 2007-25797 A

一般に、章分け箇所は、ページの先頭行とは限らず、先頭以外の行にも存在しているのが実情である。しかし、特許文献1では、ページ単位でしか章分けができないので、このような先頭以外の行に章分け箇所がある原稿文書には利用できない。さらに、章分けした原稿文書を記憶装置等へ保存することができない。   In general, chapter divisions are not limited to the top line of a page, but are actually present in lines other than the top line. However, since Patent Document 1 can divide chapters only in page units, it cannot be used for a manuscript document having chapter divisions on lines other than the top. Furthermore, the document document divided into chapters cannot be stored in a storage device or the like.

また、PDF形式の電子文書では、章が存在する対応ページを拾い出す作業を行わねばならず、また、リンク機能をもたせるためには、リンク情報を付加するための余分な作業を行わねばならないため、リンク情報付の電子文書を作成するユーザには大きな作業負担がかかる。   Also, in an electronic document in PDF format, an operation for picking up a corresponding page in which a chapter exists must be performed, and in order to provide a link function, an extra operation for adding link information must be performed. A user who creates an electronic document with link information is burdensome.

本発明は、上述の実情を考慮してなされたものであって、読み込んだ原稿画像にユーザの希望通りの章分け箇所を設定し、該章分け箇所にリンク情報を付加した原稿の電子文書の保存を行う画像形成装置を提供することを目的とする。   The present invention has been made in consideration of the above-described circumstances, and sets a chapter division as desired by the user in the read original image, and an original electronic document in which link information is added to the chapter division. An object of the present invention is to provide an image forming apparatus that performs storage.

上記の課題を解決するために、本発明の画像形成装置は、複数ページからなる原稿を読み取って電子文書を作成可能な画像形成装置において、読み取った原稿画像を文字認識して抽出した行単位の文字列から、ユーザから与えられた条件に基づいて、章分け箇所の候補行を抽出して該候補行の画像に仮マーカー付けし、前記仮マーカー付けした候補行を含むページの画像を表示して、ユーザからの指示に基づいて前記候補行が章分け箇所であることを確定し、前記確定された章分け箇所にマーカー付けして原稿画像を修正するとともに、該章分け箇所の行から抽出した文字列と前記章分け箇所とを関連付けしたリンク情報を含むアウトラインデータを生成し、すべての原稿画像と、該アウトラインデータとからリンク情報付の電子文書を生成する。   In order to solve the above-described problems, an image forming apparatus according to the present invention is an image forming apparatus capable of reading an original consisting of a plurality of pages and creating an electronic document. Based on the condition given by the user from the character string, the candidate line of the chapter division part is extracted, the temporary marker is added to the image of the candidate line, and the image of the page including the candidate line with the temporary marker is displayed. Then, based on an instruction from the user, the candidate line is confirmed to be a chapter division part, and the document image is corrected by marking the determined chapter division part and extracted from the line of the chapter division part. Generates outline data including link information that associates the character string and the chapter section with each other, and generates an electronic document with link information from all the original images and the outline data. That.

上述の章分け箇所の候補行は、次の1つ以上の条件の組み合わせで抽出する。
(1)原稿画像内の行の文字サイズがユーザの指定した文字サイズより大きいときに、該行を章分け箇所の候補行とする。
(2)原稿画像内の空白行数がユーザの指定した空白行数より大きいときに、空白行の次の行を章分け箇所の候補行とする。
(3)ユーザの指定したページ番号に合致した原稿画像内の先頭行を章分け箇所の候補行とする。
(4)原稿画像内の行の文字列にユーザの指定した文字列含むときに、該行を章分け箇所の候補行とする。
(5)原稿画像内のユーザの指定した行を章分け箇所の候補行とする。
Candidate lines for the above-mentioned chapter division locations are extracted by a combination of one or more of the following conditions.
(1) When the character size of a line in the document image is larger than the character size specified by the user, the line is set as a candidate line for a chapter division part.
(2) When the number of blank lines in the document image is larger than the number of blank lines specified by the user, the next line after the blank line is set as a candidate line for the chapter division part.
(3) The first line in the document image matching the page number designated by the user is set as a candidate line for the chapter division part.
(4) When the character string specified by the user is included in the character string of the line in the document image, the line is set as a candidate line for the chapter division part.
(5) A line designated by the user in the document image is set as a candidate line for a chapter division.

本発明によれば、読み込んだ原稿画像にユーザの希望通りの章分け箇所を設定し、該章分け箇所にリンク情報を付加した電子文書を保存できるので、リンク情報付の電子文書を作成するユーザの作業負担を軽減させることができる。   According to the present invention, a chapter division as desired by the user can be set in the read original image, and an electronic document with link information added to the chapter division can be stored. Therefore, a user who creates an electronic document with link information Work load can be reduced.

さらに、上記の電子文書を章ごとに印刷したい場合、表示されたリンク情報により章の位置を即座に見つけることができるので、原稿を一枚一枚確認して章ページを選び出す必要がなくなる。   Furthermore, when it is desired to print the electronic document for each chapter, the position of the chapter can be immediately found by the displayed link information, so that it is not necessary to check each manuscript and select a chapter page.

以下、図面を参照して本発明の画像形成装置に係る好適な実施形態について説明する。本実施形態では、画像形成装置として、多機能を備えた複合機(MFP)を用いて説明する。   Hereinafter, preferred embodiments according to an image forming apparatus of the present invention will be described with reference to the drawings. In this embodiment, an image forming apparatus will be described using a multifunction peripheral (MFP) having multiple functions.

図1は、本実施形態のMFPのハードウェアの概略構成を示すブロック図である。同図において、MFP100は、制御部101、記憶部102、操作パネル103、画像読取部104、画像出力部105、ネットワークインターフェース106、システムバス107から構成されている。   FIG. 1 is a block diagram illustrating a schematic configuration of hardware of the MFP according to the present embodiment. In FIG. 1, the MFP 100 includes a control unit 101, a storage unit 102, an operation panel 103, an image reading unit 104, an image output unit 105, a network interface 106, and a system bus 107.

制御部101は、制御プログラムを実行するCPU、制御プログラムや各種データを格納するROM、主にワークエリアとして使われるRAM等からなり、MFP100全体を制御する。   The control unit 101 includes a CPU that executes a control program, a ROM that stores control programs and various data, a RAM that is mainly used as a work area, and the like, and controls the entire MFP 100.

記憶部102は、例えば、大容量のハードディスクからなり、画像読取部104で読み取った画像データや、ネットワークインターフェース106で接続された外部の端末装置から送信された画像データを記憶管理するデータベースを構成する。   The storage unit 102 includes, for example, a large-capacity hard disk, and constitutes a database that stores and manages image data read by the image reading unit 104 and image data transmitted from an external terminal device connected by the network interface 106. .

画像読取部104は、オートドキュメントフィーダ(ADF)を含み、束状のあるいは1枚の原稿画像を光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読取信号を所定密度の画像データとして取得して、一旦記憶部102に記憶する。ここでは、読み取った原稿の画像データは、PDF形式に規定されている形式であるものとする。
画像出力部105は、記憶部102に一旦記憶された画像データを制御部101で記録信号に変換し、順次出力して紙上に画像を形成する。
The image reading unit 104 includes an auto document feeder (ADF), irradiates a bundle or one original image with a light source, forms an original reflection image on a solid-state image sensor with a lens, and rasterizes from the solid-state image sensor. The image reading signal is acquired as image data having a predetermined density, and is temporarily stored in the storage unit 102. Here, it is assumed that the image data of the read original is in a format defined in the PDF format.
The image output unit 105 converts the image data once stored in the storage unit 102 into a recording signal by the control unit 101, and sequentially outputs it to form an image on paper.

操作パネル103は、タッチパネルと一体となった表示部、テンキー、キーボード、スタートボタン、ストップボタン等を備えており、各種情報の表示および各種指示の入力に使用され、ユーザの指示や表示は制御部101で制御される。   The operation panel 103 includes a display unit integrated with a touch panel, a numeric keypad, a keyboard, a start button, a stop button, and the like. The operation panel 103 is used for displaying various information and inputting various instructions. 101.

ネットワークインターフェース106は、イーサネット(登録商標)、トークンリング、FDDI等の規格によりコンピュータ等の端末装置やネットワーク機器同士を接続する際に使用する。
また、ネットワークインターフェース106を介して外部に送信するには、制御部101において、画像読取部104から得られる画像データを外部出力用の画像ファイルへと変換して出力する。
また、ネットワークインターフェース106介して外部から受信するには、制御部101において、外部の端末装置から出力された印刷データを制御部101が受信し、その印刷データを画像出力部105で印刷可能なラスタデータに変換した後、画像出力部105によって印刷用紙上に画像を形成する。
システムバス107は、CPUに接続するデータバス、アドレスバスおよび制御信号バス等であり、制御部101が当該システムバスを介して各部を制御する。
The network interface 106 is used when connecting terminal devices such as computers and network devices according to standards such as Ethernet (registered trademark), token ring, and FDDI.
In order to transmit to the outside via the network interface 106, the control unit 101 converts the image data obtained from the image reading unit 104 into an image file for external output and outputs the image file.
In order to receive from the outside via the network interface 106, the control unit 101 receives print data output from an external terminal device in the control unit 101, and the print data can be printed by the image output unit 105. After conversion to data, the image output unit 105 forms an image on the printing paper.
The system bus 107 is a data bus, an address bus, a control signal bus, or the like connected to the CPU, and the control unit 101 controls each unit via the system bus.

次に、制御部101の本発明に係る部分について説明する。
図2は、制御部101の詳細な機能構成図であり、制御部101は、章分け条件取得部111、テキスト抽出部121、マーカー設定部131、章分け情報確定部141、PDF変換部151、章分け情報記憶部161、操作履歴記憶部171、PDF文書記憶部181を含んで構成されている。
Next, the part which concerns on this invention of the control part 101 is demonstrated.
FIG. 2 is a detailed functional configuration diagram of the control unit 101. The control unit 101 includes a chaptering condition acquisition unit 111, a text extraction unit 121, a marker setting unit 131, a chaptering information determination unit 141, a PDF conversion unit 151, The chapter division information storage unit 161, the operation history storage unit 171, and the PDF document storage unit 181 are configured.

まず、各記憶部について説明する。
章分け情報記憶部161は、画像読取部104で読み取られた画像データを各ページ毎に次のような項目を記憶する。
ページ番号:読み取った画像データの各ページに振られた番号である。
画像データ:1ページ分の画像データである。
First, each storage unit will be described.
The chapter division information storage unit 161 stores the following items for each page of the image data read by the image reading unit 104.
Page number: A number assigned to each page of the read image data.
Image data: One page of image data.

以下のライン番号、マーカーフラグ、文字サイズ、文字列、文字列の領域座標は、上記の画像データの1ページに存在する文字領域から抽出された行毎に設けられるデータ項目である。
ライン番号:ページに含まれる文字領域から抽出した各行毎に振られる順番号である。
マーカーフラグ:下記の文字列にマーカーを付加するか否かを表わすフラグ情報であり、「有」のときは、下記の文字列が章タイトルを表わしており、この文字列(章タイトル)にマーカーを付加するとともに、アウトラインデータとして文字列(章タイトル)とのリンク情報を生成することを示す。また、「無」のときには、下記文字列は、章タイトル以外の単なる文字列または空行であることを示す。
文字列:下記文字列の領域範囲の画像データを文字認識してテキスト化した時の文字コードである。空行のときには空行を表わすコードとする。
文字列の領域範囲:行内にある文字列が1ページ分の画像データのどこにあったかを示す、先頭文字と最後文字の座標である。
文字サイズ:上記文字列の先頭文字のサイズである。
The following line number, marker flag, character size, character string, and region coordinates of the character string are data items provided for each line extracted from the character region existing on one page of the image data.
Line number: A sequential number assigned to each line extracted from the character area included in the page.
Marker flag: Flag information indicating whether or not to add a marker to the following character string. When “Yes”, the following character string represents the chapter title, and this character string (chapter title) has a marker. Is added, and link information with a character string (chapter title) is generated as outline data. When “None” is indicated, the following character string indicates a simple character string other than a chapter title or a blank line.
Character string: This is a character code when the image data in the area range of the following character string is recognized and converted into text. If the line is blank, the code represents the blank line.
Area range of character string: The coordinates of the first character and the last character indicating where the character string in the line is in one page of image data.
Character size: The size of the first character of the above character string.

操作履歴記憶部171は、章分け情報確定部141において、プレビュー表示したページの画像に表示されたマーカー付きの文字列(章タイトル)を章分け箇所とするか否かの設定を操作履歴として累積記憶する。この記憶部には、章分け有効または章分け無効の種類と、その対象となったページ番号と、章分け箇所の判断の元になった行のライン番号を対応付けて記憶する。   The operation history storage unit 171 accumulates, as an operation history, a setting as to whether or not a character string with a marker (chapter title) displayed in the preview-displayed page image in the chapter division information determination unit 141 is a chapter division part. Remember. In this storage unit, the type of chapter division valid or chapter division invalid, the page number of the chapter division, and the line number of the line from which the chapter division point is determined are stored in association with each other.

PDF文書記憶部181は、PDF変換部151によって生成したリンク情報付きのPDF形式の電子文書を記憶する。この電子文書には、章分け箇所となった文字列にマーカーが付加されたすべての原稿ページの画像データ、該画像データから抽出した行毎の文字列、マーカーが付加された文字列とこの文字列のあった画像データの位置とを関連付ける情報を持つアウトラインデータが含まれている。   The PDF document storage unit 181 stores the PDF-format electronic document with link information generated by the PDF conversion unit 151. This electronic document includes image data of all manuscript pages in which a marker is added to a character string that is a chapter division part, a character string for each line extracted from the image data, a character string with a marker added, and this character Outline data having information for associating the position of image data with a column is included.

次に、処理機能について説明する。
ユーザが章分け機能を利用するときには、まず、操作パネル103から原稿読取の設定を入力し、図3に例示したような章分け機能指示画面を操作パネル103の表示部に表示させる。この章分け機能指示画面には、章分け機能ボタン301、設定リセットボタン302、閉じるボタン303、次の原稿ありボタン304、次の原稿なしボタン305、スタートボタン306が表示される。これらのボタンが押されると、ボタン部分の表示濃度が増大し、選択されたことがユーザに識別可能になっている。
Next, the processing function will be described.
When the user uses the chapter division function, first, an original reading setting is input from the operation panel 103 and a chapter division function instruction screen as illustrated in FIG. 3 is displayed on the display unit of the operation panel 103. On this chaptering function instruction screen, a chaptering function button 301, a setting reset button 302, a close button 303, a next original button 304, a next original no button 305, and a start button 306 are displayed. When these buttons are pressed, the display density of the button portion increases, and the selection can be identified by the user.

章分け機能ボタン301は、章分け機能を使用するか否かを選択するボタンである。
設定リセットボタン302は、この画面で設定した設定内容を初期化するためのボタンである。
閉じるボタン303は、画像読取動作を終了するボタンである。
次の原稿ありボタン304は、原稿の束を読み取った後に次の原稿の束があることを選択するためのボタンである。原稿が多いときには、原稿をいくつかの束に分けてその束毎に次の原稿ありボタン304とスタートボタン306を押し、最後の束のときに次の原稿なしボタン305とスタートボタン306を押して、すべての原稿を読み込ませるのに使う。
次の原稿なしボタン305は、原稿の束を読み取った後に次の原稿がないことを選択するためのボタンである。
スタートボタン306は、原稿の読取動作を開始させるためのボタンである。
The chapter division function button 301 is a button for selecting whether or not to use the chapter division function.
A setting reset button 302 is a button for initializing the setting contents set on this screen.
A close button 303 is a button for ending the image reading operation.
The next original button 304 is a button for selecting that there is a next original bundle after reading the original bundle. When there are many originals, the originals are divided into several bundles, the next original button 304 and the start button 306 are pushed for each bundle, and the next no original button 305 and the start button 306 are pushed for the last bundle. Used to load all manuscripts.
The next original no button 305 is a button for selecting that there is no next original after reading a bundle of originals.
A start button 306 is a button for starting a document reading operation.

そして、ユーザは、章分け機能ボタン301および次の原稿ありボタン304または次の原稿なしボタン305を選択し、原稿の束をADFにセットし、スタートボタン306を押す。
制御部101は、スタートボタン306が押されたことを検知すると、画像読取部104により読み取ったすべての原稿の画像データを1ページごとにページ番号を振って、章分け情報記憶部161に記憶し、すべての原稿が読み終わると章分け条件取得部111を起動する。
Then, the user selects the chaptering function button 301 and the next original button 304 or the next original button 305, sets a bundle of originals in the ADF, and presses the start button 306.
When the control unit 101 detects that the start button 306 has been pressed, the image data of all the originals read by the image reading unit 104 is assigned a page number for each page and stored in the chapter division information storage unit 161. When all the originals have been read, the chapter division condition acquisition unit 111 is activated.

章分け条件取得部111は、図4に例示するような章分け条件選択画面を操作パネル103の表示部に表示する。この章分け条件選択画面には、文字サイズボタン401、空白行ボタン402、ページ指定ボタン403、ユーザ設定ボタン404、全ページ検査ボタン405、キャンセルボタン406、OKボタン407が表示される。   The chapter division condition acquisition unit 111 displays a chapter division condition selection screen as illustrated in FIG. 4 on the display unit of the operation panel 103. On this chaptering condition selection screen, a character size button 401, a blank line button 402, a page designation button 403, a user setting button 404, an all page inspection button 405, a cancel button 406, and an OK button 407 are displayed.

文字サイズボタン401は、章分けを実行する際に、指定した文字サイズを基準として章分けする箇所を設定するボタンである。
空白行ボタン402は、指定した空白行数を基準として章分けする箇所を設定するボタンである。空白行の次の行が章分けの先頭行とする。
ページ指定ボタン403は、ページ番号を指定して章分けする箇所を設定するボタンである。
ユーザ設定ボタン404は、ユーザが文字列を指定して章分け箇所を設定するボタンである。
全ページ検査ボタン405は、文書の各ページをプレビュー画面で確認し、1箇所ずつ章分け箇所を設定するボタンである。
キャンセルボタン406は、既に選択した条件をすべて初期化するボタンである。
OKボタン407は、章分け条件の設定が完了した場合に使用するボタンである。
A character size button 401 is a button for setting a chapter division location based on a designated character size when chapter division is executed.
The blank line button 402 is a button for setting a chapter division based on the designated number of blank lines. The next line after the blank line is the first line of chapter division.
A page designation button 403 is a button for setting a part to be divided into chapters by designating a page number.
The user setting button 404 is a button for setting a chapter division by designating a character string.
The all page inspection button 405 is a button for confirming each page of the document on the preview screen and setting chapter division parts one by one.
A cancel button 406 is a button for initializing all the already selected conditions.
An OK button 407 is a button used when the setting of chapter division conditions is completed.

章分け条件取得部111は、文字サイズボタン401、空白行ボタン402、ページ指定ボタン403、ユーザ設定ボタン404のいずれかが押されたことを検知すると、ボタンに応じた基準値を入力する入力欄を表示し、その入力を促す。基準値の入力後、OKボタン407が押されたことを検知すると、これまでに取得したすべての章分け条件の種類と基準値を対応付けて制御部101に戻す。
しかし、OKボタン407が押される前にキャンセルボタン406が押されたことを検知すると、これまでに指定した章分け条件の種類と基準値を消去して、次のボタンが押されるまで待機する。
When the chaptering condition acquisition unit 111 detects that any one of the character size button 401, the blank line button 402, the page designation button 403, and the user setting button 404 is pressed, an input field for inputting a reference value corresponding to the button. Is displayed and prompts for the input. When it is detected that the OK button 407 has been pressed after the reference value is input, all types of chaptering conditions acquired so far are associated with the reference value and returned to the control unit 101.
However, if it is detected that the cancel button 406 is pressed before the OK button 407 is pressed, the type and reference value of the chapter division conditions specified so far are deleted, and the process waits until the next button is pressed.

上記の基準値は、各章分け条件によって、次のように指定する。
例えば、文字サイズボタン401が押されると、図5に例示するように、文字サイズ設定欄408と設定文字サイズプレビュー画面409が表示される。
文字サイズ設定欄408は、選択中にテンキーを使用して、章分け箇所の基準となる文字サイズを入力する。設定文字サイズプレビュー画面409には、設定した文字サイズの文字『A』が表示され、章分けの基準となる文字サイズがどのくらいの大きさなのかを実際に見て確認することができる。
The above reference values are specified as follows according to the chapter division conditions.
For example, when the character size button 401 is pressed, a character size setting field 408 and a set character size preview screen 409 are displayed as illustrated in FIG.
A character size setting field 408 is used to input a character size serving as a reference for chapter divisions using a numeric keypad during selection. On the set character size preview screen 409, the character “A” having the set character size is displayed, and it can be confirmed by actually seeing how large the character size is as a reference for chapter division.

また、空白行ボタン402が押されると、図6に例示するように、空白行数設定欄410が表示される。空白行数設定欄410は、選択中にテンキーを使用して、章分け箇所を判断する基準となる空白行数を入力する。   When the blank line button 402 is pressed, a blank line number setting column 410 is displayed as illustrated in FIG. In the blank line number setting column 410, a numeric keypad is used during selection to input the number of blank lines that serves as a reference for determining chapter divisions.

また、ページ指定ボタン403が押されると、図7に例示するように、ページ番号設定欄411が表示される。ページ番号設定欄411は、選択中にテンキーを使用して、章分けを行うページ番号を入力する。このページ指定の場合には、図8に例示するように、各章の章タイトルは、ページの先頭行になければならない。例えば、図8の場合、各章のページ番号が1,2,3,6,9,12であるから、図7のように、ページ番号設定欄411には『1,2,3,6,9,12』を入力する   When the page designation button 403 is pressed, a page number setting field 411 is displayed as illustrated in FIG. A page number setting field 411 is used to input a page number to be divided into chapters using the numeric keypad during selection. In the case of this page designation, the chapter title of each chapter must be on the top line of the page, as illustrated in FIG. For example, in the case of FIG. 8, the page numbers of the chapters are 1,2,3,6,9,12. Therefore, as shown in FIG. 7, the page number setting field 411 includes “1,2,3,6, Enter "9,12"

また、ユーザ設定ボタン404が押されると、図9に例示するように、ユーザ指定文字列設定欄412が表示される。ユーザ指定文字列設定欄412は、選択中にテンキーを使用して、章分け箇所となる行に含まれる文字列を入力する。例えば、図9の場合、各章のタイトル内に指定された文字列『2008/』が含まれると、この行を章分け箇所とする。   When the user setting button 404 is pressed, a user-specified character string setting field 412 is displayed as illustrated in FIG. The user-specified character string setting field 412 is used to input a character string included in a line to be a chapter division portion using the numeric keypad during selection. For example, in the case of FIG. 9, if the designated character string “2008 /” is included in the title of each chapter, this line is set as a chapter division part.

また、全ページ検査ボタン405が押されたときには、指定されたページをプリビュー表示して、章分け箇所を指でなぞって指定するので、図10に例示するように基準値の指定は行われない。   Also, when the all page inspection button 405 is pressed, the designated page is previewed and designated by tracing the chapter division part with a finger, so that the reference value is not designated as illustrated in FIG. .

上記の章分け条件は、1つの指定であってもよいし、また、複数個を組み合わせて行っても構わない。例えば、空白行数が3行以上あり、且つ空白行の次行の先頭文字のサイズが20pt以上であるときに行を章分け箇所と指定したい場合には、文字サイズボタン401と空白行ボタン402を両方選択して基準値を設定する。   The above chaptering condition may be one designation, or a plurality of chaptering conditions may be combined. For example, when the number of blank lines is 3 or more and the size of the first character of the next line after the blank line is 20 pt or more and a line is to be designated as a chapter division part, the character size button 401 and the blank line button 402 are displayed. Select both to set the reference value.

次に、制御部101は、テキスト抽出部121を起動する。
テキスト抽出部121は、公知の技術を用いて、次のような手順により、1ページごとに各行内の文字列に関する情報を抽出して章分け情報記憶部161を更新して、制御部101に戻る。
Next, the control unit 101 activates the text extraction unit 121.
The text extraction unit 121 extracts information on the character string in each line for each page and updates the chaptering information storage unit 161 by using a known technique, and updates the chaptering information storage unit 161 to the control unit 101. Return.

(1)1ページの画像データの文字領域を判別する。
(2)この文字領域から行を表わす行領域を抽出する。
(3)各行領域について、文字が存在する領域範囲を抽出する。
この領域範囲は、先頭文字と最後文字の座標で示す。例えば、横書きの場合には、文字列のあった領域の左上隅の座標を先頭文字の座標とし、領域の右下隅の座標を最後文字の座標とする。縦書きの場合には、領域の右上隅の座標を先頭文字の座標とし、領域の左下隅の座標を最後文字の座標とする。
(4)この文字の存在する領域範囲について文字認識を行って、行の文字コード列を取得する。
(5)この文字の存在する領域範囲にある文字列の先頭文字の文字サイズを取得する。
(6)上記の取得した各行について、章分け情報記憶部161のライン番号、マーカーフラグ、文字列、文字サイズ、文字列の領域範囲を更新する。ここで、ライン番号は、ページ毎に各行に振られた順番号であり、マーカーフラグは「無」とする。
(1) The character area of one page of image data is determined.
(2) A line area representing a line is extracted from the character area.
(3) For each line area, extract an area range where characters exist.
This area range is indicated by the coordinates of the first character and the last character. For example, in the case of horizontal writing, the coordinates of the upper left corner of the area where the character string is located are the coordinates of the first character, and the coordinates of the lower right corner of the area are the coordinates of the last character. In the case of vertical writing, the coordinates of the upper right corner of the area are the coordinates of the first character, and the coordinates of the lower left corner of the area are the coordinates of the last character.
(4) Character recognition is performed for the area range in which this character exists, and the character code string of the line is acquired.
(5) The character size of the first character of the character string in the area range where this character exists is acquired.
(6) The line number, marker flag, character string, character size, and character string area range of the chapter division information storage unit 161 are updated for each acquired line. Here, the line number is a sequential number assigned to each line for each page, and the marker flag is “none”.

次に、制御部101は、マーカー設定部131を起動して、章分け条件取得部111から取得したすべての章分け条件の種類と対応する基準値を送る。
マーカー設定部131は、制御部101から送られてきた章分け条件の種類および基準値を参照して、ページ毎にすべての行に対してマーカーフラグを決定して、章分け情報記憶部161を更新し、制御部101に戻る。
Next, the control unit 101 activates the marker setting unit 131 and sends the reference values corresponding to all types of chaptering conditions acquired from the chaptering condition acquisition unit 111.
The marker setting unit 131 refers to the type of chapter division condition and the reference value sent from the control unit 101, determines marker flags for all lines for each page, and stores the chapter division information storage unit 161. Update and return to the control unit 101.

マーカーフラグは、指定された章分け条件にもとづいて、章分け情報記憶部161に記憶されているすべての行について判定が行われる。
また、指定された章分け条件が複数ある場合には、すべてのページに対して章分け条件を1つずつ適用して、各行のマーカーフラグを設定する。
The marker flag is determined for all the rows stored in the chaptering information storage unit 161 based on the specified chaptering condition.
If there are a plurality of designated chapter division conditions, the chapter division conditions are applied to all pages one by one, and the marker flag of each line is set.

(1)文字サイズによる章分け:
行の文章の先頭文字の文字サイズが指定された基準値より大きいか等しいときに、この行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(1) Chapter division by character size:
When the character size of the first character of the sentence in the line is greater than or equal to the specified reference value, this line is determined as the chapter division line, and the marker flag is set to “present”.

(2)空白行による章分け:
連続した空行の個数が指定された基準値より大きいか等しいときに、空行の次の行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(2) Chapter division by blank lines:
When the number of consecutive blank lines is greater than or equal to the specified reference value, the next line after the blank line is determined as the chapter division line, and the marker flag is set to “present”.

(3)ページ指定による章分け:
指定されたページの先頭行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(3) Chapter division by page designation:
The first line of the specified page is determined as the chapter division line, and the marker flag is set to “present”.

(4)ユーザ設定による章分け:
指定された文字列を含む行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(4) Chapter division by user setting:
The line containing the specified character string is determined to be a chapter division line, and the marker flag is set to “present”.

(5)全ページ検査による章分け:
この場合には、事前にマーカーフラグの設定はしない。
(5) Chapter division by all page inspection:
In this case, the marker flag is not set in advance.

次に、制御部101は、章分け情報確定部141を起動する。
この章分け情報確定部141は、マーカー設定部131で仮に設定された章分け箇所の行をユーザによって確定するものであり、その動作は、(1)「文字サイズ」、「空白行」、「ページ指定」、「ユーザ設定」による章分け条件が指定された場合と、(2)「全ページ検査」による章分け条件が指定された場合とでは、異なるので分けて説明する。
Next, the control unit 101 activates the chapter division information determination unit 141.
The chapter division information determination unit 141 determines a chapter division line temporarily set by the marker setting unit 131 by the user. The operations are (1) “character size”, “blank line”, “ Since the chaptering conditions specified by “page specification” and “user setting” are different from the case where the chaptering conditions specified by (2) “all page inspection” are different, they will be described separately.

(1)章分け情報確定部141は、章分け条件として、「文字サイズ」、「空白行」、「ページ指定」、「ユーザ設定」が指定された場合、図11に例示するような章分け箇所の確定画面を操作パネル103の表示部に表示する。 (1) The chapter division information determination unit 141, when “character size”, “blank line”, “page designation”, and “user setting” are designated as the chapter division conditions, the chapter division as illustrated in FIG. The location confirmation screen is displayed on the display unit of the operation panel 103.

この章分け箇所の確定画面には、プレビュー表示画面501、プレビュー表示しているページ番号表示502、読み取った原稿の全ページ数表示503、章分けページリスト表示504、章分けページリスト表示用スクロールバー505、章分けページリスト用ページ番号506、章分け有効(はい)ボタン507、章分け無効(いいえ)ボタン508、戻るボタン509、設定リセットボタン510、設定完了ボタン511が表示される。   The chapter division location confirmation screen includes a preview display screen 501, a page number display 502 for preview display, a total page count display 503 for the read original, a chapter page list display 504, and a chapter page list display scroll bar. 505, a chapter division page list page number 506, a chapter division valid (yes) button 507, a chapter division invalid (no) button 508, a return button 509, a setting reset button 510, and a setting completion button 511 are displayed.

この章分けページリスト表示504には、マーカー設定部131で仮に設定した章分け箇所を含むページ(マーカーフラグが「有」である行を含むページ)のページ番号のリストが表示される。
ユーザが正しく章分けされたかを確かめたいときに、このリストにある確かめたいページ番号をタッチして選択する。
The chapter division page list display 504 displays a list of page numbers of pages (pages including a line having a marker flag “Yes”) including a chapter division portion temporarily set by the marker setting unit 131.
When the user wants to check whether the chapter is correctly divided, the page number to be checked in this list is touched and selected.

章分け情報確定部141は、このタッチを検出すると、タッチ位置からページ番号を決定して、プレビュー表示中ページ番号表示502にタッチしたページ番号が表示し、そのページの画像をプレビュー表示画面501に表示する。この画像には、文字列(章タイトル)にマーカーが付されて表示される。   When detecting this touch, the chaptering information determination unit 141 determines the page number from the touch position, displays the page number touched on the page number display 502 during preview display, and displays an image of the page on the preview display screen 501. indicate. This image is displayed with a marker attached to the character string (chapter title).

例えば、図12のように、章分けページリスト表示504でページ番号20を選択すると、プレビュー表示中ページ番号表示502に「20」が表示され、プレビュー表示画面501にページ番号20の画像が表示される。この画像には、章タイトル「2.目的」にマーカー512が付けられて表示される。   For example, as shown in FIG. 12, when page number 20 is selected in the chapter division page list display 504, “20” is displayed in the page number display 502 during preview display, and the image of page number 20 is displayed in the preview display screen 501. The This image is displayed with a marker 512 attached to the chapter title “2. Purpose”.

ユーザは、プレビュー表示画面501にプレビューされた画像を見て、正しくマーカーが付されていると判断したときには、章分け有効ボタン(はい)507を押す(図13)。
この場合、章分け情報確定部141は、押したボタンの種類(このときは「章分け有効ボタン」である)と、ページ番号(「20」)と、マーカーの付されていたライン番号とを対応付けて操作履歴記憶部171に累積記憶する。
When the user looks at the previewed image on the preview display screen 501 and determines that the marker is correctly attached, the user presses the chapter division effective button (Yes) 507 (FIG. 13).
In this case, the chapter division information determination unit 141 displays the type of the pressed button (in this case, the “chapter division effective button”), the page number (“20”), and the line number to which the marker is attached. The information is accumulated and stored in the operation history storage unit 171 in association.

また、ユーザは、プレビュー表示画面501にプレビューされた画像を見て、正しくマーカーが章分け箇所の行に付されていないと判断したときには、章分け無効ボタン(いいえ)508を押す(図14)。
この場合、章分け情報確定部141は、図14のように章分けページリスト表示504内のページ番号「20」を削除し、プレビュー表示画面501やプレビュー表示中ページ番号表示502を初期状態に戻すとともに、押したボタンの種類(このときは「章分け無効ボタン」である)と、ページ番号(「20」)と、マーカーの付されていたライン番号とを対応付けて操作履歴記憶部171に累積記憶する。
Also, when the user views the previewed image on the preview display screen 501 and determines that the marker is not correctly attached to the chapter division line, the user presses the chapter division invalid button (No) 508 (FIG. 14). .
In this case, the chapter division information determination unit 141 deletes the page number “20” in the chapter division page list display 504 as shown in FIG. 14, and returns the preview display screen 501 and the page number display 502 during preview display to the initial state. At the same time, the type of the pressed button (in this case, “Chapter Invalid Button”), the page number (“20”), and the line number with the marker are associated with each other in the operation history storage unit 171. Accumulate memory.

また、章分け情報確定部141は、戻るボタン509が押されたことを検知すると、操作履歴記憶部171に記憶していた最後に行った操作の逆操作を行ったときの表示を行うとともに、最後の操作履歴を削除する。
また、章分け情報確定部141は、設定リセットボタン510が押されたことを検知すると、テキスト抽出部121で抽出した章分け状態の表示に戻すとともに、操作履歴記憶部171も初期状態に戻す。
また、章分け情報確定部141は、設定完了ボタン511が押されたことを検知すると、制御部101に戻る。
In addition, when the chapter division information determination unit 141 detects that the return button 509 is pressed, the chapter division information determination unit 141 displays the reverse operation of the last operation stored in the operation history storage unit 171. Delete the last operation history.
Further, when detecting that the setting reset button 510 has been pressed, the chapter division information determination unit 141 returns the chapter division state extracted by the text extraction unit 121 and the operation history storage unit 171 to the initial state.
Further, the chapter division information determination unit 141 returns to the control unit 101 when detecting that the setting completion button 511 is pressed.

(2)章分け情報確定部141は、「全ページ検査」による章分け条件が指定された場合、図15に例示するような章分け箇所の確定画面を操作パネル103の表示部に表示する。
図15の画面に表示された各ボタンの意味は、上述の図11と同じであるので説明を省略する。但し、「全ページ検査」の条件の場合には、プレビュー表示画面501をタッチパネルとして使用する点が相違する。
(2) When the chapter division condition by “all page inspection” is designated, the chapter division information confirmation unit 141 displays a chapter division part confirmation screen as illustrated in FIG. 15 on the display unit of the operation panel 103.
The meaning of each button displayed on the screen of FIG. 15 is the same as that of FIG. However, the “all page inspection” condition is different in that the preview display screen 501 is used as a touch panel.

ユーザは、章分けページリスト表示504には、ページ番号が一つも表示されていないので、全ページ数表示503に表示されたページ数(図15の場合は120ページ)の中から、表示したいページ番号を適宜選んで、テンキーによりプレビュー表示中ページ番号表示502に入力し、プレビュー表示画面501でそのページの画像を確認しながら、1ページごとに章分け箇所を設定していく。   Since no page number is displayed in the chapter division page list display 504, the user wants to display the page number to be displayed from the number of pages displayed in the total page number display 503 (120 pages in the case of FIG. 15). A number is appropriately selected and input to the page number display 502 during preview display using the numeric keypad, and chapter divisions are set for each page while checking the image of the page on the preview display screen 501.

章分け情報確定部141は、プレビュー表示中ページ番号表示502が選択され、テンキーからページ番号「20」が入力されたことを検知すると、章分け情報記憶部161を参照して、指定されたページ番号「20」に対応する画像を取得して、図16のようにプレビュー表示画面501に表示する。   When the chapter number information determining unit 141 detects that the page number display 502 during preview display is selected and the page number “20” is input from the numeric keypad, the chapter number information determining unit 141 refers to the chapter number information storage unit 161 to specify the specified page. An image corresponding to the number “20” is acquired and displayed on the preview display screen 501 as shown in FIG.

図16において、ユーザがページ番号「20」中の『2.目的』という行を章分け箇所として使用したい場合には、プレビュー表示画面501の『2.目的』という文字列を「指」でなぞる(図17の矢印513)。
章分け情報確定部141は、プレビュー表示画面501が指でなぞられたことを検知し、指でなぞられた位置の『2.目的』の部分にマーカー513を付加してプレビュー表示画面501の表示を更新する。
In FIG. 16, the user selects “2. When it is desired to use the line “Purpose” as a chapter division, “2. The character string “purpose” is traced with a “finger” (arrow 513 in FIG. 17).
The chapter division information determination unit 141 detects that the preview display screen 501 is traced with a finger, and “2. The marker 513 is added to the “purpose” portion to update the display on the preview display screen 501.

さらに、このマーカー513が付加された状態で、章分け有効ボタン507が押されたことを検知すると、指でなぞられた位置と、文字列『2.目的』の領域範囲とからページ内のライン番号を決定し、章分けページリスト表示504にページ番号「20」を追加表示する(図18)。この場合、章分け情報確定部141は、押したボタンの種類(このときは「章分け有効ボタン」である)と、ページ番号(「20」)と、指でなぞられた文字列に対応するライン番号とを対応付けて操作履歴記憶部171に累積記憶する。   Further, when it is detected that the chapter division valid button 507 is pressed with the marker 513 added, the position traced with the finger and the character string “2. The line number in the page is determined from the “object” area range, and the page number “20” is additionally displayed in the chapter division page list display 504 (FIG. 18). In this case, the chapter division information determination unit 141 corresponds to the type of button pressed (in this case, “chapter division valid button”), the page number (“20”), and the character string traced with the finger. The line numbers are associated and accumulated in the operation history storage unit 171.

同様にして、プレビュー表示画面501でそのページの画像を確認しながら、1ページごとに章分け箇所を設定していき、最後に、設定完了ボタン511が押されたときに、制御部101に戻る。   Similarly, while checking the image of the page on the preview display screen 501, chapter divisions are set for each page, and finally, when the setting completion button 511 is pressed, the process returns to the control unit 101. .

次に、制御部101は、PDF変換部151を起動する。
PDF変換部151は、章分け情報記憶部161に記憶した情報および操作履歴記憶部171に記憶した操作履歴からリンク情報付きのPDF形式の電子文書を生成してPDF文書記憶部181に記憶し、制御部101に戻る。
Next, the control unit 101 activates the PDF conversion unit 151.
The PDF conversion unit 151 generates a PDF-format electronic document with link information from the information stored in the chaptering information storage unit 161 and the operation history stored in the operation history storage unit 171, and stores the electronic document in the PDF document storage unit 181. Return to the control unit 101.

上記の変換処理は、まず、操作履歴記憶部171に記憶した操作履歴を順に取り出して、操作が「章分け有効ボタン」であるときには、対応するページ番号のライン番号のマーカーフラグを「有」に設定し、また、「章分け無効ボタン」であるときには、対応するページ番号のライン番号のマーカーフラグを「無」に設定して、章分け情報記憶部161を更新する。   In the above conversion process, first, operation histories stored in the operation history storage unit 171 are sequentially extracted. When the operation is a “chapter effective button”, the marker flag of the line number of the corresponding page number is set to “present”. When it is set to “invalid chapter division button”, the marker flag of the line number of the corresponding page number is set to “none”, and the chapter division information storage unit 161 is updated.

次に、章分け情報記憶部161に記憶した各ページの画像データを、マーカーフラグが「有」に設定されているライン番号の文字列(章タイトル)にマーカーを付して修正する。
また、章分け情報記憶部161のすべてのライン番号について、マーカーフラグが「有」に設定されているライン番号の文字列(章タイトル)およびページ番号を取り出して、章タイトルとページ番号とからなるアウトラインデータを作成する(PDF形式におけるしおりに相当する)。
さらに、このアウトラインデータ中の文字列と、該文字列に対応するマーカー付きの文字列とをリンクで接続するリンク情報を作成する。
最後に、作成されたすべてのページについて、画像データ、すべての行の文字列コードと、アウトラインデータをまとめてPDF形式の電子文書を生成して、PDF文書記憶部181に記憶する。
Next, the image data of each page stored in the chapter division information storage unit 161 is corrected by adding a marker to the character string (chapter title) of the line number for which the marker flag is set to “present”.
Further, for all line numbers in the chapter division information storage unit 161, the character string (chapter title) and page number of the line number for which the marker flag is set to “exist” are extracted, and the chapter title and page number are included. Outline data is created (corresponding to a bookmark in PDF format).
Further, link information for connecting the character string in the outline data and a character string with a marker corresponding to the character string by a link is created.
Finally, for all the created pages, the image data, the character string codes of all the lines, and the outline data are combined to generate an electronic document in PDF format, and stored in the PDF document storage unit 181.

上述のように、章分け機能を利用すると、原稿からPDF形式のリンク情報付の電子文書を作成することができ、このPDF文書記憶部181に記憶された文書データをネットワークで接続された外部の端末装置へ送信することもできるし、また、これをもとに印刷することもできる。   As described above, by using the chapter division function, an electronic document with link information in PDF format can be created from a manuscript, and the document data stored in the PDF document storage unit 181 is externally connected via a network. It can be transmitted to the terminal device, and can be printed based on this.

また、上述のようにして作成されたリンク情報付の電子文書をネットワークで接続した端末装置から読み込んだり、USB等のインターフェースで接続した記憶装置から読み込んだときには、制御部101は、PDF文書記憶部181に記憶された画像データのうち、アウトラインデータと先頭ページの画像を図19のように操作パネル103の表示部に表示する。図19では、アウトラインデータ601とページの画像データ602が表示される。画像データ602には、最初は先頭ページが表示されるが、アウトラインデータ601の中の文字列(章タイトル)をタッチすると、その文字列を含むページの画像が表示される。
このように、ユーザは、アウトラインデータ601に表示された章タイトルを選択することによって、その章の印刷だけを速やかに指示することができる。
When the electronic document with link information created as described above is read from a terminal device connected via a network or read from a storage device connected via an interface such as a USB, the control unit 101 displays a PDF document storage unit. Among the image data stored in 181, outline data and the first page image are displayed on the display unit of the operation panel 103 as shown in FIG. 19. In FIG. 19, outline data 601 and page image data 602 are displayed. Initially, the first page is displayed in the image data 602. When a character string (chapter title) in the outline data 601 is touched, an image of a page including the character string is displayed.
As described above, the user can promptly instruct only the printing of the chapter by selecting the chapter title displayed in the outline data 601.

尚、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能であるのは勿論である。
例えば、ネットワークを介して端末装置から原稿画像をMFPに送信し、MFPから送られてくる仮に設定した章分け箇所を該端末装置が表示し、その仮の章分け箇所が有効であるか無効であるかの確定情報を該端末装置から受信したMFPがリンク情報付きの電子文書を生成して、該端末装置に送り返すように構成してもよい。
Note that the present invention is not limited to the above-described embodiment, and various modifications and corrections can be made without departing from the scope of the present invention.
For example, a document image is transmitted from the terminal device to the MFP via the network, and the provisionally set chapter division location sent from the MFP is displayed on the terminal device, and the provisional chapter division location is valid or invalid. It may be configured such that the MFP that has received the certain information from the terminal device generates an electronic document with link information and sends it back to the terminal device.

実施形態の画像形成装置(MFP)のハードウェアの概略構成を示すブロック図である。1 is a block diagram illustrating a schematic configuration of hardware of an image forming apparatus (MFP) according to an embodiment. 実施形態に係る制御部の詳細な機能構成図である。It is a detailed functional block diagram of the control part which concerns on embodiment. 章分け機能指示画面例である。It is an example of a chapter division function instruction screen. 章分け条件選択画面例である。It is an example of a chapter division condition selection screen. 文字サイズの基準値の設定画面例である。It is an example of a setting screen for a character size reference value. 空白行数の基準値の設定画面例である。It is an example of a setting screen for the reference value of the number of blank lines. 章分け箇所のページの設定画面例である。It is an example of a setting screen of a chapter division page. 章分け条件としてページ指定を使用するときの原稿例である。It is an example of a manuscript when page designation is used as a chaptering condition. 章分け箇所の章タイトルに含まれる文字列の設定画面例である。It is the example of a setting screen of the character string contained in the chapter title of a chapter division part. 章分け条件として全ページ検査を指定したときの画面例である。It is an example of a screen when all page inspection is specified as a chapter division condition. 章分け箇所の確定画面例である。It is an example of the confirmation screen of a chapter division part. 章分けページリスト表示においてページ番号を選択したときのプレビュー表示例である。It is an example of a preview display when a page number is selected in the chaptered page list display. プレビュー表示されたページを章分け箇所を含むページとして確定したときの画面例である。It is an example of a screen when a page displayed as a preview is confirmed as a page including a chapter division part. プレビュー表示されたページを章分け箇所を含むページでないとしたときの画面例である。It is an example of a screen when a page displayed as a preview is not a page including a chapter division. 章分け箇所の確定画面の他の例である。It is another example of the chapter division confirmation screen. ケージ番号を指定したときのプレビュー表示画面例である。It is an example of a preview display screen when a cage number is designated. プレビュー表示画面で章タイトルを指定したときの表示画面例である。It is an example of a display screen when a chapter title is designated on the preview display screen. 章分け箇所として確定したときの章分けページリスト表示の画面例である。It is a screen example of a chapter division page list display when it is determined as a chapter division portion. リンク情報付き電子文書を読み込んだときに表示される目次とページ内容のプレビュー表示画面の表示例である。It is a display example of a preview display screen of a table of contents and a page content displayed when an electronic document with link information is read.

符号の説明Explanation of symbols

100…MFP(複合機)、101…制御部、102…記憶部、103…操作パネル、104…画像読取部、105…画像出力部、106…ネットワークインターフェース、107…システムバス、111…章分け条件取得部、121…テキスト抽出部、131…マーカー設定部、141…章分け情報確定部、151…PDF変換部、161…章分け情報記憶部、171…操作履歴記憶部、181…PDF文書記憶部、301…章分け機能ボタン、302…設定リセットボタン、303…閉じるボタン、304…次の原稿ありボタン、305…次の原稿なしボタン、306…スタートボタン、401…文字サイズボタン、402…空白行ボタン、403…ページ指定ボタン、404…ユーザ設定ボタン、405…全ページ検査ボタン、406…キャンセルボタン、407…OKボタン、408…文字サイズ設定欄、409…設定文字サイズプレビュー画面、410…空白行数設定欄、411…ページ番号設定欄、412…ユーザ指定文字列設定欄、501…プレビュー表示画面、502…プレビュー表示中ページ番号表示、503…全ページ数表示、504…ページリスト表示、505…ページリスト表示用スクロールバー、506…ページリスト用ページ番号、507…章分け有効ボタン、508…章分け無効ボタン、509…戻るボタン、510…設定リセットボタン、511…設定完了ボタン、512…マーカー付き章タイトル、513…マーカー付き章タイトル、513…指でなぞった章タイトルの矢印、601…アウトラインデータ、602…アウトラインデータからリンクされたページの画像。 DESCRIPTION OF SYMBOLS 100 ... MFP (multifunction machine), 101 ... Control part, 102 ... Memory | storage part, 103 ... Operation panel, 104 ... Image reading part, 105 ... Image output part, 106 ... Network interface, 107 ... System bus, 111 ... Chapter division condition Acquiring unit 121 ... Text extracting unit 131 ... Marker setting unit 141 ... Chapter division information determination unit 151 ... PDF conversion unit 161 ... Chapter division information storage unit 171 ... Operation history storage unit 181 ... PDF document storage unit , 301 ... Chapter division function button, 302 ... Setting reset button, 303 ... Close button, 304 ... Next original button, 305 ... Next original button, 306 ... Start button, 401 ... Character size button, 402 ... Blank line Button 403 ... Page designation button 404 ... User setting button 405 ... All page inspection button 406 Cancel button, 407 ... OK button, 408 ... Character size setting field, 409 ... Setting character size preview screen, 410 ... Blank line number setting field, 411 ... Page number setting field, 412 ... User specified character string setting field, 501 ... Preview Display screen 502 ... Page number display during preview display, 503 ... Total page number display, 504 ... Page list display, 505 ... Page list display scroll bar, 506 ... Page list page number, 507 ... Chapter division enable button, 508 ... chapter division invalid button, 509 ... back button, 510 ... setting reset button, 511 ... setting completion button, 512 ... chapter title with marker, 513 ... chapter title with marker, 513 ... arrow of chapter title traced with finger, 601 ... Outline data, 602 ... Restore from outline data Click pages of the image.

Claims (6)

複数ページからなる原稿を読み取って電子文書を作成可能な画像形成装置において、
読み取った原稿画像を文字認識して抽出した行単位の文字列から、ユーザから与えられた条件に基づいて、章分け箇所の候補行を抽出して該候補行の画像に仮マーカー付けし、
前記仮マーカー付けした候補行を含むページの画像を表示して、ユーザからの指示に基づいて前記候補行が章分け箇所であることを確定し、
前記確定された章分け箇所にマーカー付けして原稿画像を修正するとともに、該章分け箇所の行から抽出した文字列と前記章分け箇所とを関連付けしたリンク情報を含むアウトラインデータを生成し、
すべての原稿画像と、該アウトラインデータとからリンク情報付の電子文書を生成することを特徴とする画像形成装置。
In an image forming apparatus capable of creating an electronic document by reading a document consisting of a plurality of pages,
Based on the conditions given by the user, from the character string in line units extracted by character recognition of the read document image, the candidate line of the chapter division part is extracted and a temporary marker is attached to the image of the candidate line,
Display an image of a page including the candidate line with the provisional marker, and confirm that the candidate line is a chapter division based on an instruction from the user,
Correcting the document image by marking the determined chapter division location, and generating outline data including link information associating the character string extracted from the chapter division location and the chapter division location;
An image forming apparatus that generates an electronic document with link information from all original images and the outline data.
請求項1に記載の画像形成装置において、原稿画像内の行の文字サイズがユーザの指定した文字サイズより大きいときに、該行を章分け箇所の候補行とすることを特徴とする画像形成装置。   2. The image forming apparatus according to claim 1, wherein when a character size of a line in the document image is larger than a character size designated by the user, the line is set as a candidate line for a chapter division part. . 請求項1に記載の画像形成装置において、原稿画像内の空白行数がユーザの指定した空白行数より大きいときに、空白行の次の行を章分け箇所の候補行とすることを特徴とする画像形成装置。   2. The image forming apparatus according to claim 1, wherein when the number of blank lines in the document image is larger than the number of blank lines specified by the user, a line next to the blank line is set as a candidate line for a chapter division part. Image forming apparatus. 請求項1に記載の画像形成装置において、ユーザの指定したページ番号に合致した原稿画像内の先頭行を章分け箇所の候補行とすることを特徴とする画像形成装置。   2. The image forming apparatus according to claim 1, wherein the first line in the original image that matches the page number designated by the user is set as a candidate line for a chapter division part. 請求項1に記載の画像形成装置において、原稿画像内の行の文字列にユーザの指定した文字列含むときに、該行を章分け箇所の候補行とすることを特徴とする画像形成装置。   2. The image forming apparatus according to claim 1, wherein when a character string designated by a user is included in a character string of a line in a document image, the line is set as a candidate line for a chapter division part. 請求項1に記載の画像形成装置において、原稿画像内のユーザの指定した行を章分け箇所の候補行とすることを特徴とする画像形成装置。   2. The image forming apparatus according to claim 1, wherein a line designated by a user in the document image is set as a candidate line for a chapter division part.
JP2008276518A 2008-10-28 2008-10-28 Image forming apparatus Active JP4934124B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008276518A JP4934124B2 (en) 2008-10-28 2008-10-28 Image forming apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008276518A JP4934124B2 (en) 2008-10-28 2008-10-28 Image forming apparatus

Publications (2)

Publication Number Publication Date
JP2010109420A true JP2010109420A (en) 2010-05-13
JP4934124B2 JP4934124B2 (en) 2012-05-16

Family

ID=42298476

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008276518A Active JP4934124B2 (en) 2008-10-28 2008-10-28 Image forming apparatus

Country Status (1)

Country Link
JP (1) JP4934124B2 (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102780824A (en) * 2011-05-10 2012-11-14 夏普株式会社 Image forming system
JP2012223952A (en) * 2011-04-19 2012-11-15 Canon Inc Information processing apparatus, pdl data conversion method, and computer program
WO2012169380A1 (en) * 2011-06-09 2012-12-13 Shindo Tatsuya Document sharing system
US8860990B2 (en) 2011-06-14 2014-10-14 Canon Kabushiki Kaisha Information processing apparatus, PDL data conversion method, and storage medium
JP2014226897A (en) * 2013-05-27 2014-12-08 大日本印刷株式会社 Printer capable of guaranteeing continuity of pages when resuming printing and method for resuming printing by printer
US9690528B1 (en) 2016-03-30 2017-06-27 Konica Minolta Laboratory U.S.A., Inc. Automatically editing print job based on state of the document to be printed
JP2018148580A (en) * 2018-06-05 2018-09-20 シャープ株式会社 Image transmitting apparatus and image transmitting method
CN109479081A (en) * 2017-07-03 2019-03-15 京瓷办公信息系统株式会社 Original document reading apparatus

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0888755A (en) * 1994-09-19 1996-04-02 Sharp Corp Image processing unit
JPH08137909A (en) * 1994-11-15 1996-05-31 Canon Inc Image forming device and its editing method
JPH09204439A (en) * 1996-01-29 1997-08-05 Matsushita Electric Ind Co Ltd Information display device
JP2000250908A (en) * 1999-02-26 2000-09-14 Planet Computer:Kk Support device for production of electronic book
JP2003132042A (en) * 2001-10-29 2003-05-09 Sharp Corp Table of contents generation device
JP2005004616A (en) * 2003-06-13 2005-01-06 Hypergear:Kk Link information production system for document

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0888755A (en) * 1994-09-19 1996-04-02 Sharp Corp Image processing unit
JPH08137909A (en) * 1994-11-15 1996-05-31 Canon Inc Image forming device and its editing method
JPH09204439A (en) * 1996-01-29 1997-08-05 Matsushita Electric Ind Co Ltd Information display device
JP2000250908A (en) * 1999-02-26 2000-09-14 Planet Computer:Kk Support device for production of electronic book
JP2003132042A (en) * 2001-10-29 2003-05-09 Sharp Corp Table of contents generation device
JP2005004616A (en) * 2003-06-13 2005-01-06 Hypergear:Kk Link information production system for document

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012223952A (en) * 2011-04-19 2012-11-15 Canon Inc Information processing apparatus, pdl data conversion method, and computer program
US8773677B2 (en) 2011-04-19 2014-07-08 Canon Kabushiki Kaisha Information processing apparatus, PDL data conversion method, and storage medium
JP2012238953A (en) * 2011-05-10 2012-12-06 Sharp Corp Image forming system and function addition method
CN102780824A (en) * 2011-05-10 2012-11-14 夏普株式会社 Image forming system
JPWO2012169380A1 (en) * 2011-06-09 2015-02-23 達也 進藤 Document sharing system
WO2012169380A1 (en) * 2011-06-09 2012-12-13 Shindo Tatsuya Document sharing system
US8860990B2 (en) 2011-06-14 2014-10-14 Canon Kabushiki Kaisha Information processing apparatus, PDL data conversion method, and storage medium
JP2014226897A (en) * 2013-05-27 2014-12-08 大日本印刷株式会社 Printer capable of guaranteeing continuity of pages when resuming printing and method for resuming printing by printer
US9690528B1 (en) 2016-03-30 2017-06-27 Konica Minolta Laboratory U.S.A., Inc. Automatically editing print job based on state of the document to be printed
US10216991B2 (en) 2016-03-30 2019-02-26 Konica Minolta Laboratory U.S.A., Inc. Automatically editing print job based on state of the document to be printed
CN109479081A (en) * 2017-07-03 2019-03-15 京瓷办公信息系统株式会社 Original document reading apparatus
US10397416B2 (en) 2017-07-03 2019-08-27 Kyocera Document Solutions Inc. Document reading device generating separate files based on character strings recognized on different pages
CN109479081B (en) * 2017-07-03 2019-12-17 京瓷办公信息系统株式会社 Document reading apparatus
JP2018148580A (en) * 2018-06-05 2018-09-20 シャープ株式会社 Image transmitting apparatus and image transmitting method

Also Published As

Publication number Publication date
JP4934124B2 (en) 2012-05-16

Similar Documents

Publication Publication Date Title
JP4934124B2 (en) Image forming apparatus
US8726178B2 (en) Device, method, and computer program product for information retrieval
US8610929B2 (en) Image processing apparatus, control method therefor, and program
US8634100B2 (en) Image forming apparatus for detecting index data of document data, and control method and program product for the same
JP2010039943A (en) Layout printing system, layout document browsing method, and program
US8134739B2 (en) Information processing device for outputting reduced-size pages
US8897594B2 (en) Image reader, mobile terminal apparatus, and non-transitory computer readable medium
US9614984B2 (en) Electronic document generation system and recording medium
US20100251110A1 (en) Document processing apparatus, control method therefor, and computer-readable storage medium storing program for the control method
US8854635B2 (en) Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings
JP2013196479A (en) Information processing system, information processing program, and information processing method
JP2010086151A (en) Data generation device, scanner, and computer program
US20120137219A1 (en) Document viewing device for displaying document data
JP2007148486A (en) Method for supporting document browsing, system for the same, document processor, and program
US10511733B2 (en) Setting method and setting apparatus of image forming apparatus
JP6201638B2 (en) Form processing apparatus and program
JP2011134285A (en) Printing processing apparatus, printing processing program, and printing processing method
JP6205973B2 (en) Change history output device, program
JP4827519B2 (en) Image processing apparatus, image processing method, and program
JP2007052613A (en) Translation device, translation system and translation method
JP2007011683A (en) Document management support device
JP4797507B2 (en) Translation apparatus, translation system, and program
US20100188674A1 (en) Added image processing system, image processing apparatus, and added image getting-in method
JP7271987B2 (en) Information processing device and program
US20200250266A1 (en) Information processing apparatus and non-transitory computer readable medium storing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110223

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120217

R150 Certificate of patent or registration of utility model

Ref document number: 4934124

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150224

Year of fee payment: 3