JP2006072484A - Image processor, program, and storage medium - Google Patents

Image processor, program, and storage medium Download PDF

Info

Publication number
JP2006072484A
JP2006072484A JP2004252408A JP2004252408A JP2006072484A JP 2006072484 A JP2006072484 A JP 2006072484A JP 2004252408 A JP2004252408 A JP 2004252408A JP 2004252408 A JP2004252408 A JP 2004252408A JP 2006072484 A JP2006072484 A JP 2006072484A
Authority
JP
Japan
Prior art keywords
page
layout
file
image
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004252408A
Other languages
Japanese (ja)
Inventor
Michihiro Tamune
道弘 田宗
Atsushi Ito
篤 伊藤
Masatoshi Tagawa
昌俊 田川
Naoko Sato
直子 佐藤
Tsuguaki Ryu
紹明 劉
Hiroshi Masuichi
博 増市
Kiyoshi Tashiro
潔 田代
Kyosuke Ishikawa
恭輔 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004252408A priority Critical patent/JP2006072484A/en
Publication of JP2006072484A publication Critical patent/JP2006072484A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To facilitate delimiting storage of documents in computerizing and storing a plurality of documents. <P>SOLUTION: This image processor optically reads a plurality of pages and determines, for every read page, the difference of the layout of each page from the layout of a page adjacent to each page. The image processor specifies, upon instructing display of a page that is a delimiter of a document, a page having a difference of a predetermined value or more, and displays the image of the specified page. The image processor determines, upon inputting an instruction for deciding a displayed page as a delimiter of a document, the displayed page as the delimiter of a document. The image processor delimits, upon inputting an instruction of classifying the plurality of read pages to a plurality of documents, the plurality of read pages by a page determined as a delimiter, and generates and stores, for every delimited range, a document file containing images of pages within the range. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、電子化された文書を分類して保存する技術に関する。   The present invention relates to a technique for classifying and storing digitized documents.

業務に大量の文書が用いられる企業においては、文書の電子化に関する技術が注目されている。このうち、紙に印刷されて保存されていた文書を電子化する技術は、文書の検索が容易となり文書の再利用性が高まる等、様々な効果を得ることができるため特に注目されている。従来、大量の文書を電子化して保存する際には、文書群の中から一つづつ文書を取り出してスキャナに読取らせた後、読取った文書を示す画像ファイルを文書毎に記憶させる方法が採られていた。しかしながら、このような方法では、文書の電子化を行う作業者が文書の区切りを判別し、個々の文書毎に文書を取り出してスキャナに載置するという面倒な作業を行う必要があった。   In companies where a large amount of documents are used for business, technology relating to the digitization of documents is attracting attention. Among them, a technique for digitizing a document that has been printed and stored on paper is particularly attracting attention because it can obtain various effects such as easy document search and enhanced document reusability. Conventionally, when a large number of documents are digitized and stored, a method of taking out documents one by one from a group of documents and causing a scanner to read them, and then storing an image file indicating the read documents for each document. It was taken. However, in such a method, it is necessary for the operator who digitizes the document to perform a cumbersome operation of determining a document break, taking out the document for each individual document, and placing the document on the scanner.

そこで、このような面倒な作業を行うことなく、容易に紙文書を電子化して保存する技術が提案されている(例えば、特許文献1参照)。特許文献1に示されている電子ファイリング装置は、複数の文書を纏めてスキャンする際に文書間に挿入された仕切り紙を検知し、この仕切り紙のある部分を文書間の区切りとして文書毎に文書ファイルを生成して記憶する。特許文献1に記載されている電子ファイリング装置によれば、文書群を纏めてスキャンしても文書毎にファイルが生成されるので、大量の文書を容易に電子化して保存することが可能となる。
特開平9−231309号公報
Therefore, a technique has been proposed in which a paper document is easily digitized and stored without performing such troublesome work (see, for example, Patent Document 1). The electronic filing device disclosed in Patent Document 1 detects a partition sheet inserted between documents when a plurality of documents are collectively scanned, and uses a part of the partition sheet as a partition between documents for each document. Generate and store a document file. According to the electronic filing device described in Patent Document 1, since a file is generated for each document even when a group of documents is scanned together, a large amount of documents can be easily digitized and stored. .
Japanese Patent Laid-Open No. 9-231309

ところで、特許文献1に記載されている電子ファイリング装置では、複数の文書を纏めてスキャンさせる際、電子化を行う作業者が文書の区切りを判断し仕切り紙を挿入する必要がある。電子化する文書の数が少ない場合には、このように仕切り紙を挿入する作業は作業者にとって苦にならないが、大量の文書をスキャンして電子化する場合には、文書の区切りに仕切り紙を逐一挿入していくのは非常に労力のいる作業となる。   By the way, in the electronic filing device described in Patent Document 1, when a plurality of documents are scanned together, it is necessary for an operator who performs digitization to determine a document break and insert a partition sheet. When the number of documents to be digitized is small, the work of inserting dividers in this way does not bother the operator. However, when a large number of documents are scanned and digitized, dividers are used as document dividers. It is very labor intensive to insert each one.

本発明は、上述した背景の下になされたものであり、複数の文書を電子化して保存する際、容易に文書を区切って保存できるようにすることを目的とする。   The present invention has been made under the above-described background, and an object of the present invention is to easily store a plurality of documents by separating them when the documents are digitized and stored.

上述した課題を解決するために本発明は、複数のページを光学的に読取り画像ファイルを生成する読取り手段と、前記読取り手段により生成された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段とを有する画像処理装置を提供する。   In order to solve the above-described problems, the present invention provides a reading means for optically reading a plurality of pages and generating an image file, and a layout recognition for recognizing the layout of the page represented by the image file generated by the reading means. And a dissimilarity generation means for obtaining a dissimilarity between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file by the layout recognized by the layout recognizing means; A first instruction input unit that receives a first instruction for instructing display of a page that serves as a document separator, and when the first instruction input unit receives the instruction, the degree of difference obtained by the difference degree generation unit is predetermined. Separator page display means for displaying an image of a page having a value equal to or greater than the value using the image file; A second instruction input means for receiving a second instruction for instructing to determine the page as a document break; and when the second instruction input means receives the instruction, the displayed page is determined as a break page. A third page input unit for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading unit and classify the pages into a plurality of documents; When the input means receives the instruction, the plurality of pages represented by the image file generated by the reading means are separated by the pages determined by the separator page determining means, and the pages within the range are separated for each divided range. An image processing apparatus is provided that includes a storage unit that generates a document file including an image of a page and stores the generated document file.

この画像処理装置は、複数のページを光学的に読取り、読取ったページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの相違度を求める。そして画像処理装置は、文書の区切りとなるページの表示を指示された場合、相違度が所定の値以上となっているページを特定し、該特定されたページの画像を表示する。また、画像処理装置は、表示されたページを文書の区切りとして決定する指示が入力された場合、表示されたページを文書の区切りとして決定する。画像処理装置は、読取った複数のページを区切り、複数の文書に分類する指示が入力されると、読取った複数のページを、区切りとして決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する。   This image processing apparatus optically reads a plurality of pages, and obtains the degree of difference between the layout of each page and the layout of a page adjacent to each page for each read page. When the image processing apparatus is instructed to display a page serving as a document break, the image processing apparatus specifies a page having a degree of difference equal to or greater than a predetermined value, and displays an image of the specified page. Further, when an instruction to determine the displayed page as a document break is input, the image processing apparatus determines the displayed page as a document break. When an instruction to divide a plurality of read pages and categorize into a plurality of documents is input, the image processing apparatus divides the read pages by a page determined as a delimiter, and each range is divided into the ranges. A document file including an image of the page inside is generated, and the generated document file is stored.

また本発明は、コンピュータ装置を、ページを表す画像ファイルを記憶部に記憶させる記憶手段と、前記記憶部に記憶された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段として機能させるプログラムと、該プログラムを記録したコンピュータ読取り可能な記録媒体を提供する。   According to another aspect of the present invention, there is provided a computer apparatus, a storage unit that stores an image file representing a page in a storage unit, a layout recognition unit that recognizes a layout of a page represented by the image file stored in the storage unit, and the layout A dissimilarity generating means for obtaining a dissimilarity between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, according to the layout recognized by the recognizing means; A first instruction input means for receiving a first instruction for instructing display of the page, and when the first instruction input means receives the instruction, the difference obtained by the difference generation means is a predetermined value or more. Separating page display means for displaying an image of a current page using the image file, and displaying the displayed page as a document section. Second instruction input means for receiving a second instruction for instructing to be determined, and a separator page determining means for determining the displayed page as a separator page when the second instruction input means receives the instruction; A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify them into a plurality of documents; and the third instruction input means When received, the plurality of pages represented by the image file generated by the reading unit is divided by the pages determined by the separator page determining unit, and images of pages within the range are included for each divided range. A program for generating a document file and functioning as a storage means for storing the generated document file, and a computer storing the program Providing over data readable recording medium.

本発明によれば、複数の文書を電子化して保存する際、容易に文書を区切って保存できるようになる。   According to the present invention, when a plurality of documents are digitized and stored, the documents can be easily separated and stored.

[構成]
図1は、本発明の実施形態に係る画像処理装置100の構成を示すブロック図である。図1に示したように、画像処理装置100の各部は、バス101に接続されており、このバス101を介して各部間で通信を行う。
[Constitution]
FIG. 1 is a block diagram illustrating a configuration of an image processing apparatus 100 according to an embodiment of the present invention. As illustrated in FIG. 1, each unit of the image processing apparatus 100 is connected to a bus 101, and communication is performed between the units via the bus 101.

スキャナ部108は、文書を光学的に読み取り、読取った文書を表す画像ファイルを生成するスキャナ機構を具備している。また、スキャナ部108は、ADF(Auto Document Feeder)を具備しており、CPU(Central Processing Unit)102の制御の下、ADFに載置された文書を1ページづつ読取り、1ページ毎に画像ファイルを生成する。
操作部107は、テンキーや矢印キー等、画像処理装置100を操作するための各種キーを備えており、このキーが押下されると、押下されたキーを示す信号を、CPU102へ供給する。
表示部106は、例えば、液晶ディスプレイ等の表示デバイスを有しており、CPU102の制御の下、画像処理装置100を操作するためのメニュー画面や、スキャナ部108で読取った文書の画像等、各種画面を表示する。
The scanner unit 108 includes a scanner mechanism that optically reads a document and generates an image file representing the read document. The scanner unit 108 includes an ADF (Auto Document Feeder), reads a document placed on the ADF one page at a time under the control of a CPU (Central Processing Unit) 102, and outputs an image file for each page. Is generated.
The operation unit 107 includes various keys such as a numeric keypad and an arrow key for operating the image processing apparatus 100. When this key is pressed, a signal indicating the pressed key is supplied to the CPU.
The display unit 106 includes, for example, a display device such as a liquid crystal display, and various types such as a menu screen for operating the image processing apparatus 100 under the control of the CPU 102 and an image of a document read by the scanner unit 108. Display the screen.

記憶部105は、例えばハードディスク装置など、データを永続的に記憶する装置を具備しており、画像処理装置100の各部を制御する機能を実現するOS(Operating System)プログラムや、スキャナ部108により生成された画像ファイルを文書毎に一つのファイルとしてまとめ、記憶部105に記憶させる機能を実現する画像処理プログラムなど、各種プログラムを記憶している。
また、記憶部105は、図2に示したフォーマットのファイルテーブルTB1を記憶している。ファイルテーブルTB1においては、「レコード番号」と、「画像ファイル名」と、「外接矩形画像ファイル名」と、「相違度」と、「区切りデータ」の各項目が互いに関連付けられている。
The storage unit 105 includes a device that permanently stores data, such as a hard disk device, and is generated by an OS (Operating System) program that realizes a function of controlling each unit of the image processing apparatus 100 or a scanner unit 108. Various programs such as an image processing program that realizes a function of collecting the obtained image files as one file for each document and storing them in the storage unit 105 are stored.
The storage unit 105 stores a file table TB1 having the format shown in FIG. In the file table TB1, items of “record number”, “image file name”, “circumscribed rectangle image file name”, “difference”, and “separation data” are associated with each other.

ROM(Read Only Memory)103は、IPL(Initial Program Loader)と呼ばれるプログラムを記憶している。CPU102は、図示を省略した電源から電力が供給されると、ROM103からIPLを読み出して実行する。CPU102は、IPLを実行すると、記憶部105からOSプログラムを読み出し、RAM(Random Access Memory)104を作業エリアとして起動する。CPU102は、OSプログラムを起動すると記憶部105から画像処理プログラムを読出して起動する。   A ROM (Read Only Memory) 103 stores a program called IPL (Initial Program Loader). When power is supplied from a power supply (not shown), the CPU 102 reads the IPL from the ROM 103 and executes it. When the IPL is executed, the CPU 102 reads an OS program from the storage unit 105 and starts up a RAM (Random Access Memory) 104 as a work area. When the OS program is activated, the CPU 102 reads the image processing program from the storage unit 105 and activates it.

CPU102が画像処理プログラムを起動すると、スキャナ部108に載置された文書を読取る機能が画像処理装置100において実現する。また、CPU102が画像処理プログラムを起動すると、スキャナ部108により生成された画像ファイルを文書毎に区切り、文書毎に一つのファイルとしてまとめて記憶部105に記憶させる機能が画像処理装置100において実現する。このように画像処理装置100は、CPU102がプログラムに従って動作することにより種々の機能が実現し、各種処理・制御が行われるという点で、一般的なコンピュータ装置と同様の構成を有していると言える。   When the CPU 102 activates the image processing program, the image processing apparatus 100 realizes a function of reading a document placed on the scanner unit 108. In addition, when the CPU 102 activates the image processing program, the image processing apparatus 100 realizes a function of dividing the image file generated by the scanner unit 108 for each document and collectively storing the files as one file for each document in the storage unit 105. . As described above, the image processing apparatus 100 has the same configuration as that of a general computer apparatus in that various functions are realized by the CPU 102 operating according to the program and various processes and controls are performed. I can say that.

[動作]
次に本実施形態に係る画像処理装置100の動作について説明する。
まず、文書の電子化作業を行う作業者により、複数の文書が纏めてスキャナ部108のADFに載置される。この後、作業者により操作部107のキーが操作され、文書の読取り指示が入力されると、CPU102は、スキャナ部108を制御し、ADFに載置された文書の読取り処理を行う(図3:ステップSA1)。具体的には、スキャナ部108は、CPU102の制御の下、ADFに載置された文書を1ページずつスキャンすると共に、スキャンしたページを表す画像ファイルを1ページ毎に生成する。この生成された画像ファイルは、CPU102により記憶部105に順次記憶される。この際、CPU102は、スキャンした1ページ目を表す画像ファイルのファイル名を「0001」、2ページ目を表す画像ファイルのファイル名を「0002」というように、読取られたページの順番とファイル名とを同じにして記憶部105に記憶させる。スキャナ部108は、載置された文書のスキャンを終了すると、スキャンが終了したことをCPU102へ通知する。
[Operation]
Next, the operation of the image processing apparatus 100 according to the present embodiment will be described.
First, a plurality of documents are put together on the ADF of the scanner unit 108 by an operator who digitizes the documents. Thereafter, when the operator operates the keys of the operation unit 107 and inputs a document reading instruction, the CPU 102 controls the scanner unit 108 to perform reading processing of the document placed on the ADF (FIG. 3). : Step SA1). Specifically, the scanner unit 108 scans a document placed on the ADF page by page under the control of the CPU 102 and generates an image file representing the scanned page for each page. The generated image file is sequentially stored in the storage unit 105 by the CPU 102. At this time, the CPU 102 determines the order of the read pages and the file name such that the file name of the image file representing the first scanned page is “0001”, and the file name of the image file representing the second page is “0002”. Are stored in the storage unit 105 in the same manner. When the scanning of the placed document is finished, the scanner unit 108 notifies the CPU 102 that the scanning is finished.

CPU102は、スキャン終了の通知を受取ると、記憶部105に記憶された画像ファイル毎にファイル名の数字が小さいものから順次レイアウト解析を行う(ステップSA2)。具体的には、まずCPU102は、画像ファイルが表すページを解析し、文字が記述されている文字領域や図および写真がある領域を認識する。次にCPU102は、認識した領域に外接する外接矩形を生成し、この外接矩形の配置、即ち、ページのレイアウトを示す外接矩形画像ファイルを生成して記憶部105に記憶させる。例えば、図6(a)に示したページの場合、図6(b)に示したように、文字領域のレイアウトを示す外接矩形画像ファイルが生成され記憶部105に記憶される。また、CPU102は、この外接矩形画像ファイルのファイル名と、レイアウト解析を行った画像ファイルのファイル名とを対応付けてファイルテーブルTB1に記憶させる。ここでCPU102は、図2に示したように、ファイル名が「0001」である画像ファイルに対応する外接矩形画像ファイルのファイル名を「0001a」、ファイル名が「0002」である画像ファイルに対応する外接矩形画像ファイルのファイル名を「0002a」というように、画像ファイルのファイル名に「a」を付した文字列を外接矩形画像ファイルのファイル名とする。なお、本実施形態においては、スキャンが終了した後にレイアウト解析を行うようにしているが、各ページ毎に画像ファイルが生成されるとすぐにレイアウト解析を行い、外接矩形画像ファイルを生成して記憶部105に記憶させるようにしてもよい。   When the CPU 102 receives the notification of the end of scanning, the CPU 102 sequentially performs layout analysis for each image file stored in the storage unit 105, starting from the smallest file name number (step SA2). Specifically, first, the CPU 102 analyzes the page represented by the image file, and recognizes a character region in which characters are described, a region where a figure and a photo are present. Next, the CPU 102 generates a circumscribed rectangle circumscribing the recognized area, generates a circumscribed rectangle image file indicating the layout of the circumscribed rectangle, that is, the layout of the page, and stores the circumscribed rectangle image file in the storage unit 105. For example, in the case of the page shown in FIG. 6A, a circumscribed rectangular image file indicating the layout of the character area is generated and stored in the storage unit 105 as shown in FIG. Further, the CPU 102 associates the file name of the circumscribed rectangular image file with the file name of the image file subjected to the layout analysis, and stores it in the file table TB1. Here, as shown in FIG. 2, the CPU 102 corresponds to the image file whose file name is “0001a” and whose file name is “0002” corresponding to the image file whose file name is “0001”. A character string in which “a” is added to the file name of the image file is used as the file name of the circumscribed rectangular image file, such as “0002a”. In this embodiment, the layout analysis is performed after the scan is completed. However, the layout analysis is performed as soon as an image file is generated for each page, and a circumscribed rectangular image file is generated and stored. You may make it memorize | store in the part 105. FIG.

CPU102は、各画像ファイルのレイアウト解析が終了すると、読取った各ページ毎に各ページの次のページのレイアウトとの相違度を求める処理を行う。まず、CPU102は、変数Nの値を初期化し「1」とする(ステップSA3)。そしてCPU102は、ファイルテーブルTB1においてN番目のレコードに格納されている外接矩形画像ファイルのファイル名と、N+1番目のレコードに格納されている外接矩形画像ファイルのファイル名とをファイルテーブルTB1から読み出し、この読み出したファイル名で特定されるファイルを記憶部105から読み出す(ステップSA4)。なお、ステップSA2において、ファイルテーブルTB1には、ページがスキャンされた順番で各ページに係る画像ファイルのファイル名が格納されるので、N番目のレコードから読み出したファイル名で特定されるファイルは、N番目にスキャンされたページのレイアウトを表し、N+1番目のレコードから読み出したファイル名で特定されるファイルは、N+1番目にスキャンされたページのレイアウトを表すこととなる。   When the layout analysis of each image file is completed, the CPU 102 performs a process for obtaining a degree of difference from the layout of the next page of each page for each read page. First, the CPU 102 initializes the value of the variable N to “1” (step SA3). Then, the CPU 102 reads out the file name of the circumscribed rectangular image file stored in the Nth record in the file table TB1 and the file name of the circumscribed rectangular image file stored in the N + 1th record from the file table TB1. The file specified by the read file name is read from the storage unit 105 (step SA4). In step SA2, the file table TB1 stores the file names of the image files related to each page in the order in which the pages were scanned. Therefore, the file specified by the file name read from the Nth record is The file identified by the file name read from the (N + 1) th record represents the layout of the Nth scanned page, and represents the layout of the (N + 1) th scanned page.

CPU102は、この読み出したファイルを用い、N番目のページのレイアウトと、N+1番目のページのレイアウトの相違度を求める。具体的には、CPU102は、読み出したファイルが表すページ中の矩形を用い、N番目のページにある各矩形と同じ矩形がN+1番目のページにあるか否かを、例えばパターンマッチング等の手法を用いて判断し、同じ矩形がないと判断された矩形の数をカウントする。そして、CPU102は、このカウント値をファイルテーブルTB1のN番目のレコードに格納する(ステップSA5)。例えば、読取られた文書において、各ページのレイアウトが図7に示したレイアウトであった場合、CPU102は、Nページ目とN+1ページ目との間のレイアウトの相違度を「3」とし、N+1ページ目とN+2ページ目との間のレイアウトの相違度を「0」とする。また、CPU102は、Mページ目とM+1ページ目との間のレイアウトの相違度を「3」とし、M+1ページ目とM+2ページ目との間のレイアウトの相違度を「1」とする。   The CPU 102 uses this read file to obtain the degree of difference between the layout of the Nth page and the layout of the (N + 1) th page. Specifically, the CPU 102 uses a rectangle in the page represented by the read file, and determines whether or not the same rectangle as each rectangle on the Nth page is on the N + 1th page by using a method such as pattern matching. The number of rectangles that are determined to be not found to be the same rectangle is counted. Then, the CPU 102 stores this count value in the Nth record of the file table TB1 (step SA5). For example, if the layout of each page in the read document is the layout shown in FIG. 7, the CPU 102 sets the layout dissimilarity between the Nth page and the (N + 1) th page to “3”, and the N + 1th page. The difference in layout between the eyes and the (N + 2) th page is “0”. Further, the CPU 102 sets “3” as the layout difference between the Mth page and the (M + 1) th page, and “1” as the layout difference between the (M + 1) th page and the (M + 2) th page.

次にCPU102は、変数Nの値に「1」を加算する(ステップSA6)。そしてCPU102は、読取った全てのページにおいて、次のページとのレイアウトの相違度を求めたか否かを判断する(ステップSA7)。CPU102は、ステップSA7でNOと判断した場合、ステップSA4へ処理の流れを戻す。一方、CPU102は、ステップSA7においてYESと判定した場合、まず、変数Mの値を初期化し「3」とする(ステップSA8)。そして、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。次にCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページと、文書の区切りを指定するためのボタンとを図8に例示したように表示部106に表示させる(ステップSA9)。なお、本実施形態においては、5ページ分が表示部106に表示されるようになっているが、表示されるページの数は5ページに限定されるものではなく、任意の数のページを表示するようにしてもよい。   Next, the CPU 102 adds “1” to the value of the variable N (step SA6). Then, the CPU 102 determines whether or not the degree of layout difference with the next page has been obtained for all the read pages (step SA7). If CPU 102 determines NO in step SA7, CPU 102 returns the flow of processing to step SA4. On the other hand, if the CPU 102 determines YES in step SA7, it first initializes the value of the variable M to “3” (step SA8). Then, in the file table TB1, the file names of the image files stored in the Mth record and the records up to M ± 2 are read. Next, the CPU 102 reads the image file specified by the read file name from the storage unit 105, and the page indicated by the read image file and the button for designating the document separator are illustrated in FIG. It is displayed on the display unit 106 (step SA9). In the present embodiment, five pages are displayed on the display unit 106, but the number of displayed pages is not limited to five, and an arbitrary number of pages can be displayed. You may make it do.

図8に示した画面が表示部106に表示された後、作業者により操作部107が操作され、右矢印ボタンB04を押下する旨の操作が行われると(ステップSA13:YES)、CPU102は、変数Mの値に「1」を加算し、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA14)。   After the screen shown in FIG. 8 is displayed on the display unit 106, when the operator operates the operation unit 107 and performs an operation of pressing the right arrow button B04 (step SA13: YES), the CPU 102 “1” is added to the value of the variable M, and the file names of the image files stored in the Mth record and the records up to M ± 2 in the file table TB1 are read. Then, the CPU 102 reads the image file specified by the read file name from the storage unit 105, and causes the display unit 106 to display the page represented by the read image file (step SA14).

また、作業者により操作部107が操作され、左矢印ボタンB02を押下する旨の操作が行われると(ステップSA11:YES)、CPU102は、変数Mの値から「1」を減算し、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA12)。   When the operator operates the operation unit 107 and performs an operation to press the left arrow button B02 (step SA11: YES), the CPU 102 subtracts “1” from the value of the variable M, and the file table At TB1, the file names of the image files stored in the Mth record and the records up to M ± 2 are read. Then, the CPU 102 reads out the image file specified by the read file name from the storage unit 105, and causes the display unit 106 to display the page represented by the read image file (step SA12).

また、作業者により操作部107が操作され、右早送りボタンB05を押下する旨の操作が行われると(ステップSA17)、CPU102は、M番目以降のレコードにおいて相違度が「3」以上となっているレコードをM番目のレコードから順次検索していく。CPU102は、相違度が「3」以上となっているレコードを見つけると、変数Mの値をこのレコードの番号とし、ファイルテーブルTB1において、このM番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA16)。例えば、相違度が図9に示したようにファイルテーブルTB1に格納されている場合、ファイル名が「0006」のファイルから「0010」までのファイルが記憶部105から読み出され、この読み出されたファイルが表す画像が表示部106に表示される(ステップSA18)。   When the operator operates the operation unit 107 and performs an operation for pressing the right fast-forward button B05 (step SA17), the CPU 102 has a difference degree of “3” or more in the Mth and subsequent records. Are sequentially searched from the Mth record. When the CPU 102 finds a record having a difference degree of “3” or more, the value of the variable M is set to the number of this record, and stored in the Mth record and the records up to M ± 2 in the file table TB1. Read the file name of the image file that has been saved. Then, the CPU 102 reads the image file specified by the read file name from the storage unit 105, and causes the display unit 106 to display the page represented by the read image file (step SA16). For example, when the degree of difference is stored in the file table TB1 as shown in FIG. 9, files from the file name “0006” to “0010” are read from the storage unit 105 and read. The image represented by the file is displayed on the display unit 106 (step SA18).

また、作業者により操作部107が操作され、左早送りボタンB01を押下する旨の操作が行われると(ステップSA15)、CPU102は、M番目以前のレコードにおいて相違度が「3」以上となっているレコードをM番目のレコードから順次検索していく。CPU102は、相違度が「3」以上となっているレコードを見つけると、変数Mの値をこのレコードの番号とし、ファイルテーブルTB1において、このM番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA16)。   Further, when the operator operates the operation unit 107 and performs an operation to press the left fast-forward button B01 (step SA15), the CPU 102 has a degree of difference of “3” or more in the Mth and previous records. Are sequentially searched from the Mth record. When the CPU 102 finds a record having a difference degree of “3” or more, the value of the variable M is set to the number of this record, and stored in the Mth record and the records up to M ± 2 in the file table TB1. Read the file name of the image file that has been saved. Then, the CPU 102 reads the image file specified by the read file name from the storage unit 105, and causes the display unit 106 to display the page represented by the read image file (step SA16).

作業者により操作部107が操作され、OKボタンB03を押下する旨の操作が行われると(ステップSA19)、CPU102はM番目のページが文書の区切りであるとし、文書の区切りであることを表すデータである「○」をM番目のレコードの区切りデータフィールドに格納する(ステップSA20)。また、CPU102は、M番目のレコードに格納されている外接矩形画像ファイルのファイル名で特定されるファイルを、文書の区切りとなるページのレイアウトを表す区切りページファイルとして記憶部105に記憶させる。   When the operator operates the operation unit 107 and performs an operation for pressing the OK button B03 (step SA19), the CPU 102 assumes that the Mth page is a document break, and indicates that it is a document break. The data “◯” is stored in the delimited data field of the Mth record (step SA20). In addition, the CPU 102 causes the storage unit 105 to store the file specified by the file name of the circumscribed rectangular image file stored in the Mth record as a separator page file that represents the layout of a page that is a separator of the document.

区切りページファイルが記憶部105に記憶された後、作業者により操作部107が操作され、右早送りボタンB05を押下する旨の操作が行われた場合(ステップSA17:YES)、CPU102は、区切りページファイルを読み出す。そしてCPU102は、区切りページファイルが示すレイアウトと同じレイアウトを示す外接矩形画像ファイルを、例えば、パターンマッチング等を行い検索する。CPU102は、同じレイアウトを表している外接矩形画像ファイルを見つけると、これらのファイルのファイル名のうち、変数Mの値以上の値をファイル名とし、変数Mの値に最も近い値をファイル名としている外接矩形画像ファイルを特定する。CPU102は、外接矩形画像ファイルのファイル名を特定すると、変数Mの値を、このファイル名の値と同じ値とする。そして、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表す画像を表示部106に表示させる(ステップSA18)。例えば、ファイル名が「0015a」である外接矩形画像ファイルが表すレイアウトが、区切りページファイルが表すレイアウトと一致する場合、CPU102は、ファイル名が「0013」から「0017」までの画像ファイルを記憶部105から読み出し、この読み出したファイルが表す画像を表示部106に表示させる。   After the separator page file is stored in the storage unit 105, when the operator operates the operation unit 107 and performs an operation to press the right fast-forward button B05 (step SA17: YES), the CPU 102 Read the file. Then, the CPU 102 searches for a circumscribed rectangular image file having the same layout as the layout indicated by the separator page file, for example, by performing pattern matching or the like. When the CPU 102 finds circumscribed rectangular image files representing the same layout, the file name of these files is greater than or equal to the value of the variable M, and the value closest to the value of the variable M is the file name. Identify the circumscribed rectangle image file. When the CPU 102 specifies the file name of the circumscribed rectangular image file, the CPU 102 sets the value of the variable M to the same value as this file name. Then, the file names of the image files stored in the Mth record and the records up to M ± 2 are read. Then, the CPU 102 reads out the image file specified by the read file name from the storage unit 105, and causes the display unit 106 to display the image represented by the read image file (step SA18). For example, when the layout represented by the circumscribed rectangular image file having the file name “0015a” matches the layout represented by the separator page file, the CPU 102 stores the image files having the file names “0013” to “0017”. The image read from 105 is displayed on the display unit 106.

また、作業者により操作部107が操作され、左早送りボタンB01を押下する旨の操作が行われた場合(ステップSA15:YES)、CPU102は、区切りページファイルを読み出す。そしてCPU102は、区切りページファイルが表すレイアウトと同じレイアウトを示す外接矩形画像ファイルを、例えば、パターンマッチング等を行い検索する。CPU102は、同じレイアウトを表している外接矩形画像ファイルを見つけると、これらのファイルのファイル名のうち、変数Mの値以下の値をファイル名とし、変数Mの値に最も近い値をファイル名としている外接矩形画像ファイルを特定する。CPU102は、外接矩形画像ファイルのファイル名を特定すると、変数Mの値を、このファイル名の値と同じ値とする。そして、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表す画像を表示部106に表示させる(ステップSA16)。   When the operator operates the operation unit 107 and performs an operation to press the left fast-forward button B01 (step SA15: YES), the CPU 102 reads a separator page file. Then, the CPU 102 searches for a circumscribed rectangular image file showing the same layout as the layout represented by the separator page file, for example, by performing pattern matching or the like. When the CPU 102 finds circumscribed rectangular image files representing the same layout, the file name is set to a value equal to or smaller than the value of the variable M, and the value closest to the value of the variable M is set to the file name. Identify the circumscribed rectangle image file. When the CPU 102 specifies the file name of the circumscribed rectangular image file, the CPU 102 sets the value of the variable M to the same value as this file name. Then, the file names of the image files stored in the Mth record and the records up to M ± 2 are read. Then, the CPU 102 reads the image file specified by the read file name from the storage unit 105, and displays the image represented by the read image file on the display unit 106 (step SA16).

作業者により操作部107が操作され、OKボタンB03を押下する旨の操作が行われると、CPU102はM番目のページが文書の区切りであるとし、文書の区切りであることを表すデータである「○」をM番目のレコードの区切りデータフィールドに格納する(ステップSA20)。なお、区切りページファイルが既に記憶されている場合、CPU102は、M番目のレコードに格納されている外接矩形画像ファイルのファイル名で特定されるファイルを、文書の区切りとなるページのレイアウトを表す区切りページファイルとして記憶部105に記憶させない。   When the operator operates the operation unit 107 and performs an operation of pressing the OK button B03, the CPU 102 assumes that the Mth page is a document break, and is data indicating that the document is a break. Is stored in the delimited data field of the Mth record (step SA20). When the separator page file is already stored, the CPU 102 uses the file specified by the file name of the circumscribed rectangular image file stored in the Mth record as a separator that represents the layout of a page that serves as a document separator. It is not stored in the storage unit 105 as a page file.

作業者により操作部107が操作され、画面上の終了ボタンB06を押下する旨の操作が行われると(ステップSA21)、CPU102は、スキャンしたページの画像を文書毎に纏める処理を行う。まず、CPU102は、変数Mの値と変数Nの値を初期化し、「M=1」、「N=2」とする(ステップSA22)。次にCPU102は、変数Nの値がファイルテーブルTB1のレコードの数以上であるか否かを判断する(ステップSA23)。CPU102は、ステップSA23でNOと判断した場合、N番目のレコードの区切りデータフィールドに「○」が格納されているか否かを判断する(ステップSA24)。CPU102は、ステップSA24でNOと判断した場合には、変数Nの値に「1」を加算し(ステップSA25)、ステップSA23へ戻る。CPU102は、ステップSA24でYESと判断した場合、M番目からN−1番目までのレコードの画像ファイル名フィールドに格納されているファイル名で特定される画像ファイルを記憶部105から読み出す(ステップSA26)。そして、CPU102は、読み出した画像ファイルが表すページの画像を全て含む文書ファイルを生成し、生成した文書ファイルを記憶部105に記憶させる(ステップSA27)。次にCPU102は、変数Mに変数Nの値を代入した後、変数Nに「1」を加算して(ステップSA28)、ステップSA23へ戻る。   When the operator operates the operation unit 107 and performs an operation for pressing the end button B06 on the screen (step SA21), the CPU 102 performs a process of collecting the scanned page images for each document. First, the CPU 102 initializes the value of the variable M and the value of the variable N, and sets “M = 1” and “N = 2” (step SA22). Next, the CPU 102 determines whether or not the value of the variable N is equal to or greater than the number of records in the file table TB1 (step SA23). If the CPU 102 determines NO in step SA23, it determines whether or not “◯” is stored in the delimiter data field of the Nth record (step SA24). If the CPU 102 determines NO in step SA24, it adds “1” to the value of the variable N (step SA25) and returns to step SA23. If the CPU 102 determines YES in step SA24, the CPU 102 reads out from the storage unit 105 the image file specified by the file name stored in the image file name field of the Mth to N−1th records (step SA26). . Then, the CPU 102 generates a document file that includes all the images of the page represented by the read image file, and stores the generated document file in the storage unit 105 (step SA27). Next, the CPU 102 assigns the value of the variable N to the variable M, then adds “1” to the variable N (step SA28), and returns to step SA23.

CPU102は、ステップSA23でYESと判断すると、M番目以降のレコードの画像ファイル名フィールドに格納されているファイル名で特定される画像を記憶部105から読み出す。そして、CPU102は、読み出した画像ファイルが表すページの画像を全て含む文書ファイルを生成し、生成した文書ファイルを記憶部105に記憶させ(ステップSA29)、処理を終了する。このように、まとめてスキャンされた複数のページを表す画像は、文書毎に一つのファイルに纏められ、記憶部105に記憶される。   If CPU 102 determines YES in step SA 23, CPU 102 reads an image specified by the file name stored in the image file name field of the Mth and subsequent records from storage unit 105. Then, the CPU 102 generates a document file that includes all the images of the page represented by the read image file, stores the generated document file in the storage unit 105 (step SA29), and ends the process. In this manner, images representing a plurality of pages scanned together are collected into one file for each document and stored in the storage unit 105.

以上説明したように本実施形態によれば、仕切り紙を用いずに複数の文書を纏めてスキャンさせても、文書の区切り候補となるページを容易に見つけて文書の区切りを特定し、文書を保存することが可能となる。   As described above, according to the present embodiment, even when a plurality of documents are scanned together without using a divider, a page that is a candidate for a document break can be easily found, a document break can be specified, It can be saved.

[変形例]
(変形例1)
上述した実施形態においては、スキャナ部108は画像処理装置100と一体となっているが、スキャナ部108を別体で構成されていてもよい。例えば、文書の読み取りをパーソナルコンピュータ装置に接続されたスキャナ装置に行わせ、図3乃至5に示したフローチャートの処理をパーソナルコンピュータ装置に行わせる構成としてもよい。
[Modification]
(Modification 1)
In the above-described embodiment, the scanner unit 108 is integrated with the image processing apparatus 100. However, the scanner unit 108 may be configured separately. For example, the document may be read by a scanner device connected to the personal computer device, and the processing of the flowcharts shown in FIGS. 3 to 5 may be performed by the personal computer device.

(変形例2)
上述した実施形態においては、左早送りボタンB01や右早送りボタンB05を押下する旨の操作が行われた場合、相違度が「3」以上となっているページを文書の区切り候補として表示するようにしているが、例えば、相違度が「5」以上であったり、相違度が「2」以上のページを文書の区切り候補として表示するようにしてもよい。
(Modification 2)
In the above-described embodiment, when an operation for pressing the left fast-forward button B01 or the right fast-forward button B05 is performed, a page having a difference degree of “3” or more is displayed as a document delimiter candidate. However, for example, a page with a difference degree of “5” or more or a difference degree of “2” or more may be displayed as a document separation candidate.

(変形例3)
文書の区切りとなるページのレイアウトは一つのレイアウトに限定されるものではない。上述した実施形態においては、複数種類の区切りページファイルを記憶部105に記憶させ、この区切りページファイルが表すレイアウトに一致するページを文書の区切り候補として表示するようにしてもよい。
(Modification 3)
The layout of a page that serves as a document separator is not limited to one layout. In the embodiment described above, a plurality of types of separator page files may be stored in the storage unit 105, and pages that match the layout represented by the separator page file may be displayed as document separator candidates.

(変形例4)
上述した実施形態においてCPU102は、各ページ毎に次ページとの間の相違度を求めているが、前ページとの間の相違度を求めるようにしてもよいし、前ページと後ページとの間の両方の相違度を求めるようにしてもよい。
(Modification 4)
In the above-described embodiment, the CPU 102 obtains the degree of difference from the next page for each page. However, the degree of difference from the previous page may be obtained, or the previous page and the back page may be obtained. You may make it obtain | require both the difference between.

(変形例5)
OKボタンB03を押下する旨の操作が行われずに、終了ボタンB06を押下する旨の操作が行われた場合、相違度が「3」以上となっているページを文書の区切りとし、文書ファイルを生成するようにしてもよい。
(Modification 5)
If an operation for pressing the end button B06 is performed without an operation for pressing the OK button B03, a page having a difference degree of “3” or more is set as a document delimiter, and the document file is stored. You may make it produce | generate.

本発明の一実施形態に係る画像処理装置100の構成を示すブロック図である。1 is a block diagram illustrating a configuration of an image processing apparatus 100 according to an embodiment of the present invention. 画像処理装置100に記憶されているファイルテーブルTB1のフォーマットを例示した図である。3 is a diagram illustrating a format of a file table TB1 stored in the image processing apparatus 100. FIG. 画像処理装置100のCPU102が行う処理の流れを例示したフローチャートである。3 is a flowchart illustrating a flow of processing performed by a CPU of the image processing apparatus. 画像処理装置100のCPU102が行う処理の流れを例示したフローチャートである。3 is a flowchart illustrating a flow of processing performed by a CPU of the image processing apparatus. 画像処理装置100のCPU102が行う処理の流れを例示したフローチャートである。3 is a flowchart illustrating a flow of processing performed by a CPU of the image processing apparatus. CPU102によるレイアウト解析処理を説明するための図である。It is a figure for demonstrating the layout analysis process by CPU102. ページ間のレイアウトの相違度を求める処理を説明するための図である。It is a figure for demonstrating the process which calculates | requires the difference of the layout between pages. 表示部106に表示される画面を例示した図である。4 is a diagram illustrating a screen displayed on a display unit 106. FIG. ファイルテーブルTB1に格納されたデータを例示した図である。It is the figure which illustrated the data stored in file table TB1.

符号の説明Explanation of symbols

100・・・画像処理装置、101・・・バス、102・・・CPU、103・・・ROM、104・・・RAM、105・・・記憶部、106・・・表示部、107・・・操作部、108・・・スキャナ部。   DESCRIPTION OF SYMBOLS 100 ... Image processing apparatus, 101 ... Bus, 102 ... CPU, 103 ... ROM, 104 ... RAM, 105 ... Memory | storage part, 106 ... Display part, 107 ... Operation unit, 108... Scanner unit.

Claims (6)

複数のページを光学的に読取り画像ファイルを生成する読取り手段と、
前記読取り手段により生成された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、
前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、
文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、
前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、
前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、
前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、
前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、
前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段と
を有する画像処理装置。
Reading means for optically reading a plurality of pages and generating an image file;
Layout recognition means for recognizing the layout of the page represented by the image file generated by the reading means;
A degree-of-difference generation means for obtaining a degree of difference between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, by the layout recognized by the layout recognition means;
First instruction input means for receiving a first instruction for instructing display of a page serving as a document separator;
A separator page display means for displaying, using the image file, an image of a page in which the difference obtained by the difference generation means is a predetermined value or more when the first instruction input means receives the instruction; ,
Second instruction input means for receiving a second instruction for instructing to determine the displayed page as a document break;
When the second instruction input unit receives the instruction, a separator page determining unit that determines the displayed page as a separator page;
A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify the pages into a plurality of documents;
When the third instruction input means receives the instruction, the plurality of pages represented by the image file generated by the reading means are separated by the pages determined by the separator page determining means, and are separated for each divided range. An image processing apparatus comprising: a storage unit configured to generate a document file including an image of a page within the range and store the generated document file.
前記区切りページ表示手段は、前記相違度生成手段により求められた相違度が所定の値以上となっているページを特定し、該特定されたページと、該ページに隣接するページの画像を前記画像ファイルを用いて表示することを特徴とする請求項1に記載の画像処理装置。   The separator page display means identifies a page in which the degree of difference obtained by the degree-of-difference generation means is a predetermined value or more, and images of the identified page and a page adjacent to the page are displayed as the image. The image processing apparatus according to claim 1, wherein the display is performed using a file. 前記区切りページ表示手段は、前記区切りページ決定手段により区切りのページが決定された場合、前記レイアウトファイルにより該ページのレイアウトと同じレイアウトのページを特定し、該特定されたページを表示することを特徴とする請求項1に記載の画像処理装置。   The separator page display means, when a separator page is determined by the separator page determination means, specifies a page having the same layout as the layout of the page by the layout file and displays the specified page. The image processing apparatus according to claim 1. 前記区切りページ決定手段により区切りとなるページが決定されていない場合、前記記憶手段は、前記相違度生成手段により求められた相違度が所定の値以上となっているページを特定し、この特定されたページで前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶することを特徴とする請求項1に記載の画像処理装置。   When the page to be separated is not determined by the separator page determining unit, the storage unit specifies a page in which the difference obtained by the difference generation unit is equal to or greater than a predetermined value. A plurality of pages represented by the image file generated by the reading unit is divided on each page, a document file including an image of a page within the range is generated for each divided range, and the generated document file is stored. The image processing apparatus according to claim 1. コンピュータ装置を、
ページを表す画像ファイルを記憶部に記憶させる記憶手段と、
前記記憶部に記憶された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、
前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、
文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、
前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、
前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、
前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、
前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、
前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段
として機能させるプログラム。
Computer equipment,
Storage means for storing an image file representing a page in a storage unit;
Layout recognition means for recognizing the layout of the page represented by the image file stored in the storage unit;
A degree-of-difference generation means for obtaining a degree of difference between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, by the layout recognized by the layout recognition means;
First instruction input means for receiving a first instruction for instructing display of a page serving as a document separator;
A separator page display means for displaying, using the image file, an image of a page in which the difference obtained by the difference generation means is a predetermined value or more when the first instruction input means receives the instruction; ,
Second instruction input means for receiving a second instruction for instructing to determine the displayed page as a document break;
When the second instruction input unit receives the instruction, a separator page determining unit that determines the displayed page as a separator page;
A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify the pages into a plurality of documents;
When the third instruction input unit receives the instruction, the plurality of pages represented by the image file generated by the reading unit are separated by the page determined by the separator page determining unit, and each page is divided into ranges. A program that generates a document file including an image of a page within the range and functions as a storage unit that stores the generated document file.
請求項5に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。   A computer-readable recording medium on which the program according to claim 5 is recorded.
JP2004252408A 2004-08-31 2004-08-31 Image processor, program, and storage medium Pending JP2006072484A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004252408A JP2006072484A (en) 2004-08-31 2004-08-31 Image processor, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004252408A JP2006072484A (en) 2004-08-31 2004-08-31 Image processor, program, and storage medium

Publications (1)

Publication Number Publication Date
JP2006072484A true JP2006072484A (en) 2006-03-16

Family

ID=36153085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004252408A Pending JP2006072484A (en) 2004-08-31 2004-08-31 Image processor, program, and storage medium

Country Status (1)

Country Link
JP (1) JP2006072484A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239217A (en) * 2010-05-11 2011-11-24 Sharp Corp Image display apparatus, and image formation apparatus having the same
WO2013061674A1 (en) * 2011-10-26 2013-05-02 シャープ株式会社 Document file output device, document file output method, and computer program
JP2016086450A (en) * 2016-02-16 2016-05-19 シャープ株式会社 Image display unit and control program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011239217A (en) * 2010-05-11 2011-11-24 Sharp Corp Image display apparatus, and image formation apparatus having the same
US8902157B2 (en) 2010-05-11 2014-12-02 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
US9473652B2 (en) 2010-05-11 2016-10-18 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
USRE48003E1 (en) 2010-05-11 2020-05-19 Sharp Kabushiki Kaisha Image display unit and image forming apparatus including the same
WO2013061674A1 (en) * 2011-10-26 2013-05-02 シャープ株式会社 Document file output device, document file output method, and computer program
JP2013093777A (en) * 2011-10-26 2013-05-16 Sharp Corp Document file output device, document file output method and computer program
CN103907339A (en) * 2011-10-26 2014-07-02 夏普株式会社 Document file output device, document file output method, and computer program
US9858513B2 (en) 2011-10-26 2018-01-02 Sharp Kabushiki Kaisha Document file output apparatus, document file output method, and computer readable medium
JP2016086450A (en) * 2016-02-16 2016-05-19 シャープ株式会社 Image display unit and control program

Similar Documents

Publication Publication Date Title
JP4405831B2 (en) Image processing apparatus, control method therefor, and program
JP4023075B2 (en) Image acquisition device
US8452601B2 (en) Reading device with shortcut read function
US7031982B2 (en) Publication confirming method, publication information acquisition apparatus, publication information providing apparatus and database
JP2007293417A (en) Display controller, image processor, and display control method
JP2010020468A (en) Image processing apparatus, image processing method, its program, and storage medium
JP2006155588A (en) Image processing device, image processing method and image processing program
US8090728B2 (en) Image processing apparatus, control method thereof, and storage medium that stores program thereof
JP2018046416A (en) Information processing device and program
JP2003209643A (en) Image-processing device
US7539671B2 (en) Image processing apparatus, image forming apparatus, method for searching processed document, program for searching processed document, and recording medium
JP2006072484A (en) Image processor, program, and storage medium
JP3727995B2 (en) Document processing method and apparatus
US10057437B2 (en) Image processing apparatus, operation assistance method, and non-transitory computer-readable recording medium encoded with operation assistance program
JP5298997B2 (en) Document image editing apparatus, document image editing method, document image editing program, and computer-readable recording medium storing a program for causing a computer to execute the method
JP2006252455A (en) File management device, file management method and file management program
JP2006262152A (en) Image forming method and device, and program
JP2006333248A (en) Image processing apparatus, image processing method, program and storage medium
JP2009163475A (en) Information processor, information processing system and information processing program
JP2007336008A (en) Image searching apparatus and method
US20200110476A1 (en) Digital Redacting Stylus and System
US9292528B2 (en) Information processing apparatus, method, and medium for processing files stored in a storage medium
JP7271987B2 (en) Information processing device and program
JP2007025160A (en) Image forming apparatus, control method and program thereof
JP5233213B2 (en) Image processing apparatus, image processing method, and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070719

A977 Report on retrieval

Effective date: 20091015

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Effective date: 20091027

Free format text: JAPANESE INTERMEDIATE CODE: A131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100309