JP2006072484A - Image processor, program, and storage medium - Google Patents
Image processor, program, and storage medium Download PDFInfo
- Publication number
- JP2006072484A JP2006072484A JP2004252408A JP2004252408A JP2006072484A JP 2006072484 A JP2006072484 A JP 2006072484A JP 2004252408 A JP2004252408 A JP 2004252408A JP 2004252408 A JP2004252408 A JP 2004252408A JP 2006072484 A JP2006072484 A JP 2006072484A
- Authority
- JP
- Japan
- Prior art keywords
- page
- layout
- file
- image
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、電子化された文書を分類して保存する技術に関する。 The present invention relates to a technique for classifying and storing digitized documents.
業務に大量の文書が用いられる企業においては、文書の電子化に関する技術が注目されている。このうち、紙に印刷されて保存されていた文書を電子化する技術は、文書の検索が容易となり文書の再利用性が高まる等、様々な効果を得ることができるため特に注目されている。従来、大量の文書を電子化して保存する際には、文書群の中から一つづつ文書を取り出してスキャナに読取らせた後、読取った文書を示す画像ファイルを文書毎に記憶させる方法が採られていた。しかしながら、このような方法では、文書の電子化を行う作業者が文書の区切りを判別し、個々の文書毎に文書を取り出してスキャナに載置するという面倒な作業を行う必要があった。 In companies where a large amount of documents are used for business, technology relating to the digitization of documents is attracting attention. Among them, a technique for digitizing a document that has been printed and stored on paper is particularly attracting attention because it can obtain various effects such as easy document search and enhanced document reusability. Conventionally, when a large number of documents are digitized and stored, a method of taking out documents one by one from a group of documents and causing a scanner to read them, and then storing an image file indicating the read documents for each document. It was taken. However, in such a method, it is necessary for the operator who digitizes the document to perform a cumbersome operation of determining a document break, taking out the document for each individual document, and placing the document on the scanner.
そこで、このような面倒な作業を行うことなく、容易に紙文書を電子化して保存する技術が提案されている(例えば、特許文献1参照)。特許文献1に示されている電子ファイリング装置は、複数の文書を纏めてスキャンする際に文書間に挿入された仕切り紙を検知し、この仕切り紙のある部分を文書間の区切りとして文書毎に文書ファイルを生成して記憶する。特許文献1に記載されている電子ファイリング装置によれば、文書群を纏めてスキャンしても文書毎にファイルが生成されるので、大量の文書を容易に電子化して保存することが可能となる。
ところで、特許文献1に記載されている電子ファイリング装置では、複数の文書を纏めてスキャンさせる際、電子化を行う作業者が文書の区切りを判断し仕切り紙を挿入する必要がある。電子化する文書の数が少ない場合には、このように仕切り紙を挿入する作業は作業者にとって苦にならないが、大量の文書をスキャンして電子化する場合には、文書の区切りに仕切り紙を逐一挿入していくのは非常に労力のいる作業となる。
By the way, in the electronic filing device described in
本発明は、上述した背景の下になされたものであり、複数の文書を電子化して保存する際、容易に文書を区切って保存できるようにすることを目的とする。 The present invention has been made under the above-described background, and an object of the present invention is to easily store a plurality of documents by separating them when the documents are digitized and stored.
上述した課題を解決するために本発明は、複数のページを光学的に読取り画像ファイルを生成する読取り手段と、前記読取り手段により生成された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段とを有する画像処理装置を提供する。 In order to solve the above-described problems, the present invention provides a reading means for optically reading a plurality of pages and generating an image file, and a layout recognition for recognizing the layout of the page represented by the image file generated by the reading means. And a dissimilarity generation means for obtaining a dissimilarity between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file by the layout recognized by the layout recognizing means; A first instruction input unit that receives a first instruction for instructing display of a page that serves as a document separator, and when the first instruction input unit receives the instruction, the degree of difference obtained by the difference degree generation unit is predetermined. Separator page display means for displaying an image of a page having a value equal to or greater than the value using the image file; A second instruction input means for receiving a second instruction for instructing to determine the page as a document break; and when the second instruction input means receives the instruction, the displayed page is determined as a break page. A third page input unit for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading unit and classify the pages into a plurality of documents; When the input means receives the instruction, the plurality of pages represented by the image file generated by the reading means are separated by the pages determined by the separator page determining means, and the pages within the range are separated for each divided range. An image processing apparatus is provided that includes a storage unit that generates a document file including an image of a page and stores the generated document file.
この画像処理装置は、複数のページを光学的に読取り、読取ったページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの相違度を求める。そして画像処理装置は、文書の区切りとなるページの表示を指示された場合、相違度が所定の値以上となっているページを特定し、該特定されたページの画像を表示する。また、画像処理装置は、表示されたページを文書の区切りとして決定する指示が入力された場合、表示されたページを文書の区切りとして決定する。画像処理装置は、読取った複数のページを区切り、複数の文書に分類する指示が入力されると、読取った複数のページを、区切りとして決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する。 This image processing apparatus optically reads a plurality of pages, and obtains the degree of difference between the layout of each page and the layout of a page adjacent to each page for each read page. When the image processing apparatus is instructed to display a page serving as a document break, the image processing apparatus specifies a page having a degree of difference equal to or greater than a predetermined value, and displays an image of the specified page. Further, when an instruction to determine the displayed page as a document break is input, the image processing apparatus determines the displayed page as a document break. When an instruction to divide a plurality of read pages and categorize into a plurality of documents is input, the image processing apparatus divides the read pages by a page determined as a delimiter, and each range is divided into the ranges. A document file including an image of the page inside is generated, and the generated document file is stored.
また本発明は、コンピュータ装置を、ページを表す画像ファイルを記憶部に記憶させる記憶手段と、前記記憶部に記憶された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段として機能させるプログラムと、該プログラムを記録したコンピュータ読取り可能な記録媒体を提供する。 According to another aspect of the present invention, there is provided a computer apparatus, a storage unit that stores an image file representing a page in a storage unit, a layout recognition unit that recognizes a layout of a page represented by the image file stored in the storage unit, and the layout A dissimilarity generating means for obtaining a dissimilarity between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, according to the layout recognized by the recognizing means; A first instruction input means for receiving a first instruction for instructing display of the page, and when the first instruction input means receives the instruction, the difference obtained by the difference generation means is a predetermined value or more. Separating page display means for displaying an image of a current page using the image file, and displaying the displayed page as a document section. Second instruction input means for receiving a second instruction for instructing to be determined, and a separator page determining means for determining the displayed page as a separator page when the second instruction input means receives the instruction; A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify them into a plurality of documents; and the third instruction input means When received, the plurality of pages represented by the image file generated by the reading unit is divided by the pages determined by the separator page determining unit, and images of pages within the range are included for each divided range. A program for generating a document file and functioning as a storage means for storing the generated document file, and a computer storing the program Providing over data readable recording medium.
本発明によれば、複数の文書を電子化して保存する際、容易に文書を区切って保存できるようになる。 According to the present invention, when a plurality of documents are digitized and stored, the documents can be easily separated and stored.
[構成]
図1は、本発明の実施形態に係る画像処理装置100の構成を示すブロック図である。図1に示したように、画像処理装置100の各部は、バス101に接続されており、このバス101を介して各部間で通信を行う。
[Constitution]
FIG. 1 is a block diagram illustrating a configuration of an
スキャナ部108は、文書を光学的に読み取り、読取った文書を表す画像ファイルを生成するスキャナ機構を具備している。また、スキャナ部108は、ADF(Auto Document Feeder)を具備しており、CPU(Central Processing Unit)102の制御の下、ADFに載置された文書を1ページづつ読取り、1ページ毎に画像ファイルを生成する。
操作部107は、テンキーや矢印キー等、画像処理装置100を操作するための各種キーを備えており、このキーが押下されると、押下されたキーを示す信号を、CPU102へ供給する。
表示部106は、例えば、液晶ディスプレイ等の表示デバイスを有しており、CPU102の制御の下、画像処理装置100を操作するためのメニュー画面や、スキャナ部108で読取った文書の画像等、各種画面を表示する。
The
The
The
記憶部105は、例えばハードディスク装置など、データを永続的に記憶する装置を具備しており、画像処理装置100の各部を制御する機能を実現するOS(Operating System)プログラムや、スキャナ部108により生成された画像ファイルを文書毎に一つのファイルとしてまとめ、記憶部105に記憶させる機能を実現する画像処理プログラムなど、各種プログラムを記憶している。
また、記憶部105は、図2に示したフォーマットのファイルテーブルTB1を記憶している。ファイルテーブルTB1においては、「レコード番号」と、「画像ファイル名」と、「外接矩形画像ファイル名」と、「相違度」と、「区切りデータ」の各項目が互いに関連付けられている。
The
The
ROM(Read Only Memory)103は、IPL(Initial Program Loader)と呼ばれるプログラムを記憶している。CPU102は、図示を省略した電源から電力が供給されると、ROM103からIPLを読み出して実行する。CPU102は、IPLを実行すると、記憶部105からOSプログラムを読み出し、RAM(Random Access Memory)104を作業エリアとして起動する。CPU102は、OSプログラムを起動すると記憶部105から画像処理プログラムを読出して起動する。
A ROM (Read Only Memory) 103 stores a program called IPL (Initial Program Loader). When power is supplied from a power supply (not shown), the
CPU102が画像処理プログラムを起動すると、スキャナ部108に載置された文書を読取る機能が画像処理装置100において実現する。また、CPU102が画像処理プログラムを起動すると、スキャナ部108により生成された画像ファイルを文書毎に区切り、文書毎に一つのファイルとしてまとめて記憶部105に記憶させる機能が画像処理装置100において実現する。このように画像処理装置100は、CPU102がプログラムに従って動作することにより種々の機能が実現し、各種処理・制御が行われるという点で、一般的なコンピュータ装置と同様の構成を有していると言える。
When the
[動作]
次に本実施形態に係る画像処理装置100の動作について説明する。
まず、文書の電子化作業を行う作業者により、複数の文書が纏めてスキャナ部108のADFに載置される。この後、作業者により操作部107のキーが操作され、文書の読取り指示が入力されると、CPU102は、スキャナ部108を制御し、ADFに載置された文書の読取り処理を行う(図3:ステップSA1)。具体的には、スキャナ部108は、CPU102の制御の下、ADFに載置された文書を1ページずつスキャンすると共に、スキャンしたページを表す画像ファイルを1ページ毎に生成する。この生成された画像ファイルは、CPU102により記憶部105に順次記憶される。この際、CPU102は、スキャンした1ページ目を表す画像ファイルのファイル名を「0001」、2ページ目を表す画像ファイルのファイル名を「0002」というように、読取られたページの順番とファイル名とを同じにして記憶部105に記憶させる。スキャナ部108は、載置された文書のスキャンを終了すると、スキャンが終了したことをCPU102へ通知する。
[Operation]
Next, the operation of the
First, a plurality of documents are put together on the ADF of the
CPU102は、スキャン終了の通知を受取ると、記憶部105に記憶された画像ファイル毎にファイル名の数字が小さいものから順次レイアウト解析を行う(ステップSA2)。具体的には、まずCPU102は、画像ファイルが表すページを解析し、文字が記述されている文字領域や図および写真がある領域を認識する。次にCPU102は、認識した領域に外接する外接矩形を生成し、この外接矩形の配置、即ち、ページのレイアウトを示す外接矩形画像ファイルを生成して記憶部105に記憶させる。例えば、図6(a)に示したページの場合、図6(b)に示したように、文字領域のレイアウトを示す外接矩形画像ファイルが生成され記憶部105に記憶される。また、CPU102は、この外接矩形画像ファイルのファイル名と、レイアウト解析を行った画像ファイルのファイル名とを対応付けてファイルテーブルTB1に記憶させる。ここでCPU102は、図2に示したように、ファイル名が「0001」である画像ファイルに対応する外接矩形画像ファイルのファイル名を「0001a」、ファイル名が「0002」である画像ファイルに対応する外接矩形画像ファイルのファイル名を「0002a」というように、画像ファイルのファイル名に「a」を付した文字列を外接矩形画像ファイルのファイル名とする。なお、本実施形態においては、スキャンが終了した後にレイアウト解析を行うようにしているが、各ページ毎に画像ファイルが生成されるとすぐにレイアウト解析を行い、外接矩形画像ファイルを生成して記憶部105に記憶させるようにしてもよい。
When the
CPU102は、各画像ファイルのレイアウト解析が終了すると、読取った各ページ毎に各ページの次のページのレイアウトとの相違度を求める処理を行う。まず、CPU102は、変数Nの値を初期化し「1」とする(ステップSA3)。そしてCPU102は、ファイルテーブルTB1においてN番目のレコードに格納されている外接矩形画像ファイルのファイル名と、N+1番目のレコードに格納されている外接矩形画像ファイルのファイル名とをファイルテーブルTB1から読み出し、この読み出したファイル名で特定されるファイルを記憶部105から読み出す(ステップSA4)。なお、ステップSA2において、ファイルテーブルTB1には、ページがスキャンされた順番で各ページに係る画像ファイルのファイル名が格納されるので、N番目のレコードから読み出したファイル名で特定されるファイルは、N番目にスキャンされたページのレイアウトを表し、N+1番目のレコードから読み出したファイル名で特定されるファイルは、N+1番目にスキャンされたページのレイアウトを表すこととなる。
When the layout analysis of each image file is completed, the
CPU102は、この読み出したファイルを用い、N番目のページのレイアウトと、N+1番目のページのレイアウトの相違度を求める。具体的には、CPU102は、読み出したファイルが表すページ中の矩形を用い、N番目のページにある各矩形と同じ矩形がN+1番目のページにあるか否かを、例えばパターンマッチング等の手法を用いて判断し、同じ矩形がないと判断された矩形の数をカウントする。そして、CPU102は、このカウント値をファイルテーブルTB1のN番目のレコードに格納する(ステップSA5)。例えば、読取られた文書において、各ページのレイアウトが図7に示したレイアウトであった場合、CPU102は、Nページ目とN+1ページ目との間のレイアウトの相違度を「3」とし、N+1ページ目とN+2ページ目との間のレイアウトの相違度を「0」とする。また、CPU102は、Mページ目とM+1ページ目との間のレイアウトの相違度を「3」とし、M+1ページ目とM+2ページ目との間のレイアウトの相違度を「1」とする。
The
次にCPU102は、変数Nの値に「1」を加算する(ステップSA6)。そしてCPU102は、読取った全てのページにおいて、次のページとのレイアウトの相違度を求めたか否かを判断する(ステップSA7)。CPU102は、ステップSA7でNOと判断した場合、ステップSA4へ処理の流れを戻す。一方、CPU102は、ステップSA7においてYESと判定した場合、まず、変数Mの値を初期化し「3」とする(ステップSA8)。そして、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。次にCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページと、文書の区切りを指定するためのボタンとを図8に例示したように表示部106に表示させる(ステップSA9)。なお、本実施形態においては、5ページ分が表示部106に表示されるようになっているが、表示されるページの数は5ページに限定されるものではなく、任意の数のページを表示するようにしてもよい。
Next, the
図8に示した画面が表示部106に表示された後、作業者により操作部107が操作され、右矢印ボタンB04を押下する旨の操作が行われると(ステップSA13:YES)、CPU102は、変数Mの値に「1」を加算し、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA14)。
After the screen shown in FIG. 8 is displayed on the
また、作業者により操作部107が操作され、左矢印ボタンB02を押下する旨の操作が行われると(ステップSA11:YES)、CPU102は、変数Mの値から「1」を減算し、ファイルテーブルTB1において、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA12)。
When the operator operates the
また、作業者により操作部107が操作され、右早送りボタンB05を押下する旨の操作が行われると(ステップSA17)、CPU102は、M番目以降のレコードにおいて相違度が「3」以上となっているレコードをM番目のレコードから順次検索していく。CPU102は、相違度が「3」以上となっているレコードを見つけると、変数Mの値をこのレコードの番号とし、ファイルテーブルTB1において、このM番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA16)。例えば、相違度が図9に示したようにファイルテーブルTB1に格納されている場合、ファイル名が「0006」のファイルから「0010」までのファイルが記憶部105から読み出され、この読み出されたファイルが表す画像が表示部106に表示される(ステップSA18)。
When the operator operates the
また、作業者により操作部107が操作され、左早送りボタンB01を押下する旨の操作が行われると(ステップSA15)、CPU102は、M番目以前のレコードにおいて相違度が「3」以上となっているレコードをM番目のレコードから順次検索していく。CPU102は、相違度が「3」以上となっているレコードを見つけると、変数Mの値をこのレコードの番号とし、ファイルテーブルTB1において、このM番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表すページを表示部106に表示させる(ステップSA16)。
Further, when the operator operates the
作業者により操作部107が操作され、OKボタンB03を押下する旨の操作が行われると(ステップSA19)、CPU102はM番目のページが文書の区切りであるとし、文書の区切りであることを表すデータである「○」をM番目のレコードの区切りデータフィールドに格納する(ステップSA20)。また、CPU102は、M番目のレコードに格納されている外接矩形画像ファイルのファイル名で特定されるファイルを、文書の区切りとなるページのレイアウトを表す区切りページファイルとして記憶部105に記憶させる。
When the operator operates the
区切りページファイルが記憶部105に記憶された後、作業者により操作部107が操作され、右早送りボタンB05を押下する旨の操作が行われた場合(ステップSA17:YES)、CPU102は、区切りページファイルを読み出す。そしてCPU102は、区切りページファイルが示すレイアウトと同じレイアウトを示す外接矩形画像ファイルを、例えば、パターンマッチング等を行い検索する。CPU102は、同じレイアウトを表している外接矩形画像ファイルを見つけると、これらのファイルのファイル名のうち、変数Mの値以上の値をファイル名とし、変数Mの値に最も近い値をファイル名としている外接矩形画像ファイルを特定する。CPU102は、外接矩形画像ファイルのファイル名を特定すると、変数Mの値を、このファイル名の値と同じ値とする。そして、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表す画像を表示部106に表示させる(ステップSA18)。例えば、ファイル名が「0015a」である外接矩形画像ファイルが表すレイアウトが、区切りページファイルが表すレイアウトと一致する場合、CPU102は、ファイル名が「0013」から「0017」までの画像ファイルを記憶部105から読み出し、この読み出したファイルが表す画像を表示部106に表示させる。
After the separator page file is stored in the
また、作業者により操作部107が操作され、左早送りボタンB01を押下する旨の操作が行われた場合(ステップSA15:YES)、CPU102は、区切りページファイルを読み出す。そしてCPU102は、区切りページファイルが表すレイアウトと同じレイアウトを示す外接矩形画像ファイルを、例えば、パターンマッチング等を行い検索する。CPU102は、同じレイアウトを表している外接矩形画像ファイルを見つけると、これらのファイルのファイル名のうち、変数Mの値以下の値をファイル名とし、変数Mの値に最も近い値をファイル名としている外接矩形画像ファイルを特定する。CPU102は、外接矩形画像ファイルのファイル名を特定すると、変数Mの値を、このファイル名の値と同じ値とする。そして、M番目のレコードおよびM±2番目までのレコードに格納されている画像ファイルのファイル名を読み出す。そしてCPU102は、この読み出したファイル名で特定される画像ファイルを記憶部105から読み出し、読み出した画像ファイルが表す画像を表示部106に表示させる(ステップSA16)。
When the operator operates the
作業者により操作部107が操作され、OKボタンB03を押下する旨の操作が行われると、CPU102はM番目のページが文書の区切りであるとし、文書の区切りであることを表すデータである「○」をM番目のレコードの区切りデータフィールドに格納する(ステップSA20)。なお、区切りページファイルが既に記憶されている場合、CPU102は、M番目のレコードに格納されている外接矩形画像ファイルのファイル名で特定されるファイルを、文書の区切りとなるページのレイアウトを表す区切りページファイルとして記憶部105に記憶させない。
When the operator operates the
作業者により操作部107が操作され、画面上の終了ボタンB06を押下する旨の操作が行われると(ステップSA21)、CPU102は、スキャンしたページの画像を文書毎に纏める処理を行う。まず、CPU102は、変数Mの値と変数Nの値を初期化し、「M=1」、「N=2」とする(ステップSA22)。次にCPU102は、変数Nの値がファイルテーブルTB1のレコードの数以上であるか否かを判断する(ステップSA23)。CPU102は、ステップSA23でNOと判断した場合、N番目のレコードの区切りデータフィールドに「○」が格納されているか否かを判断する(ステップSA24)。CPU102は、ステップSA24でNOと判断した場合には、変数Nの値に「1」を加算し(ステップSA25)、ステップSA23へ戻る。CPU102は、ステップSA24でYESと判断した場合、M番目からN−1番目までのレコードの画像ファイル名フィールドに格納されているファイル名で特定される画像ファイルを記憶部105から読み出す(ステップSA26)。そして、CPU102は、読み出した画像ファイルが表すページの画像を全て含む文書ファイルを生成し、生成した文書ファイルを記憶部105に記憶させる(ステップSA27)。次にCPU102は、変数Mに変数Nの値を代入した後、変数Nに「1」を加算して(ステップSA28)、ステップSA23へ戻る。
When the operator operates the
CPU102は、ステップSA23でYESと判断すると、M番目以降のレコードの画像ファイル名フィールドに格納されているファイル名で特定される画像を記憶部105から読み出す。そして、CPU102は、読み出した画像ファイルが表すページの画像を全て含む文書ファイルを生成し、生成した文書ファイルを記憶部105に記憶させ(ステップSA29)、処理を終了する。このように、まとめてスキャンされた複数のページを表す画像は、文書毎に一つのファイルに纏められ、記憶部105に記憶される。
If
以上説明したように本実施形態によれば、仕切り紙を用いずに複数の文書を纏めてスキャンさせても、文書の区切り候補となるページを容易に見つけて文書の区切りを特定し、文書を保存することが可能となる。 As described above, according to the present embodiment, even when a plurality of documents are scanned together without using a divider, a page that is a candidate for a document break can be easily found, a document break can be specified, It can be saved.
[変形例]
(変形例1)
上述した実施形態においては、スキャナ部108は画像処理装置100と一体となっているが、スキャナ部108を別体で構成されていてもよい。例えば、文書の読み取りをパーソナルコンピュータ装置に接続されたスキャナ装置に行わせ、図3乃至5に示したフローチャートの処理をパーソナルコンピュータ装置に行わせる構成としてもよい。
[Modification]
(Modification 1)
In the above-described embodiment, the
(変形例2)
上述した実施形態においては、左早送りボタンB01や右早送りボタンB05を押下する旨の操作が行われた場合、相違度が「3」以上となっているページを文書の区切り候補として表示するようにしているが、例えば、相違度が「5」以上であったり、相違度が「2」以上のページを文書の区切り候補として表示するようにしてもよい。
(Modification 2)
In the above-described embodiment, when an operation for pressing the left fast-forward button B01 or the right fast-forward button B05 is performed, a page having a difference degree of “3” or more is displayed as a document delimiter candidate. However, for example, a page with a difference degree of “5” or more or a difference degree of “2” or more may be displayed as a document separation candidate.
(変形例3)
文書の区切りとなるページのレイアウトは一つのレイアウトに限定されるものではない。上述した実施形態においては、複数種類の区切りページファイルを記憶部105に記憶させ、この区切りページファイルが表すレイアウトに一致するページを文書の区切り候補として表示するようにしてもよい。
(Modification 3)
The layout of a page that serves as a document separator is not limited to one layout. In the embodiment described above, a plurality of types of separator page files may be stored in the
(変形例4)
上述した実施形態においてCPU102は、各ページ毎に次ページとの間の相違度を求めているが、前ページとの間の相違度を求めるようにしてもよいし、前ページと後ページとの間の両方の相違度を求めるようにしてもよい。
(Modification 4)
In the above-described embodiment, the
(変形例5)
OKボタンB03を押下する旨の操作が行われずに、終了ボタンB06を押下する旨の操作が行われた場合、相違度が「3」以上となっているページを文書の区切りとし、文書ファイルを生成するようにしてもよい。
(Modification 5)
If an operation for pressing the end button B06 is performed without an operation for pressing the OK button B03, a page having a difference degree of “3” or more is set as a document delimiter, and the document file is stored. You may make it produce | generate.
100・・・画像処理装置、101・・・バス、102・・・CPU、103・・・ROM、104・・・RAM、105・・・記憶部、106・・・表示部、107・・・操作部、108・・・スキャナ部。
DESCRIPTION OF
Claims (6)
前記読取り手段により生成された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、
前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、
文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、
前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、
前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、
前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、
前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、
前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段と
を有する画像処理装置。 Reading means for optically reading a plurality of pages and generating an image file;
Layout recognition means for recognizing the layout of the page represented by the image file generated by the reading means;
A degree-of-difference generation means for obtaining a degree of difference between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, by the layout recognized by the layout recognition means;
First instruction input means for receiving a first instruction for instructing display of a page serving as a document separator;
A separator page display means for displaying, using the image file, an image of a page in which the difference obtained by the difference generation means is a predetermined value or more when the first instruction input means receives the instruction; ,
Second instruction input means for receiving a second instruction for instructing to determine the displayed page as a document break;
When the second instruction input unit receives the instruction, a separator page determining unit that determines the displayed page as a separator page;
A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify the pages into a plurality of documents;
When the third instruction input means receives the instruction, the plurality of pages represented by the image file generated by the reading means are separated by the pages determined by the separator page determining means, and are separated for each divided range. An image processing apparatus comprising: a storage unit configured to generate a document file including an image of a page within the range and store the generated document file.
ページを表す画像ファイルを記憶部に記憶させる記憶手段と、
前記記憶部に記憶された画像ファイルにより表されるページのレイアウトを認識するレイアウト認識手段と、
前記レイアウト認識手段により認識されたレイアウトにより、前記画像ファイルにより表されるページ毎に各ページのレイアウトと各ページに隣接するページのレイアウトとの間の相違度を求める相違度生成手段と、
文書の区切りとなるページの表示を指示する第1指示を受取る第1指示入力手段と、
前記第1指示入力手段が指示を受取った場合、前記相違度生成手段により求められた相違度が所定の値以上となっているページの画像を前記画像ファイルを用いて表示する区切りページ表示手段と、
前記表示されたページを文書の区切りとして決定するよう指示する第2指示を受取る第2指示入力手段と、
前記第2指示入力手段が指示を受取った場合、前記表示されているページを区切りのページとして決定する区切りページ決定手段と、
前記読取り手段により生成された画像ファイルにより表される複数のページを区切り、複数の文書に分類するよう指示する第3指示を受取る第3指示入力手段と、
前記第3指示入力手段が指示を受取った場合、前記読取り手段により生成された画像ファイルにより表される複数のページを、前記区切りページ決定手段により決定されたページで区切り、区切られた範囲毎に該範囲内のページの画像を含む文書ファイルを生成し、生成した文書ファイルを記憶する記憶手段
として機能させるプログラム。 Computer equipment,
Storage means for storing an image file representing a page in a storage unit;
Layout recognition means for recognizing the layout of the page represented by the image file stored in the storage unit;
A degree-of-difference generation means for obtaining a degree of difference between the layout of each page and the layout of a page adjacent to each page for each page represented by the image file, by the layout recognized by the layout recognition means;
First instruction input means for receiving a first instruction for instructing display of a page serving as a document separator;
A separator page display means for displaying, using the image file, an image of a page in which the difference obtained by the difference generation means is a predetermined value or more when the first instruction input means receives the instruction; ,
Second instruction input means for receiving a second instruction for instructing to determine the displayed page as a document break;
When the second instruction input unit receives the instruction, a separator page determining unit that determines the displayed page as a separator page;
A third instruction input means for receiving a third instruction for instructing to divide a plurality of pages represented by the image file generated by the reading means and classify the pages into a plurality of documents;
When the third instruction input unit receives the instruction, the plurality of pages represented by the image file generated by the reading unit are separated by the page determined by the separator page determining unit, and each page is divided into ranges. A program that generates a document file including an image of a page within the range and functions as a storage unit that stores the generated document file.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004252408A JP2006072484A (en) | 2004-08-31 | 2004-08-31 | Image processor, program, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004252408A JP2006072484A (en) | 2004-08-31 | 2004-08-31 | Image processor, program, and storage medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006072484A true JP2006072484A (en) | 2006-03-16 |
Family
ID=36153085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004252408A Pending JP2006072484A (en) | 2004-08-31 | 2004-08-31 | Image processor, program, and storage medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006072484A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011239217A (en) * | 2010-05-11 | 2011-11-24 | Sharp Corp | Image display apparatus, and image formation apparatus having the same |
WO2013061674A1 (en) * | 2011-10-26 | 2013-05-02 | シャープ株式会社 | Document file output device, document file output method, and computer program |
JP2016086450A (en) * | 2016-02-16 | 2016-05-19 | シャープ株式会社 | Image display unit and control program |
-
2004
- 2004-08-31 JP JP2004252408A patent/JP2006072484A/en active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011239217A (en) * | 2010-05-11 | 2011-11-24 | Sharp Corp | Image display apparatus, and image formation apparatus having the same |
US8902157B2 (en) | 2010-05-11 | 2014-12-02 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
US9473652B2 (en) | 2010-05-11 | 2016-10-18 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
USRE48003E1 (en) | 2010-05-11 | 2020-05-19 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
WO2013061674A1 (en) * | 2011-10-26 | 2013-05-02 | シャープ株式会社 | Document file output device, document file output method, and computer program |
JP2013093777A (en) * | 2011-10-26 | 2013-05-16 | Sharp Corp | Document file output device, document file output method and computer program |
CN103907339A (en) * | 2011-10-26 | 2014-07-02 | 夏普株式会社 | Document file output device, document file output method, and computer program |
US9858513B2 (en) | 2011-10-26 | 2018-01-02 | Sharp Kabushiki Kaisha | Document file output apparatus, document file output method, and computer readable medium |
JP2016086450A (en) * | 2016-02-16 | 2016-05-19 | シャープ株式会社 | Image display unit and control program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4405831B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4023075B2 (en) | Image acquisition device | |
US8452601B2 (en) | Reading device with shortcut read function | |
US7031982B2 (en) | Publication confirming method, publication information acquisition apparatus, publication information providing apparatus and database | |
JP2007293417A (en) | Display controller, image processor, and display control method | |
JP2010020468A (en) | Image processing apparatus, image processing method, its program, and storage medium | |
JP2006155588A (en) | Image processing device, image processing method and image processing program | |
US8090728B2 (en) | Image processing apparatus, control method thereof, and storage medium that stores program thereof | |
JP2018046416A (en) | Information processing device and program | |
JP2003209643A (en) | Image-processing device | |
US7539671B2 (en) | Image processing apparatus, image forming apparatus, method for searching processed document, program for searching processed document, and recording medium | |
JP2006072484A (en) | Image processor, program, and storage medium | |
JP3727995B2 (en) | Document processing method and apparatus | |
US10057437B2 (en) | Image processing apparatus, operation assistance method, and non-transitory computer-readable recording medium encoded with operation assistance program | |
JP5298997B2 (en) | Document image editing apparatus, document image editing method, document image editing program, and computer-readable recording medium storing a program for causing a computer to execute the method | |
JP2006252455A (en) | File management device, file management method and file management program | |
JP2006262152A (en) | Image forming method and device, and program | |
JP2006333248A (en) | Image processing apparatus, image processing method, program and storage medium | |
JP2009163475A (en) | Information processor, information processing system and information processing program | |
JP2007336008A (en) | Image searching apparatus and method | |
US20200110476A1 (en) | Digital Redacting Stylus and System | |
US9292528B2 (en) | Information processing apparatus, method, and medium for processing files stored in a storage medium | |
JP7271987B2 (en) | Information processing device and program | |
JP2007025160A (en) | Image forming apparatus, control method and program thereof | |
JP5233213B2 (en) | Image processing apparatus, image processing method, and image processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070719 |
|
A977 | Report on retrieval |
Effective date: 20091015 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
A131 | Notification of reasons for refusal |
Effective date: 20091027 Free format text: JAPANESE INTERMEDIATE CODE: A131 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100309 |