JP2009169675A - Document processing apparatus, document processing method and document processing program - Google Patents
Document processing apparatus, document processing method and document processing program Download PDFInfo
- Publication number
- JP2009169675A JP2009169675A JP2008007075A JP2008007075A JP2009169675A JP 2009169675 A JP2009169675 A JP 2009169675A JP 2008007075 A JP2008007075 A JP 2008007075A JP 2008007075 A JP2008007075 A JP 2008007075A JP 2009169675 A JP2009169675 A JP 2009169675A
- Authority
- JP
- Japan
- Prior art keywords
- document
- page
- unit
- style
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、文書処理装置、文書処理方法および文書処理プログラムに関し、特に、原稿の読取り機能を有する文書処理装置、文書処理方法および文書処理プログラムに関する。 The present invention relates to a document processing apparatus, a document processing method, and a document processing program, and more particularly to a document processing apparatus, a document processing method, and a document processing program having a document reading function.
省資源や省スペースの観点から、紙原稿などに記載された文書を電子文書に変換して管理する文書管理システムが実用化されている。このような文書管理システムでは、スキャナ装置などを用いて原稿を読取ることで文書画像を生成し、これらの文書画像から電子文書を生成する。 From the viewpoint of resource saving and space saving, a document management system that converts and manages a document described on a paper manuscript or the like into an electronic document has been put into practical use. In such a document management system, a document image is generated by reading a document using a scanner device or the like, and an electronic document is generated from these document images.
従来より、様々な文書を連続して入力する場合に、文書の区切りを自動的に設定するための提案がなされている。 2. Description of the Related Art Conventionally, proposals have been made for automatically setting document separators when various documents are continuously input.
たとえば、特許文献1には、電子ファイリング装置が、画像の文字認識を行ない、その文字認識結果が予め設定した文字列と一致した場合に、文書の区切りを設定することが開示されている。
For example,
また、特許文献2には、画像処理装置が、各ページのレイアウトと各ページに隣接するページのレイアウトとの相違度に基づいて、文書の区切りを設定することが開示されている。
また、特許文献3には、電子ファイル装置が、画像の向き(縦横)を検出し、検出した画像の向きが直前の原稿と異なる場合に文書の区切りを設定することが開示されている。
特許文献1では、文書の区切りを設定するためには、文書の最初または終わりなどに特定の文字列を含むことが必要とされる。しかしながら、特定の文字列を含む同種の文書は限定される。
In
特許文献2では、文書の最初と最後とでレイアウトの変化が必要とされる。単一の種類の文書では、文書の区切りでレイアウトの規則的な変化が生じる場合もあるが、複数の文書が混在した場合にはレイアウトの変化に規則性を生じない場合も少なくない。また、レイアウトが変化しない種類の文書、あるいは、レイアウトが多様な文書も存在する。
In
さらに、特許文献3では、複数の文書をスキャナにかける前に、ユーザが、区切りを設定したい箇所に各文書の向きを直前の文書の向きと変える等の手間が必要となる。
Furthermore, according to
本発明は、上記のような問題を解決するためになされたものであって、その目的は、多様な種類の文書が混在した原稿から、ユーザの手間無しに自動的に文書の区切りを設定することのできる画像処理装置、文書処理方法および文書処理プログラムを提供することである。 The present invention has been made to solve the above-described problems, and an object of the present invention is to automatically set document separation without any user's effort from a manuscript in which various types of documents are mixed. An image processing apparatus, a document processing method, and a document processing program are provided.
この発明のある局面に従う画像処理装置は、文書画像を記憶するための第1の記憶手段と、前記第1の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するための判定手段と、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える。 An image processing apparatus according to an aspect of the present invention is configured to extract a predetermined type of document area from a first storage unit for storing a document image and the document image stored in the first storage unit. Detecting means for detecting a plurality of area attributes based on each of a plurality of predetermined attribute types for each document area, and detecting a style feature representing a pattern of the combination of the area attributes; A plurality of the style features are classified for each pattern, a determination unit for determining one or more main style features for the document image based on the appearance frequency of the classified pattern, and a plurality of style features for each page Detect which of the main style features is present and set the document image separation position based on the amount of change of the main style features between pages And an order of the setting means.
好ましくは、前記判定手段は、前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む。 Preferably, for each of the style features, the determination unit includes a frequency calculation unit for calculating the number of pages in which the style feature appears as the appearance frequency, and a style feature in which the calculated number of pages is equal to or greater than a predetermined value. Means for determining as the main style feature.
好ましくは、前記設定手段は、各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む。 Preferably, the setting means includes means for determining the main style feature existing in each page as the page feature of the page, and for each page, the page feature of the page is derived from the page feature of the previous page. An amount calculating means for calculating the changed amount as the change amount; and a means for setting a break position between the pages when the calculated change amount is equal to or greater than a predetermined value.
好ましくは、前記設定手段は、連続する第1、第2および第3のページのうち、前記第2のページ以外の前記第1および第3のページで同一のページ特徴が検出された場合には、前記第2のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む。 Preferably, when the same page feature is detected in the first and third pages other than the second page among the continuous first, second and third pages, the setting means The second page further includes correction means for correcting that the same page feature has been detected.
好ましくは、前記設定手段により設定された区切り位置に基づいて、前記文書画像を分割して出力するための出力手段をさらに備える。 Preferably, output means for dividing and outputting the document image based on the separation position set by the setting means is further provided.
好ましくは、前記文書画像が前記区切り位置に基づいて区切られた場合に、区切られた複数の分割文書画像における最初のページのインデックス画像を表示するための信号を生成する表示制御手段と、前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える。 Preferably, when the document image is divided based on the separation position, a display control unit that generates a signal for displaying an index image of a first page in the plurality of divided document images, and the display Display means for performing output in accordance with a signal from the control means.
好ましくは、ユーザから、前記設定手段による前記文書画像の区切り数に関する指示を受付けるための指示受付手段をさらに備える。 Preferably, the apparatus further includes an instruction receiving unit for receiving an instruction from the user regarding the number of document image divisions by the setting unit.
好ましくは、受付けられた前記指示に応じて、前記設定手段による区切り位置の設定のための所定のパラメータを変更する変更手段と、前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える。 Preferably, in accordance with the received instruction, a changing unit that changes a predetermined parameter for setting a separation position by the setting unit, and after the change by the changing unit, the processing by the setting unit is executed again. And execution instruction means for instructing.
好ましくは、レイアウトあるいは所定の文字列に基づいて、前記文書画像の区切り位置を設定するための第2の設定手段をさらに備える。 Preferably, the image processing apparatus further includes a second setting unit for setting a break position of the document image based on a layout or a predetermined character string.
好ましくは、前記所定の複数の属性種別は、上位領域での位置,大きさ,色、部分領域の個数,位置,高さ,色,隣接する部分領域との距離、文字の大きさ,文字修飾、文字色、背景色、フォントの種別のうち、少なくとも2つを含む。 Preferably, the plurality of predetermined attribute types include position, size, color in upper area, number of partial areas, position, height, color, distance between adjacent partial areas, character size, character modification , Character color, background color, and font type.
好ましくは、前記所定の種類の文書領域は、段、行、文字列および文字のうちのいずれかに対応する。 Preferably, the predetermined type of document area corresponds to one of a column, a line, a character string, and a character.
この発明のさらに他の局面に従う文書処理方法は、文書画像を記憶するための記憶部と演算処理部とを備えた文書処理装置において実行される文書処理方法であって、前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するステップと、ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える。 A document processing method according to still another aspect of the present invention is a document processing method executed in a document processing apparatus including a storage unit for storing a document image and an arithmetic processing unit, wherein the arithmetic processing unit includes: A step of extracting a predetermined type of document area from the document image stored in the storage unit; and the arithmetic processing unit includes a plurality of area attributes based on a plurality of predetermined attribute types for each of the document areas. Detecting and detecting a style feature representing a combination pattern of the region attributes, classifying the detected plurality of style features for each pattern, and based on the appearance frequency of the classified pattern, the document image Determining one or more primary style features of each of the plurality of primary style features, detecting which of the plurality of primary style features is present for each page; Based on the amount of change in the primary style features among di-, and a step of setting a sectioning position of the document image.
この発明のさらに他の局面に従う画像処理プログラムは、上記記載の文書処理方法をコンピュータに実行させる。 An image processing program according to still another aspect of the present invention causes a computer to execute the document processing method described above.
本発明によると、多様な種類の文書が混在した原稿からでも、ユーザの手間無しに区切り位置を設定することができる。また、主要なスタイル特徴が判定されるため、最適な位置で、文書画像を分割することができる。 According to the present invention, it is possible to set a separation position without a user's effort even from an original in which various types of documents are mixed. In addition, since the main style feature is determined, the document image can be divided at an optimal position.
本発明の実施の形態について図面を参照しながら詳細に説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰返さない。 Embodiments of the present invention will be described in detail with reference to the drawings. In the drawings, the same or corresponding parts are denoted by the same reference numerals and description thereof will not be repeated.
<構成について>
(全体システム構成)
図1は、この発明の実施の形態に従う文書処理装置を含むシステムの概略構成図である。本実施の形態においては、代表的に、本発明に係る文書処理装置を搭載するMFP(Multi Function Peripheral)について説明する。なお、本発明に係る文書処理装置は、
MFPに限らず、複写機、ファクシミリ装置、スキャナ装置などにも適用可能である。
<About configuration>
(Overall system configuration)
FIG. 1 is a schematic configuration diagram of a system including a document processing apparatus according to an embodiment of the present invention. In the present embodiment, an MFP (Multi Function Peripheral) equipped with the document processing apparatus according to the present invention will be typically described. The document processing apparatus according to the present invention is
The present invention can be applied not only to the MFP but also to a copying machine, a facsimile apparatus, a scanner apparatus, and the like.
図1を参照して、本実施の形態に従うMFP1は、原稿300を読取るための画像読取部104と、紙媒体などへの印刷処理を行なうためのプリント部106とを含んで構成される。本実施の形態に従うMFP1は、画像読取部104で原稿300を読取ることで文書画像を取得し、この文書画像を含む電子文書を生成する。また、MFP1は、読取った文書画像をプリント部106に出力する。
Referring to FIG. 1, MFP 1 according to the present embodiment is configured to include an
特に、MFP1は、複数ページを有する文書画像のスタイル特徴に基づいて、該文書画像の区切り位置を設定することができる。区切り位置は、ページ単位で設定される。
In particular, the
MFP1は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれに対応した複数の電子文書を生成する。これらの電子文書400には、代表的に、PDF(Portable Document Format)などのフォーマットが採用できる。
The
MFP1は、生成した電子文書400を自身の記憶部(図1において不図示)に格納する。また、記憶された電子文書400を、ネットワークを介してパーソナルコンピュータPC1,PC2,PC3(以下、「パーソナルコンピュータPC」とも総称する)に送信したりする。代表的な使用形態として、MFP1が設置されている同一のオフィス内に敷設されたネットワークであるLAN(Local Area Network)に接続されているパーソナルコンピュータPC1,PC2に対しては、MFP1から電子文書400が直接的に送信される。一方、LANとWAN(Wide Area Network)との接続点には、サーバ装置SRVが設けてあり、MFP1とは離れたオフィスにあるパーソナルコンピュータPC3などに対しては、MFP1からサーバ装置SRVを介して電子文書400が送信される。ここで、サーバ装置SRVは代表的に、メールサーバ、FTP(File Transfer Protocol)サーバ、Webサーバ、SMBサーバなどからなる。
The
画像読取部104は、原稿をセットするための戴荷台と、原稿台ガラスと、戴荷台にセットされた原稿を原稿台ガラスに自動的に一枚ずつ搬送する搬送部と、読取られた原稿を排出するための排出台とを含む(いずれも図示しない)。これにより、複数枚の原稿を連続的に読取って、一つまたは複数の電子文書を生成することができる。
The
プリント部106は、ソート機能を備えている。MFP1は、設定された区切り位置により文書画像を分割し、分割された複数の文書画像それぞれを、ソート方法を変えてプリント部106に出力する。これにより、一度に読み取られた原稿を、仕分けして出力することができる。
The
(MFP1の概略構成)
図2は、本発明の実施の形態に従うMFP1における概略のハードウェア構成を示すブロック図である。
(Schematic configuration of MFP 1)
FIG. 2 is a block diagram showing a schematic hardware configuration in
図2を参照して、MFP1の機能構成としては、制御部100と、メモリ部102と、画像読取部104と、プリント部106と、通信インターフェイス部108と、操作パネル部110と、記憶部112とを含む。
Referring to FIG. 2, the functional configuration of
制御部100は、代表的にCPU(Central Processing Unit)などの演算装置から構成され、プログラムを実行することで本実施の形態に従う文書処理を実現する。メモリ部102は、代表的にDRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、制御部100で実行されるプログラムやプログラムの実行に必要なデータなどを保持する。通信インターフェイス部108は、代表的に、ネットワーク(たとえば、図1に示すLAN)を介してパーソナルコンピュータPC(図1)との間でデータを送受信するための部位であり、たとえば、LANアダプタおよびそれを制御するドライバソフトなどを含む。プリント部106は、プリント処理を行なうための部位であり、プリント処理に係るハードウェア構成に加えて、各部の作動を制御するための制御装置をも含む。
The
記憶部112は、代表的にハードディスク装置やフラッシュメモリなどの不揮発性の記憶装置であり、制御部100の動作のためのプログラムや制御部100で生成された電子文書400などを格納する。
The
なお、本実施の形態において、設定された区切り位置に基づいて分割された文書画像は、通信インターフェイス部108、記憶部112およびプリント部106のうちのいずれかに出力されるものとする。
In the present embodiment, it is assumed that the document image divided based on the set separation position is output to any one of the
操作パネル部110の外観例を図3に示す。図3は、本発明の実施の形態に従うMFP1の操作パネル部の外観の一例を示す図である。
An example of the appearance of the
図3を参照して、操作パネル部110は、液晶表示装置やタッチパネルなどから構成される表示パネル110aと、ストップボタン110bと、スタートボタン110cと、英数キーなどを含む操作ボタン110dとを備えている。
Referring to FIG. 3,
なお、MFP1は、表示機能と指示の入力機能とを兼ね備えた操作パネル部110を備えることとしたが、これに代えて、表示部とハードウェアボタンを含む入力部との両方を備えることとしてもよい。
The
(パーソナルコンピュータの構成)
図4は、本発明の実施の形態に従うパーソナルコンピュータPCの概略のハードウェア構成を示す模式図である。
(Configuration of personal computer)
FIG. 4 is a schematic diagram showing a schematic hardware configuration of personal computer PC according to the embodiment of the present invention.
図4を参照して、パーソナルコンピュータPCは、オペレーティングシステム(OS:Operating System)を含む各種プログラムを実行するCPU(Central Processing Unit)201と、CPU201でのプログラムの実行に必要なデータを一時的に記憶するメモリ部213と、CPU201で実行されるプログラムを不揮発的に記憶するハードディスク部(HDD:Hard Disk Drive)211とを含む。また、ハードディスク部211には、MFP1で生成された電子文書400を表示するための閲覧アプリケーションが記憶されており、このようなプログラムは、FDDドライブ217またはCD−ROMドライブ215によって、それぞれフレキシブルディスク217aまたはCD−ROM(Compact Disk-Read Only Memory)215aなどから読取られる。
Referring to FIG. 4, personal computer PC temporarily stores a CPU (Central Processing Unit) 201 that executes various programs including an operating system (OS) and data necessary for the
CPU201は、キーボードやマウスなどからなる入力部209を介してユーザからの指示を受取るとともに、プログラムの実行によって生成される画面出力をディスプレイ部205へ出力する。また、CPU201は、LANカードなどからなる通信インターフェイス部207を介して、LANやWANに接続されたMFP1やサーバ装置SRV(図1)から電子文書400を取得し、ハードディスク部211などに格納する。また、上述の各部は、内部バス203を介して相互にデータを授受する。
The
(MFPの機能構成)
図5は、本発明の実施の形態に従うMFP1が電子文書を生成する場合の機能構成を示す機能ブロック図である。
(Functional configuration of MFP)
FIG. 5 is a functional block diagram showing a functional configuration when
図5を参照して、MFP1の制御部100は、画像バッファ部13と、電子文書生成部15と、画像解析部16と、送信処理部17と、表示制御部25と、指示受付部26と、パラメータ変更部27とを含む。
Referring to FIG. 5, the
上述の画像読取部104は、原稿300を読取って文書画像を取得する。より具体的には、紙状の原稿300を光学的に読取り、デジタルデータに変換することでRGBデジタル画像データを取得する。画像読取部104は、取得した文書画像(デジタル画像データ)を画像バッファ部13へ出力する。
The above-described
なお、本実施の形態では、画像読取部104によって読取られた文書画像が、画像バッファ部13に出力されることとして説明するが、受信部12として機能する通信インターフェイス部108が受信した画像データ310が、画像バッファ部13に出力されてもよい。受信部12は、LANなどのネットワークを介して画像データ310を受信してもよいし、たとえば携帯型小型メモリ(図示せず)に記憶された画像データ310を受付けてもよい。受信部12は、データ形式の整合をとった上で、画像データ310を出力する。
In the present embodiment, the document image read by the
画像バッファ部13は、文書画像のデータを一時的に格納する部位であり、画像解析部16および電子文書生成部15から出力の要求があるまで画像データを保持する。画像解析部16および電子文書生成部15から出力の要求があれば、対応する画像データを出力する。本実施の形態において、画像バッファ部13は、各画像データの管理情報も保持する。管理情報には、後述するように、文書IDが含まれる。
The
画像解析部16は、行領域抽出部21と、スタイル特徴検出部22と、主要判定部23と、区切り位置設定部24とを含む。
The
行領域抽出部21は、画像バッファ部13から出力される文書画像から、所定の種類の文書領域として行領域を抽出する。本実施の形態において、「所定の種類の文書領域」は、テキスト領域に含まれる領域であればよく、行領域に限定されるものではない。たとえば、一定以上の余白によって分割される文字領域、文字列および段など、他の部分領域であってもよい。あるいは、ページ,カラムなどの上位領域であってもよい。
The line
スタイル特徴検出部22は、行領域抽出部21で抽出された行領域ごとに、所定の複数の属性種別に基づいて、スタイル特徴を検出する。より具体的には、行領域ごとに、所定の複数の属性種別それぞれに基づく複数の行属性を検出し、その行属性の組合せのパターンを、スタイル特徴として検出する。「所定の複数の属性種別」とは、文書画像に含まれる複数のページの特徴を特定するために用いられる情報であり、上位領域での位置,大きさ,色、部分領域の個数,位置,高さ,色,隣接する部分領域との距離、文字の大きさ,文字修飾、文字色、背景色、フォントの種別のうち、少なくとも2つを含む。その他にも、頻度が上位の文字領域の高さ、などを含んでもよい。本実施の形態では、所定の複数の属性種別は、行(部分領域)の高さ、近接行との行間(位置)、文字色、背景色および文字修飾を含むものとする。本実施の形態において、「行属性」とは、行領域ごとの、5つの属性種別それぞれに対応した5種類の属性をいう。
The style
検出された行領域ごとのスタイル特徴は、主要判定部23に出力される。
主要判定部23は、検出された複数のスタイル特徴のうち、読取られた文書画像の主要なスタイル特徴を判定する。具体的には、複数のスタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、文書画像についての1以上の主要なスタイル特徴を判定する。つまり、主要判定部23は、スタイル特徴ごとに、そのスタイル特徴が出現したページ数を出現頻度として算出(カウント)し、算出されたページ数が、所定値以上であるスタイル特徴を、主要なスタイル特徴(有効)として判定する。言い換えると、ページ数が所定値未満のスタイル特徴は、局所的なスタイル特徴であり、文書を特徴付ける主要なスタイル特徴ではない(無効)と判断する。判定された主要なスタイル特徴は、区切り位置設定部24に出力される。
The detected style feature for each row area is output to the
The main determining
区切り位置設定部24は、判定された複数の主要なスタイル特徴に基づいて、読取られた文書画像の区切り位置をページ単位で設定する。具体的には、ページごとに、複数の主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での主要なスタイル特徴の変化量に基づいて、文書画像の区切り位置を設定する。つまり、ページに存在する主要なスタイル特徴を、当該ページのページ特徴として判定する。そして、ページごとに、当該ページのページ特徴が前ページのページ特徴から変化した量を変化量として算出する。区切り位置設定部24は、算出された変化量が一定値以上の場合に、そのページ間に区切り位置を設定する。箇所を、区切り位置として設定する。また、区切り位置設定部24は、設定した区切り位置に基づいて、各ページに対応する画像データに文書IDを付与する。付与した文書IDの情報は、画像バッファ部13に出力される。
The delimiter
このように、文書画像における主要なスタイル特徴に基づいて、自動的に区切り位置が設定される。そのため、多様な種類の文書が混在した原稿からでもユーザの手間を必要とせずに最適な位置に区切りを設定することができる。 Thus, the break position is automatically set based on the main style features in the document image. Therefore, it is possible to set a break at an optimum position without requiring the user's effort even from a manuscript in which various types of documents are mixed.
なお、区切り位置設定部24は、ページ特徴を判定した後に、補正処理も行なうことが好ましい。すなわち、連続する第1、第2および第3のページのうち、第2のページ以外の第1および第3のページで同一のページ特徴が検出された場合には、第2のページにも同一のページ特徴が検出されたものとして補正する。このような補正は、全ページに同一のページ特徴が検出されない場合にのみ、実行されることが好ましい。前後のページに同じページ特徴がある場合には、その間のページも同じページ特徴であることが一般的である。たとえば、その間のページが表や写真であった場合などが想定される。このような場合にも、主要なスタイル特徴の出現位置から各ページのページ特徴を適切に判定するために、上記のような補正処理を行なう。これにより、区切りとして最適でない位置で区切りが設定されてしまうことを防止することができる。
Note that the break
電子文書生成部15は、画像バッファ部13から文書画像および管理情報を入力する。電子文書生成部15は、画像データの圧縮処理を行ない、圧縮された画像データをPDF形式に変換する(電子文書を生成する)。その際に、電子文書生成部15は、管理情報に含まれる文書IDに基づいて(すなわち、設定された区切り位置に基づいて)、複数の電子文書を生成する。より具体的には、付与された文書IDごとに、電子文書を生成する。そして、生成した電子文書の情報を表示制御部25に出力する。また、指示受付部26が所定の指示を受付けた場合に、生成された電子文書を、ユーザによる設定などに応じて、記憶部112へ格納されたり、送信処理部17へ出力されたりする。なお、圧縮度合いは、生成される電子文書の大きさや、要求される文書画像の解像度などに応じて変化させてもよい。
The electronic
表示制御部25は、生成された各電子文書を特定するためのインデックス画像、たとえば最初のページのプレビュー画像を表示するための信号を生成する。表示制御部25は、生成した信号を操作パネル部110に出力する。これにより、操作パネル部110に、複数のプレビュー画像が表示される。なお、インデックス画像は、文書画像の区切り位置が特定可能であればよく、最初のページのプレビュー画像に限定されない。また、文書画像の区切り位置が特定できれば、画像でなくてもよい。
The
指示受付部26は、操作パネル部110を介して、生成された電子文書の数に関する指示を受付ける。具体的には、ユーザから、文書数を増やす指示(以下「増指示」という)、文書数を減らす指示(以下「減指示」という)およびOK指示(現状の文書数で出力する旨の指示)のいずれかが受付けられる。指示受付部26は、増指示または減指示を受付けた場合に、その指示内容をパラメータ変更部27に出力する。OK指示を受付けた場合には、その旨を電子文書生成部15に出力する。
The
パラメータ変更部27は、受付けた修正の指示内容に基づいて、区切り位置設定のための所定のパラメータを変更する。パラメータが変更されると、再度、区切り位置設定部24による処理の実行が指示される。これにより、区切り位置設定部24は、変更されたパラメータに基づいて、再度、区切り位置設定処理を実行する。
The
このように、本実施の形態では、区切り位置が自動的に設定された後に、ユーザにその区切り度合い(分割数)を確認させる。そのため、ユーザは、希望の数になるように何度でも区切り位置設定処理の実行を指示することができる。 As described above, in this embodiment, after the break position is automatically set, the user is made to confirm the break degree (number of divisions). Therefore, the user can instruct execution of the separation position setting process as many times as desired.
送信処理部17は、電子文書400を、各種の通信プロトコルに従って、ユーザにより指定された送り先に送信するための処理を行なう。プロトコルとしては、たとえばSMB(Server Message Block),FTP(File Transfer Protocol),HTTP(Hyper Text Transfer Protocol),SMTP(Simple Mail Transfer Protocol)などが選択可能である。本実施の形態において、送信処理部17は、文書IDが異なる複数の電子文書400が生成された場合には、各電子文書400に異なるファイル名を付与する。ファイル名として、たとえば、「“Doc”+“文書ID”+“.pdf”」が付与される。また、送信処理部17は、ユーザからの指示に基づいて、電子文書400の送り先を設定する。なお、これらの具体的な処理の例については後述する。送信処理部17は、電子文書400、電子文書400ごとのファイル名および送り先を送信部18に出力する。
The
送信部18は、通信インターフェイス部108によって実現され、LANなどのネットワークを介してパーソナルコンピュータPC(図1)などへ、電子文書生成部15で生成された複数の電子文書400を送信する。なお、送信部18は、たとえば携帯型小型メモリ(図示せず)を装着可能であり、電子文書400は、そのような着脱可能なメモリに出力されてもよい。
The
なお、制御部100に含まれる各ブロックの動作は、たとえば記憶部112中に格納されたソフトウェアを実行することで実現されてもよいし、これらのブロックのうち少なくとも1つについては、ハードウェアで実現されてもよい。
The operation of each block included in the
<動作について>
(電子文書生成処理)
以下に、本発明の実施の形態のMFP1が実行する電子文書生成処理について、図6〜8のフローチャートおよび図9〜22を参照して具体的に説明する。
<About operation>
(Electronic document generation processing)
The electronic document generation process executed by the
図6は、本発明の実施の形態における電子文書生成処理を示すフローチャートである。図6のフローチャートに示す処理は、予めプログラムとして記憶部112に格納されており、制御部100がこのプログラムを読み出して実行することにより、電子文書生成処理の機能が実現される。なお、このフローチャートにおいては、電子文書をインターネット経由でPC等に送信することがユーザにより設定されたものとして説明する。
FIG. 6 is a flowchart showing an electronic document generation process in the embodiment of the present invention. The processing shown in the flowchart of FIG. 6 is stored in advance in the
図6を参照して、はじめに、行領域抽出部21は、画像バッファ部13に記憶された文書画像から、行領域を抽出する(ステップS2)。具体的には、次の手順で行領域が抽出される。図9は、本実施の形態における行領域抽出処理を説明するための図である。図9(a)には、元の文書画像の任意のページが示されている。
With reference to FIG. 6, the line
行領域抽出部21は、各ページのRGB画像データを2値化する。たとえば、RGB画像の輝度値に変換し、各ページの輝度値の平均値と比較する。これにより、明るい場合は「0」、暗い場合は「1」がたとえばメモリ部102に一時記録される。次に、2値画像の値が“1”の画素を8連結で走査する。連結がある場合には、画素に同一のラベル値を与えることで黒連結領域を生成し、その外接矩形を求める。図9(b)は、外接矩形が求められた結果を示す図である。
The row
次に、各外接矩形について左右方向に一定距離以下に近接する領域を検出し、検出された領域を1つの領域に統合する。図9(c)は、図9(b)の外接矩形が統合された領域を示す図である。行領域抽出部21は、統合された領域を行領域として出力する。複数ページを含む文書に対して抽出された行領域の例を図10に示す。なお、行領域を抽出するための処理は、上述のような処理に限定されるものではない。
Next, for each circumscribed rectangle, a region close to a certain distance in the left-right direction is detected, and the detected regions are integrated into one region. FIG. 9C shows a region where the circumscribed rectangles of FIG. 9B are integrated. The line
ステップS2の処理が終わると、スタイル特徴検出部22は、所定の複数の属性種別に基づいて、抽出された行領域ごとのスタイル特徴を検出する(ステップS4)。具体的には、複数の属性種別として、行の高さ、近接行との行間、文字色、背景色および文字修飾が用いられる。したがって、スタイル特徴検出部22は、行領域ごとに、これらの属性種別に基づいたスタイル特徴を検出する。
When the process of step S2 ends, the style
「行の高さ」は、行領域の高さを算出することで得られる。「近接行との行間」は、上下に隣接する行領域を検出して、隣接する各行領域との距離を算出する。そして、距離が小さい方の値を、「近接行との行間」として得る。「文字色」および「背景色」は、各行領域のカラーヒストグラムを生成する。そして、最頻度の色を「背景色」、次頻度の色を「文字色」として得る。「文字修飾」は、行領域のランレングスヒストグラムを生成する。すなわち、行領域の縦方向および横方向の黒画素の連続長のヒストグラムを生成する。そして、生成されたランレングスヒストグラムに基づいて、「太い文字」、「斜体」などの文字修飾を判定し、最頻度の文字修飾を「文字修飾」として得る。なお、各々の行属性の検出方法は、上述のような方法に限定されるものではない。 The “row height” is obtained by calculating the height of the row area. “Inter-row spacing” detects the adjacent row regions in the vertical direction and calculates the distance to each adjacent row region. Then, the value having the smaller distance is obtained as “the space between adjacent rows”. “Character color” and “background color” generate a color histogram of each row region. Then, the most frequent color is obtained as “background color” and the next frequency color is obtained as “character color”. “Character modification” generates a run-length histogram of the line area. That is, a continuous length histogram of black pixels in the vertical and horizontal directions of the row region is generated. Then, based on the generated run length histogram, character modification such as “thick character” and “italic” is determined, and the most frequent character modification is obtained as “character modification”. The method for detecting each row attribute is not limited to the method described above.
スタイル特徴検出部22は、検出した各々の行属性を、行領域リストに記録する。
図11は、文書画像に含まれる行領域のリストの一例を示す図である。図11を参照して、行領域のリストには、主に4つの項目すなわちページ、ページID、行IDおよび属性種別を有しており、これらの項目が互いに対応付けられている。ページの項目には、文書画像のページ順に、1ページ目、2ページ目、…、6ページ目が記録される。ページIDの項目には、各ページを一意に特定するための識別情報(ID)が記録される。行IDの項目には、各ページ内の各行を一意に特定するための識別情報(ID)が記録される。属性種別の項目には、行IDごとに、上記5つの属性種別に基づくスタイル特徴が記録される。「スタイル特徴」とは、本実施の形態において、5つの行属性の組合せに基づく特徴を示す。つまり、たとえば、1ページ目における行ID1の行では、行の高さ「4」、近接行との行間「20」、文字色「黒」、背景色「白」および文字修飾「太い文字」のそれぞれが、この行の行属性である。また、これらの行属性の組合せが、この行のスタイル特徴となる。
The style
FIG. 11 is a diagram illustrating an example of a list of row areas included in the document image. Referring to FIG. 11, the row area list has mainly four items, that is, a page, a page ID, a row ID, and an attribute type, and these items are associated with each other. In the page item, the first page, the second page,..., The sixth page are recorded in the page order of the document image. In the page ID item, identification information (ID) for uniquely specifying each page is recorded. In the row ID item, identification information (ID) for uniquely specifying each row in each page is recorded. In the attribute type item, style characteristics based on the above five attribute types are recorded for each row ID. “Style feature” refers to a feature based on a combination of five row attributes in the present embodiment. That is, for example, in the row with the
ステップS4の処理が終わると、スタイル特徴検出部22は、行領域ごとに検出されたスタイル特徴に基づいて、スタイル特徴リストを生成する(ステップS6)。スタイル特徴リストは、ユニークなスタイル特徴のリストである。
When the process of step S4 ends, the style
図12は、スタイル特徴リストの一例を示す図である。
図12を参照して、スタイル特徴リストは、6つの項目すなわち、スタイルID、行の高さ、近接行との行間、文字色、背景色および文字修飾の項目を有し、各項目は互いに対応付けられている。スタイルIDは、ユニークなスタイル特徴を一意に特定するための識別情報(ID)である。
FIG. 12 is a diagram illustrating an example of a style feature list.
Referring to FIG. 12, the style feature list has six items, that is, a style ID, a line height, a space between adjacent lines, a character color, a background color, and a character modification item, and each item corresponds to each other. It is attached. The style ID is identification information (ID) for uniquely specifying a unique style feature.
ステップS6の処理が終わると、主要判定部23は、スタイル特徴ごとの頻度を算出する(ステップS8)。具体的には、スタイル特徴リストのスタイルIDごとに、出現する行数およびページ数を算出する。これにより、各スタイルIDで特定されるスタイル特徴ごとに、文書画像における出現頻度(存在割合)が算出される。なお、ページごとのスタイル特徴を抽出する必要があるので、ページ数のみが算出されることとしてもよい。
When the process of step S6 ends, the
図13は、スタイル特徴ごとの頻度算出結果を示すテーブル(以下「算出結果テーブル」という)の一例を示す図である。図13を参照して、算出結果テーブルの列には、7つのスタイルIDそれぞれに対応する7つの項目が設けられ、該テーブルの行には、6つのページIDそれぞれに対応する6つの項目と、行数を示す項目と、ページ数を示す項目とが設けられる。なお、算出結果テーブルの行に含まれる有効性を示すの項目は、後の判定処理の結果が記録される。 FIG. 13 is a diagram illustrating an example of a table indicating a frequency calculation result for each style feature (hereinafter referred to as “calculation result table”). Referring to FIG. 13, the calculation result table column includes seven items corresponding to the seven style IDs, and the row of the table includes six items corresponding to the six page IDs, and An item indicating the number of lines and an item indicating the number of pages are provided. In addition, the item of the effectiveness included in the row of the calculation result table records the result of the subsequent determination process.
算出結果テーブルには、ページIDの欄には、各スタイルIDで特定されるスタイル特徴が出現する行数が記録される。そして、主要判定部23は、記録した行数の情報に基づいて、スタイルIDごとに、行数およびページ数を算出する。
In the calculation result table, the number of lines in which the style feature specified by each style ID appears is recorded in the page ID column. Then, the
ステップS8の処理が終わると、主要判定部23は、主要なスタイル特徴を判定する(ステップS10)。具体的には、たとえば、ページ数が所定数以上のスタイル特徴を、主要なスタイル特徴として判定する。なお、ここでの「所定数」とは、文書画像が有するページ数に基づいて、予め算出された値であることが望ましい。たとえば、ページ数に一定割合(たとえば、1/3)を乗じた値である。したがって、図10に示した文書画像の例では、ページ数が2以上のスタイル特徴が、主要なスタイル特徴であると判定される。
When the process of step S8 ends, the
主要判定部23は、算出結果テーブルの有効性の欄のうち、ページ数が2以上のスタイル特徴に対応するスタイルIDの欄に有効を示す「有」を記録し、ページ数が2未満のスタイル特徴に対応するスタイルIDの欄に無効を示す「無」を記録する。つまり、主要なスタイル特徴であれば「有」が記録されることになる。図13では、スタイルIDが2,3,5,6のスタイル特徴が主要なスタイル特徴であることが示される。
The
なお、ここでは、ページ数のみに基づいて、主要なスタイル特徴を判定したが、行数を加味した判定を行なってもよい。たとえば、ページ数が2以上であり、かつ、行数が所定数以上であるものを、主要なスタイル特徴と判定してもよい。この場合の「所定数」は、全行数に基づいて、予め算出された値であってもよいし、ページ数に基づいて、予め算出された値であってもよい。このように、行数も加味した判定をすることで、ページ内での出現割合が低いスタイル特徴が、主要なスタイル特徴と判定されることを防止することができる。または、各スタイル特徴のページ内での占有面積を算出し、その割合が、一定値以上の場合にのみ、ページ数をカウントするようにしてもよい。 Here, the main style features are determined based only on the number of pages, but determination may be made in consideration of the number of lines. For example, a case where the number of pages is 2 or more and the number of lines is a predetermined number or more may be determined as the main style feature. The “predetermined number” in this case may be a value calculated in advance based on the total number of rows, or may be a value calculated in advance based on the number of pages. In this way, by making a determination in consideration of the number of lines, it is possible to prevent a style feature having a low appearance ratio in the page from being determined as a main style feature. Alternatively, the occupation area of each style feature in a page may be calculated, and the number of pages may be counted only when the ratio is equal to or greater than a certain value.
ステップS10の処理が終わると、主要判定部23は、主要なスタイル特徴と判定されたスタイル特徴についてのテーブル(以下「主要領域特徴テーブル」)を生成する(ステップS12)。図14は、主要領域特徴テーブルの一例を示す図である。
When the process of step S10 ends, the
図14を参照して、主要領域特徴テーブルは、図13に示した算出結果テーブルのうち、有効性の欄に「有」が記録されたスタイルIDに対応する項目のみを含む。つまり、主要領域特徴テーブルには、主要なスタイル特徴と判定されたスタイル特徴についての、ページごとの出現行数、トータルの行数、出現ページ数(および有効性)が含まれる。 Referring to FIG. 14, the main area feature table includes only items corresponding to the style ID in which “present” is recorded in the validity column in the calculation result table shown in FIG. 13. In other words, the main area feature table includes the number of appearing lines, the total number of lines, and the number of appearing pages (and validity) for each page for the style feature determined as the main style feature.
ステップS12の処理が終わると、区切り位置設定部24は、区切り位置設定処理を実行する(ステップS14)。区切り位置設定処理については、図7のサブルーチンのフローチャートを用いて詳細に説明する。
When the process of step S12 ends, the break
図7は、本発明の実施の形態における区切り位置設定処理を示すフローチャートである。 FIG. 7 is a flowchart showing a delimiter position setting process according to the embodiment of the present invention.
区切り位置設定部24は、各ページのページ特徴を判定する(ステップS102)。図14の主要領域特徴テーブルに基づくと、ページ1のページ特徴は、スタイルIDが2,3のスタイル特徴であり、ページ2のページ特徴は、スタイルIDが3のスタイル特徴である。また、ページ3のページ特徴は、スタイルIDが2,3のスタイル特徴であり、ページ4,5のページ特徴は、各々、スタイルIDが5,6のスタイル特徴である。ページ6のページ特徴は、スタイルIDが6のスタイル特徴である。
The delimiter
次に、区切り位置設定部24は、補正処理を実行する(ステップS104)。具体的には、連続する3つのページのうち、間のページのみに存在しないスタイルIDがある場合に、そのページにも該スタイルIDが存在するものとして補正する。図14の例では、囲み線51で示されるように、スタイルID“2”で特定されるスタイル特徴(ページ特徴)は、ページ1および3に存在するが、ページ2には存在しない。したがって、区切り位置設定部24は、スタイルID“2”に対応するページ2の欄を、“0”から“1”に書き換える。補正した結果を図15に示す。図15は、本発明の実施の形態における補正処理が行なわれた後の主要領域特徴テーブルを示す図である。図15に示されるように、上記書き換えに伴ない、スタイルIDが“2”の行の行数およびページ数を1だけインクリメントする。このような補正処理の結果、主要領域特徴テーブルの列にページ特徴判定結果の項目61が追加される。項目61の行を参照すると、ページ1〜3のページ特徴がスタイルID2,3、ページ4,5のページ特徴がスタイルID5,6、ページ6のページ特徴がスタイルID6であることが示される。
Next, the break
なお、ここでの補正処理は、前後のページ(第1および第3のページ)に、1つでも同一のスタイル特徴の行が存在すれば実行される。しかしながら、たとえば、全ページ数に応じて予め定められた行数が存在する場合にのみ、補正処理が実行されてもよい。 Note that the correction processing here is executed if at least one row having the same style feature exists in the previous and subsequent pages (first and third pages). However, for example, the correction process may be executed only when there is a predetermined number of lines according to the total number of pages.
また、補正処理は、補正処理をするか否かを特定するための「変数i」が1である場合にのみ実行されるものとし、はじめ、変数iは1にセットされているものとする。 The correction process is executed only when the “variable i” for specifying whether or not to perform the correction process is 1, and the variable i is initially set to 1.
なお、このような補正処理は、必ずしも実行されなくてもよい。
ステップS104の処理が終わると、区切り位置設定部24は、ページ間でのページ特徴変化量を算出する(ステップS106)。区切り位置設定部24は、図15に示した主要領域特徴テーブルの列に、さらに、ページ特徴変化量の項目62を追加する。項目62の行を参照すると、ページ1〜3のページ特徴は同一であるため、ページ1からページ2への変化量、および、ページ2からページ3への変化量は、ともに“0”であることが記録される。ページ4には、ページ3におけるページ特徴であるスタイルID2,3のいずれも存在しないため、ページ3からページ4への変化量は、“2”と記録される。ページ4とページ5とは、ページ特徴が同一であるため、ページ4からページ5への変化量は、“0”となる。ページ6には、ページ5におけるページ特徴であるスタイルID5が存在しないため、ページ5からページ6への変化量は、“1”となる。
Note that such correction processing does not necessarily have to be executed.
When the process of step S104 is completed, the break
ステップS106の処理が終わると、区切り位置設定部24は、区切り位置を設定する(ステップS108)。具体的には、区切り位置設定部24は、変化量が「変数j」以上であるページ間に、区切り位置を設定する。「変数j」は、区切り位置を設定する際の基準となる値(変化量)であり、はじめ、変数jは、1に設定されているものとする。つまり、項目62の欄に1以上の数値が記録されたページの直前で、区切り位置が設定される。したがって、この例では、ページ3とページ4との間、ページ5とページ6との間に区切り位置が設定される。
When the process of step S106 is completed, the break
再び図6を参照して、区切り位置設定部24は、区切り位置に基づいて、文書IDを付与する(ステップS16)。すなわち、区切り位置設定部24は、区切り位置と判定された箇所で、文書IDを更新する。具体的には、区切り位置設定部24は、図15に示した主要領域特徴テーブルの列に、さらに、文書IDの項目63を追加する。項目63の行を参照して、ページ1〜3の欄には、文書IDとして“1”が記録され、ページ4,5の欄には、文書IDとして“2”が記録される。また、ページ6の欄には、文書IDとして“3”が記録される。このように、最初のページに文書IDとして“1”を付与し、区切り位置で文書IDを1だけインクリメントする。
Referring to FIG. 6 again, the break
区切り位置設定部24は、文書IDの情報を、画像バッファ部13に出力する。これにより、画像バッファ部13に、文書画像とともに、文書IDを含む管理情報が記憶される。図16に、文書IDを含む管理情報のデータ構造の一例を示す。管理情報には、ページIDと、文書IDと、各画像データ(ページ)へのポインタとが対応付けられて記憶されている。画像バッファ部13は、文書画像のデータと管理情報とを、電子文書生成部15に出力する。
The delimiter
電子文書生成部15は、管理情報に含まれる文書IDの情報に基づき、複数の電子文書を生成する(ステップS18)。つまり、電子文書生成部15は、文書IDの数分、電子文書を生成する。図10の文書画像について、3つの文書が生成された例を、図17に示す。図17を参照して、第1の電子文書となるPDFデータ1は、文書ID1に対応しており、当該電子文書には、ページ1〜ページ3の文書画像が含まれる。第2の電子文書となるPDFデータ2は、文書ID2に対応しており、当該電子文書には、ページ4,5の文書画像が含まれる。第3の電子文書となるPDFデータ3は、文書ID3に対応しており、当該電子文書には、ページ6の文書画像が含まれる。
The electronic
次に、表示制御部25は、操作パネル部110の表示パネル110aに文書確認画面を表示する(ステップS20)。図18は、文書確認画面の一例を示す図であり、図18(a)は、図6のステップS20にて表示される画面の一例を示す。図18(a)を参照して、文書確認画面には、各電子文書の先頭ページのプレビュー画像が表示され、「3つの文書を読み込みました。送付してよろしいですか?」とのメッセージが表示される。また、同画面には、ユーザからの指示を受付けるための4つのボタン(OKボタン,修正(増)ボタン,修正(減)ボタン,キャンセルボタン)が表示される。
Next, the
指示受付部26は、操作パネル部110を介してOK指示が入力されたか否かを判断する(ステップS22)。修正ボタンが選択された場合(ステップS24でNO)、パラメータ変更部27は、パラメータ変更処理を実行する(ステップS26)。なお、キャンセルボタンが選択された場合には、全ての処理を中断して、元の状態(区切り位置が設定されていない状態)へ戻されものとする。
The
パラメータ変更処理については、図8に示すサブルーチンのフローチャートを用いて説明する。 The parameter change process will be described with reference to a subroutine flowchart shown in FIG.
図8は、本発明の実施の形態におけるパラメータ変更処理を示すフローチャートである。図8を参照して、パラメータ変更部27は、ユーザから、増指示が入力されたか否かを判断する(ステップS202)。増指示が入力されたと判断された場合、すなわち、修正(増)ボタンが選択された場合に(ステップS202においてYES)、パラメータ変更部27は、上述の変数iを0にする(ステップS204)。つまり、上述の補正処理(ステップS104)を実行しないように設定する。
FIG. 8 is a flowchart showing parameter change processing in the embodiment of the present invention. Referring to FIG. 8,
また、増指示でないと判断された場合、すなわち、修正(減)ボタンが選択された場合には(ステップS202においてNO)、パラメータ変更部27は、上述の変数j(区切り位置を設定する際の基準)をたとえば1だけインクリメントする(ステップS206)。
When it is determined that the instruction is not an increase instruction, that is, when the correction (decrease) button is selected (NO in step S202), the
パラメータ変更処理が終わると、処理は、ステップS14に戻され、変更後のパラメータに基づいて、再度、区切り位置設定処理が実行される。 When the parameter changing process ends, the process returns to step S14, and the delimiter position setting process is executed again based on the changed parameter.
上記の例では、はじめ、変数iは1(補正処理をする)であり、変数jも1(基準値が1)であった。増指示が入力された場合に、変数iは0(補正処理をしない)とされる。図19は、増指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図19を参照して、補正処理が実行されないので、スタイルID2で特定されるスタイル特徴は、ページ2には存在しないこととなる。したがって、この状態でのページ特徴判定結果の項目61Aの行を参照すると、ページ1,3のページ特徴がスタイルID2,3、ページ2のページ特徴がスタイルID3、ページ4,5のページ特徴がスタイルID5,6、ページ6のページ特徴がスタイルID6であることが示される。そうすると、ページ特徴変化量の項目62Aを参照すると、ページ1からページ2への変化量、および、ページ2からページ3への変化量は、ともに“1”であることが記録される。ページ3〜6の変化量の欄は、図15と同様である。したがって、文書IDの項目63Aの行を参照すると、変化量が1以上の箇所で文書IDが更新されるため、ページ1の欄には、文書IDとして“1”が記録され、ページ2の欄には、文書IDとして“2”が記録される。また、ページ3の欄には、文書IDとして“3”が記録され、ページ4,5の欄には、文書IDとして“4”が記録される。また、ページ6の欄には、文書IDとして“5”が記録される。このように、増指示が入力された場合、分割数が3つから5つに増加される。
In the above example, first, the variable i is 1 (correction processing is performed), and the variable j is also 1 (reference value is 1). When an increase instruction is input, the variable i is set to 0 (no correction process is performed). FIG. 19 is a diagram showing a main area feature table when the delimiter position setting process is executed again after the increase instruction is input. Referring to FIG. 19, since the correction process is not executed, the style feature specified by
図18(b)には、図18(a)に示した文書確認画面において、修正(増)ボタンが選択された場合に、2回目のステップS20において表示される文書画面確認画面の一例が示される。 FIG. 18B shows an example of the document screen confirmation screen displayed in the second step S20 when the correction (increase) button is selected on the document confirmation screen shown in FIG. It is.
他方、減指示が入力された場合に、変数j(変化量基準値)は2とされる。図20は、減指示が入力された後に、再度、区切り位置設定処理が実行された場合の主要領域特徴テーブルを示す図である。図20を参照して、ページ特徴判定結果は、1回目の区切り位置設定処理の場合と同じであるため、項目61,62の行は図15と同様である。文書IDの項目63Bの行を参照すると、変化量が2以上の箇所で文書IDが更新されるため、ページ1〜3の欄には、文書IDとして“1”が記録され、ページ4,5の欄には、文書IDとして“2”が記録される。ページ5からページ6への変化量は、基準値(2)未満であるため、ページ6の欄にも、文書IDとして“2”が記録される。このように、減指示が入力された場合、分割数が3つから2つに減少される。
On the other hand, when a reduction instruction is input, the variable j (change amount reference value) is set to 2. FIG. 20 is a diagram illustrating a main area feature table when the delimiter position setting process is executed again after the reduction instruction is input. Referring to FIG. 20, since the page feature determination result is the same as that in the first separation position setting process, the rows of
図18(c)には、図18(a)に示した文書確認画面において、修正(減)ボタンが選択された場合に、2回目のステップS20において表示される文書確認画面の一例が示される。 FIG. 18C shows an example of the document confirmation screen displayed in the second step S20 when the correction (decrease) button is selected on the document confirmation screen shown in FIG. .
なお、図18(b)および(c)に示した画面において、さらに、修正ボタンが選択されると、その度に、パラメータ(変数i,j)を変更して区切り位置設定処理が繰り返される。 In the screens shown in FIGS. 18B and 18C, each time a correction button is selected, the parameter (variables i, j) is changed and the delimiter position setting process is repeated.
ステップS22において、OK指示が入力された場合、すなわち、OKボタンが選択された場合(ステップS22においてYES)、送信処理部17は、文書画像ごとにファイル名を生成して、操作パネル部110に送付先設定画面を表示する(ステップS24)。
If an OK instruction is input in step S22, that is, if the OK button is selected (YES in step S22), the
図21は、送付先設定画面の一例を示す図である。図21を参照して、送付先設定画面には、各電子文書の名前および送付先が表示され、「以下に送付します」というメッセージが表示される。同画面には、ユーザからの指示の入力を受付けるためのボタン(OKボタン,キャンセル,変更ボタン)が表示される。変更ボタンは、各電子文書の名前および送付先を変更する指示を受付けるためのボタンであり、電子文書ごとに設けられる。なお、図21は、ユーザにより送付先が設定された後の画面の一例が表示されている。送付先は、電子文書ごとに、たとえば、ユーザがメールアドレスをマニュアルで入力することにより設定されてもよい。そのような入力も、操作パネル部110が受付けてよい。
FIG. 21 is a diagram illustrating an example of a destination setting screen. Referring to FIG. 21, the name and destination of each electronic document are displayed on the destination setting screen, and a message “Send to below” is displayed. On this screen, buttons (OK button, cancel, change button) for accepting input of instructions from the user are displayed. The change button is a button for accepting an instruction to change the name and destination of each electronic document, and is provided for each electronic document. FIG. 21 shows an example of a screen after the transmission destination is set by the user. The delivery destination may be set for each electronic document, for example, when the user manually inputs a mail address. Such an input may be accepted by the
送付先設定画面において、OKボタンが選択されると、送信処理部17は、電子文書ごとに設定された送付先に対して、送信部18を介して電子文書を送信する(ステップS28)。以上で文書画像生成処理は終了される。
When the OK button is selected on the transmission destination setting screen, the
なお、生成された電子文書を送信部18に出力する場合について説明したが、生成された電子文書を記憶部112に出力する場合も上記と同様の処理が実行されるものとする。その場合、ステップS24,S28の処理に代えて、記憶部112に、複数の電子文書を格納する処理が実行されればよい。
Note that although the case where the generated electronic document is output to the
このように、多様な種類の文書が混在した原稿を一括して読み込んだとしても、自動的に生成された複数の電子文書それぞれを、ユーザが設定した送り先に送信することができる。また、取得した文書画像のスタイル特徴に基づいて、区切り位置を設定するため、最適な位置で電子文書を分離することができる。つまり、本実施の形態によると、まず、行領域ごとに、スタイル特徴を検出し、文書画像を特徴付けるスタイルのパターンを表わす主要なスタイル特徴を判定する。その上で、ページごとに、該ページに存在する主要なスタイル特徴をページ特徴として検出し、ページ間でのページ特徴の変化量に基づいて、文書画像の区切り位置を設定する。このように、一旦、文書画像全体における主要なスタイル特徴を判定してから、ページごとのページ特徴を検出する。したがって、単純に、行領域ごとのスタイル特徴のみに基づいて区切り位置を設定するよりも、最適な位置で区切り位置を設定することが可能となる。 As described above, even when documents including various types of documents are read together, a plurality of automatically generated electronic documents can be transmitted to destinations set by the user. In addition, since the delimiter position is set based on the style characteristics of the acquired document image, the electronic document can be separated at the optimum position. In other words, according to the present embodiment, first, a style feature is detected for each row area, and a main style feature representing a style pattern that characterizes the document image is determined. Then, for each page, main style features existing on the page are detected as page features, and a document image separation position is set based on the amount of change in page features between pages. In this way, once the main style features in the entire document image are determined, the page features for each page are detected. Therefore, it is possible to set the delimiter position at an optimum position rather than simply setting the delimiter position based only on the style feature for each row area.
なお、上述のように、パラメータを変更するために、増指示または減指示の入力を受付けることとしたが、ユーザから、分割数に関する指示が受付けられればこのような形態に限定されない。たとえば、ユーザから、直接、分割数の入力を受付けてもよい。または、区切り位置設定処理が実行される前の段階で、ユーザから、分割数の入力を受付けておいてもよい。この場合、受付けた分割数(あるいはその数に近い値)になるまでパラメータを変更して区切り位置設定処理を実行する。そうすることで、ユーザは、所望の数の電子文書を効率良く得ることができる。 As described above, in order to change the parameter, an input of an increase instruction or a decrease instruction is accepted, but the present invention is not limited to such a form as long as an instruction regarding the number of divisions is accepted from the user. For example, an input of the number of divisions may be received directly from the user. Alternatively, an input of the number of divisions may be received from the user before the separation position setting process is executed. In this case, the parameter is changed until the accepted division number (or a value close to the number) is reached, and the delimiter position setting process is executed. By doing so, the user can efficiently obtain a desired number of electronic documents.
また、上述の区切り位置設定処理が実行された後、さらに、従来から存在する手法を用いて、第2の区切り位置設定処理を実行してもよい。本実施の形態における区切り位置設定処理では、行領域のスタイル特徴に基づいて区切り位置が設定される。したがって、ページ特徴の変化量が0の状態が複数ページ続いた場合、それらのページの間では区切り位置が設定されないことになる。そのような場合、多数のページが1つの文書として扱われることになるので、不都合が生じる場合もある。そのため、画像解析部16は、たとえば、文書IDが同一のページが所定数続いた場合に、第2の区切り位置設定処理を実行してもよい。あるいは、文書IDを付与する前に、所定のページ数連続して、ページ特徴の変化量が0である場合に、第2の区切り位置設定処理を実行することとしてもよい。第2の区切り位置設定処理としては、たとえば、レイアウトや特定文字列(たとえば、ページ番号を表わす文字列)に基づく処理が採用可能である。
In addition, after the above-described separation position setting process is executed, the second separation position setting process may be executed using a conventional method. In the break position setting process in the present embodiment, the break position is set based on the style characteristics of the row area. Therefore, when a state where the amount of change in page feature is zero continues for a plurality of pages, no separation position is set between these pages. In such a case, since many pages are handled as one document, inconvenience may occur. Therefore, for example, the
また、各電子文書400のファイル名は、固定の文字列と文書IDとを組み合わせたものとしたが、各文書の内容からファイル名を決定してもよい。たとえば、分割された文書それぞれのタイトルに相当する文字列をファイル名としてもよい。その場合、画像解析部16は、区切り位置が設定された各文書画像の中で、高さが最大の文字列領域を抽出する。そして、その領域に対して文字認識処理を行ない、その認識処理の結果をファイル名として決定する。決定したファイル名を上述の管理情報に含めることで、上記と同様に、送信処理部17が各電子文書400のファイル名を付与することができる。このような処理をすることで、より有用なファイル名の付与が可能となる。
The file name of each
また、上記フローチャートでは、一旦、電子文書が生成されてから、ユーザからの増減の指示を受付けたが、そのような手順に限定されない。たとえば、表示制御部25が、先に、文書IDに基づいて表示処理を実行し、指示受付部26によりOK指示が入力された場合に、電子文書生成部15が電子文書を生成することとしてもよい。
In the above flowchart, once the electronic document is generated, an instruction to increase or decrease from the user is accepted. However, the present invention is not limited to such a procedure. For example, the
また、MFP1は、設定された区切り位置に基づいて、複数の電子文書を生成することとしたが、区切り位置に特定のページ(たとえば白紙ページ)を挿入して1つの電子文書を生成することとしてもよい。
In addition, the
各電子文書400のデータ構造例を図22に示す。図22を参照して、各電子文書400は、ヘッダ部402と、文書画像部404と、フッタ部408とを含む。ヘッダ部402およびフッタ部408には、電子文書400の属性についての情報、たとえば作成日時・作成者・著作権情報などが格納される。文書画像部406には、各ページに対応する文書画像が格納される。なお、この文書画像は、上述したように圧縮された状態で格納されてもよい。
An example of the data structure of each
(印刷処理)
以上、文書画像から電子文書を生成する処理において、区切り位置が設定される手順について説明したが、文書画像についての印刷処理を実行する処理においても上記と同様に区切り位置が設定される。
(Printing process)
The procedure for setting the delimiter position in the process of generating the electronic document from the document image has been described above. However, the delimiter position is also set in the process for executing the print process for the document image in the same manner as described above.
図23は、本発明の実施の形態に従うMFP1が印刷処理を実行する場合の機能構成を示す機能ブロック図である。図23においては、MFP1が印刷処理を実行する場合の機能が示されている。図5と同じ機能については、同じ符号を付してある。したがって、それらの説明は繰返さない。
FIG. 23 is a functional block diagram showing a functional configuration when
図23を参照して、図5の電子文書生成部15,送信処理部17に代えて、画像処理部19が、MFP1の機能構成に加えられる。また、送信部18,記憶部112に代えて、プリント部106がMFP1の機能構成に加えられる。画像処理部19は、ユーザ操作に応じて、画像バッファ部13から出力される文書画像をプリント部106でのプリント動作に適した画像に変換する。代表的に、RGB表示系で規定された文書画像をカラープリントに適したCMYK表示系の画像データなどに変換する。このとき、プリント部106の特性に応じた色調整を行なってもよい。プリント部106は、画像処理部19からのCMYK画像からプリント画像を形成して、紙媒体などへの印刷処理を行なう。
Referring to FIG. 23, an
MFP1が印刷処理を実行する場合、図6のフローチャートのうち、電子文書生成処理(ステップS18)が削除される。また、送付先設定画面表示(ステップS24)および送信処理(ステップS28)に代えて、画像処理が実行される。画像処理において、画像処理部19は、上述のような変換処理を行なうとともに、文書IDごとにソート方法を変えて、プリント部106に画像データを出力する。これにより、プリント部106より仕分けされた紙媒体が出力される。
When the
なお、プリント部106は、必ずしもソート機能を備えていなくてもよい。この場合、画像処理部19は、たとえば、文書IDの変わり目に、白紙ページなどの特定のページを挿入することとしてもよい。
Note that the
<変形例>
上述の実施の形態においては、本発明に係る処理がMFP1で実行される場合について説明したが、原稿300を読取るための画像読取機能を備えたコンピュータにおいて上記処理が実行されてもよい。この場合には、コンピュータを文書処理装置として機能させるための図5または図23に示された処理機能を実行させるプログラムを提供することもできる。このようなプログラムは、CD−ROM(Compact Disk-Read Only Memory)などの光学媒体や、メモリカードなどのコンピュータ読取り可能な記録媒体にて記憶させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記憶媒体にて記憶させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
<Modification>
In the above-described embodiment, the case where the process according to the present invention is executed by the
また、プログラムを記録しているたとえば光学媒体等をMFP1の駆動装置(図示せず)で読み出して、記憶部112のプログラムをアップデートすることもできる。
Further, the program in the
また、画像読取機能を他の装置またはコンピュータで実現した上で、生成された文書画像を受取って、上記のような処理に従って区切り位置を設定してもよい。 Alternatively, the image reading function may be realized by another device or computer, and the generated document image may be received and the separation position may be set according to the above processing.
なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。 The program according to the present invention is a program module that is provided as a part of a computer operating system (OS) and calls necessary modules in a predetermined arrangement at a predetermined timing to execute processing. Also good. In that case, the program itself does not include the module, and the process is executed in cooperation with the OS. A program that does not include such a module can also be included in the program according to the present invention.
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。 The program according to the present invention may be provided by being incorporated in a part of another program. Even in this case, the program itself does not include the module included in the other program, and the process is executed in cooperation with the other program. Such a program incorporated in another program can also be included in the program according to the present invention.
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記憶された記憶媒体とを含む。 The provided program product is installed in a program storage unit such as a hard disk and executed. Note that the program product includes the program itself and a storage medium in which the program is stored.
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。 The embodiment disclosed this time should be considered as illustrative in all points and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
1 MFP、PC1,PC2,PC3 パーソナルコンピュータ、SRV サーバ装置、12 受信部、13 画像バッファ部、15 電子文書生成部、16 画像解析部、17 送信処理部、18 送信部、19 画像処理部、21 行領域抽出部、22 スタイル特徴検出部、23 主要判定部、24 位置設定部、25 表示制御部、26 指示受付部、27 パラメータ変更部、100 制御部、102 メモリ部、104 画像読取部、106 プリント部、108 通信インターフェイス部、110 操作パネル部、112 記憶部、201 CPU、203 内部バス、205 ディスプレイ部、207 通信インターフェイス部、209 入力部、211 ハードディスク部、213 メモリ部、215 CD−ROMドライブ、215a CD−ROM、217 FDDドライブ、217a フレキシブルディスク、300 原稿、310 画像データ、400 電子文書。
DESCRIPTION OF
Claims (13)
前記第1の記憶手段に記憶された文書画像から、所定の種類の文書領域を抽出するための抽出手段と、
前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するための検出手段と、
検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するための判定手段と、
ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するための設定手段とを備える、文書処理装置。 First storage means for storing a document image;
Extraction means for extracting a predetermined type of document area from the document image stored in the first storage means;
Detecting means for detecting a plurality of region attributes based on each of a plurality of predetermined attribute types for each document region, and detecting a style feature representing a combination pattern of the region attributes;
Classification means for classifying the detected plurality of style features for each pattern, and determining one or more main style features for the document image based on the appearance frequency of the classified patterns;
Detecting, for each page, one of a plurality of the main style features, and setting a separation position of the document image based on a change amount of the main style features between pages. A document processing apparatus comprising setting means.
前記スタイル特徴ごとに、当該スタイル特徴が出現したページ数を前記出現頻度として算出するための頻度算出手段と、
算出されたページ数が、所定値以上であるスタイル特徴を、前記主要なスタイル特徴として判定する手段とを含む、請求項1に記載の文書処理装置。 The determination means includes
For each style feature, a frequency calculating means for calculating the number of pages in which the style feature appears as the appearance frequency;
The document processing apparatus according to claim 1, further comprising: a unit that determines a style feature whose calculated number of pages is a predetermined value or more as the main style feature.
各ページに存在する前記主要なスタイル特徴を、当該ページのページ特徴として判定するための手段と、
ページごとに、当該ページのページ特徴が、前ページのページ特徴から変化した量を前記変化量として算出するための量算出手段と、
算出された前記変化量が一定値以上の場合に、当該ページ間に区切り位置を設定する手段とを含む、請求項2に記載の文書処理装置。 The setting means includes
Means for determining the primary style features present on each page as page features of the page;
For each page, an amount calculation means for calculating the amount of change of the page feature of the page from the page feature of the previous page as the amount of change;
The document processing apparatus according to claim 2, further comprising means for setting a break position between the pages when the calculated amount of change is equal to or greater than a predetermined value.
連続する第1、第2および第3のページのうち、前記第2のページ以外の前記第1および第3のページで同一のページ特徴が検出された場合には、前記第2のページにも前記同一のページ特徴が検出されたものとして補正するための補正手段をさらに含む、請求項3に記載の文書処理装置。 The setting means includes
If the same page feature is detected in the first and third pages other than the second page among consecutive first, second and third pages, the second page is also displayed. The document processing apparatus according to claim 3, further comprising correction means for correcting that the same page feature is detected.
前記表示制御手段からの信号に応じた出力を行なう表示手段とをさらに備える、請求項1〜5のいずれか1項に記載の文書処理装置。 Display control means for generating a signal for displaying an index image of the first page in a plurality of divided document images when the document image is divided based on the separation position;
The document processing apparatus according to claim 1, further comprising display means for performing output in accordance with a signal from the display control means.
前記変更手段による変更後に、再度、前記設定手段による処理の実行を指示するための実行指示手段とをさらに備える、請求項7に記載の文書処理装置。 A changing means for changing a predetermined parameter for setting a delimiter position by the setting means in accordance with the received instruction;
The document processing apparatus according to claim 7, further comprising an execution instructing unit for instructing execution of processing by the setting unit again after the change by the changing unit.
前記演算処理部が、前記記憶部に記憶された前記文書画像から、所定の種類の文書領域を抽出するステップと、
前記演算処理部が、前記文書領域ごとに、所定の複数の属性種別それぞれに基づく複数の領域属性を検出し、前記領域属性の組合せのパターンを表わすスタイル特徴を検出するステップと、
検出された複数の前記スタイル特徴をパターンごとに分類し、分類されたパターンの出現頻度に基づいて、前記文書画像についての1以上の主要なスタイル特徴を判定するステップと、
ページごとに、複数の前記主要なスタイル特徴のうちのいずれが存在するかを検出し、ページ間での前記主要なスタイル特徴の変化量に基づいて、前記文書画像の区切り位置を設定するステップとを備える、文書処理方法。 A document processing method executed in a document processing apparatus including a storage unit for storing a document image and an arithmetic processing unit,
The arithmetic processing unit extracting a document area of a predetermined type from the document image stored in the storage unit;
The arithmetic processing unit detects a plurality of region attributes based on each of a plurality of predetermined attribute types for each document region, and detects a style feature representing a combination pattern of the region attributes;
Classifying the detected plurality of style features for each pattern, and determining one or more main style features for the document image based on the appearance frequency of the classified pattern;
Detecting which of the plurality of main style features is present for each page, and setting a separation position of the document image based on a change amount of the main style features between pages; A document processing method comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008007075A JP2009169675A (en) | 2008-01-16 | 2008-01-16 | Document processing apparatus, document processing method and document processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008007075A JP2009169675A (en) | 2008-01-16 | 2008-01-16 | Document processing apparatus, document processing method and document processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009169675A true JP2009169675A (en) | 2009-07-30 |
Family
ID=40970768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008007075A Withdrawn JP2009169675A (en) | 2008-01-16 | 2008-01-16 | Document processing apparatus, document processing method and document processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009169675A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011239217A (en) * | 2010-05-11 | 2011-11-24 | Sharp Corp | Image display apparatus, and image formation apparatus having the same |
WO2013061674A1 (en) * | 2011-10-26 | 2013-05-02 | シャープ株式会社 | Document file output device, document file output method, and computer program |
JP5327492B1 (en) * | 2012-08-22 | 2013-10-30 | 富士ゼロックス株式会社 | Image processing apparatus and image processing program |
JP2015213207A (en) * | 2014-05-01 | 2015-11-26 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, and program |
JP2019003660A (en) * | 2018-07-12 | 2019-01-10 | キヤノンマーケティングジャパン株式会社 | Information processing device, method for controlling the same, program, information processing system, method for controlling the same, and program |
CN109241750A (en) * | 2018-07-20 | 2019-01-18 | 海南大学 | Personalized English alphabet shows style conversion method |
US11635940B2 (en) | 2020-01-08 | 2023-04-25 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
-
2008
- 2008-01-16 JP JP2008007075A patent/JP2009169675A/en not_active Withdrawn
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011239217A (en) * | 2010-05-11 | 2011-11-24 | Sharp Corp | Image display apparatus, and image formation apparatus having the same |
US8902157B2 (en) | 2010-05-11 | 2014-12-02 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
USRE48003E1 (en) | 2010-05-11 | 2020-05-19 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
US9473652B2 (en) | 2010-05-11 | 2016-10-18 | Sharp Kabushiki Kaisha | Image display unit and image forming apparatus including the same |
US9858513B2 (en) | 2011-10-26 | 2018-01-02 | Sharp Kabushiki Kaisha | Document file output apparatus, document file output method, and computer readable medium |
WO2013061674A1 (en) * | 2011-10-26 | 2013-05-02 | シャープ株式会社 | Document file output device, document file output method, and computer program |
JP2013093777A (en) * | 2011-10-26 | 2013-05-16 | Sharp Corp | Document file output device, document file output method and computer program |
JP5327492B1 (en) * | 2012-08-22 | 2013-10-30 | 富士ゼロックス株式会社 | Image processing apparatus and image processing program |
JP2015213207A (en) * | 2014-05-01 | 2015-11-26 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, and program |
JP2019003660A (en) * | 2018-07-12 | 2019-01-10 | キヤノンマーケティングジャパン株式会社 | Information processing device, method for controlling the same, program, information processing system, method for controlling the same, and program |
CN109241750A (en) * | 2018-07-20 | 2019-01-18 | 海南大学 | Personalized English alphabet shows style conversion method |
CN109241750B (en) * | 2018-07-20 | 2023-04-07 | 海南大学 | Method for changing display style of individual English letters |
US11635940B2 (en) | 2020-01-08 | 2023-04-25 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4371965B2 (en) | Image processing apparatus and image processing method | |
JP4405831B2 (en) | Image processing apparatus, control method therefor, and program | |
JP5111268B2 (en) | Image processing apparatus, image processing method, program thereof, and storage medium | |
US11386046B2 (en) | Apparatus for setting file name for scan image, method of controlling same, and storage medium | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
US7339695B2 (en) | Data processing device, data processing method, and data processing program for recognizing characters in a URL | |
US8542953B2 (en) | Image processing apparatus and image processing method | |
US10574839B2 (en) | Image processing apparatus, method and storage medium for acquiring character information from scanned image | |
JP2019041150A (en) | Device for setting file name or the like to scan image, control method therefor and program | |
JP2009169675A (en) | Document processing apparatus, document processing method and document processing program | |
JP2007049388A (en) | Image processing apparatus and control method thereof, and program | |
JP2009193356A (en) | Image processing apparatus, image processing method, program, and storage medium | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP5176416B2 (en) | Document processing apparatus, document processing method, and document processing program | |
JP4956319B2 (en) | Image processing apparatus, control method thereof, program thereof, and storage medium | |
JP5412903B2 (en) | Document image processing apparatus, document image processing method, and document image processing program | |
US20090279793A1 (en) | Image processing apparatus and method for controlling the same | |
JP5412916B2 (en) | Document image processing apparatus, document image processing method, and document image processing program | |
JP2008305088A (en) | Document processor, document processing method, and document processing program | |
JP5098614B2 (en) | Method for controlling sentence processing apparatus and sentence processing apparatus | |
JP4541770B2 (en) | Image processing apparatus, control method therefor, and program | |
JP2009266009A (en) | Document processor, document summary preparation method, and document summary preparation program | |
JP2006333248A (en) | Image processing apparatus, image processing method, program and storage medium | |
JP2019153919A (en) | Image processing device, control method thereof, and program | |
US8380685B2 (en) | Information processing apparatus, control method thereof, computer program, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110405 |