JP2011237840A - Document processing device - Google Patents
Document processing device Download PDFInfo
- Publication number
- JP2011237840A JP2011237840A JP2010105894A JP2010105894A JP2011237840A JP 2011237840 A JP2011237840 A JP 2011237840A JP 2010105894 A JP2010105894 A JP 2010105894A JP 2010105894 A JP2010105894 A JP 2010105894A JP 2011237840 A JP2011237840 A JP 2011237840A
- Authority
- JP
- Japan
- Prior art keywords
- template
- area
- document
- position information
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
本発明は、原稿の画像から文字を抽出し、その画像の管理に用いる文書処理装置に関する。 The present invention relates to a document processing apparatus that extracts characters from an image of a document and is used for managing the image.
従来、帳票を読み取り、その後に帳票内の線分を抽出し、抽出された線分に基づいて、自動的に帳票内の特定の領域を抽出することで、記入済みの帳票をOCR(Optical Character Recognition)を行うときのテンプレートを作成することが提案されている。 Conventionally, a form is read, then a line segment in the form is extracted, and a specific area in the form is automatically extracted based on the extracted line segment, whereby the completed form is converted into an OCR (Optical Character). It has been proposed to create a template for performing (Recognition).
従来の技術では、帳票以外、つまり線分のない原稿では、容易にOCRテンプレートを作成することができない。
本発明の課題は、帳票に限らず様々な原稿を対象としたOCRテンプレートを容易に作成することのできる技術を提供することにある。
With the conventional technology, it is not possible to easily create an OCR template for a document other than a form, that is, an original without a line segment.
An object of the present invention is to provide a technique capable of easily creating an OCR template for various originals as well as forms.
以下に、課題を解決するための手段として複数の態様を説明する。これら態様は、必要に応じて任意に組み合わせることができる。 Hereinafter, a plurality of modes will be described as means for solving the problems. These aspects can be arbitrarily combined as necessary.
本発明の第1見地に係る文書処理装置は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この文書処理装置は、画像読取部、領域位置情報取得部、指定文字取得部、およびテンプレート記憶部を備える。画像読取部は、原稿上の画像をテンプレート画像として読み取る。領域位置情報取得部は、テンプレート画像において、予め定められた特徴を有する指定領域の位置情報を領域位置情報として取得する。指定文字取得部は、指定領域に含まれる文字列から、指定文字を取得する。テンプレート記憶部は、指定文字を領域位置情報と関連付けて記憶する。
この文書処理装置によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(指定領域の位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。
The document processing apparatus according to the first aspect of the present invention recognizes a character specified based on a designated character as a variation parameter in an image obtained from an original. The document processing apparatus includes an image reading unit, a region position information acquisition unit, a designated character acquisition unit, and a template storage unit. The image reading unit reads an image on a document as a template image. The region position information acquisition unit acquires position information of a designated region having a predetermined feature as region position information in the template image. The designated character acquisition unit acquires a designated character from a character string included in the designated area. The template storage unit stores the designated character in association with the region position information.
According to this document processing apparatus, it is possible to read a document having a specific format in advance and obtain information (position information of a designated region and designated characters) indicating a region where character recognition is to be performed on an unknown document. . Therefore, an OCR template can be easily created.
文書処理装置は、指定文字に対する変動パラメータの相対位置を表す相対位置情報を取得する相対位置情報取得部をさらに備えていてもよい。さらに、テンプレート記憶部は、相対位置情報を指定文字と関連付けて記憶してもよい。これによって、文字認識するべき領域の位置を、より厳密に規定することができる。 The document processing apparatus may further include a relative position information acquisition unit that acquires relative position information indicating the relative position of the variation parameter with respect to the designated character. Further, the template storage unit may store the relative position information in association with the designated character. As a result, the position of the area where the character should be recognized can be more strictly defined.
領域位置情報取得部は、特定の色を示す領域を指定領域として認識することで、領域位置情報を取得してもよい。 The area position information acquisition unit may acquire area position information by recognizing an area indicating a specific color as a specified area.
また、本発明の第2見地に係る文書処理装置は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この文書処理装置は、画像読取部、テンプレート記憶部、テンプレート認識部、および変動パラメータ抽出部を備える。画像読取部は、原稿上の画像を原稿画像として読み取る。テンプレート記憶部は、指定文字と領域位置情報とを関連付けて記憶する。テンプレート認識部は、原稿画像において、領域位置情報によって特定される領域である抽出領域内で、指定文字を認識する。変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字を変動パラメータとして抽出する。
このように、上述の領域位置情報および指定文字に基づいて、原稿画像上で、文字認識を行って変動パラメータを取得すべき領域が特定される。つまり、原稿画像の全体に対して文字認識を行うことなく、特定の領域のみについて文字認識を行うことで、必要な文字列が容易に得られる。なお、変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字の全てを変動パラメータとして抽出するだけでなく、指定文字以外に抽出領域に存在する文字の一部のみを変動パラメータとして抽出してもよい。
Further, the document processing apparatus according to the second aspect of the present invention recognizes a character specified based on a designated character as a variation parameter in an image obtained from an original. The document processing apparatus includes an image reading unit, a template storage unit, a template recognition unit, and a variation parameter extraction unit. The image reading unit reads an image on a document as a document image. The template storage unit stores the designated character and the region position information in association with each other. The template recognizing unit recognizes a designated character in an extraction area that is an area specified by area position information in a document image. The variation parameter extraction unit extracts characters existing in the extraction area other than the designated character as variation parameters.
As described above, based on the above-described region position information and the designated character, the region on which the variation parameter is to be acquired by performing character recognition on the document image is specified. That is, a necessary character string can be easily obtained by performing character recognition on only a specific area without performing character recognition on the entire document image. Note that the fluctuation parameter extraction unit not only extracts all the characters existing in the extraction area other than the designated characters as fluctuation parameters, but also extracts only a part of the characters existing in the extraction area other than the designated characters as fluctuation parameters. May be.
文書処理装置は、抽出領域に指定文字が存在しない場合、より広い領域に対応するように領域位置情報を補正する領域位置情報補正部をさらに備えてもよい。 The document processing apparatus may further include an area position information correction unit that corrects the area position information so as to correspond to a wider area when the designated character does not exist in the extraction area.
文書処理装置は、変動パラメータを原稿画像と関連付けて記憶する文書記憶部をさらに備えていてもよい。 The document processing apparatus may further include a document storage unit that stores the variation parameter in association with the document image.
文書処理装置は、ユーザから検索語の入力を受け付ける検索受付部と、検索語と一致する変動パラメータと関連付けられた原稿画像を、文書記憶部内の原稿画像から選択する検索部と、をさらに備えてもよい。 The document processing apparatus further includes a search reception unit that receives an input of a search word from a user, and a search unit that selects a document image associated with a variation parameter that matches the search word from the document image in the document storage unit. Also good.
また、文書処理装置は、上述の第1見地および第2見地に係る構成の両方を備えていてもよい。すなわち、文書処理装置は、画像読取部、領域位置情報取得部、指定文字取得部、テンプレート記憶部、テンプレート認識部、および変動パラメータ抽出部を備えていてもよい。画像読取部は、原稿上の画像をテンプレート画像又は原稿画像として読み取る。領域位置情報取得部は、画像読取部によって読み取られたテンプレート画像において、予め定められた特徴を有する指定領域の位置を、領域位置情報として取得する。指定文字取得部は、指定領域に含まれる文字列から、指定文字を取得する。テンプレート記憶部は、指定文字を領域位置情報と関連付けて記憶する。テンプレート認識部は、画像読取部によって読み取られた原稿画像において、領域位置情報によって特定される領域である抽出領域内で、指定文字を認識する。変動パラメータ抽出部は、指定文字以外に抽出領域に存在する文字を変動パラメータとして抽出する。 Further, the document processing apparatus may include both of the configurations related to the first viewpoint and the second viewpoint. That is, the document processing apparatus may include an image reading unit, a region position information acquisition unit, a designated character acquisition unit, a template storage unit, a template recognition unit, and a variation parameter extraction unit. The image reading unit reads an image on a document as a template image or a document image. The area position information acquisition unit acquires the position of a designated area having a predetermined feature as area position information in the template image read by the image reading unit. The designated character acquisition unit acquires a designated character from a character string included in the designated area. The template storage unit stores the designated character in association with the region position information. The template recognizing unit recognizes a designated character in an extraction area that is an area specified by the area position information in the document image read by the image reading unit. The variation parameter extraction unit extracts characters existing in the extraction area other than the designated character as variation parameters.
本発明によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(領域位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。 According to the present invention, it is possible to read a document having a specific format in advance, and acquire information (region position information and designated characters) indicating a region where character recognition should be performed on an unknown document. Therefore, an OCR template can be easily created.
(1)複合機の構成
図1を参照して、本実施形態の複合機について説明する。図1は、複合機1全体の構成を示すブロック図である。
(1) Configuration of MFP The MFP according to the present embodiment will be described with reference to FIG. FIG. 1 is a block diagram showing the overall configuration of the multifunction machine 1.
複合機1は、コピー機、プリンタ、スキャナ、およびファクシミリ装置としての機能を有する装置である。
図1に示すように、複合機1は、NCU(Network Control Unit)11、モデム12、ネットワークインターフェース13、画像読取部14、画像形成部15、操作パネル16、記憶部17および制御装置18を備える。複合機1内の各部は、バスによって接続されている。
The multifunction device 1 is a device having functions as a copier, a printer, a scanner, and a facsimile device.
As shown in FIG. 1, the multifunction device 1 includes an NCU (Network Control Unit) 11, a
NCU11は、PSTN(公衆交換電話網:Public Subscriber Telephone Network)101に接続されており、電話回線を介して発呼および着呼を含む通信を制御する。
The
モデム12は、デジタル信号とアナログ信号を相互変換する変復調装置である。
The
ネットワークインターフェース13は、複合機1のインターネット102への接続を可能とし、複合機1の外部の機器との通信を可能とする。ネットワークインターフェース13として、LAN(Local Area Network)に接続可能なインターフェースが設けられており、複合機1が同LANに接続された他の機器との通信可能であってもよい。
画像読取部14は、原稿上の画像を読み取ることで画像データを取得する。本実施形態では、画像読取部14はカラー画像データを取得することができる。具体的には、画像読取部14は、図示しない原稿搬送装置、プラテンガラス、光源、ミラー群、レンズ、読取素子、および信号処理回路等を備える。原稿搬送装置によって搬送される原稿またはプラテンガラス上に載置された原稿は、光源によって照明される。原稿からの反射光は、ミラー群およびレンズによって読取素子上に導かれる。読取素子は受けた光に応じた電気信号を出力し、信号処理回路がこの電気信号にデジタル化等の処理を施すことで、画像データが得られる
The
The
画像形成部15は、用紙上に画像データに沿った画像を形成する。画像形成部15としては、電子写真方式またはインクジェット方式等の方式によって画像形成を行う装置が採用される。
The
操作パネル16は、表示パネルおよびタッチセンサを有するタッチパネル161;並びにハードキー162等を備える。タッチパネル161は、表示パネルによって画像を表示することで、画像形成装置の動作状況およびエラーの発生等の情報をユーザに伝えると共に、ソフトキーを介してユーザからの操作を受け付けることができる。また、ハードキーは、テンキー、実行キーおよびおキャンセルキー等のキーを含み、ユーザからの操作を受け付けることができる。ユーザは、操作パネル16を用いて、例えば、コピー、スキャンまたはファクシミリ送信等を実行する指示を入力することができる。
The
記憶部17は、複合機1の電源がオフとなってもその記憶内容が消えない不揮発性メモリである。記憶部17は、具体的にはテンプレート記憶領域(テンプレート記憶部)171および文書記憶領域(文書記憶部)172を有する。テンプレート記憶領域171には、後述のテンプレートが記憶される。また、文書記憶領域172には、後述の画像データおよび変動パラメータが記憶される。
The
制御装置18は、複合機1内の各部の動作を制御し、また種々の演算等の処理を実行する装置である。制御装置18は、MPU(Micro Processing Unit)等の演算装置並びにフラッシュメモリおよびSDRAM(Synchronous Dynamic Random Access Memory)等の記憶装置を備える。MPUは、フラッシュメモリ内に格納されたプログラムを読み出して実行することで、制御装置18の機能を実現する。具体的には、制御装置18は、複合機1の各部の動作を制御することで、コピー、プリント、ファクシミリ送受信およびスキャン等の動作を実行させる。また、制御装置18は、文字認識部20、テンプレート取得部31(領域位置情報取得部、指定文字取得部、相対位置情報取得部)、テンプレート認識部41、座標補正部42(領域位置情報補正部)、変動パラメータ抽出部43、および検索部44として機能する。各部の機能については後述する。フラッシュメモリは、種々のプログラムを格納する。SDRAMは、読込および書込が可能なメモリであり、MPUがプログラムを実行するときのワークエリアとして機能する。
The
以上に述べた構成の他に、複合機1は、必要に応じて種々のデバイスを有する。例えば、複合機1は、図示しないCODEC(Coder and Decoder)を備えている。CODEC画像データを圧縮(符号化)/展開(復号化)する。 In addition to the configuration described above, the multifunction device 1 includes various devices as necessary. For example, the multifunction device 1 includes a CODEC (Coder and Decoder) (not shown). Compress (encode) / decompress (decode) the CODEC image data.
(2)テンプレート登録
図2、図3A〜図3C、および図4A〜図4Cを参照して、テンプレート登録について説明する。図2はテンプレート登録の流れを示すフローチャートであり、図3Aはテンプレート原稿の例を示す図であり、図3Bは指定領域の例を示す図であり、図3Cは仮テンプレートの例を示す図である。図4A〜図4Cは、登録されるテンプレートの例である。
(2) Template Registration Template registration will be described with reference to FIGS. 2, 3A to 3C, and 4A to 4C. FIG. 2 is a flowchart showing the flow of template registration, FIG. 3A is a diagram showing an example of a template document, FIG. 3B is a diagram showing an example of a designated area, and FIG. 3C is a diagram showing an example of a temporary template. is there. 4A to 4C are examples of registered templates.
(2−1)テンプレート原稿の読取:ステップS1
図2に示すように、まず、画像読取部14がテンプレート原稿50上の画像を読み取り、画像データを取得する(ステップS1)。図3Aに示すように、テンプレート原稿50は、色マーカーの付された第1指定領域51、第2指定領域52および第3指定領域53を有する
(2-1) Reading of template document: Step S1
As shown in FIG. 2, first, the
(2−2)指定領域の座標取得:ステップS2〜S3
テンプレート取得部31は、領域位置情報取得部として機能する。
(2-2) Acquisition of coordinates of designated area: steps S2 to S3
The
すなわち、テンプレート取得部31は、予め指定された色が付された領域を認識することで指定領域を認識し(ステップS2)、その座標を領域位置情報として取得する(ステップS3)。例えば、予め黄色がマーカー色として指定されている場合、テンプレート取得部31は、テンプレート原稿50の画像の中で、黄色が付された領域を認識する。
なお、マーカーは、指定領域の有する特徴の一例に過ぎない。指定領域は、予め定められ、テンプレート原稿における他の領域と区別できる特徴を有していればよい。特徴としては、マーカー以外に、字体、下線、色文字等が挙げられる。
That is, the
The marker is only an example of the characteristics of the designated area. The designated area may be determined in advance and have a feature that can be distinguished from other areas in the template document. Features include fonts, underlines, color characters, etc., in addition to markers.
さらに、図3Bに示すように、テンプレート取得部31は、認識された領域の対角の2点の座標を取得する。図3Bの例では、第1指定領域51に対応する領域位置情報として、座標(X11,Y11)および座標(X12,Y12)が取得される。このように特定された2つの座標を対角とする長方形の領域を、以下では「テンプレート領域」と称し、図3Aおよび図3Bでは符号“54”を付す。
Furthermore, as illustrated in FIG. 3B, the
同様に、第2指定領域52に対応する第2テンプレート領域55の座標、および第3指定領域53に対応する第3テンプレート領域56の座標が取得される(図3Aおよび図3C)。
Similarly, the coordinates of the
なお、色の指定は、デフォルトで設定されていてもよいし、操作パネル16を介して入力されてもよい。
Note that the color designation may be set by default or may be input via the
(2−3)仮テンプレートの取得:ステップS4〜S6
テンプレート取得部31は、指定文字取得部および相対位置情報取得部としても機能する。テンプレート取得部31によって、仮テンプレートが取得され、その後テンプレートが編集されることで、最終的なテンプレート(座標、指定文字、および相対位置情報を含む)が取得される。
(2-3) Acquisition of temporary template: Steps S4 to S6
The
まず、仮テンプレートの取得について説明する。テンプレート取得部31の制御の下、テンプレート領域に対して、文字認識部20によるOCR処理が実行される(ステップS4)。すなわち、画像データに基づいて、文字認識部20はテンプレート領域に含まれる文字列を認識する。図3Aに示すように、第1テンプレート領域54に含まれる文字列は“技術文書:ZZZ報告書”であり、第2テンプレート領域55に含まれる文字列は“日付:2010年1月15日”であり、第3テンプレート領域56に含まれる文字列は“作成者:鈴木太郎”である。
First, acquisition of a temporary template will be described. Under the control of the
こうして認識された文字列およびステップS3で取得された座標は、仮テンプレートとして、上述のSDRAM等の記憶媒体に記憶される(ステップS5)。1つのテンプレート原稿50内で、上述の指定された色を示す領域が他にあれば(ステップS6でNo)、他の領域について、座標取得、OCR処理および仮テンプレートの記憶が実行される(ステップS3〜S5)。1つのテンプレート原稿50内で、上述の指定された色を示す全ての領域について仮テンプレートの記憶が完了すれば(ステップS6でYes)、次の処理が行われる。
図3Aの例では、3つの指定領域51〜53について以上の処理が実行される。
The character string thus recognized and the coordinates acquired in step S3 are stored as a temporary template in a storage medium such as the above-described SDRAM (step S5). If there is another area indicating the specified color in one template document 50 (No in step S6), coordinate acquisition, OCR processing, and temporary template storage are executed for the other area (step S6). S3 to S5). If the storage of the temporary template is completed for all the areas indicating the above-mentioned designated color in one template document 50 (Yes in step S6), the following processing is performed.
In the example of FIG. 3A, the above processing is executed for the three designated
仮テンプレートについて、具体的に説明する。図3Cに示すように、仮テンプレート60は、第1情報61、第2情報62および第3情報63を有する。第1情報61は、第1テンプレート領域54の座標を有すると共に、Indexとして、第1テンプレート領域54から得られた文字列である“技術文書:ZZZ報告書”を有する。第2情報62は、第2テンプレート領域55の座標を有すると共に、Indexとして、第2テンプレート領域55から得られた文字列である“日付:2010年1月15日”を有する。第3情報63は、第3テンプレート領域56の座標を有すると共に、Indexとして、第3テンプレート領域56から得られた文字列である“作成者:鈴木太郎”を有する。
The temporary template will be specifically described. As illustrated in FIG. 3C, the
(2−4)テンプレートの編集:ステップS7
次の処理として、仮テンプレートの編集が行われる(ステップS7)。
具体的には、タッチパネル161上に、仮テンプレート60が表示されると共に、テンプレートに含まれる情報の編集を受け付けるソフトキーが表示される。“編集”とは、追加、変更、および削除を含む。なお、編集されない情報は表示される必要はない。例えば、座標が編集不可に設定されている場合、座標は仮テンプレートとして表示されなくてもよい。
(2-4) Template editing: Step S7
As the next processing, the temporary template is edited (step S7).
Specifically,
テンプレート取得部31は、これらのソフトキーを介してユーザが行った入力に基づいて仮テンプレートを編集することで、最終的なテンプレートを取得する。最終的に得られるテンプレートは、上述の座標を含むと共に、インデックス名、指定文字および相対位置情報を含んでいてもよい。
The
インデックス名は、ユーザにより指定される文字列であり、一般的には、後述の変動パラメータの分類を示す文字列である。具体的には、インデックス名として、技術文書、年間報告書、月間報告書および実験報告書等の文書の種類;作成日および提出日等の日付の種類;並びに文書の作成者、責任者および受領者等の氏名の種類を表すアルファベットが指定される。 The index name is a character string designated by the user, and is generally a character string indicating a classification of a variation parameter described later. Specifically, the name of the index includes technical documents, annual reports, monthly reports and experimental reports, etc .; the types of dates such as the date of creation and submission; An alphabet representing the name type of the person or the like is designated.
指定文字とは、IndexおよびDelimiterを含む概念である。指定文字には、記号も含まれる。Indexは、後述の変動パラメータに付随して表記される文字列である。Delimiterは、変動パラメータと他の文字列との間の区切りを示す記号であり、例えばIndexと変動パラメータとの区切りを示す記号である。Delimiterの記号としては、コロン又はセミコロン等が用いられる。 The designated character is a concept including Index and Delimiter. The designated character includes a symbol. The Index is a character string that is written in association with a variation parameter described later. Delimiter is a symbol indicating a delimiter between the variation parameter and another character string, for example, a symbol indicating a delimiter between the index and the variation parameter. As the symbol of Delimiter, a colon or a semicolon is used.
相対位置情報とは、指定文字に対する変動パラメータの相対位置を示す情報であり、例えば、指定文字に対する変動パラメータの方向を表す情報である。方向の入力は、“右”、“左”、“上”および“下”の選択肢を示すソフトキーが表示され、いずれかのソフトキーが押下されることで行われる。
また、テンプレート取得部31は、ユーザからの指示に応じて、領域位置情報である座標を修正することもできる。つまり、タッチパネル161に表示された座標を見たユーザが、より適切な値を入力することで、上述の座標は修正可能である。
The relative position information is information indicating the relative position of the variation parameter with respect to the designated character, for example, information indicating the direction of the variation parameter with respect to the designated character. The direction input is performed by displaying soft keys indicating choices of “right”, “left”, “up”, and “down”, and pressing one of the soft keys.
Moreover, the
テンプレートの具体例について以下に説明する。
(i)第1例
図4Aのテンプレート70は、第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703を含む。第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703はそれぞれ、第1情報61、第2情報62および第3情報63が編集されることで得られる情報である。テンプレート情報701〜703は、第1テンプレート領域54、第2テンプレート領域55および第3テンプレート領域56の座標をそれぞれ含むと共に、インデックス名、指定文字および相対位置情報を含む。
A specific example of the template will be described below.
(I) First Example The
図4Aに示すように、第1テンプレート情報701は、インデックス名(Index name)として、文書名である“技術文書”に対応する文字列“Technical Doc”を有する。第2テンプレート情報702は、“日付”に対応する文字列“Date”を有する。第3テンプレート情報703は、“作成者”に対応する文字列“Originator”を有する。これらの文字列は、ユーザが入力することで得られる。
As illustrated in FIG. 4A, the
図4Aに示すように、指定文字として、第1テンプレート情報701は、Indexとして文字列“技術文書:”を有する。この文字列は、仮テンプレートの第1情報61(図3C)において、Indexに含まれる文字列“ZZZ技術文書”が、ユーザの指示に基づいて削除されることで得られる。また、第2テンプレート情報702は、Indexとして文字列“日付:”を有する。この文字列は、第2情報62のIndexに含まれる文字列“2010年1月15日”が削除されることで得られる。第3テンプレート情報703は、Indexとして文字列“作成者:”を有する。この文字列は、第3情報のIndexに含まれる文字列“鈴木太郎”が削除されることで得られる。このように、図4Aのテンプレート情報701〜703において、指定文字であるIndexは、変動パラメータの分類を示す文字列およびDelimiterの両方を含む。
As shown in FIG. 4A, as the designated character, the
テンプレート原稿50は、指定領域51〜53中に、指定文字以外の文字列(後述の変動パラメータに相当する文字列である、“ZZZ報告書”、“2010年1月15日”、および“鈴木太郎”)を含む。それゆえ、仮テンプレート60から文字列を削除することで、指定文字が得られる。ただし、テンプレート原稿が指定文字以外の文字列を指定領域中に含まない場合、このような削除の作業は必要ない。
The
図4Aに示すように、第1テンプレート情報701、第2テンプレート情報702および第3テンプレート情報703は、相対位置情報(Location)として、“右(Right)”との情報を有する。
As shown in FIG. 4A, the
(ii)第2例
図4Bのテンプレート71は、指定文字として、Indexを含まず、Delimiterのみを有する。それ以外は、本例のテンプレート71は、第1例のテンプレート70と同様の構成である。具体的には、テンプレート71の第1テンプレート情報711、第2テンプレート情報712、および第3テンプレート情報713は、Delimiterとしてコロン(:)を有し、Indexを含まない。
このように、テンプレート取得部31は、仮テンプレート60に含まれる“Index”をユーザの指示に応じて削除することができるし、“Delimiter”を追加することもできる。
(Ii) Second Example The
As described above, the
(iii)第3例
図4Cのテンプレート72は、指定文字として、IndexおよびDelimiterの両方を、個別の情報として含む以外は、第1例のテンプレート70と同様の構成である。
(Iii) Third Example The
つまり、テンプレート72の第1テンプレート情報721は、Indexとして“技術文書”を含み、Delimiterとしてコロン含む。第2テンプレート情報722は、Indexとして“日付”を含み、Delimiterとしてコロンを含む。第3テンプレート情報723は、Indexとして“作成者”を含み、Delimiterとしてコロンを含む。
このように、テンプレート取得部31は、仮テンプレート60に含まれるIndexの一部を削除することができるし、“Delimiter”を追加することもできる。
That is, the
As described above, the
(2−5)テンプレートの登録:ステップS8およびS9
編集が完了した後(ステップS8でYes)、テンプレート取得部31の制御の下、編集後の最新のテンプレートが、記憶部17のテンプレート記憶領域171に記憶される(ステップS9)。こうして、テンプレート領域の座標と指定文字とが、関連付けて記憶される。
(2-5) Template registration: Steps S8 and S9
After the editing is completed (Yes in step S8), the latest template after editing is stored in the
編集の完了は、例えば、ハードキーとして設けられたスタートキーの押下、ソフトキーとして設けられた“完了”キーの押下、ソフトキーとして設けられた“保存”キーの押下等によって指示される。 Completion of editing is instructed, for example, by pressing a start key provided as a hard key, pressing a “done” key provided as a soft key, pressing a “save” key provided as a soft key, or the like.
(3)文書登録
複合機1は、文字を含む原稿の画像(文書)を変動パラメータと関連付けて登録し、この変動パラメータを文書の管理に用いることができる。すなわち、変動パラメータは、インデックスとして利用される。
以下に、文書登録について図5を参照して説明する。図5は文書登録の流れを示すフローチャートである。
(3) Document Registration The multifunction device 1 can register an image (document) of a document including characters in association with a variation parameter, and use the variation parameter for document management. That is, the variation parameter is used as an index.
Hereinafter, document registration will be described with reference to FIG. FIG. 5 is a flowchart showing the flow of document registration.
(3−1)テンプレート選択:S11
複合機1は、操作パネル16により、ユーザから、以下の処理に用いるテンプレートの選択を受け付ける(ステップS11)。
(3-1) Template selection: S11
The multi-function device 1 accepts selection of a template used for the following processing from the user via the operation panel 16 (step S11).
(3−2)原稿読取:S12〜S20
画像読取部14は、ユーザにセットされた原稿から画像を読み取る(ステップS12)。
(3-2) Document reading: S12 to S20
The
(3−3)変動パラメータの抽出:ステップS13〜S19
テンプレート認識部41は、得られた画像から、ステップS11で選択されたテンプレートに含まれる座標によって特定される領域を抽出する(ステップS13)。
(3-3) Fluctuation parameter extraction: Steps S13 to S19
The
抽出された領域(以下、「抽出領域」と称する)に対して、テンプレート認識部41の制御の下、文字認識部20によってOCR処理が実行される(ステップS14)。
The
テンプレート認識部41は、こうして得られた文字列に、テンプレート中の指定文字(Indexおよび/またはDelimiter)が含まれているかどうか判定する(ステップS15)。
The
指定文字と一致する文字が含まれていれば(ステップS16でYes)、変動パラメータ抽出部43は、指定文字に対して、テンプレート中の相対位置情報により特定される位置に存在する文字列を、変動パラメータとして抽出する(ステップS17)。
変動パラメータ抽出部43は、抽出領域に存在する文字の全てを変動パラメータとして抽出するだけでなく、指定文字以外に抽出領域に存在する文字の一部のみを変動パラメータとして抽出してもよい。例えば、変動パラメータとして抽出すべき文字数に制限値が設けられていてもよく、抽出領域中に存在する文字列がこの制限値を超えるときは、変動パラメータ抽出部43は、この制限値に合致する数の文字列を抽出してもよい。
なお、変動パラメータ抽出部43が抽出した文字が、タッチパネル161上に表示されることで、ユーザが抽出内容を確認することができる。変動パラメータ抽出部43は、ユーザの指示等に応じて、変動パラメータの修正(一部の文字列の削除および変更等)をさらに行ってもよい。
If a character that matches the designated character is included (Yes in step S16), the variation
The variation
The characters extracted by the variation
指定文字と一致する文字が含まれていなければ(ステップS16でNo)、座標補正部42は、抽出領域がより広くなるように、座標を補正する(ステップS18)。具体的には、1つのテンプレート情報における2つの座標のX成分同士の差および/またはY成分同士の差が大きくなるように、座標が補正される。補正後の座標報に基づいて、領域抽出以降の処理が再度行われる。
If a character that matches the designated character is not included (No in step S16), the coordinate
以上の処理は、1つのテンプレートによって特定される全ての抽出領域について変動パラメータの取得が完了するまで行われる(ステップS19)。 The above processing is performed until the acquisition of the variation parameter is completed for all the extraction regions specified by one template (step S19).
変動パラメータ抽出の具体例について、図6A〜図6Cを参照して説明する。図6A〜図6Cは、同一の原稿から得られた画像において、上述のテンプレート70〜72をそれぞれ用いた場合のテンプレート認識および変動パラメータの抽出を模式的に示す図面である。以下に説明する。
A specific example of fluctuation parameter extraction will be described with reference to FIGS. 6A to 6C. 6A to 6C are diagrams schematically showing template recognition and variation parameter extraction when the above-described
(i)第1例
ステップS12で図4Aのテンプレート70が選択された場合、図6Aに示すように、原稿画像80において、第1テンプレート情報701、第2テンプレート702、および第3テンプレート703の座標に基づいて、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
(I) First Example When the
第1抽出領域81において、第1テンプレート情報701のIndex“技術文書:”に一致する文字列811が認識され、相対位置情報に基づいて、文字列811の右側に存在する変動パラメータ812である文字列“実験報告書”が抽出される(ステップS14〜S17)。
In the
第2抽出領域82では、第2テンプレート情報702のIndex“日付:”に一致する文字列821が認識され、相対位置情報に基づいて、文字列821の右側に存在する変動パラメータ822である文字列“2010年3月15日”が抽出される(ステップS14〜S17)。
In the
第3抽出領域83では、第3テンプレート情報703のIndex“作成者:”に一致する文字列831が認識され、相対位置情報に基づいて、文字列831の右側に存在する変動パラメータ832である文字列“田中次郎”が抽出される(ステップS14〜S17)。
In the
(ii)第2例
本例では、用いられるテンプレートが異なる以外、特に指定文字が異なる以外は、第1例と同じ処理がなされ、抽出される変動パラメータも同じである。
(Ii) Second Example In this example, the same processing as that in the first example is performed except that the used template is different and the designated characters are different, and the extracted variation parameters are also the same.
ステップS12で図4Bのテンプレート71が選択された場合も、図6Bに示すように、原稿画像80において、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
When the
第1抽出領域81において、第1テンプレート情報711のDelimiterに一致する記号841が認識され、相対位置情報に基づいて、変動パラメータ812が抽出される(ステップS14〜S17)。
In the
第2抽出領域82では、第2テンプレート情報712のDelimiterに一致する記号842が認識され、相対位置情報に基づいて、変動パラメータ822が抽出される(ステップS14〜S17)。
In the
第3抽出領域83では、第3テンプレート情報713のDelimiterに一致する記号843が認識され、相対位置情報に基づいて、変動パラメータ832が抽出される(ステップS14〜S17)。
In the
(iii)第3例
本例では、用いられるテンプレートが異なる以外、特に指定文字が異なる以外は、第1例と同じ処理がなされ、抽出される変動パラメータも同じである。
(Iii) Third Example In this example, the same processing as that in the first example is performed except that the used template is different and the designated characters are different, and the extracted variation parameters are also the same.
ステップS12で図4Cのテンプレート72が選択された場合も、図6Cに示すように、原稿画像80において、第1抽出領域81、第2抽出領域82および第3抽出領域83が抽出される(ステップS13)。
When the
第1抽出領域81において、第1テンプレート情報721のIndex“技術文書”に一致する文字列記号851およびDelimiterに一致する記号841が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号841の右側に存在する変動パラメータ812が抽出される(ステップS14〜S17)。
In the
第2抽出領域82では、第2テンプレート情報722のIndex“日付”に一致する文字列852およびDelimiterに一致する記号842が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号842の右側に存在する変動パラメータ822が抽出される(ステップS14〜S17)。
In the
第3抽出領域83では、第3テンプレート情報723のIndex“作成者”に一致する文字列853およびDelimiterに一致する記号843が認識される(ステップS14〜S16)。そして、相対位置情報に基づいて、記号843の右側に存在する変動パラメータ832が抽出される(ステップS14〜S17)。
In the
(3−4)文書登録:ステップS20
変動パラメータの取得が完了した後(ステップS19でYes)、原稿の画像データと変動パラメータとが関連付けられて、文書記憶領域172に記憶される(ステップS20)。具体的には、変動パラメータはXML(Extensible Markup Language)データとして保存される。
(3-4) Document registration: Step S20
After the acquisition of the variation parameter is completed (Yes in step S19), the image data of the document and the variation parameter are associated and stored in the document storage area 172 (step S20). Specifically, the variation parameter is stored as XML (Extensible Markup Language) data.
(4)文書検索
こうして登録された変動パラメータは、例えば文書の分類および検索に用いられる。
ユーザが操作、パネル16を介して、検索語を入力し、さらに検索実行を指示したとき、検索部44は、この検索語に一致する変動パラメータを有する画像を文書記憶領域172内で検索する。検索結果はタッチパネル161上に表示される。こうして、ユーザは容易に目的の画像を入手することができる。
なお、検索部44においては、部分一致または完全一致等の検索方法が、デフォルトで設定されていてもよいし、ユーザの指定によって検索方法が変更可能であってもよい。
(4) Document Search The variation parameters registered in this way are used for document classification and search, for example.
When the user inputs a search word via the
In the
以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、発明の要旨を逸脱しない範囲で種々の変更が可能である As mentioned above, although one Embodiment of this invention was described, this invention is not limited to the said embodiment, A various change is possible in the range which does not deviate from the summary of invention.
(5)特徴
複合機1は、原稿から得られた画像において、指定文字に基づいて特定される文字を変動パラメータとして認識する。この複合機1は、画像読取部14、テンプレート取得部31、およびテンプレート記憶領域171を備える。画像読取部14は、原稿上の画像を読み取る。テンプレート取得部31は、画像読取部14によって読み取られたテンプレート画像において、予め定められた特徴を有する指定領域51〜54の座標を取得する。テンプレート取得部31は、指定領域51〜54に含まれる文字列から、指定文字を取得する。テンプレート記憶領域171は、指定文字を座標と関連付けて記憶する。
(5) Features The multi function device 1 recognizes a character specified based on a designated character as a variation parameter in an image obtained from a document. The multi-function device 1 includes an
この複合機1によると、予め特定の様式を有する原稿を読み取って、そこから、未知の原稿において文字認識を行うべき領域を示す情報(領域位置情報および指定文字)を取得することができる。従って、OCRテンプレートが容易に作成される。 According to the multi function device 1, it is possible to read a document having a specific format in advance, and acquire information (region position information and designated characters) indicating an area where character recognition should be performed on an unknown document. Therefore, an OCR template can be easily created.
複合機1において、テンプレート取得部31は、指定文字に対する変動パラメータの相対位置を表す相対位置情報を取得する、相対位置情報取得部としても機能する。さらに、テンプレート記憶領域171は、相対位置情報を指定文字と関連付けて記憶してもよい。これによって、文字認識するべき領域の位置を、より厳密に規定することができる。
In the multi function device 1, the
複合機1において、テンプレート取得部31は特定の色を示す領域を認識する。
In the multi function device 1, the
また、複合機1は、テンプレート認識部41および変動パラメータ抽出部43を備える。テンプレート認識部41は、原稿画像80において、座標によって特定される領域である抽出領域81〜83内で、指定文字を認識する。変動パラメータ抽出部43は、指定文字以外に抽出領域81〜83に存在する文字を変動パラメータとして抽出する。
In addition, the multifunction machine 1 includes a
このように、上述の座標および指定文字に基づいて、原稿画像上で、文字認識を行って変動パラメータを取得すべき領域が特定される。つまり、原稿画像の全体に対して文字認識を行うことなく、特定の領域のみについて文字認識を行うことで、必要な文字列が容易に得られる。 As described above, based on the above-described coordinates and the designated character, a region on which the variation parameter is to be acquired by performing character recognition on the document image is specified. That is, a necessary character string can be easily obtained by performing character recognition on only a specific area without performing character recognition on the entire document image.
複合機1は、抽出領域81〜83に指定文字が存在しない場合、より広い領域に対応するように領域位置情報を補正する座標補正部42をさらに備える。
複合機1は、変動パラメータを原稿画像と関連付けて記憶する文書記憶領域172をさらに備える。
The multifunction device 1 further includes a coordinate
The multi-function device 1 further includes a
複合機1において、操作パネル16は、ユーザから検索語の入力を受け付ける。検索部44は、検索語と一致する変動パラメータと関連付けられた原稿画像を、文書記憶部内の原稿画像から選択する。
In the multi function device 1, the
本発明は、画像読取機能を有する装置、例えばファクシミリ装置、スキャナ、複合機等に利用可能である。 The present invention can be used for an apparatus having an image reading function, for example, a facsimile machine, a scanner, a multifunction machine, and the like.
1 複合機
12 モデム
13 ネットワークインターフェース
14 画像読取部
15 画像形成部
16 操作パネル
17 記憶部
18 制御装置
20 文字認識部
31 テンプレート取得部(領域位置情報取得部、指定文字取得部、相対位置情報取得部)
41 テンプレート認識部
42 座標補正部
43 変動パラメータ抽出部
44 検索部
50 テンプレート原稿
51 第1指定領域
52 第2指定領域
53 第3指定領域
54 第1テンプレート領域
55 第2テンプレート領域
56 第3テンプレート領域
60 仮テンプレート
70 テンプレート
71 テンプレート
72 テンプレート
102 インターネット
161 タッチパネル(検索受付部)
162 ハードキー
171 テンプレート記憶領域(テンプレート記憶部)
172 文書記憶領域
DESCRIPTION OF SYMBOLS 1
41
162
172 Document storage area
Claims (8)
原稿上の画像をテンプレート画像として読み取る画像読取部と、
前記テンプレート画像において、予め定められた特徴を有する指定領域の位置を前記領域位置情報として取得する領域位置情報取得部と、
前記指定領域に含まれる文字列から、前記指定文字を取得する指定文字取得部と、
前記指定文字を前記領域位置情報と関連付けて記憶するテンプレート記憶部と、
を備える文書処理装置。 A document processing apparatus that recognizes, as a variation parameter, a character specified based on a specified character in an area specified by area position information in an image obtained from a document.
An image reading unit that reads an image on a document as a template image;
In the template image, an area position information acquisition unit that acquires a position of a specified area having a predetermined characteristic as the area position information;
A designated character obtaining unit for obtaining the designated character from a character string included in the designated region;
A template storage unit for storing the designated character in association with the region position information;
A document processing apparatus comprising:
前記テンプレート記憶部は、前記相対位置情報を前記指定文字と関連付けて記憶する
請求項1に記載の文書処理装置。 A relative position information acquisition unit that acquires relative position information representing a relative position of the variation parameter with respect to the designated character;
The document processing apparatus according to claim 1, wherein the template storage unit stores the relative position information in association with the designated character.
請求項1または2に記載の文書処理装置。 The document processing apparatus according to claim 1, wherein the area position information acquisition unit acquires the area position information by recognizing an area indicating a specific color as the designated area.
原稿上の画像を原稿画像として読み取る画像読取部と、
前記指定文字と前記領域位置情報とを関連付けて記憶するテンプレート記憶部と、
前記原稿画像において、前記領域位置情報によって特定される領域である抽出領域内で、前記指定文字を認識するテンプレート認識部と、
前記指定文字以外に前記抽出領域に存在する文字を変動パラメータとして抽出する変動パラメータ抽出部と、
を備える文書処理装置。 A document processing apparatus that recognizes, as a variation parameter, a character specified based on a specified character in an area specified by area position information in an image obtained from a document.
An image reading unit that reads an image on a document as a document image;
A template storage unit that associates and stores the designated character and the region position information;
A template recognizing unit that recognizes the designated character in an extraction area that is an area specified by the area position information in the document image;
A variation parameter extraction unit that extracts characters existing in the extraction region other than the designated character as a variation parameter;
A document processing apparatus comprising:
請求項4に記載の文書処理装置。 The document processing apparatus according to claim 4, further comprising an area position information correction unit that corrects the area position information so as to correspond to a wider area when the designated character does not exist in the extraction area.
請求項4または5のいずれかに記載の文書処理装置。 The document processing apparatus according to claim 4, further comprising a document storage unit that stores the variation parameter in association with the document image.
前記検索語と一致する変動パラメータと関連付けられた前記原稿画像を、前記文書記憶部内の原稿画像から選択する検索部と、
をさらに備える請求項6に記載の文書処理装置。 A search reception unit that receives input of search terms from the user;
A search unit that selects the document image associated with the variation parameter that matches the search term from the document image in the document storage unit;
The document processing apparatus according to claim 6, further comprising:
原稿上の画像をテンプレート画像又は原稿画像として読み取る画像読取部と、
前記テンプレート画像において、予め定められた特徴を有する指定領域の位置を領域位置情報として取得する領域位置情報取得部と、
前記指定領域に含まれる文字列から、指定文字を取得する指定文字取得部と、
前記指定文字を前記領域位置情報と関連付けて記憶するテンプレート記憶部と、
前記原稿画像において、前記領域位置情報によって特定される領域である抽出領域内で、前記指定文字を認識するテンプレート認識部と、
前記指定文字以外に前記抽出領域に存在する文字を変動パラメータとして抽出する変動パラメータ抽出部と、
を備える文書処理装置。 A document processing apparatus that recognizes, as a variation parameter, a character specified based on a specified character in an area specified by area position information in an image obtained from a document.
An image reading unit that reads an image on a document as a template image or a document image;
In the template image, an area position information acquisition unit that acquires the position of a specified area having a predetermined feature as area position information;
A designated character obtaining unit for obtaining a designated character from a character string included in the designated region;
A template storage unit for storing the designated character in association with the region position information;
A template recognizing unit that recognizes the designated character in an extraction area that is an area specified by the area position information in the document image;
A variation parameter extraction unit that extracts characters existing in the extraction region other than the designated character as a variation parameter;
A document processing apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010105894A JP2011237840A (en) | 2010-04-30 | 2010-04-30 | Document processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010105894A JP2011237840A (en) | 2010-04-30 | 2010-04-30 | Document processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011237840A true JP2011237840A (en) | 2011-11-24 |
Family
ID=45325784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010105894A Pending JP2011237840A (en) | 2010-04-30 | 2010-04-30 | Document processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011237840A (en) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013250730A (en) * | 2012-05-31 | 2013-12-12 | Pfu Ltd | Document creation system, document creation device, document creation method and program |
EP2677481A1 (en) * | 2012-06-14 | 2013-12-25 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
US8990112B2 (en) | 2012-03-01 | 2015-03-24 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
US9245296B2 (en) | 2012-03-01 | 2016-01-26 | Ricoh Company Ltd. | Expense report system with receipt image processing |
US9659327B2 (en) | 2012-03-01 | 2017-05-23 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
JP2017123597A (en) * | 2016-01-08 | 2017-07-13 | シャープ株式会社 | Image reading device, image reading method, and image reading program |
US10332213B2 (en) | 2012-03-01 | 2019-06-25 | Ricoh Company, Ltd. | Expense report system with receipt image processing by delegates |
JP2019168747A (en) * | 2018-03-22 | 2019-10-03 | 富士ゼロックス株式会社 | Document reader and program |
CN110390323A (en) * | 2018-04-18 | 2019-10-29 | 富士施乐株式会社 | Information processing unit and computer-readable medium |
JP2020042466A (en) * | 2018-09-10 | 2020-03-19 | 富士ゼロックス株式会社 | Recognition processing device and program |
JP2020160649A (en) * | 2019-03-26 | 2020-10-01 | 株式会社日立情報通信エンジニアリング | Image processing apparatus, image processing method and image processing program |
-
2010
- 2010-04-30 JP JP2010105894A patent/JP2011237840A/en active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10332213B2 (en) | 2012-03-01 | 2019-06-25 | Ricoh Company, Ltd. | Expense report system with receipt image processing by delegates |
US9659327B2 (en) | 2012-03-01 | 2017-05-23 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
US8990112B2 (en) | 2012-03-01 | 2015-03-24 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
US9245296B2 (en) | 2012-03-01 | 2016-01-26 | Ricoh Company Ltd. | Expense report system with receipt image processing |
JP2013250730A (en) * | 2012-05-31 | 2013-12-12 | Pfu Ltd | Document creation system, document creation device, document creation method and program |
EP2677481A1 (en) * | 2012-06-14 | 2013-12-25 | Ricoh Company, Ltd. | Expense report system with receipt image processing |
JP2017123597A (en) * | 2016-01-08 | 2017-07-13 | シャープ株式会社 | Image reading device, image reading method, and image reading program |
JP2019168747A (en) * | 2018-03-22 | 2019-10-03 | 富士ゼロックス株式会社 | Document reader and program |
JP7059734B2 (en) | 2018-03-22 | 2022-04-26 | 富士フイルムビジネスイノベーション株式会社 | Document reader and program |
CN110390323A (en) * | 2018-04-18 | 2019-10-29 | 富士施乐株式会社 | Information processing unit and computer-readable medium |
CN110390323B (en) * | 2018-04-18 | 2023-09-05 | 富士胶片商业创新有限公司 | Information processing apparatus and computer readable medium |
JP2020042466A (en) * | 2018-09-10 | 2020-03-19 | 富士ゼロックス株式会社 | Recognition processing device and program |
JP7338135B2 (en) | 2018-09-10 | 2023-09-05 | 富士フイルムビジネスイノベーション株式会社 | Recognition processing device and program |
JP2020160649A (en) * | 2019-03-26 | 2020-10-01 | 株式会社日立情報通信エンジニアリング | Image processing apparatus, image processing method and image processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011237840A (en) | Document processing device | |
JP4251629B2 (en) | Image processing system, information processing apparatus, control method, computer program, and computer-readable storage medium | |
US7640269B2 (en) | Image processing system and image processing method | |
EP2264995B1 (en) | Image processing apparatus, image processing method, and computer program | |
JP5972578B2 (en) | Image processing apparatus, image forming apparatus, program, and recording medium | |
JP2009193356A (en) | Image processing apparatus, image processing method, program, and storage medium | |
US20130088748A1 (en) | Image forming apparatus, image forming system, and non-transitory computer readable medium | |
JP6579332B2 (en) | Image forming apparatus, document digitizing program, and document digitizing method | |
JP2010114840A (en) | Image forming apparatus and confirmation system for stored image | |
JP2011039580A (en) | Device and method for processing document, and program | |
JP2012118863A (en) | Image reading device, image formation device, image reading method, program and recording medium therefor | |
JP6579331B2 (en) | Image forming apparatus, document digitizing program, and document digitizing method | |
JP7379876B2 (en) | Character recognition device, document file generation method, document file generation program | |
US20140344747A1 (en) | Input device and image processing apparatus | |
US9542140B2 (en) | Systems and methods for editing documents | |
US20070299889A1 (en) | Information processing apparatus performing plurality of series of predetermined processes and control program embodied in computer readable medium to be executed in information processing apparatus | |
JP2010244131A (en) | Printer and printing program | |
JP6201686B2 (en) | Text data embedding apparatus, image processing apparatus including the apparatus, text data embedding method, and embedding program | |
JP2005110183A (en) | Image processing apparatus | |
JP2007028181A (en) | Image processor | |
US20220179597A1 (en) | Modify and output printout including data in predefined format | |
JP6137998B2 (en) | Image processing apparatus, image forming apparatus, program, and recording medium | |
JP2023054708A (en) | Information processing device, document division method, and program | |
JP4420443B2 (en) | Form recognition apparatus, control method therefor, and program | |
JP2022010995A (en) | Device, system, method, and program |