JP4645349B2 - Information processing apparatus and program - Google Patents

Information processing apparatus and program Download PDF

Info

Publication number
JP4645349B2
JP4645349B2 JP2005224217A JP2005224217A JP4645349B2 JP 4645349 B2 JP4645349 B2 JP 4645349B2 JP 2005224217 A JP2005224217 A JP 2005224217A JP 2005224217 A JP2005224217 A JP 2005224217A JP 4645349 B2 JP4645349 B2 JP 4645349B2
Authority
JP
Japan
Prior art keywords
image information
input
information input
document
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005224217A
Other languages
Japanese (ja)
Other versions
JP2007043388A (en
Inventor
哲 柳
一成 室井
倫 渡邉
一磨 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2005224217A priority Critical patent/JP4645349B2/en
Publication of JP2007043388A publication Critical patent/JP2007043388A/en
Application granted granted Critical
Publication of JP4645349B2 publication Critical patent/JP4645349B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、文字認識を行い、認識した文字情報を出力する情報処理装置等に関する。   The present invention relates to an information processing apparatus that performs character recognition and outputs recognized character information.

近年、名刺に記載された文字を画像情報として読み取って文字認識を行い、認識した文字情報をデータベースへ登録することにより検索照会を行うことを可能とした名刺管理システムが知られている。例えば、以下の特許文献1に記載の技術は、名刺情報読み取り手段によって名刺に記載された文字情報を項目別に読み取り、認識した個人名と会社名とをキーにしてデータベースを検索する。そして、該当する情報が見つからなかった場合に、名刺から読み取った文字情報をデータベースへ登録する技術である。
特開平6−274550号公報
2. Description of the Related Art In recent years, a business card management system is known in which characters written on a business card are read as image information, character recognition is performed, and a search query can be performed by registering the recognized character information in a database. For example, in the technique described in Patent Document 1 below, character information written on a business card is read by item by a business card information reading unit, and a database is searched using the recognized personal name and company name as keys. And when the corresponding information is not found, this is a technique for registering character information read from a business card in a database.
JP-A-6-274550

この特許文献1に記載の技術には、十分な文字認識率が必要であるが、現在の文字認識技術(いわゆるOCR技術)では、名刺に特殊なフォントが用いられていると十分な文字認識率が得られない場合がある。また、名刺のような活字が用いられるものはまだ良いが、手書きの文章を読み取る場合は、著しく文字認識率が落ちるというのが実情である。   The technology described in Patent Document 1 requires a sufficient character recognition rate. However, with the current character recognition technology (so-called OCR technology), a sufficient character recognition rate is achieved when a special font is used for a business card. May not be obtained. In addition, it is still good to use characters such as business cards, but when reading handwritten text, the actual situation is that the character recognition rate drops significantly.

したがって、このような発展途上にある文字認識技術を用いて、例えば手書き文章をデータベース化すると、誤認識された情報によってデータベースへの登録が行われ、後からユーザがその情報を理解することができないという問題が発生する場合がある。   Therefore, for example, when handwritten text is made into a database using such developing character recognition technology, registration into the database is performed based on misrecognized information, and the user cannot later understand the information. May occur.

本発明は、このような問題にかんがみなされたものであり、十分な文字認識率が得られない場合でも、登録された情報をユーザが後から確認することができる技術を提供することを目的とする。   The present invention has been considered in view of such problems, and it is an object of the present invention to provide a technique that allows a user to confirm registered information later even when a sufficient character recognition rate cannot be obtained. To do.

上記課題を解決するためになされた請求項1に記載の情報処理装置は、画像情報入力手段と、判断手段と、出力手段とを備える。このうち、画像情報入力手段は画像情報を入力する手段である。また、判断手段は、画像情報入力手段が入力した画像情報に基づき文字認識を行って認識した文字情報を出力すべきか、画像情報入力手段が入力した画像情報を画像情報のまま出力すべきかを、文字認識率を考慮した判断基準により判断する手段である。また、出力手段は、判断手段の判断結果に基づいて、文字情報または画像情報を出力する手段である。なお、出力手段が文字情報や画像情報を出力する先としては、例えば、本発明の情報処理装置とネットワークを介して接続されたデータベース装置が考えられる。当該情報処理装置自体が情報を記憶する記憶手段を備えていて、その記憶手段に対して出力するようになっていてもよい。また、出力手段は、画像情報入力手段が入力した画像情報全てを出力対象として文字情報または画像情報を出力するようになっていてもよいが、入力した画像情報における一または複数の特定領域だけを出力対象として文字情報または画像情報を出力するようになっていてもよい。   An information processing apparatus according to claim 1, which has been made to solve the above problem, includes an image information input unit, a determination unit, and an output unit. Among these, the image information input means is means for inputting image information. Further, the determination means determines whether to perform character recognition based on the image information input by the image information input means and output the recognized character information or whether to output the image information input by the image information input means as image information. This is a means for making a determination based on a determination criterion considering the character recognition rate. The output means is means for outputting character information or image information based on the determination result of the determination means. Note that, for example, a database apparatus connected to the information processing apparatus of the present invention via a network can be considered as a destination to which the output unit outputs character information and image information. The information processing apparatus itself may be provided with storage means for storing information, and output to the storage means. Further, the output means may output character information or image information for all the image information input by the image information input means, but only one or a plurality of specific areas in the input image information. Character information or image information may be output as an output target.

このような情報処理装置によれば、判断手段が用いる判断基準を適切に設定することにより、情報処理装置による文字認識では誤認識されるような文字については画像情報としてそのままデータベースへ出力され、文字認識が正常に行われるような文字については文字認識が行われた結果の文字情報がデータベースへ出力される。現在の情報処理装置による文字認識技術は、人間の文字認識力に比較して劣るものであるが、人間の文字認識力をもってすれば認識可能な文字情報というのは少なくない。これらのことから、本発明の情報処理装置によれば、データベースに登録された情報を後からユーザが理解できないということを大幅に減らすことができる。   According to such an information processing apparatus, by appropriately setting the determination criteria used by the determination means, characters that are erroneously recognized in the character recognition by the information processing apparatus are output to the database as image information as they are. For characters that can be recognized normally, character information obtained as a result of character recognition is output to the database. The current character recognition technology using information processing apparatuses is inferior to human character recognition, but there are many character information that can be recognized by human character recognition. For these reasons, according to the information processing apparatus of the present invention, it is possible to greatly reduce the fact that the user cannot understand the information registered in the database later.

また、本発明において画像情報入力手段は、それぞれ独立して画像情報を入力可能な複数種類の手段から構成されており、判断基準は、対象とする画像情報を入力した画像情報入力手段の種類とされている。具体的には、画像情報入力手段が、文字認識に適した画像情報を入力する手段と、文字認識に不適な画像情報を入力する手段とから構成されているような場合を想定している。そして、文字認識に適した画像情報を入力する手段から画像情報を入力した場合には、文字認識を行って文字情報を出力し、文字認識に不適な画像情報を入力する手段から画像情報を入力した場合には、画像情報のまま出力する。   Further, in the present invention, the image information input means is composed of a plurality of types of means capable of inputting image information independently, and the judgment criterion is the type of image information input means that inputs the target image information. Has been. Specifically, a case is assumed in which the image information input unit includes a unit for inputting image information suitable for character recognition and a unit for inputting image information unsuitable for character recognition. When image information is input from a means for inputting image information suitable for character recognition, character recognition is performed to output character information, and image information is input from means for inputting image information unsuitable for character recognition. In such a case, the image information is output as it is.

このようになっていれば、画像情報を入力した手段の種別を判別するだけで、上述した判断(画像情報のまま出力するか文字認識を行って文字情報として出力するかの判断)を行うことができるため、判断を簡易に行うことができ、情報処理装置の高速化に貢献する。   If this is the case, the above-described determination (determination of whether to output the image information as it is or to perform character recognition and output as character information) is performed simply by determining the type of means that has input the image information. Therefore, the determination can be made easily, which contributes to the speeding up of the information processing apparatus.

なお、画像情報入力手段における複数種類の手段というのは、スキャナ機能によって画像情報を入力するスキャナ手段と、ファクシミリ受信機能によって画像情報を入力するファクシミリ受信手段とであると特によく、また、その場合、判断手段は、スキャナ手段によって入力された画像情報については文字認識を行って文字情報を出力すべきと判断し、ファクシミリ受信手段によって入力された画像情報については画像情報のまま出力すべきと判断するとよい。一般的に、スキャナ手段によって入力された画像情報は精細なものであり、一方、ファクシミリ受信手段によって入力された画像情報は粗いものである。したがって、これらの手段によって入力された画像情報は著しく文字認識率が異なる。 The plural types of means in the image information input means are particularly preferably a scanner means for inputting image information by a scanner function and a facsimile receiving means for inputting image information by a facsimile reception function. The determining means determines that the image information input by the scanner means should be character-recognized and output the character information, and the image information input by the facsimile receiving means should be output as the image information. Thus not good. In general, the image information input by the scanner means is fine, while the image information input by the facsimile receiving means is coarse. Accordingly, the image information input by these means has a significantly different character recognition rate.

このため、このように著しく文字認識率が異なる画像情報に対して、その画像情報を入力した手段の種別により出力形式を決定するようになっていれば、情報処理装置の高速化を実現しながら、特に実情に合致した形式で情報を出力することができる。   For this reason, if the output format is determined according to the type of means for inputting the image information for the image information having such a significantly different character recognition rate, the information processing apparatus can be speeded up. In particular, information can be output in a format that matches the actual situation.

た、上記課題を解決するためになされた請求項2に記載のプログラムは、コンピュータを、画像情報を入力する画像情報入力ステップ、画像情報入力ステップにおいて入力した画像情報に基づき文字認識を行って認識した文字情報を出力すべきか、画像情報入力ステップにおいて入力した画像情報を画像情報のまま出力すべきかを、文字認識率を考慮した判断基準によって判断する判断ステップ、判断ステップにおける判断結果に基づいて、文字情報または画像情報を出力する出力ステップ、として機能させ、画像情報入力ステップは、それぞれが独立して画像情報を入力可能な複数種類のステップから構成され、判断基準は、対象とする画像情報を入力した画像情報入力ステップの種類であることを特徴とする。また、判断ステップでは、前記スキャナステップにて入力された前記画像情報については前記文字認識を行って文字情報を出力すべきと判断し、前記ファクシミリステップにて入力された前記画像情報については画像情報のまま出力すべきと判断することを特徴とする。 Also, the program according to claim 2 which has been made to solve the above problems, the computer, the image information input step of inputting image information, a character recognition based on the image information input in the image information input step performed Based on the determination result in the determination step, which determines whether the recognized character information should be output or whether the image information input in the image information input step should be output as image information based on a determination criterion considering the character recognition rate , Functioning as an output step for outputting character information or image information, and the image information input step is composed of a plurality of types of steps in which image information can be input independently, and the determination criterion is the target image information The type of the image information input step in which is input. In the determining step, the image information input in the scanner step is determined to be subjected to the character recognition to output character information, and the image information input in the facsimile step is determined to be image information. It is characterized in that it should be output as it is.

このようなプログラムを、情報処理装置が内蔵するコンピュータに実行させれば、上述した請求項1に記載の情報処理装置と同様の効果を奏する。また、プログラムはネットワーク等を用いて流通させることも可能である上、情報処理装置におけるプログラムの入れ替えは、部品の入れ替えに比較して容易である。したがって、情報処理装置の機能向上を容易に行うことができる。   If such a program is executed by a computer built in the information processing apparatus, the same effect as the information processing apparatus according to claim 1 described above can be obtained. Further, the program can be distributed using a network or the like, and the replacement of the program in the information processing apparatus is easier than the replacement of the parts. Therefore, it is possible to easily improve the function of the information processing apparatus.

以下、本発明が適用された実施形態について図面を用いて説明する。尚、本発明は、下記の実施形態に何ら限定されることはなく種々の形態を採りうる。
[構成の説明]
図1は、本発明の情報処理装置の機能が組み込まれた複合機11の概略構成を示すブロック図である。複合機11は、LAN通信部13,WAN通信部15,FAX通信部17,FAX符号部19,FAX復号部21,PC通信部23,記憶媒体アクセス部25,記録部27,読取部29,データ記憶部31,設定記憶部33,操作部35,表示部37及び制御部39を備える。
Embodiments to which the present invention is applied will be described below with reference to the drawings. In addition, this invention is not limited to the following embodiment at all, and can take a various form.
[Description of configuration]
FIG. 1 is a block diagram showing a schematic configuration of a multifunction machine 11 in which the function of the information processing apparatus of the present invention is incorporated. The MFP 11 includes a LAN communication unit 13, a WAN communication unit 15, a FAX communication unit 17, a FAX encoding unit 19, a FAX decoding unit 21, a PC communication unit 23, a storage medium access unit 25, a recording unit 27, a reading unit 29, data A storage unit 31, a setting storage unit 33, an operation unit 35, a display unit 37, and a control unit 39 are provided.

LAN通信部13は、LANと接続され、LANに接続された他の様々な機器と通信を行う。
WAN通信部15は、WANと接続され、WANに接続された他の様々な機器と通信を行う。
The LAN communication unit 13 is connected to the LAN and communicates with various other devices connected to the LAN.
The WAN communication unit 15 is connected to the WAN and communicates with various other devices connected to the WAN.

FAX通信部17は、PSTN(公衆交換電話網)と接続され、FAX符号部19から渡された符号化されたデータをPSTNに接続された他の機器に送信すると共に、PSTNに接続された他の機器から送信されたデータをFAX復号部21に渡す。   The FAX communication unit 17 is connected to the PSTN (Public Switched Telephone Network), transmits the encoded data passed from the FAX encoding unit 19 to other devices connected to the PSTN, and others connected to the PSTN. The data transmitted from the device is transferred to the FAX decoding unit 21.

FAX符号部19は、制御部39から渡されるデータをファクシミリ規格に準じて符号化し、FAX通信部17に渡す。
FAX復号部21は、FAX通信部17から渡されるファクシミリ規格に準じたデータを復号化して制御部39が処理可能なデータにし、制御部39に渡す。
The FAX encoding unit 19 encodes the data passed from the control unit 39 according to the facsimile standard, and passes it to the FAX communication unit 17.
The FAX decoding unit 21 decodes data conforming to the facsimile standard delivered from the FAX communication unit 17 to make data that can be processed by the control unit 39 and passes the data to the control unit 39.

PC通信部23は、制御部39からの指令に基づき、USB規格やIEEE1394規格等の通信規格を利用してパーソナルコンピュータと通信を行う機能を備える。
記憶媒体アクセス部25は、制御部39からの指令に基づきメモリカード(記憶媒体)にアクセスし、メモリカードからデータを読み込んだり、メモリカードにデータを書き込んだりする。
The PC communication unit 23 has a function of communicating with a personal computer using a communication standard such as the USB standard or the IEEE 1394 standard based on a command from the control unit 39.
The storage medium access unit 25 accesses a memory card (storage medium) based on a command from the control unit 39, reads data from the memory card, and writes data to the memory card.

記録部27は、制御部39からの指令に基づき、レーザー転写方式、インクジェット方式等の記録方式によって紙媒体に画像を記録する機能を有する。
読取部29は、制御部39からの指令に基づき、CCD等の読取機能を有する素子により、紙媒体に記録された画像を画像データとして読み取る機能を有する。
The recording unit 27 has a function of recording an image on a paper medium by a recording method such as a laser transfer method or an ink jet method based on a command from the control unit 39.
The reading unit 29 has a function of reading an image recorded on a paper medium as image data by an element having a reading function such as a CCD based on a command from the control unit 39.

データ記憶部31は、ハードディスクやフラッシュメモリ等の不揮発性の記憶媒体を有し、制御部39からの指令に基づいてデータを記憶したり読み出したりする。データ記憶部31は、文書情報を蓄積する文書テーブルと、文書情報を記憶する際に利用するフォーム情報を記憶しているフォームテーブルとを備える。この文書テーブルとフォームテーブルの詳細については後述する。   The data storage unit 31 has a nonvolatile storage medium such as a hard disk or a flash memory, and stores or reads data based on a command from the control unit 39. The data storage unit 31 includes a document table that stores document information and a form table that stores form information used when storing the document information. Details of the document table and the form table will be described later.

設定記憶部33は、使用者が操作部35等を操作することによって複合機11の動作について設定した設定情報を記憶する記憶部である。フラッシュメモリ等によって構成される。   The setting storage unit 33 is a storage unit that stores setting information set for the operation of the multifunction machine 11 by the user operating the operation unit 35 or the like. It is composed of a flash memory or the like.

操作部35は、表示部37の表示面と一体に構成されたタッチパネルと、表示部37の周辺に配置されたメカニカルなキーとから構成され、使用者が様々な指示を入力するためのものである。   The operation unit 35 includes a touch panel configured integrally with the display surface of the display unit 37 and mechanical keys arranged around the display unit 37, and is used by the user to input various instructions. is there.

表示部37は、液晶ディスプレイ、有機ELディスプレイ等から構成され、制御部39からの指令にしたがって情報を表示させる。
制御部39は、CPU,ROM,RAM,SRAM,I/O及びこれらの構成を接続するバスラインなどからなる周知のマイクロコンピュータを中心に構成されており、ROMに記憶されたプログラムに基づいて上記各部を統括的に制御して各種処理を実行する。
The display unit 37 is configured by a liquid crystal display, an organic EL display, or the like, and displays information according to a command from the control unit 39.
The control unit 39 is configured around a well-known microcomputer including a CPU, ROM, RAM, SRAM, I / O, a bus line connecting these configurations, and the like, and is based on the program stored in the ROM. Various processes are executed by comprehensively controlling each unit.

次に、図2を用い、データ記憶部31が記憶する文書テーブルについて説明する。図2は文書テーブルの一部を表形式で示した説明図であるが、文書テーブルの各レコード(文書レコード)は、文書ID,フォームID,日付時刻,入力種別ID,相手アドレス,フィールド1〜フィールド6という11の項目から構成される。   Next, the document table stored in the data storage unit 31 will be described with reference to FIG. FIG. 2 is an explanatory diagram showing a part of the document table in a tabular form. Each record (document record) of the document table includes a document ID, a form ID, a date time, an input type ID, a partner address, fields 1 to It consists of eleven items, field 6.

文書ID項目に入力される文書IDは、文書レコードを一意に特定するためのIDであり、レコード挿入時に自動生成される情報である。
フォームID項目に入力されるフォームIDは、フォームテーブルのレコードを特定するためのIDであり、文書レコード挿入時に設定される情報である。
The document ID input to the document ID item is an ID for uniquely identifying the document record, and is information that is automatically generated when the record is inserted.
The form ID input to the form ID item is an ID for specifying a record in the form table, and is information set when a document record is inserted.

日付時刻項目に入力される日付時刻は、文書レコードが挿入される際の日付と時刻の情報であり、レコード挿入時に自動生成される情報である。
入力種別ID項目に入力される入力種別IDは、文書レコードを構成する元となる入力画像の入力種別を表すIDである。具体的には、入力画像がFAX通信部17を介して入力したファクシミリ画像である場合は「FXR」というIDが割り当てられ、入力画像が読取部29を介して入力したスキャナ画像である場合は「SCN」というIDが割り当てられる。
The date / time input to the date / time item is date and time information when the document record is inserted, and is automatically generated when the record is inserted.
The input type ID input to the input type ID item is an ID representing the input type of the input image that forms the document record. Specifically, when the input image is a facsimile image input via the FAX communication unit 17, an ID “FXR” is assigned, and when the input image is a scanner image input via the reading unit 29, “ An ID “SCN” is assigned.

相手アドレス項目に入力される相手アドレスは、文書レコードを構成する元となる入力画像がFAX通信部17を介して入力したファクシミリ画像である場合の、そのファクシミリ画像の送信元アドレス(電話番号)である。なお、文書レコードを構成する元となる入力画像が読取部29を介して入力したスキャナ画像である場合には、相手アドレス項目のデータはNULLとなる。   The partner address input in the partner address field is the transmission source address (telephone number) of the facsimile image when the input image constituting the document record is a facsimile image input via the FAX communication unit 17. is there. Note that if the input image that forms the document record is a scanner image input via the reading unit 29, the data of the partner address item is NULL.

フィールド1〜フィールド6は、文書レコードに対応する入力画像に関する情報を入力するための項目である。具体的には、入力画像における特定箇所の画像データへのポインタ(パス)、または、その画像を文字認識した文字データを入力するための項目である。   Fields 1 to 6 are items for inputting information related to the input image corresponding to the document record. Specifically, it is an item for inputting a pointer (path) to image data at a specific location in the input image or character data obtained by character recognition of the image.

次に、図3に示すテーブル説明図を用い、データ記憶部31が記憶するフォームテーブルについて説明する。図3はフォームテーブルの一部を表形式で示した説明図であるが、フォームテーブルの各レコード(フォームレコード)は、フォームID,フォーム名,フィールド数,フィールド1(フィールド名,左上座標,右下座標)〜フィールド6(フィールド名,左上座標,右下座標)という21の項目から構成される。   Next, the form table stored in the data storage unit 31 will be described using the table explanatory diagram shown in FIG. FIG. 3 is an explanatory diagram showing a part of the form table in a tabular form. Each record (form record) in the form table includes a form ID, a form name, the number of fields, a field 1 (field name, upper left coordinates, right (Lower coordinates) to field 6 (field name, upper left coordinates, lower right coordinates).

フォームID項目に入力されるフォームIDは、フォームレコードを一意に特定するためのIDであり、フォームレコード挿入時に自動生成される情報である。
フォーム名項目に入力されるフォーム名は、フォームレコードによって定義されるフォームの名称である。
The form ID input to the form ID item is an ID for uniquely identifying the form record, and is information that is automatically generated when the form record is inserted.
The form name entered in the form name field is the name of the form defined by the form record.

フィールド数項目に入力されるフィールド数は、フォームレコードに定義された有効なフィールド数である。つまり、この値が「3」であれば、フォームレコードは、フィールド1(フィールド名,左上座標,右下座標)〜フィールド3(フィールド名,左上座標,右下座標)までが有効なデータであり、フィールド4〜フィールド6のデータは不定である。   The number of fields entered in the field number field is the number of valid fields defined in the form record. That is, if this value is “3”, the form record is valid data from field 1 (field name, upper left coordinate, lower right coordinate) to field 3 (field name, upper left coordinate, lower right coordinate). The data in field 4 to field 6 are indefinite.

フィールド名項目に入力されるフィールド名は、入力画像中において選択する領域(フィールド)の名称である。このフィールド名は、後述する画面表示の際に用いられる。
左上座標項目に入力される左上座標は、入力画像中における上記領域(フィールド)の左上の座標である。なお、上記領域(フィールド)は矩形であり、左上座標と後述する右下座標とによって大きさと位置が決定される。
The field name input to the field name item is the name of the area (field) to be selected in the input image. This field name is used for screen display described later.
The upper left coordinate input to the upper left coordinate item is the upper left coordinate of the region (field) in the input image. The area (field) is rectangular, and its size and position are determined by upper left coordinates and lower right coordinates described later.

右下座標項目に入力される右下座標は、入力画像中における上記領域(フィールド)の右下の座標である。
このような、フィールド名、左上座標、右下座標の3つが組になったものが、1レコードあたり6つ定義できるようになっている。また、フォームテーブルには、複合機11に入力される可能性のある文書情報に対応するフォームレコードが予め用意されていることを前提としている。
The lower right coordinate input to the lower right coordinate item is the lower right coordinate of the region (field) in the input image.
Such a combination of the field name, the upper left coordinate, and the lower right coordinate can be defined as six per record. Further, it is assumed that form records corresponding to document information that may be input to the multifunction machine 11 are prepared in advance in the form table.

[動作の説明]
次に、制御部39によって実行される文書保存処理と、その文書保存処理から呼び出されて実行されるフィールド読取処理と、これらの処理によって保存された文書情報の利用形態とを説明する。なお、通常の複合機の制御部が実行するコピー処理やスキャナ処理やファクシミリ送受信処理等については説明を省略する。
[Description of operation]
Next, a document saving process executed by the control unit 39, a field reading process called and executed from the document saving process, and a usage mode of the document information saved by these processes will be described. Note that a description of copy processing, scanner processing, facsimile transmission / reception processing, and the like executed by a control unit of a normal multifunction peripheral is omitted.

(1)文書保存処理の説明
まず、文書保存処理について図4のフローチャートを用いて説明する。この文書保存処理は、複合機11への電力供給が開始された際に制御部39にて実行が開始される処理である。
(1) Description of Document Saving Process First, the document saving process will be described with reference to the flowchart of FIG. This document storage process is a process that is started to be executed by the control unit 39 when the power supply to the multifunction machine 11 is started.

文書保存処理の実行が開始されると、まず、終了指示を検知したか否かが判断される(S110)。これは、操作部35がユーザから終了指示を受け付けたか否かによって判断される。このS110において、操作部35が終了指示を受け付けたと判断された場合は(S110:Yes)、本処理(文書保存処理)が終了される。一方、操作部35が終了指示を受け付けなかったと判断された場合は(S110:No)、S115に処理が移行される。   When the execution of the document storage process is started, it is first determined whether or not an end instruction is detected (S110). This is determined by whether or not the operation unit 35 has received an end instruction from the user. In S110, when it is determined that the operation unit 35 has received an end instruction (S110: Yes), this process (document storage process) is ended. On the other hand, when it is determined that the operation unit 35 has not received the end instruction (S110: No), the process proceeds to S115.

S115では、FAX受信機能またはスキャナ機能が起動されたか否かが判断される。なお、ここで言う「FAX受信機能」というのは、FAX通信部17およびFAX復号部21によって、PSTNに接続された他の機器から送信された画像データを受信する機能を意味する。また、「スキャナ機能」というのは、読取部29によって、紙媒体に記録された画像を画像データとして読み取る機能を意味する。   In S115, it is determined whether the FAX reception function or the scanner function is activated. The “FAX reception function” mentioned here means a function of receiving image data transmitted from another device connected to the PSTN by the FAX communication unit 17 and the FAX decoding unit 21. The “scanner function” means a function of reading an image recorded on a paper medium as image data by the reading unit 29.

このS115において、FAX受信機能またはスキャナ機能の何れかが起動されたと判断された場合は(S115:Yes)、S120に処理が移行され、FAX受信機能およびスキャナ機能の何れもが起動されなかったと判断された場合は(S115:No)、上述したS110に処理が移行される。   If it is determined in S115 that either the FAX reception function or the scanner function has been activated (S115: Yes), the process proceeds to S120, and it is determined that neither the FAX reception function nor the scanner function has been activated. If it has been performed (S115: No), the process proceeds to S110 described above.

S120では、FAX受信機能またはスキャナ機能により得た画像データの中に、フォームIDが含まれていることが認識できる否かが判定される。フォームIDが認識できると判定された場合は(S120:Yes)、S125に処理が移行され、フォームIDが認識できないと判定された場合は(S120:No)、上述したS110に処理が移行される。   In S120, it is determined whether it can be recognized that the form data is included in the image data obtained by the FAX reception function or the scanner function. If it is determined that the form ID can be recognized (S120: Yes), the process proceeds to S125. If it is determined that the form ID cannot be recognized (S120: No), the process proceeds to S110 described above. .

S125では、空の文書レコードが制御部39のRAM上に生成され、文書ID項目にユニークな連番が設定され、日付時刻項目に現在の日付時刻が設定される。
続く、S130では、FAX受信機能またはスキャナ機能により得た画像データの中に含まれるフォームIDが識別され、その識別されたフォームIDは、RAM上の文章レコードのフォームID項目に設定される。
In S125, an empty document record is generated on the RAM of the control unit 39, a unique serial number is set in the document ID item, and the current date / time is set in the date / time item.
In S130, the form ID included in the image data obtained by the FAX reception function or the scanner function is identified, and the identified form ID is set in the form ID item of the text record on the RAM.

続くS135では、複合機11にて起動された機能がスキャナ機能であるか否かが判断される。起動された機能がスキャナ機能であると判断された場合は(S135:Yes)、RAM上の文書レコードの入力種別ID項目が「SCN」に設定される。そして、S155に処理が移行される。一方、起動された機能がスキャナ機能でないと判断された場合は(S135:No)、S145に処理が移行される。   In the subsequent S135, it is determined whether or not the function activated in the multifunction machine 11 is a scanner function. When it is determined that the activated function is the scanner function (S135: Yes), the input type ID item of the document record on the RAM is set to “SCN”. Then, the process proceeds to S155. On the other hand, if it is determined that the activated function is not a scanner function (S135: No), the process proceeds to S145.

S145では、複合機11にて起動された機能がFAX受信機能であるか否かが判断される。起動された機能がFAX受信機能であると判断された場合は(S145:Yes)、RAM上の文書レコードの入力種別ID項目が「FXR」に設定される。そして、S155に処理が移行される。一方、起動された機能がFAX受信機能でないと判断された場
合は(S145:No)、上述したS110に処理が移行される。
In S145, it is determined whether or not the function activated in the multifunction machine 11 is a FAX reception function. When it is determined that the activated function is the FAX reception function (S145: Yes), the input type ID item of the document record on the RAM is set to “FXR”. Then, the process proceeds to S155. On the other hand, if it is determined that the activated function is not a FAX reception function (S145: No), the process proceeds to S110 described above.

S155では、後述するフィールド読取処理が実行される。そして、続くS160では、RAM上の文書レコードが文書テーブルに挿入されて登録される。登録がなされると、上述したS110に処理が移行される。   In S155, a field reading process to be described later is executed. In subsequent S160, the document record on the RAM is inserted into the document table and registered. When registration is performed, the process proceeds to S110 described above.

(2)フィールド読取処理の説明
次に、フィールド読取処理について図5のフローチャートを用いて説明する。このフィールド読取処理は、上述した文書保存処理のS155において呼び出され、制御部39にて実行される処理である。
(2) Description of Field Reading Process Next, the field reading process will be described with reference to the flowchart of FIG. This field reading process is a process that is called in S155 of the document storage process described above and executed by the control unit 39.

フィールド読取処理の実行が開始されると、まず、フォームテーブルから該当フォームのフォームレコードがRAMに読み込まれる(S210)。ここで言う「該当フォームのフォームレコード」というのは、上述した文書保存処理のS130において識別されたフォームIDと同一のフォームIDを有するフォームレコードを意味する。   When the execution of the field reading process is started, first, the form record of the corresponding form is read from the form table into the RAM (S210). The “form record of the corresponding form” here means a form record having the same form ID as the form ID identified in S130 of the document storage process described above.

続くS215では、S210で読み込まれたフォームレコードのフィールド数項目に定義されたフィールド数分のデータが全て処理されたか否かについて判定される。ここで言う「処理」というのは、後述するS220〜S240の処理である。このS215において、上述したフィールド数分のデータが全て処理されたと判定された場合は(S215:Yes)、本処理(フィールド読取処理)が終了され、上述したフィールド数分のデータが全て処理されたと判定されなかった場合は(S215:No)、S220に処理が移行される。   In subsequent S215, it is determined whether or not all the data corresponding to the number of fields defined in the field number item of the form record read in S210 has been processed. The “process” here is a process of S220 to S240 described later. If it is determined in S215 that all the data for the number of fields described above has been processed (S215: Yes), this processing (field reading processing) is terminated, and all the data for the number of fields described above has been processed. If not determined (S215: No), the process proceeds to S220.

S220では、S210で読み込まれたフォームレコードに定義されたフィールドのうち、まだ切り取りが行われていないフィールド(矩形領域)が、上述したFAX受信機能またはスキャナ機能により得られた画像データから切り取られる。なお、この切り取られるフィールドは、フォームレコードに定義された左上座標と右下座標とから決定され矩形状の領域である。   In S220, among the fields defined in the form record read in S210, a field (rectangular area) that has not yet been cut is cut out from the image data obtained by the above-described FAX reception function or scanner function. Note that the field to be cut out is a rectangular area determined from the upper left coordinates and the lower right coordinates defined in the form record.

続くS225では、RAM上の文書レコードの入力種別ID項目が「SCN」であるか否かが判定される。RAM上の文書レコードの入力種別ID項目が「SCN」であると判定された場合は(S225:Yes)、S230に処理が移行され、RAM上の文書レコードの入力種別ID項目が「SCN」でないと判定された場合は(S225:No)、S235に処理が移行される。   In subsequent S225, it is determined whether or not the input type ID item of the document record on the RAM is “SCN”. If it is determined that the input type ID item of the document record on the RAM is “SCN” (S225: Yes), the process proceeds to S230, and the input type ID item of the document record on the RAM is not “SCN”. Is determined (S225: No), the process proceeds to S235.

S230では、S220にて切り取られたフィールド(矩形領域)がOCR解析され、得られた文字データが、RAM上の対応する番号のフィールド項目(例えば、フィールド1等)に設定される。そして、上述したS215に処理が移行される。   In S230, the field (rectangular area) cut out in S220 is subjected to OCR analysis, and the obtained character data is set in the field item (for example, field 1) of the corresponding number on the RAM. Then, the process proceeds to S215 described above.

S235では、RAM上の文書レコードの入力種別が「FXR」であるか否かが判定される。RAM上の文書レコードの入力種別が「FXR」であると判定された場合は(S235:Yes)、S240に処理が移行され、RAM上の文書レコードの入力種別が「FXR」でないと判定された場合は(S235:No)、本処理(フィールド読取処理)が終了される。   In S235, it is determined whether or not the input type of the document record on the RAM is “FXR”. When it is determined that the input type of the document record on the RAM is “FXR” (S235: Yes), the process proceeds to S240, and it is determined that the input type of the document record on the RAM is not “FXR”. In this case (S235: No), this process (field reading process) is terminated.

S240では、S220にて切り取られたフィールド(矩形領域)がファイルとしてデータ記憶部31に記憶され、そのパスが、RAM上の対応する番号のフィールド項目(例えば、フィールド1等)に設定される。そして、上述したS215に処理が移行される。   In S240, the field (rectangular area) cut out in S220 is stored as a file in the data storage unit 31, and the path is set to the field item (for example, field 1) of the corresponding number on the RAM. Then, the process proceeds to S215 described above.

(3)保存された文書情報の利用形態の説明
次に、文書テーブルに保存された文書情報の利用形態について、「文章単位での表示画面」(図6の画面例301)および「フィールド単位での表示画面」(図7の画面例401)を用いて説明する。これらの画面は、複合機11とLANを介して接続されたパーソナルコンピュータの表示装置に表示される画面である。
(3) Description of Usage Type of Stored Document Information Next, regarding the usage mode of document information stored in the document table, “display screen in units of sentences” (screen example 301 in FIG. 6) and “in units of fields”. Will be described with reference to “display screen” (screen example 401 in FIG. 7). These screens are displayed on a display device of a personal computer connected to the multifunction machine 11 via the LAN.

まず、図6の画面例301を用い、「文書単位での表示画面」について説明する。図6の画面例301は、上部に条件選択領域303が、下部にフィールド表示領域317が設けられている。   First, the “display screen in document units” will be described using the screen example 301 of FIG. In the screen example 301 of FIG. 6, a condition selection area 303 is provided at the top and a field display area 317 is provided at the bottom.

このうち、条件選択領域303は、文書IDドロップダウンリスト305と、フォーム名ドロップダウンリスト307と、日付時刻ドロップダウンリスト309と、入力種別IDドロップダウンリスト311と、相手アドレスドロップダウンリスト313と、表示データドロップダウンリスト315とから構成される。   Among them, the condition selection area 303 includes a document ID drop-down list 305, a form name drop-down list 307, a date / time drop-down list 309, an input type ID drop-down list 311, a partner address drop-down list 313, A display data drop-down list 315 is included.

文書IDドロップダウンリスト305は、文書IDがメンバであるドロップダウンリストであり、初期状態では文書テーブルに登録されている全文書レコードの文書IDが選択可能になっている。   The document ID drop-down list 305 is a drop-down list in which the document ID is a member. In the initial state, the document IDs of all document records registered in the document table can be selected.

フォーム名ドロップダウンリスト307は、フォーム名がメンバであるドロップダウンリストであり、初期状態ではフォームテーブルに登録されている全フォームレコードのフォーム名が選択可能になっている。   The form name drop-down list 307 is a drop-down list in which the form name is a member. In the initial state, the form names of all the form records registered in the form table can be selected.

日付時刻ドロップダウンリスト309は、日付時刻がメンバであるドロップダウンリストであり、初期状態では文書テーブルに登録されている全文書レコードの日付時刻が選択可能になっている。   The date / time drop-down list 309 is a drop-down list of which the date / time is a member, and in the initial state, the date / time of all the document records registered in the document table can be selected.

入力種別IDドロップダウンリスト311は、入力種別IDがメンバであるドロップダウンリストであり、初期状態では「SCN」と「FXR」が選択可能になっている。
相手アドレスドロップダウンリスト313は、相手アドレスがメンバであるドロップダウンリストであり、初期状態では文書テーブルに登録されている全文書レコードの相手アドレスが選択可能になっている。
The input type ID drop-down list 311 is a drop-down list whose input type ID is a member, and “SCN” and “FXR” can be selected in the initial state.
The partner address drop-down list 313 is a drop-down list in which the partner address is a member. In the initial state, the partner addresses of all document records registered in the document table can be selected.

表示データドロップダウンリスト315は、表示データの種別(「画像」、「OCR」、「すべて」)がメンバであるドロップダウンリストであり、初期状態ではいずれも選択可能になっている。   The display data drop-down list 315 is a drop-down list whose members are display data types (“image”, “OCR”, “all”), and can be selected in the initial state.

これらのドロップダウンリストがユーザによって選択されると、関連するドロップダウンリストの選択可能メンバが変更され、また、各ドロップダウンリストの選択中のメンバも変更される。   When these drop-down lists are selected by the user, the selectable members of the associated drop-down list are changed, and the selected member of each drop-down list is also changed.

例えば、文書IDドロップダウンリスト305から文書IDがユーザによって選択されると、その選択された文書IDによって文書テーブルから該当する文書レコードが検索される。そして、その検索された文書レコードに含まれるフォームIDに対応するフォーム名がフォームテーブルから検索され、その検索されたフォーム名がフォーム名ドロップダウンリスト307の選択中のメンバとして表示される。また、検索された文書レコードに含まれる日付時刻が日付時刻ドロップダウンリスト309の選択中のメンバとして表示される。また、検索された文書レコードに含まれる入力種別IDが入力種別IDドロップダウンリスト311の選択中のメンバとして表示される。   For example, when a document ID is selected by the user from the document ID drop-down list 305, the corresponding document record is searched from the document table by the selected document ID. Then, the form name corresponding to the form ID included in the retrieved document record is retrieved from the form table, and the retrieved form name is displayed as a selected member of the form name drop-down list 307. In addition, the date and time included in the retrieved document record is displayed as the selected member of the date and time drop-down list 309. In addition, the input type ID included in the retrieved document record is displayed as a selected member of the input type ID drop-down list 311.

また、検索された文書レコードに含まれる相手アドレスが相手アドレスドロップダウンリスト313の選択中のメンバとして表示される。また、検索された文書レコードに含まれる入力種別IDがSCNであった場合には、表示データドロップダウンリスト315の選択中のメンバとして「OCR」が表示され、検索された文書レコードに含まれる入力種別IDがFXRであった場合には、表示データドロップダウンリスト315の選択中のメンバとして「画像」が表示される。   In addition, the partner address included in the retrieved document record is displayed as the selected member in the partner address drop-down list 313. If the input type ID included in the retrieved document record is SCN, “OCR” is displayed as the selected member in the display data drop-down list 315, and the input included in the retrieved document record. When the type ID is FXR, “image” is displayed as the selected member of the display data drop-down list 315.

一方、フィールド表示領域317には、条件選択領域303の各ドロップダウンリストで選択されているメンバを条件とし、それに合致する文書レコードの内容(フィールド1〜フィールド6)が、対応するフォームレコードに定義されたフィールド名と共に表示される。   On the other hand, in the field display area 317, the member selected from each drop-down list in the condition selection area 303 is used as a condition, and the contents (field 1 to field 6) of the corresponding document record are defined in the corresponding form record. Is displayed along with the specified field name.

具体的には例えば、文書IDドロップダウンリスト305の選択されているメンバが「00003」に変更されたとすると、その文書IDを有する文書レコードが文書テーブルから検索され、その文書レコードの有効フィールド数分(当該文書レコードのフォームIDによってフォームテーブルからフォームレコードが検索され、その検索されたフォームレコードのフィールド数項目に定義された値分)だけフィールド1から順に表示される。その際、文書レコードのフィールド1に文字データが入っている場合はその文字データに対応する文字が表示され、文書レコードのフィールド1にパスが入っている場合はそのパスによって特定される画像データがデータ記憶部31から読み出されて画像として表示される。   Specifically, for example, if the selected member of the document ID drop-down list 305 is changed to “00003”, a document record having the document ID is searched from the document table, and the number of valid fields of the document record is the same. A form record is searched from the form table according to the form ID of the document record, and only the values defined in the field number item of the searched form record are displayed in order from the field 1. At this time, if character data is contained in field 1 of the document record, characters corresponding to the character data are displayed. If field 1 is contained in field 1 of the document record, image data specified by the path is displayed. It is read from the data storage unit 31 and displayed as an image.

また、表示されるフィールド名は、当該文書レコードのフォームIDによってフォームテーブルからフォームレコードが検索され、そのフォームレコードにおいて対応するフィールド番号のフィールド名が用いられる。なお、フィールド表示領域317の表示内容は、フィールド表示領域317に存在するドロップダウンリストのうち、何れかの選択メンバが変更されたタイミングで変更される。また、条件に合致する文書レコードが複数あった場合は、その複数ある文書レコードの内容がそれぞれフィールド表示領域317に表示される。   As the field name to be displayed, the form record is searched from the form table by the form ID of the document record, and the field name corresponding to the field number in the form record is used. Note that the display content of the field display area 317 is changed when any selected member of the drop-down list existing in the field display area 317 is changed. If there are a plurality of document records that match the conditions, the contents of the plurality of document records are displayed in the field display area 317, respectively.

さらに、このようにしてフィールド表示領域317に表示された各フィールド名はユーザによって選択することができるようになっている。そして、ユーザによって何れかのフィールド名(以下、「注目フィールド名」と称す。)が選択されると、次に説明する「フィールド単位での表示画面」が表示されるようになっている。   Further, each field name displayed in the field display area 317 in this way can be selected by the user. When one of the field names (hereinafter referred to as “target field name”) is selected by the user, a “display screen in field units” described below is displayed.

次に、図7の画面例401を用い、「フィールド単位での表示画面」について説明する。図7の画面例401は、上部に条件選択領域403が、下部にフィールド表示領域411が設けられている。   Next, the “display screen in field units” will be described using the screen example 401 of FIG. In the screen example 401 of FIG. 7, a condition selection area 403 is provided at the top and a field display area 411 is provided at the bottom.

このうち、条件選択領域403は、フォーム名ドロップダウンリスト405と、フィールド名ドロップダウンリスト407と、表示順ドロップダウンリスト409とから構成される。   Among these, the condition selection area 403 includes a form name drop-down list 405, a field name drop-down list 407, and a display order drop-down list 409.

フォーム名ドロップダウンリスト405は、フォーム名がメンバであるドロップダウンリストである。なお、初期状態で選択されているフォーム名は、注目フィールド名を有するフォームレコードに定義されたフォーム名である。また、選択可能なメンバは、フォームテーブルに存在する全フォームレコードのフォーム名である。   The form name drop-down list 405 is a drop-down list whose form name is a member. Note that the form name selected in the initial state is the form name defined in the form record having the field name of interest. The selectable members are form names of all form records existing in the form table.

フィールド名ドロップダウンリスト407は、フィールド名がメンバであるドロップダウンリストである。なお、初期状態で選択されているフィールド名は、注目フィールド名である。また、選択可能なメンバは、フォーム名ドロップダウンリスト405で選択されているフォーム名に存在するフィールド名である。つまり、フォーム名ドロップダウンリスト405で選択されているフォーム名に対応するフォームレコードに含まれる全てのフィールド名のみがメンバとなっている。   The field name drop-down list 407 is a drop-down list whose field name is a member. Note that the field name selected in the initial state is the field name of interest. The selectable members are field names existing in the form name selected in the form name drop-down list 405. That is, all field names included in the form record corresponding to the form name selected in the form name drop-down list 405 are members.

表示順ドロップダウンリスト409は、表示順がメンバであるドロップダウンリストである。なお、選択可能なメンバは「文書ID(昇順)」、「文書ID(降順)」、「日付時刻(昇順)」、「日付時刻(降順)」であり、初期状態では「文書ID(昇順)」が選択された状態となっている。   The display order drop-down list 409 is a drop-down list whose display order is a member. The selectable members are “document ID (ascending order)”, “document ID (descending order)”, “date time (ascending order)”, “date time (descending order)”, and “document ID (ascending order)” in the initial state. "Is selected.

なお、これらのドロップダウンリストのうち、フォーム名ドロップダウンリスト405の選択メンバが変更されると、それに合わせてフィールド名ドロップダウンリスト407の選択可能メンバも変更される(選択されているフォーム名に対応するフォームレコードに含まれる全てのフィールド名が選択可能メンバとなる)。   Of these drop-down lists, when the selected member of the form name drop-down list 405 is changed, the selectable member of the field name drop-down list 407 is also changed accordingly (to the selected form name). All field names included in the corresponding form record are selectable members).

一方、フィールド表示領域411には、条件選択領域403の各ドロップダウンリストで選択されているメンバを条件とし、それに合致する文書レコードの内容(フィールド1〜フィールド6の何れか)が、文書IDと日付時刻と共に一覧表示される。なお、この表示順は、表示順ドロップダウンリスト409で選択されている表示順である。   On the other hand, in the field display area 411, the member selected in each drop-down list in the condition selection area 403 is used as a condition, and the content of the document record (any one of the fields 1 to 6) that matches the condition is displayed as the document ID and Listed with date and time. This display order is the display order selected in the display order drop-down list 409.

具体的には例えば、フォーム名ドロップダウンリスト405では「参加者名簿1」が選択され、フィールド名ドロップダウンリスト407では「名前」が選択され、表示順ドロップダウンリスト409では「文書ID(昇順)」が選択されている場合、文書テーブルからフォームIDが「A001(参加者名簿1のフォームID)」のレコードが全て検索され、その検索されたレコードのフィールド1(「名前」)のデータが一覧表示される。そして、その表示された名前の下に、文書IDと日付時刻とが表示される。なお、フィールド1のデータが文字データであればその文字データに対応する文字が表示され、フィールド1のデータがパスであれば、そのパスが示す画像データが画像として表示される。   Specifically, for example, “participant list 1” is selected in the form name drop-down list 405, “name” is selected in the field name drop-down list 407, and “document ID (ascending order)” is displayed in the display order drop-down list 409. "Is selected, all records having the form ID" A001 (participant list 1 form ID) "are retrieved from the document table, and the data of field 1 (" name ") of the retrieved records is listed. Is displayed. The document ID and date / time are displayed under the displayed name. If the data in the field 1 is character data, the character corresponding to the character data is displayed. If the data in the field 1 is a path, the image data indicated by the path is displayed as an image.

このように、本実施形態の複合機11では、一般的にOCR処理した際の認識率が低いファクシミリ受信機能により入力した画像データについては、フィールド毎に切り出してデータ記憶部31に(パスについては文書テーブルに)記憶する。一方、一般的にOCR処理した際の認識率が高いスキャナ機能により入力した画像データについては、フィールド毎に切り出してOCR処理し、文字データとして文書テーブルに記憶する。また、現在のOCR技術は、人間の文字認識力に比較して劣るものであるが、人間の文字認識力をもってすれば認識可能な文字情報というのは少なくない。したがって、本実施形態の複合機11によれば、文書テーブルに登録された文書情報を後からユーザが理解できないということを大幅に減らすことができる。   As described above, in the MFP 11 according to the present embodiment, image data input by a facsimile reception function generally having a low recognition rate when OCR processing is performed is cut out for each field and stored in the data storage unit 31 (for paths). (In the document table). On the other hand, in general, image data input by a scanner function having a high recognition rate when OCR processing is performed is cut out for each field, subjected to OCR processing, and stored as character data in a document table. Further, the current OCR technology is inferior to human character recognition ability, but there are not a few pieces of character information that can be recognized with human character recognition ability. Therefore, according to the multifunction machine 11 of the present embodiment, it is possible to greatly reduce that the user cannot understand the document information registered in the document table later.

また、本実施形態の複合機11では、画像データからフィールドを切り出す際の切り出し領域に関する情報がフォームレコードとしてフォームテーブルに記憶されており、フィールドを切り出す際にフォームテーブルからフォームレコードを決定し、その決定したフォームレコードに基づいてフィールドの切り出しを行うようになっている。このため、画像データ中の濃淡から切り出す領域を決定するような方式に比べ、切り出す領域を瞬時に特定することができるため、高速に処理することができる。   Further, in the multifunction machine 11 of the present embodiment, information related to a cutout area when cutting out a field from image data is stored in the form table as a form record, and the form record is determined from the form table when cutting out the field. The field is cut out based on the determined form record. For this reason, compared with the method of determining the region to be cut out from the shading in the image data, the region to be cut out can be specified instantaneously, and therefore processing can be performed at high speed.

また、本実施形態の複合機11では、画像データのまま記憶するか、OCR処理を行って文字データとして記憶するかという判断を、画像データの入力元(つまり、スキャナ機能によって入力されたか、FAX受信機能によって入力されたか)によって行うようになっている。一般的に、スキャナ機能によって入力された画像データは精細なものであり、一方、ファクシミリ受信機能によって入力された画像データは粗いものである。つまり、これらの手段によって入力された画像データは著しく文字認識率が異なる。   Further, in the multifunction machine 11 of the present embodiment, whether the image data is stored as it is or whether it is stored as character data by performing OCR processing is determined based on whether the image data is input from the input source (that is, whether it has been input by a scanner function, FAX This is done depending on whether it is input by the reception function). In general, the image data input by the scanner function is fine, whereas the image data input by the facsimile reception function is coarse. In other words, the image data input by these means has a significantly different character recognition rate.

しがって、このように著しく文字認識率が異なる画像データに対して、その画像データの入力元により上述した判断を行うようになっていれば、処理の高速化を実現しながら、実情に合致した判断を行うこととなる。   Therefore, if the above-mentioned determination is performed by the input source of the image data for the image data having such a significantly different character recognition rate, the processing speed can be increased and the actual situation can be achieved. A matching decision will be made.

[他の実施形態]
(1)上記実施形態では、ファクシミリ受信機能により入力した画像データについては画像データとして記憶し、スキャナ機能により入力した画像データについてはOCR処理を行って文字データとして記憶するようになっていたが、入力した画像データの解像度によって何れの形式で記憶するかを判断するようにしてもよい。
[Other Embodiments]
(1) In the above embodiment, the image data input by the facsimile reception function is stored as image data, and the image data input by the scanner function is subjected to OCR processing and stored as character data. Depending on the resolution of the input image data, it may be determined in which format it is stored.

例えば、入力した画像データの解像度が200dbi以上あるならばOCR処理を行って文字データとして記憶し、入力した画像データの解像度が200dpi未満であるならば画像データのまま記憶するようにしてもよい。なお、この「200dpi」という基準は、画像データ中に含まれる文字の大きさや鮮明度合い、OCR処理を行うソフトウェアの能力等によって決定すればよい。   For example, if the resolution of the input image data is 200 dbi or more, OCR processing may be performed and stored as character data. If the resolution of the input image data is less than 200 dpi, the image data may be stored as it is. The reference “200 dpi” may be determined based on the size and sharpness of characters included in the image data, the ability of software for performing OCR processing, and the like.

また、解像度の代わりに、文字の認識率に影響を及ぼす画像の特性(例えば、画像の階調、画像の圧縮アルゴリズム、画像をやりとりした際の通信モード等)を用いて判断するようになっていてもよい。具体的には例えば、他のファクシミリ装置から画像データを受信した際の通信モードが、スーパーファインモード、ファインモードの場合にはOCR処理を行って文字データとして記憶し、標準モードの場合には画像データとして記憶するようになっていてもよい。   Further, instead of the resolution, the determination is made using image characteristics (for example, image gradation, image compression algorithm, communication mode when images are exchanged, etc.) that affect the character recognition rate. May be. Specifically, for example, if the communication mode when image data is received from another facsimile apparatus is the super fine mode or the fine mode, OCR processing is performed and stored as character data. If the communication mode is the standard mode, the image data is stored. It may be stored as data.

文字認識の正否は、対象とする画像データの特性の影響を大きく受ける。したがって、上述したようになっていれば、結果的に、文字認識率の向上に貢献する。
(2)上記実施形態では、入力した画像データ単位で、画像データのままで記憶するか、OCR処理を行って文字データとして記憶するかという判断を行っていたが、切り出すフィールド毎に判断を行うようになっていてもよい。具体的な判断方法としては、予めフォームレコードにフィールド単位でフラグ(画像データのまま記憶するか、OCR処理を行って文字データとして記憶するかを表すフラグ)を設定しておき、このフラグにしたがって動作することが考えられる。また、一旦、フィールドとして切り出した画像領域をOCR処理し、所定の基準によって認識正確度を判断し、その判断結果によってOCR処理した文字データを記憶するか、画像データのまま記憶するかを判断するようにしてもよい。
The correctness of character recognition is greatly influenced by the characteristics of the target image data. Therefore, if it has become as mentioned above, it will contribute to the improvement of a character recognition rate as a result.
(2) In the above embodiment, it is determined whether the image data is stored as it is in units of input image data or is stored as character data by performing OCR processing. However, the determination is made for each field to be cut out. It may be like this. As a specific determination method, a flag (a flag indicating whether image data is stored as it is or whether it is stored as character data by performing OCR processing) is set in advance in the form record, and according to this flag It is possible to work. Also, once the image area cut out as a field is subjected to OCR processing, the recognition accuracy is determined based on a predetermined criterion, and whether the character data subjected to the OCR processing is stored or the image data is stored is determined based on the determination result. You may do it.

このようになっていれば、フィールド毎に実情に合った判断が行えるため、積極的に文字データとして記憶することができる。その結果、データのサイズという観点において、効率的に蓄積することができる(∵一般的に文字データの方が画像データよりもデータサイズが小さいため)。   If this is the case, it is possible to make a decision in accordance with the actual situation for each field, so that it can be positively stored as character data. As a result, it can be efficiently stored in terms of data size (since character data is generally smaller in data size than image data).

[特許請求の範囲との対応]
実施形態と特許請求の範囲との対応を示す。FAX通信部17およびFAX復号部21がファクシミリ手段に相当し、読取部29がスキャナ手段に相当する。そして、これらFAX通信部17,FAX復号部21,読取部29が 画像情報入力手段に相当する。
[Correspondence with Claims]
The correspondence between the embodiments and the claims is shown. The FAX communication unit 17 and the FAX decoding unit 21 correspond to a facsimile unit, and the reading unit 29 corresponds to a scanner unit. The FAX communication unit 17, the FAX decoding unit 21, and the reading unit 29 correspond to an image information input unit.

また、上述したフィールド読取処理におけるS225およびS235の処理が、判断手段としての機能に対応する。また、上述した文書保存処理におけるS160の処理が、出力手段としての機能に対応する。   In addition, the processes in S225 and S235 in the field reading process described above correspond to the function as the determination unit. Further, the processing of S160 in the document storage processing described above corresponds to a function as output means.

実施形態の複合機の概略構成を示すブロック図である。1 is a block diagram illustrating a schematic configuration of a multifunction machine according to an embodiment. 文書テーブルを説明するための説明図である。It is explanatory drawing for demonstrating a document table. フォームテーブルを説明するための説明図である。It is explanatory drawing for demonstrating a form table. 文書保存処理を説明するためのフローチャートである。It is a flowchart for demonstrating a document preservation | save process. フィールド読取処理を説明するためのフローチャートである。It is a flowchart for demonstrating a field reading process. 利用形態を説明するための画面例である。It is an example of a screen for explaining a use form. 利用形態を説明するための画面例である。It is an example of a screen for explaining a use form.

11…複合機、13…LAN通信部、15…WAN通信部、17…FAX通信部、19…FAX符号部、21…FAX復号部、23…PC通信部、25…記憶媒体アクセス部、27…記録部、29…読取部、31…データ記憶部、33…設定記憶部、35…操作部、37…表示部、39…制御部。   DESCRIPTION OF SYMBOLS 11 ... MFP, 13 ... LAN communication part, 15 ... WAN communication part, 17 ... FAX communication part, 19 ... FAX encoding part, 21 ... FAX decoding part, 23 ... PC communication part, 25 ... Storage medium access part, 27 ... Recording unit, 29 ... reading unit, 31 ... data storage unit, 33 ... setting storage unit, 35 ... operation unit, 37 ... display unit, 39 ... control unit.

Claims (2)

画像情報を入力する画像情報入力手段と、
前記画像情報入力手段が入力した前記画像情報に基づき文字認識を行って認識した文字情報を出力すべきか、前記画像情報入力手段が入力した前記画像情報を画像情報のまま出力すべきかを、文字認識率を考慮した判断基準によって判断する判断手段と、
前記判断手段の判断結果に基づいて、前記文字情報または前記画像情報を出力する出力手段と、を備え、
前記画像情報入力手段は、それぞれが独立して画像情報を入力可能な複数種類の手段である、スキャナ機能によって画像情報を入力するスキャナ手段と、ファクシミリ受信機能によって画像情報を入力するファクシミリ受信手段とから構成され、
前記判断基準は、対象とする前記画像情報を入力した前記画像情報入力手段の種類であり、
前記判断手段は、前記スキャナ手段によって入力された前記画像情報については前記文字認識を行って文字情報を出力すべきと判断し、前記ファクシミリ受信手段によって入力された前記画像情報については画像情報のまま出力すべきと判断すること、
を特徴とする情報処理装置。
Image information input means for inputting image information;
Character recognition whether character information recognized by performing character recognition based on the image information input by the image information input means should be output or whether the image information input by the image information input means should be output as image information Judgment means to judge according to the judgment criteria considering the rate,
Output means for outputting the character information or the image information based on the determination result of the determination means,
The image information input means is a plurality of kinds of means capable of independently inputting image information, a scanner means for inputting image information by a scanner function, and a facsimile receiving means for inputting image information by a facsimile reception function; Consisting of
The criterion, Ri kinds der of said image information input means inputs the image information of interest,
The determination means determines that the character information should be output by performing the character recognition for the image information input by the scanner means, and the image information input by the facsimile reception means remains as image information. Judging that it should be output,
An information processing apparatus characterized by the above.
コンピュータを、
画像情報を入力する画像情報入力ステップ、
前記画像情報入力ステップにおいて入力した前記画像情報に基づき文字認識を行って認識した文字情報を出力すべきか、前記画像情報入力ステップにおいて入力した前記画像情報を画像情報のまま出力すべきかを、文字認識率を考慮した判断基準によって判断する判断ステップ、
前記判断ステップにおける判断結果に基づいて、前記文字情報または前記画像情報を出力する出力ステップ、として機能させ、
前記画像情報入力ステップは、それぞれが独立して画像情報を入力可能な複数種類のステップである、スキャナ機能によって画像情報を入力するスキャナステップと、ファクシミリ受信機能によって画像情報を入力するファクシミリステップとから構成され、
前記判断基準は、対象とする前記画像情報を入力した前記画像情報入力ステップの種類であり、
前記判断ステップでは、前記スキャナステップにて入力された前記画像情報については前記文字認識を行って文字情報を出力すべきと判断し、前記ファクシミリステップにて入力された前記画像情報については画像情報のまま出力すべきと判断すること、
を特徴とするプログラム。
Computer
Image information input step for inputting image information,
Character recognition whether character information recognized by performing character recognition based on the image information input in the image information input step should be output or whether the image information input in the image information input step should be output as image information Judgment step to judge according to judgment criteria considering rate,
Based on the determination result in the determination step, function as an output step for outputting the character information or the image information,
The image information input step includes a plurality of steps in which image information can be input independently, a scanner step for inputting image information by a scanner function, and a facsimile step for inputting image information by a facsimile reception function. Configured,
The criterion, Ri kinds der of the image information input step that inputs the image information of interest,
In the determining step, it is determined that the image information input in the scanner step should be recognized and the character information should be output, and the image information input in the facsimile step Judging that it should be output as it is,
A program characterized by
JP2005224217A 2005-08-02 2005-08-02 Information processing apparatus and program Expired - Fee Related JP4645349B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005224217A JP4645349B2 (en) 2005-08-02 2005-08-02 Information processing apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005224217A JP4645349B2 (en) 2005-08-02 2005-08-02 Information processing apparatus and program

Publications (2)

Publication Number Publication Date
JP2007043388A JP2007043388A (en) 2007-02-15
JP4645349B2 true JP4645349B2 (en) 2011-03-09

Family

ID=37800972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005224217A Expired - Fee Related JP4645349B2 (en) 2005-08-02 2005-08-02 Information processing apparatus and program

Country Status (1)

Country Link
JP (1) JP4645349B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4848987B2 (en) * 2007-03-26 2011-12-28 日本電気株式会社 Data input support system, data input support method and program

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08204874A (en) * 1995-01-30 1996-08-09 Oki Electric Ind Co Ltd Slip processing system by facsimile equipment
JPH1055413A (en) * 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd Name card recognizing device
JPH10105654A (en) * 1996-09-30 1998-04-24 Aibitsukusu Kk Character recognition device for form
JPH10313372A (en) * 1997-05-13 1998-11-24 Sanyo Electric Co Ltd Data communication equipment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08204874A (en) * 1995-01-30 1996-08-09 Oki Electric Ind Co Ltd Slip processing system by facsimile equipment
JPH1055413A (en) * 1996-08-09 1998-02-24 Matsushita Electric Ind Co Ltd Name card recognizing device
JPH10105654A (en) * 1996-09-30 1998-04-24 Aibitsukusu Kk Character recognition device for form
JPH10313372A (en) * 1997-05-13 1998-11-24 Sanyo Electric Co Ltd Data communication equipment

Also Published As

Publication number Publication date
JP2007043388A (en) 2007-02-15

Similar Documents

Publication Publication Date Title
US20070177824A1 (en) Document management method using barcode to store access history information
US8416446B2 (en) Image forming apparatus having printing log management function and method thereof
US8045228B2 (en) Image processing apparatus
JP2008052521A (en) Electronic mail processor, electronic mail processing method and electronic mail processing program
US8370384B2 (en) Information processing apparatus, file management method, program, and storage medium
JP2007036406A (en) Image editing device
US20080043284A1 (en) Print data processing system, printer, and data processing indicating apparatus
US7929164B2 (en) Image forming apparatus accepting a print job and computer transmitting a print job
US20090150359A1 (en) Document processing apparatus and search method
JP4172478B2 (en) Document management apparatus and document management method
JP2006209261A (en) Method, apparatus, and program for displaying job of received business form
JP2006126941A (en) Image processor, image processing method, image processing control program, and storage medium
US8068241B2 (en) Data processing apparatus, method and computer program product for passing data among plural users with different processing associated with different users in the same group
JP4715413B2 (en) Document management apparatus and program
JP4645349B2 (en) Information processing apparatus and program
JP2021056722A (en) Information processing device and program
JP4281719B2 (en) File processing apparatus, file processing method, and file processing program
US20070245226A1 (en) Data processing apparatus and method
JP4682747B2 (en) Document processing apparatus, rule data generation method and program
US20090153896A1 (en) Image Forming Device, Image Forming Device Terminal, Image Forming System, and Program
US8031352B2 (en) Apparatus and method for processing received data
JP3728319B2 (en) Received document processing apparatus, received document processing method, program, and storage medium
JP2010039542A (en) Operation information management system
JP2007158858A (en) Image forming apparatus and image formation processing program
JP7271987B2 (en) Information processing device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080325

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4645349

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees