JP2016208074A - Document input system, program, and operation method for document input system - Google Patents

Document input system, program, and operation method for document input system Download PDF

Info

Publication number
JP2016208074A
JP2016208074A JP2015083200A JP2015083200A JP2016208074A JP 2016208074 A JP2016208074 A JP 2016208074A JP 2015083200 A JP2015083200 A JP 2015083200A JP 2015083200 A JP2015083200 A JP 2015083200A JP 2016208074 A JP2016208074 A JP 2016208074A
Authority
JP
Japan
Prior art keywords
document
data
image data
input
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015083200A
Other languages
Japanese (ja)
Inventor
沼 秀 一 飯
Shuichi Iinuma
沼 秀 一 飯
地 正 洋 菊
Masahiro Kikuchi
地 正 洋 菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2015083200A priority Critical patent/JP2016208074A/en
Publication of JP2016208074A publication Critical patent/JP2016208074A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a document input system, program, and operation method for the document input system capable of reducing a management cost, securing security, and making document information into electronic data.SOLUTION: A document input system includes: a host side sub-system that includes a control device and at least one input device; and a client side sub-system that includes an image processing device, a terminal device, and a storage device and is connected to the host side sub-system through a communication channel. The control device comprises a program transmission unit for transmitting a previously created and stored image division program to the terminal device in order to divide image data. The terminal device comprises: a data reception unit for receiving character input data transmitted from the control device; an image data processing unit for dividing document image data into a plurality of divided pieces of image data; and a data transmission unit for transmitting the divided pieces of image data to the control device.SELECTED DRAWING: Figure 1

Description

本発明は、書類入力システム、プログラム及び書類入力システムの運用方法に関し、特にセキュリティを確保しつつ書類情報を電子データ化する書類入力システム、プログラム及びその運用方法に関する。   The present invention relates to a document input system, a program, and an operation method of the document input system, and more particularly, to a document input system, a program, and an operation method thereof for converting document information into electronic data while ensuring security.

名刺、はがきや手書きの各種申込書など、氏名や住所などの個人情報が記載された書類から必要な情報を取り出し、活用するために文字データとして電子データ化することが一般に行われている。取り扱う書類が少数の場合は、個別にパーソナルコンピュータ等に入力してもよいが、営業部門などのように多量の顧客書類を取り扱う部署では、個別の取り扱いでは処理しきれないことも起こりうる。
そこで、電子データ化する書類を一括で受け入れて、書類に書かれた必要な文字情報をデータとして入力し、一連のデータファイルとして納入するデータ入力代行が事業として確立され、広く活用されている。
It is common practice to extract necessary information from documents containing personal information such as name and address, such as business cards, postcards, and handwritten application forms, and convert them into electronic data as character data for use. When a small number of documents are handled, they may be individually input to a personal computer or the like, but a department handling a large amount of customer documents such as a sales department may not be able to handle the individual handling.
Therefore, a data input agency that accepts documents to be converted into electronic data at once, inputs necessary character information written on the documents as data, and delivers them as a series of data files has been established as a business and is widely used.

一般的に電子データ化する基の書類はスキャナーによってスキャンされ、画像データとしてデータ入力代行者に支給され、画像データを基にオペレータが文字入力することによって電子データ化が行われる。しかしながら個人情報が第3者であるオペレータに開示されることから個人情報漏えいのリスクが否めない。
そこで文字データ入力におけるセキュリティを確保する方法として特許第5312701号にはスキャンされた画像データを受信後、いくつかのピースに分解し、全体画像が見えない形で入力オペレータに配信することでセキュリティを確保する名刺管理方法が開示されている。
Generally, a document to be converted into electronic data is scanned by a scanner, supplied to a data input agent as image data, and converted into electronic data by an operator inputting characters based on the image data. However, since personal information is disclosed to an operator who is a third party, the risk of leakage of personal information cannot be denied.
Therefore, as a method for ensuring security in character data input, Japanese Patent No. 5312701 receives scanned image data, disassembles it into several pieces, and distributes it to the input operator so that the entire image cannot be seen. A business card management method to be secured is disclosed.

これによりオペレータのレベルでの情報漏えいのリスクは大幅に低減するものの、基の書類の画像データがデータ入力代行者に提供され、文字入力されて電子データ化された情報は、完成データとしてまとまったものを依頼元に納入するために、個人情報漏えいのリスクが十分に排除されたとは言い切れない。
個人情報の漏えいはしばしば社会問題となり、企業イメージの大幅な低下につながることから更なるセキュリティの向上が求められる。
This greatly reduces the risk of information leakage at the operator level, but the image data of the original document is provided to the data input agent, and the information that has been input into characters and converted into electronic data is collected as completed data. It cannot be said that the risk of leakage of personal information has been sufficiently eliminated in order to deliver goods to the client.
Leakage of personal information often becomes a social problem and leads to a significant deterioration of the corporate image, so further security improvement is required.

今日、情報を分割してオペレーターレベルの情報漏えいを防止する技術は広く普及し、データ入力代行は同業他社とは差別化しにくい状況となっている。一方で情報漏えいのリスクは低減したものの、基の書類の画像データを入手するためにセキュリティ管理は必要であり、そのための管理コストがかかり、データ入力代行の受注コスト低減の障害になっている。このため情報のセキュリティを確保した上で他社と差別化が図れる書類情報の電子データ化手法が求められている。   Today, technology to divide information and prevent information leakage at the operator level has become widespread, and data entry agency is difficult to differentiate from other companies in the same industry. On the other hand, although the risk of information leakage has been reduced, security management is necessary to obtain the image data of the original document, which incurs management costs, and is an obstacle to reducing the order costs for data input agency. For this reason, there is a need for an electronic data processing method for document information that can be differentiated from other companies while ensuring information security.

本発明は、上記従来の書類入力システムにおける問題点に鑑みてなされたものであって、本発明の目的は、管理コストを低減でき、セキュリティを確保しつつ書類情報を電子データ化する書類入力システム、プログラム及び書類入力システムの運用方法を提供することにある。   The present invention has been made in view of the above problems in the conventional document input system, and an object of the present invention is to reduce the management cost and to convert document information into electronic data while ensuring security. Another object of the present invention is to provide a method for operating a program and a document input system.

上記目的を達成するためになされた本発明による書類入力システムは、制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、画像処理装置と、端末装置と記憶装置と、を含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有し、前記制御装置は、画像データを分割するために予め作成され保存された画像分割プログラムを前記端末装置に送信するプログラム送信部と、前記端末装置から送信された分割画像データまたは前記入力装置から送信された文字入力データを受信するデータ受信部と、前記分割画像データを前記入力装置に送信又は、前記文字入力データを前記端末装置に送信するデータ送信部と、受信した前記分割画像データに対応する前記文字入力データの管理と前記ホスト側サブシステム制御のための制御部とを備え、前記入力装置は、前記制御装置から送信された分割画像データを受信する分割画像データ受信部と、前記分割画像データを表示する分割画像データ表示部と、前記分割画像データに対応する文字を入力する文字入力部と文字入力データを前記制御装置に送信する文字入力データ送信部とを備え、前記画像処理装置は、書類をスキャンまたは撮影して書類画像データを作成する画像処理部と、前記書類画像データを送信する書類画像データ送信部を備え、前記端末装置は、前記画像処理装置から送信された書類画像データまたは前記制御装置から送信された前記文字入力データを受信するデータ受信部と、前記制御装置から送信された画像分割プログラムを受信するプログラム受信部と、前記画像分割プログラムに従い、前記書類画像データの文字認識の結果から抽出されたキーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断する判断部と、前記書類データリスト中にすべての前記キーワードが一致する書類データがない場合に前記書類画像データを複数の分割画像データに分割する画像データ処理部と、前記分割画像データを前記制御装置に送信するデータ送信部と、前記書類画像データに対応して前記文字入力データから書類構成データを生成するデータ構成部とを備え、前記画像分割プログラムは所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように構成されることを特徴とする。   In order to achieve the above object, a document input system according to the present invention includes a control device, a host-side subsystem including at least one input device, an image processing device, a terminal device, and a storage device. A client-side subsystem connected to the host-side subsystem through a communication line, and the control device transmits an image division program created and stored in advance to divide image data to the terminal device A transmission unit; a data reception unit that receives the divided image data transmitted from the terminal device or the character input data transmitted from the input device; and the divided image data transmitted to the input device or the character input data Data transmission unit for transmitting to the terminal device, and management of the character input data corresponding to the received divided image data A control unit for controlling the host-side subsystem, wherein the input device receives a divided image data reception unit that receives the divided image data transmitted from the control device, and divided image data that displays the divided image data A display unit; a character input unit that inputs characters corresponding to the divided image data; and a character input data transmission unit that transmits character input data to the control device. The image processing device scans or captures a document. An image processing unit for generating document image data, and a document image data transmission unit for transmitting the document image data. The terminal device is transmitted from the document image data transmitted from the image processing device or the control device. A data receiving unit that receives the character input data, and a program receiving unit that receives the image segmentation program transmitted from the control device Judgment to determine whether or not document data in which all the keywords extracted from the result of character recognition of the document image data match are in the document data list created in advance and stored in the storage device according to the image segmentation program An image data processing unit that divides the document image data into a plurality of divided image data when there is no document data that matches all the keywords in the document data list, and the divided image data is sent to the control device. A data transmission unit for transmitting, and a data configuration unit for generating document configuration data from the character input data corresponding to the document image data, and the image segmentation program at least performs image segmentation when a predetermined condition is satisfied Is configured to stop a subprogram including

前記書類画像データの文字認識の結果から抽出された前記キーワードが、予め前記書類に付与された固有のID番号とレビジョン番号を含むことが好ましい。
前記画像分割プログラムが少なくとも画像分割を含むサブプログラムを停止するのは前記端末装置が前記制御装置から送信された作業完了フラグを受信することによってなされることが好ましい。
It is preferable that the keyword extracted from the result of character recognition of the document image data includes a unique ID number and a revision number assigned to the document in advance.
It is preferable that the image division program stops the subprogram including at least image division when the terminal device receives a work completion flag transmitted from the control device.

上記目的を達成するためになされた本発明によるプログラムは、制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、画像処理装置と、端末装置と、記憶装置とを含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有する書類入力システムにおいて、前記制御装置より前記端末装置に送信され、前記端末装置にて実行されるプログラムであって、前記端末装置が、前記画像処理装置によって書類をスキャンまたは撮影することによって得られ前記画像処理装置から受信した書類画像データから、文字を認識してキーワードとして抽出し、前記キーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断し、前記書類データリスト中にすべての前記キーワードが一致する書類データがない場合に前記書類画像データを複数の分割画像データに分割し、前記複数の分割画像データを前記制御装置に送信するように制御し、前記端末装置が、前記分割画像データを基に生成され前記制御装置から送信された文字入力データを受信すると、前記書類画像データに対応して前記文字入力データから書類構成データを生成するように制御し、所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように制御することを特徴とする。   A program according to the present invention made to achieve the above object includes a host side subsystem including a control device, at least one input device, an image processing device, a terminal device, and a storage device, and the host In a document input system having a client side subsystem connected to a side subsystem through a communication line, a program transmitted from the control device to the terminal device and executed by the terminal device, the terminal device comprising: From the document image data obtained by scanning or photographing the document by the image processing apparatus and received from the image processing apparatus, characters are recognized and extracted as keywords, and document data in which all the keywords match is created in advance. Determine if it is in the document data list stored in the storage device When there is no document data that matches all the keywords in the document data list, the document image data is divided into a plurality of divided image data, and the plurality of divided image data is transmitted to the control device. When the terminal device receives the character input data generated based on the divided image data and transmitted from the control device, the terminal device generates document configuration data from the character input data corresponding to the document image data. And, when a predetermined condition is satisfied, control is performed such that at least a subprogram including image division is stopped.

前記書類画像データから文字を認識して抽出された前記キーワードが、予め前記書類に付与された固有のID番号とレビジョン番号を含むことが好ましい。
前記所定の条件は前記端末装置が前記制御装置から送信された作業完了フラグを受信することであることが好ましい。
It is preferable that the keyword extracted by recognizing characters from the document image data includes a unique ID number and a revision number previously assigned to the document.
The predetermined condition is preferably that the terminal device receives a work completion flag transmitted from the control device.

上記目的を達成するためになされた本発明による書類入力システムの運用方法は、制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、画像処理装置と、端末装置と、記憶装置とを含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有する書類入力システムにおける書類入力方法であって、前記画像処理装置が、書類をスキャンまたは撮影して書類画像データを作成するステップと、前記端末装置が前記画像処理装置から前記書類画像データを受信して、書類識別番号を付加して前記記憶装置に保存するステップと、前記端末装置が、予め作成され保存された画像分割プログラムを前記制御装置から受信するステップと、前記端末装置が前記画像分割プログラムを実行し、該画像分割プログラムに従い、前記書類画像データを読み出し、書類画像データから文字を認識してキーワードとして抽出し、前記キーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断するステップと、前記画像分割プログラムに従い、前記書類データリスト中にすべての前記キーワードが一致する書類データがある場合は、前記書類画像データは削除するステップと、すべての前記キーワードが一致する書類データがない場合は、前記書類画像データを複数の分割画像データに分割し、前記複数の分割画像データを前記制御装置に送信するステップと、前記制御装置が、前記複数の分割画像データを受信し、少なくとも1つの入力装置に前記分割画像データを配信するステップと、前記入力装置により前記複数の分割画像データを基に、オペレータによって入力された文字データにしたがい電子化された文字入力データを生成するステップと、前記制御装置が、前記文字入力データを前記入力装置より受信して、前記端末装置に送信するステップと、前記端末装置が前記画像分割プログラムに従い、受信した前記文字入力データを基に、前記書類画像データに対応して前記文字入力データから書類構成データを生成するステップと、を有し、前記画像分割プログラムは所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように構成されることを特徴とする。   In order to achieve the above object, a method for operating a document input system according to the present invention includes a control device, a host-side subsystem including at least one input device, an image processing device, a terminal device, and a storage device. A document input method in a document input system having a client side subsystem connected to the host side subsystem through a communication line, wherein the image processing device scans or shoots the document to obtain the document image data. A step of creating, a step of receiving the document image data from the image processing device, adding a document identification number to the terminal device and storing the document device in the storage device, and a step of creating and storing the terminal device in advance. Receiving an image segmentation program from the control device; and the terminal device executing the image segmentation program; In accordance with an image division program, the document image data is read out, characters are recognized from the document image data and extracted as keywords, and document data in which all the keywords match are created in advance in a document data list stored in the storage device. Determining whether or not there is document data that matches all the keywords in the document data list according to the image dividing program, deleting the document image data, and determining that all the keywords are If there is no matching document data, the document image data is divided into a plurality of divided image data, and the plurality of divided image data are transmitted to the control device; and the control device includes the plurality of divided image data. And the divided image data is distributed to at least one input device. A step of generating digitized character input data according to character data input by an operator based on the plurality of divided image data by the input device, and the control device converts the character input data to Receiving from the input device and transmitting to the terminal device, and based on the character input data received by the terminal device according to the image segmentation program, from the character input data corresponding to the document image data Generating document configuration data, and the image division program is configured to stop a subprogram including at least image division when a predetermined condition is satisfied.

前記書類画像データから文字を認識して抽出された前記キーワードが予め前記書類に付与された固有のID番号とレビジョン番号を含むことが好ましい。
前記所定の条件は前記端末装置が前記制御装置から送信された作業完了フラグを受信することであることが好ましい。
Preferably, the keyword extracted by recognizing characters from the document image data includes a unique ID number and revision number previously assigned to the document.
The predetermined condition is preferably that the terminal device receives a work completion flag transmitted from the control device.

本発明に係る書類入力システム及びその運用方法によれば、データ入力代行を発注するクライアント側で画像データを分割してからデータ入力代行者に支給するため、基の書類画像データはクライアント側にとどめることができ、データ入力代行者側ではセキュリティ管理を行う必要がなく、そのための管理コストも低減できるという効果がある。
また画像分割の技術ノーハウを有するデータ入力代行者側から、画像分割のプログラムが支給されるため、クライアント側では容易に画像分割を行うことができるという効果がある。
さらに、クライアント側に支給される画像分割のプログラムには有効期限があり、例えば入力文字データの納入や作業完了フラグの受信をもってその機能を停止することができるため、クライアントによる転用により、作成元であるデータ入力代行者の画像分割の技術ノーハウの流出もしくは同業他社への転注を防止することができるという効果がある。
According to the document input system and its operation method according to the present invention, since the image data is divided on the client side who orders the data input agent and then supplied to the data input agent, the original document image data is kept on the client side. Therefore, there is no need to perform security management on the data input agent side, and there is an effect that the management cost can be reduced.
In addition, since an image division program is provided from the data input agent side having the image division technique know-how, there is an effect that the image can be easily divided on the client side.
Furthermore, the image segmentation program provided to the client side has an expiration date. For example, the function can be stopped by receiving the input character data or receiving the work completion flag. There is an effect that it is possible to prevent a data input agent from leaking image know-how and transferring it to other companies in the same industry.

本発明の実施形態による書類入力システムの構成を示す図である。It is a figure which shows the structure of the document input system by embodiment of this invention. 本発明の実施形態によるホスト側サブシステムの構成を示す図である。It is a figure which shows the structure of the host side subsystem by embodiment of this invention. 本発明の実施形態によるクライアント側サブシステムの構成を示す図である。It is a figure which shows the structure of the client side subsystem by embodiment of this invention. 本発明の実施形態によるホスト側サブシステムの処理を説明するためのフロー図である。It is a flowchart for demonstrating the process of the host side subsystem by embodiment of this invention. 本発明の実施形態によるクライアント側サブシステムの処理を説明するためのフロー図である。It is a flowchart for demonstrating the process of the client side subsystem by embodiment of this invention. 本発明の実施形態による分割画像データを作成する処理を説明するためのフロー図である。It is a flowchart for demonstrating the process which produces the divided image data by embodiment of this invention. 本発明の実施形態による画像分割プログラムの構成を示す図である。It is a figure which shows the structure of the image division program by embodiment of this invention. 本発明の実施形態による分割画像を例示的に示す図である。It is a figure which shows the division | segmentation image by embodiment of this invention exemplarily.

次に、本発明に係る液晶表示装置を実施するための形態の具体例を図面を参照しながら説明する。
図1は本発明の実施形態による書類入力システムの構成を示す図である。図1を参照すると書類入力システム10は、通信回線40で接続されたホスト側サブシステム20及びクライアント側サブシステム30を含む。
ホスト側サブシステム20は制御装置100とホスト内通信回線で制御装置100に接続された複数の入力装置200を含む。一方クライアント側サブシステム30は、端末装置300と、クライアント内通信回線で端末装置300に接続された記憶装置400及び画像処理装置500とを含む。
ホスト内通信回線及びクライアント内通信回線は有線LANのような有線のネットワークでもよいし、無線LANのような無線のネットワークでもよい。
Next, a specific example of a mode for carrying out the liquid crystal display device according to the present invention will be described with reference to the drawings.
FIG. 1 is a diagram showing a configuration of a document input system according to an embodiment of the present invention. Referring to FIG. 1, the document input system 10 includes a host side subsystem 20 and a client side subsystem 30 connected by a communication line 40.
The host side subsystem 20 includes a control device 100 and a plurality of input devices 200 connected to the control device 100 via an intra-host communication line. On the other hand, the client side subsystem 30 includes a terminal device 300, a storage device 400 and an image processing device 500 connected to the terminal device 300 via an intra-client communication line.
The intra-host communication line and the intra-client communication line may be a wired network such as a wired LAN or a wireless network such as a wireless LAN.

図2は本発明の実施形態によるホスト側サブシステムの構成を示す図である。図2を参照すると、制御装置100は制御部110、プログラム送信部120、データ受信部130、データ送信部140、記憶部150を含む。
制御部110は、ホスト側サブシステム20を制御するほか、クライアントの端末装置300から受信する書類の分割画像データと、この分割画像データに基づいて入力装置200で入力され、入力装置200から送信された文字入力データとを対応させて管理する。分割画像データと文字入力データとは記憶部150に一時保存して管理を行う。
FIG. 2 is a diagram showing the configuration of the host-side subsystem according to the embodiment of the present invention. Referring to FIG. 2, the control device 100 includes a control unit 110, a program transmission unit 120, a data reception unit 130, a data transmission unit 140, and a storage unit 150.
In addition to controlling the host-side subsystem 20, the control unit 110 receives the divided image data of the document received from the client terminal device 300, the input device 200 based on the divided image data, and the input device 200 transmits the divided image data. The character input data is managed correspondingly. The divided image data and the character input data are temporarily stored in the storage unit 150 for management.

プログラム送信部120は、書類をスキャン又は撮影して得られる書類画像データから複数の分割画像データを生成するように構成されて事前に記憶部150に保存された画像分割プログラムを、制御部110の指示にしたがい通信回線40を使って端末装置300に送信する。尚、ここで画像分割プログラムは制御装置100内の記憶部150に保存されたものとしたが、図2には示さない別の記憶装置に予め保存しておき、制御部110がホスト内通信回線を使って読出し、プログラム送信部120から送信するようにしてもよい。   The program transmission unit 120 is configured to generate a plurality of divided image data from document image data obtained by scanning or photographing a document, and stores an image division program stored in the storage unit 150 in advance in the control unit 110. According to the instruction, the data is transmitted to the terminal device 300 using the communication line 40. Here, the image division program is stored in the storage unit 150 in the control device 100. However, the image division program is stored in advance in another storage device not shown in FIG. And may be transmitted from the program transmission unit 120.

データ受信部130は、端末装置300によって作成され、通信回線40を使って送信された分割画像データを受信する。またデータ受信部130は、分割画像データに基づき入力装置200で入力されホスト内通信回線を使って送信された文字入力データを受信する。
データ送信部140は、端末装置300から受信した分割画像データを、制御部110の制御にしたがいホスト内通信回線を使って入力装置200に送信する。入力装置200が複数ある場合は、制御部110の指示する送信先に制御部110の指示する分割画像データを送信する。このとき分割画像データの送信先は、特定の入力装置でもよいし、複数の入力装置に分散するように指定してもよい。
またデータ送信部140は、制御部110の指示にしたがい入力装置200から受信して記憶部150に保存された文字入力データを通信回線40を使って端末装置300に送信する。さらに端末装置300から受信した分割画像データに対応する文字入力データをすべて端末装置300に送信した後、作業完了フラグを通信回線40を使って端末装置300に送信してもよい。
The data receiving unit 130 receives the divided image data created by the terminal device 300 and transmitted using the communication line 40. The data receiving unit 130 receives character input data that is input from the input device 200 based on the divided image data and transmitted using the intra-host communication line.
The data transmission unit 140 transmits the divided image data received from the terminal device 300 to the input device 200 using the intra-host communication line under the control of the control unit 110. When there are a plurality of input devices 200, the divided image data instructed by the control unit 110 is transmitted to the transmission destination instructed by the control unit 110. At this time, the transmission destination of the divided image data may be a specific input device or may be specified to be distributed to a plurality of input devices.
Further, the data transmission unit 140 transmits the character input data received from the input device 200 and stored in the storage unit 150 according to the instruction of the control unit 110 to the terminal device 300 using the communication line 40. Furthermore, after all the character input data corresponding to the divided image data received from the terminal device 300 is transmitted to the terminal device 300, the work completion flag may be transmitted to the terminal device 300 using the communication line 40.

図2を参照すると、入力装置200は、分割画像データ受信部210、分割画像データ表示部220、文字入力部230、文字入力データ送信部240を含む。
分割画像データ受信部210は、制御装置100によって送信された分割画像データを受信する。分割画像データは図示していない入力装置200の記憶部に一時的に保存してもよい。
Referring to FIG. 2, the input device 200 includes a divided image data receiving unit 210, a divided image data display unit 220, a character input unit 230, and a character input data transmission unit 240.
The divided image data receiving unit 210 receives the divided image data transmitted by the control device 100. The divided image data may be temporarily stored in a storage unit of the input device 200 (not shown).

分割画像データ表示部220は、受信した分割画像データを入力装置200のオペレータが識別できるように画像として表示する。具体的には液晶ディスプレイや有機ELディスプレイなどの各種ディスプレイ装置により具現化される。
文字入力部230は、画像として表示された分割画像データに基づきオペレータが文字データを入力するのに使用する。具体的にはキーボードやマウスによって具現化される。文字入力部230は、オペレータによって入力された文字データにしたがい電子化された文字入力データを生成する。
文字入力データ送信部240は、生成された文字入力データをホスト内通信回線を使って制御装置100に送信する。
The divided image data display unit 220 displays the received divided image data as an image so that the operator of the input device 200 can identify it. Specifically, it is embodied by various display devices such as a liquid crystal display and an organic EL display.
The character input unit 230 is used by an operator to input character data based on the divided image data displayed as an image. Specifically, it is embodied by a keyboard or a mouse. The character input unit 230 generates digitized character input data in accordance with the character data input by the operator.
The character input data transmission unit 240 transmits the generated character input data to the control device 100 using the intra-host communication line.

図3は本発明の実施形態によるクライアント側サブシステムの構成を示す図である。図3を参照すると、端末装置300は、プログラム受信部310、データ受信部320、データ送信部330、判断部340、画像データ処理部350、データ構成部360、制御部370、及び記憶部380を含む。
プログラム受信部310は、ホスト側サブシステム20の制御装置100から通信回線40を使って送信された画像分割プログラムを受信する。
FIG. 3 is a diagram showing the configuration of the client side subsystem according to the embodiment of the present invention. Referring to FIG. 3, the terminal device 300 includes a program reception unit 310, a data reception unit 320, a data transmission unit 330, a determination unit 340, an image data processing unit 350, a data configuration unit 360, a control unit 370, and a storage unit 380. Including.
The program receiving unit 310 receives an image segmentation program transmitted from the control device 100 of the host side subsystem 20 using the communication line 40.

データ受信部320は、画像処理装置500で作成されクライアント内通信回線を使って送信された書類画像データを受信する。またデータ受信部320は、ホスト側サブシステム20の制御装置100から通信回線40を使って送信された文字入力データを受信する。
さらに制御装置100から送信される作業完了フラグを受信してもよい。
判断部340は、画像分割プログラムの実行により、データ受信部320で受信した書類画像データに対して画像データ処理部350にて文字認識を行った結果抽出されたキーワードが、すべて一致する書類データが、予め作成され記憶装置400に保存された書類データリスト中にあるかどうかを判断する。
The data receiving unit 320 receives document image data generated by the image processing apparatus 500 and transmitted using the intra-client communication line. The data receiving unit 320 receives character input data transmitted from the control device 100 of the host side subsystem 20 using the communication line 40.
Further, a work completion flag transmitted from the control device 100 may be received.
The determination unit 340 executes the image division program, and the document data whose keywords extracted as a result of the character recognition performed by the image data processing unit 350 on the document image data received by the data receiving unit 320 are all matched. It is determined whether or not the document data list is created in advance and stored in the storage device 400.

画像データ処理部350は、画像分割プログラムの実行により、データ受信部320で受信した書類画像データに対して文字認識を行い、認識した文字の中から少なくとも一つのキーワードを抽出する。また画像データ処理部350は、判断部340にて抽出したキーワードがすべて一致する書類データが、予め作成され記憶装置400に保存された書類データリスト中にないと判断された場合に、画像分割プログラムの実行により、書類画像データを複数の分割画像データに分割する。さらに、複数の分割画像データにそれぞれの分割画像データが識別できる番号を付して、抽出したキーワードを含め一連のデータとして記憶部380に保存する。
キーワードは認識された文字から任意に設定でき、名前や住所などでもよいし、予め書類に印字されたID番号やレビジョン番号でもよい。またキーワードは基の書類に対して一つでも複数でも設定できる。
The image data processing unit 350 performs character recognition on the document image data received by the data receiving unit 320 by executing the image division program, and extracts at least one keyword from the recognized characters. The image data processing unit 350 also determines that the document data that matches all the keywords extracted by the determination unit 340 is not in the document data list created in advance and stored in the storage device 400. As a result, the document image data is divided into a plurality of divided image data. Further, a number for identifying each divided image data is assigned to the plurality of divided image data, and the extracted data including the extracted keyword is stored in the storage unit 380 as a series of data.
The keyword can be arbitrarily set from recognized characters, and may be a name or address, or may be an ID number or a revision number printed on a document in advance. One or more keywords can be set for the original document.

データ送信部330は、制御部370の指示にしたがって、画像データ処理部350にて分割され作成された一連の分割画像データの一部または全部を通信回線40を使ってホスト側サブシステム20の制御装置100に送信する。
データ構成部360は、画像分割データに対応して作成された文字入力データを、画像分割データの基になる書類画像データに対応して、必要項目を配置した書類構成データを生成する。書類構成データは基になる書類の記載項目の内、電子化が必要な部分に対応する文字入力データを集約した一覧表形式のデータである。
The data transmission unit 330 controls the host-side subsystem 20 by using the communication line 40 for part or all of a series of divided image data divided and created by the image data processing unit 350 in accordance with an instruction from the control unit 370. Transmit to device 100.
The data configuration unit 360 generates document configuration data in which necessary items are arranged corresponding to the document image data that is the basis of the image segmentation data, based on the character input data created corresponding to the image segmentation data. The document structure data is data in a list form in which character input data corresponding to a part that needs to be digitized is included in the description items of the base document.

制御部370は画像分割プログラムを実行し、各構成要素が連携して適切に動作するように制御するとともに、所定の条件を満たした場合は少なくとも画像分割を含むサブプログラムを停止するように制御を行う。一実施形態では所定の条件は、制御装置100から作業完了フラグを受信することによって満たされる。
制御部370は、データ構成部360にて生成された書類構成データを、基になる書類画像データから抽出し記憶部380に保存されたキーワードと関連付けして書類データとして記憶装置400に保存する。制御部370は、記憶装置400に保存する書類データのキーワード検索がしやすいように書類データリストとして一覧表にまとめたファイルを作成し、新しい書類データを保存するたびに、書類データリストに追加して更新するように管理する。
The control unit 370 executes an image segmentation program and controls each component to operate properly in cooperation with each other. When a predetermined condition is satisfied, the control unit 370 performs control to stop at least a subprogram including image segmentation. Do. In one embodiment, the predetermined condition is satisfied by receiving a work completion flag from the control device 100.
The control unit 370 extracts the document configuration data generated by the data configuration unit 360 from the original document image data, associates it with the keyword stored in the storage unit 380, and stores it in the storage device 400 as document data. The control unit 370 creates a file summarized in a list as a document data list so that the keyword search of the document data stored in the storage device 400 can be easily performed, and each time new document data is stored, it is added to the document data list. Manage to update.

また図3を参照すると画像処理装置500は画像処理部510及び書類画像データ送信部520を含む。
画像処理部510は文字データ化する基の書類のスキャン又は撮影を行い、書類画像データを作成する。書類画像データは一つの画像データであって、書類に記載された文字も画像データの一部として含まれる。
書類画像データ送信部520は、クライアント内通信回線を用いて作成した書類画像データを端末装置300に送信する。
3, the image processing apparatus 500 includes an image processing unit 510 and a document image data transmission unit 520.
The image processing unit 510 scans or captures a document to be converted into character data, and creates document image data. The document image data is one piece of image data, and characters written on the document are included as part of the image data.
The document image data transmission unit 520 transmits the document image data created using the intra-client communication line to the terminal device 300.

図4は本発明の実施形態によるホスト側サブシステムの処理を説明するためのフロー図である。図4を参照すると、ステップS101にてホスト側サブシステム20の制御装置100が画像分割プログラムをクライアント側サブシステム30の端末装置300に送信する。画像分割プログラムは、書類をスキャンまたは撮影して作成した書類画像データに対して文字認識を行い、認識された文字データの中から一又は複数の所定のキーワードを抽出し、予め作成された書類データのキーワードと比較して、抽出したキーワードとすべて一致するキーワードを有する書類データがない場合に、書類画像データを所定の分割画像データに分割するように構成され、予めホスト側サブシステム20の記憶部150に保存しておく。   FIG. 4 is a flowchart for explaining the processing of the host-side subsystem according to the embodiment of the present invention. Referring to FIG. 4, the control device 100 of the host side subsystem 20 transmits the image division program to the terminal device 300 of the client side subsystem 30 in step S101. The image segmentation program performs character recognition on document image data created by scanning or photographing a document, extracts one or a plurality of predetermined keywords from the recognized character data, and pre-created document data The document image data is divided into predetermined divided image data when there is no document data having a keyword that matches all of the extracted keywords as compared with the keywords in FIG. Save to 150.

ステップS102にて制御装置100は端末装置300からの分割画像データの受信を待つように待機する。分割画像データを受信すると、制御装置100はステップS103にて受信した分割画像データを複数の入力装置に分散して送信する。このとき制御装置100は分割画像データの内容に応じて入力装置を適宜選定する。分割画像データはランダムに複数の入力装置に割り振ってもよいし、例えば名前、住所など項目ごとに入力装置を固定的に割り当て、該当する分割画像データを割り振るように送信してもよい。または文字入力データの信頼性を確保するために同じ分割画像データを複数の入力装置に送信し、後のステップで入力された文字入力データが入力装置間で相違がないことを確認して確定するようにしてもよい。分割画像データの内容が少なければ、分散させずに一つの入力装置に絞って送信してもよい。   In step S102, the control device 100 waits to wait for reception of the divided image data from the terminal device 300. When the divided image data is received, the control device 100 distributes the divided image data received in step S103 to a plurality of input devices and transmits the divided image data. At this time, the control device 100 appropriately selects an input device according to the content of the divided image data. The divided image data may be randomly allocated to a plurality of input devices, or may be transmitted so that the input device is fixedly assigned to each item such as a name and an address, and the corresponding divided image data is allocated. Alternatively, in order to ensure the reliability of the character input data, the same divided image data is transmitted to a plurality of input devices, and the character input data input in the subsequent step is confirmed and confirmed between the input devices. You may do it. If the content of the divided image data is small, it may be transmitted by narrowing down to one input device without being distributed.

ステップS104で分割画像データを基に、オペレータが入力装置毎にデータ入力を行う。入力した文字入力データは基の分割画像データと関連付けして入力装置200の記憶部(図2には図示せず)に一時的に保存してもよい。
分割画像データに対する文字入力が終了すると、ステップS105で各入力装置200は文字入力データを制御装置100に送信する。
In step S104, the operator inputs data for each input device based on the divided image data. The input character input data may be temporarily stored in a storage unit (not shown in FIG. 2) of the input device 200 in association with the base divided image data.
When the character input for the divided image data is completed, each input device 200 transmits the character input data to the control device 100 in step S105.

ステップS106で制御装置100は、端末装置300から受信した分割画像データに対する文字入力が全て終了して必要な文字入力データ揃ったかどうかを確認する。全データの文字入力済みが確認できると、制御装置100はステップS107にて文字入力データを基の分割画像データに対応付けして端末装置300に送信する。続けてステップS108にて制御装置100は作業完了フラグを端末装置300に送信する。   In step S <b> 106, the control device 100 confirms whether or not all character input for the divided image data received from the terminal device 300 has been completed and the necessary character input data has been prepared. If it is confirmed that all data has been entered, the control device 100 associates the character input data with the base divided image data and transmits it to the terminal device 300 in step S107. In step S108, the control device 100 transmits a work completion flag to the terminal device 300.

図5は本発明の実施形態によるクライアント側サブシステムの処理を説明するためのフロー図である。図5を参照すると、ステップS201で画像処理装置500にて文字データ化する基の書類のスキャン又は撮影を行い、書類画像データを作成し、画像処理装置500は作成した書類画像データを端末装置300に送信する。
ステップS202にて、端末装置300は書類画像データ毎に書類を識別する書類識別番号を付して記憶部380に保存する。
FIG. 5 is a flowchart for explaining processing of the client side subsystem according to the embodiment of the present invention. Referring to FIG. 5, in step S <b> 201, the original document to be converted into character data is scanned or photographed in step S <b> 201 to create document image data, and the image processing device 500 uses the created document image data as the terminal device 300. Send to.
In step S202, terminal apparatus 300 assigns a document identification number for identifying the document for each document image data, and stores the document identification number in storage unit 380.

ステップS203で、端末装置300は制御装置100からの画像分割プログラムの受信を待つように待機する。画像分割プログラムを受信すると、ステップS204で端末装置300は、記憶部380から必要な書類画像データを読出し、画像分割プログラムを実行して書類画像データを所定のブロックに分割した複数の分割画像データを作成する。分割画像データの作成に関しては図6を用いて後述する。
ステップS205にて端末装置300は、作成した分割画像データに画像識別番号を付して基となる書類画像データと対応付けして記憶部380に保存する。
In step S <b> 203, the terminal device 300 stands by so as to wait for reception of an image division program from the control device 100. When the image division program is received, in step S204, the terminal apparatus 300 reads necessary document image data from the storage unit 380, executes the image division program, and obtains a plurality of divided image data obtained by dividing the document image data into predetermined blocks. create. The creation of the divided image data will be described later with reference to FIG.
In step S <b> 205, the terminal device 300 assigns an image identification number to the created divided image data, associates it with the original document image data, and saves it in the storage unit 380.

ステップS206にて端末装置300は分割画像データと画像識別番号をセットで制御装置100に送信する。このとき一つの書類画像データから作成した複数の分割画像データに、共通の識別番号と枝番を組み合わせたような画像識別番号を付していると、第3者に一連のデータであることが推測され、情報の漏えいにつながる恐れがあるため、分割画像データ間の相関が読み取れないような識別番号とすることが好ましい。このため端末装置300で、記憶部380に保存した画像識別番号とは別に、相関の読み取れない新たな識別番号を生成し、これを制御装置100に送信する際の画像識別番号とするとともに、書類画像データと分割画像データの新たな識別番号との相関を示す相関テーブルを作成して管理してもよい。
また、複数の書類画像データから作成した複数の分割画像データをまとめて制御装置100に送信する際、異なる書類画像データから作成した複数の分割画像データ同士を組み合わせることでも情報漏えいリスクを低減することができる。さらに情報漏えいリスクを低減するために、必要な書類画像データには無いダミーの分割画像データを加えてもよい。
In step S206, the terminal apparatus 300 transmits the divided image data and the image identification number as a set to the control apparatus 100. At this time, if an image identification number such as a combination of a common identification number and a branch number is attached to a plurality of divided image data created from one document image data, it may be a series of data to a third party. Since it is estimated and may lead to information leakage, it is preferable to set the identification number so that the correlation between the divided image data cannot be read. For this reason, the terminal device 300 generates a new identification number whose correlation cannot be read separately from the image identification number stored in the storage unit 380, and uses this as the image identification number when transmitting it to the control device 100, and the document You may create and manage the correlation table which shows the correlation with image data and the new identification number of division | segmentation image data.
Further, when a plurality of divided image data created from a plurality of document image data are collectively transmitted to the control device 100, the risk of information leakage can be reduced by combining a plurality of divided image data created from different document image data. Can do. Furthermore, in order to reduce the risk of information leakage, dummy divided image data that is not included in necessary document image data may be added.

ステップS207で端末装置300は制御装置100からの文字入力データの受信を待つように待機する。
端末装置300は、制御装置100から文字入力データを受信すると、ステップS208で書類画像データ毎に対応付けられた分割画像データに対応する文字入力データを集積して、書類毎の書類構成データを生成する。さらに、生成した書類構成データは図6の説明で後述する書類画像データから抽出されて保存されたキーワードと関連付けして書類データとして記憶装置400に保存する。
In step S207, the terminal device 300 stands by so as to wait for reception of character input data from the control device 100.
Upon receiving the character input data from the control device 100, the terminal device 300 accumulates character input data corresponding to the divided image data associated with each document image data in step S208, and generates document configuration data for each document. To do. Further, the generated document configuration data is stored in the storage device 400 as document data in association with a keyword extracted and stored from document image data, which will be described later with reference to FIG.

ステップS209で端末装置300は制御装置100からの作業完了フラグの受信を待つように待機する。
端末装置300は、制御装置100から作業完了フラグを受信すると、ステップS210で実行している画像分割プログラムの終了処置を行う。画像分割プログラムの終了処置は画像分割プログラムの少なくとも画像分割を含むサブプログラムを停止することで行われる。
In step S209, the terminal apparatus 300 waits to wait for reception of a work completion flag from the control apparatus 100.
When the terminal device 300 receives the work completion flag from the control device 100, the terminal device 300 performs termination processing of the image division program being executed in step S210. The termination processing of the image division program is performed by stopping a subprogram including at least image division of the image division program.

さらに、終了処置を終えた画像分割プログラムは、所定の処置を施さないと再実行できないような構成にすることが好ましい。これは画像分割を含むサブプログラムにノーハウが盛り込まれるため、必要な文字入力データがクライアントに納入された後に転用されるのを防止するためである。そこで新たに追加の書類の文字データ化が必要な場合は、その都度画像分割プログラムを制御装置100から送信する、または一度送信された画像分割プログラムの再実行のためのキーを制御装置100から送信することが必要となるような構成とすることが好ましい。   Furthermore, it is preferable that the image segmentation program that has finished the end procedure be configured so that it cannot be re-executed unless a predetermined procedure is performed. This is because know-how is included in the sub-program including image division, so that necessary character input data is prevented from being diverted after being delivered to the client. Therefore, when it is necessary to convert the additional document into character data, the image division program is transmitted from the control device 100 each time, or a key for re-execution of the image division program once transmitted is transmitted from the control device 100. It is preferable to adopt a configuration that requires this.

図6は本発明の実施形態による分割画像データを作成する処理を説明するためのフロー図である。図6を参照すると、ステップS301で端末装置300は、記憶部380から必要な書類画像データを読出し、画像分割プログラムを実行して書類画像データの文字認識を行う。
ステップS302で、端末装置300は、認識された文字認識データよりキーワードの抽出を行う。キーワードは前述のように任意に設定でき、名前や住所でも、ID番号やレビジョン番号でもよく、一つでも複数でもよいが、書類の種類やフォーマット毎に予め定めておくことで、過去に文字データ化した書類データとの比較が行えるようになる。
書類画像データの文字認識の際、書類の汚れや判読しにくい手書き文字により誤認識や認識不可となる虞がある。このため認識処理の後に認識したデータを基の書類画像データと対比して表示し、端末装置300のオペレータにより、確認または修正を行うステップを行うようにしてもよい。
FIG. 6 is a flowchart for explaining a process of creating divided image data according to the embodiment of the present invention. Referring to FIG. 6, in step S <b> 301, the terminal device 300 reads necessary document image data from the storage unit 380 and executes an image division program to perform character recognition of the document image data.
In step S302, the terminal device 300 extracts keywords from the recognized character recognition data. The keyword can be arbitrarily set as described above, and it may be a name, address, ID number or revision number, and may be one or more. It becomes possible to compare with document data.
At the time of character recognition of document image data, there is a possibility that the document may be misrecognized or unrecognizable due to dirt on the document or handwritten characters that are difficult to read. For this reason, the data recognized after the recognition processing may be displayed in comparison with the original document image data, and the operator of the terminal device 300 may perform a step of confirmation or correction.

ステップS303で端末装置300は、記憶装置400に保存された書類データの中に、抽出したキーワードがすべて一致する書類データがあるかどうかを判別する。もしキーワードがすべて一致する書類データがあれば、過去に文字データ化が行われているので、新たにキーワードを抽出した書類画像データは削除(ステップS313)してステップS307に進む。
もし抽出したキーワードがすべて一致する書類データがなかった場合、端末装置300は、ステップS304にて記憶部380に保存した書類画像データに対応して抽出したキーワードを記憶部380に保存する。
In step S <b> 303, the terminal device 300 determines whether there is document data in which all extracted keywords match in the document data stored in the storage device 400. If there is document data in which all the keywords match, since character data has been converted in the past, the document image data from which the keyword has been newly extracted is deleted (step S313), and the process proceeds to step S307.
If there is no document data in which all the extracted keywords match, the terminal device 300 stores the extracted keyword in the storage unit 380 corresponding to the document image data stored in the storage unit 380 in step S304.

ステップS305にて端末装置300は、画像分割プログラムの実行により、ステップS302で認識された文字認識データを基に、複数の分割画像データを作成する。ステップS306で作成した分割画像データは画像識別番号を付し基となる書類画像データと対応付けして記憶部380に保存する。
ステップS307にて端末装置300は、次の書類画像データがあるかどうか判別し、次のデータがある場合はステップS301に戻って次の書類画像データに対する処理を行い、次の書類画像データがない場合は画像分割処理を終了する。
In step S305, the terminal apparatus 300 creates a plurality of divided image data based on the character recognition data recognized in step S302 by executing the image division program. The divided image data created in step S306 is assigned an image identification number, and is stored in the storage unit 380 in association with the original document image data.
In step S307, the terminal device 300 determines whether there is next document image data. If there is next data, the terminal device 300 returns to step S301 to perform processing on the next document image data, and there is no next document image data. In this case, the image division process is terminated.

図7は本発明の実施形態による画像分割プログラムの構成を示す図である。図7を参照すると、画像分割プログラムはキーワード抽出プログラム610、書類データ比較判断プログラム620、画像分割処理プログラム630、及び書類構成データ生成プログラム640のサブプログラムを含む。
キーワード抽出プログラム610は、画像処理装置500によってスキャン又は撮影することによって得られ端末装置300に送られた書類画像データから、端末装置300が文字を認識してキーワードとして抽出するように構成される。一実施形態ではキーワードとして予め書類に付与された固有のID番号とレビジョン番号を含む。
書類画像データの文字認識の際、書類の汚れや判読しにくい手書き文字により誤認識や認識不可となる虞があることから、キーワード抽出プログラム610は、書類画像データの認識処理の後に認識したデータを基の書類画像データと対比して表示し、端末装置300のオペレータに、確認または修正を促し、オペレータの処理に伴い次の処理に進むような構成としてもよい。
FIG. 7 is a diagram showing a configuration of an image division program according to the embodiment of the present invention. Referring to FIG. 7, the image division program includes a keyword extraction program 610, a document data comparison / determination program 620, an image division processing program 630, and a document configuration data generation program 640 subprogram.
The keyword extraction program 610 is configured such that the terminal device 300 recognizes characters and extracts them as keywords from document image data obtained by scanning or photographing with the image processing device 500 and sent to the terminal device 300. In one embodiment, a unique ID number and revision number previously assigned to the document are included as keywords.
When character recognition is performed on document image data, the keyword extraction program 610 may recognize the data recognized after the document image data recognition processing because there is a risk that the document is dirty or handwritten characters that are difficult to read. It may be configured to display the document image data in comparison with the original document image data, prompt the operator of the terminal device 300 to confirm or correct, and proceed to the next processing in accordance with the processing of the operator.

書類データ比較判断プログラム620は、キーワード抽出プログラム610で抽出したキーワードと同一のキーワードを有する書類データが記憶装置400に保存されているかどうかを検索するように端末装置300を制御し、抽出したキーワードがすべて一致する書類データが保存されている場合は当該書類画像データを消去して次の書類画像データ処理を行うようキーワード抽出に処理を渡し、抽出したキーワードがすべて一致する書類データが保存されていない場合は画像分割処理プログラム630に処理を引き渡すように構成される。   The document data comparison / determination program 620 controls the terminal device 300 to search whether or not document data having the same keyword as the keyword extracted by the keyword extraction program 610 is stored in the storage device 400, and the extracted keyword is If all matching document data is saved, the process passes to keyword extraction to delete the document image data and perform the next document image data processing. Document data that matches all the extracted keywords is not saved. In this case, the image division processing program 630 is configured to deliver the processing.

画像分割処理プログラム630は、書類画像データの文字認識で得られた情報に基づき、端末装置300が認識された文字の位置や配列などから氏名、住所などの文字列の属性を判断し、必要とされる属性の文字列をブロックに分割して分割画像データとして取り出すように構成される。
さらに、作成した分割画像データに画像識別番号を付し基となる書類画像データと対応付けして記憶部380に保存するように構成される。
The image division processing program 630 determines the attributes of character strings such as names and addresses from the position and arrangement of characters recognized by the terminal device 300 based on information obtained by character recognition of document image data, and The character string of the attribute to be processed is divided into blocks and extracted as divided image data.
Further, an image identification number is assigned to the created divided image data, and the divided image data is stored in the storage unit 380 in association with the original document image data.

書類構成データ生成プログラム640は、端末装置300が制御装置100から送信された書類画像データの各分割画像データに対応した文字入力データを書類画像データ毎に集積して配列し、書類毎の書類構成データを生成するよう構成される。
さらに、生成した書類構成データは書類画像データから抽出されたキーワードと関連付けして書類データとして記憶装置400に保存するように構成される。
The document configuration data generation program 640 accumulates and arranges character input data corresponding to each divided image data of the document image data transmitted from the control device 100 by the terminal device 300, and arranges the document configuration for each document. Configured to generate data.
Further, the generated document configuration data is configured to be stored in the storage device 400 as document data in association with a keyword extracted from the document image data.

また、一実施形態では画像分割プログラムは、端末装置300が制御装置100から作業完了フラグを受信すると、少なくとも画像分割処理プログラム630を含むプログラム終了処置を行うよう構成される。
次の書類の文字データ化を行う際は、一度終了処置を行った画像分割プログラムは、再実行を不可とし、その都度新たに画像分割プログラムを受信するか、再実行のためのキーを制御装置100から受信することによって再実行が可能となるよう構成されてもよい。
In one embodiment, when the terminal device 300 receives a work completion flag from the control device 100, the image division program is configured to perform a program termination process including at least the image division processing program 630.
When the next document is converted into character data, the image division program that has been once terminated cannot be re-executed, and each time a new image division program is received or a key for re-execution is assigned to the control device. Re-execution may be possible by receiving from 100.

図8は本発明の実施形態による分割画像を例示的に示す図であり、基となる書類が名刺の場合を示す。図8を参照すると、名刺をスキャンして得られた書類画像データには会社名、役職、氏名などの情報を含む。この書類画像データに対する文字認識の結果、認識された文字列からキーワードが抽出される。キーワードは書類毎に予め定められ、図8の実施形態では例えば氏名「飯田 優二」とID番号及びレビジョン番号「A1000000−2」である。   FIG. 8 is a diagram exemplarily showing a divided image according to the embodiment of the present invention, and shows a case where a base document is a business card. Referring to FIG. 8, document image data obtained by scanning a business card includes information such as company name, title, and name. As a result of character recognition for the document image data, keywords are extracted from the recognized character strings. The keywords are predetermined for each document, and in the embodiment of FIG. 8, for example, the name “Yuji Iida”, the ID number, and the revision number “A1000000-2”.

画像分割プログラムの実行により、書類画像データは図7の例にあるように会社名5101、役職5102、氏名5103など5101〜5109の文字ブロックを含むように分割画像データが作成される。
ここで名刺を例に示したが、書類は挨拶状などの葉書、各種伝票や申込書など文字データ化が必要な書類には同様に適用できる。また文字データ化する文字は手書きであっても構わない。
By executing the image dividing program, the divided image data is created so that the document image data includes character blocks 5101 to 5109 such as a company name 5101, a title 5102, and a name 5103 as shown in the example of FIG.
Here, a business card is shown as an example, but the document can be similarly applied to a document that needs to be converted into character data, such as a postcard such as a greeting card, various slips, and an application form. The character to be converted into character data may be handwritten.

以上、本発明の実施形態について図面を参照しながら説明したが、本発明は、上述の実施形態に限定されるものではなく、本発明の技術的範囲から逸脱しない範囲内で多様に変更することが可能である。   As mentioned above, although embodiment of this invention was described referring drawings, this invention is not limited to the above-mentioned embodiment, It can change variously within the range which does not deviate from the technical scope of this invention. Is possible.

10 書類入力システム
20 ホスト側サブシステム
30 クライアント側サブシステム
100 制御装置
110、370 制御部
120 プログラム送信部
130、320 データ受信部
140、330 データ送信部
200 入力装置
210 分割画像データ受信部
220 分割画像データ表示部
230 文字入力部
240 文字入力データ送信部
300 端末装置
310 プログラム受信部
340 判断部
350 画像データ処理部
360 データ構成部
400 記憶装置
500 画像処理装置
510 画像処理部
520 書類画像データ送信部
DESCRIPTION OF SYMBOLS 10 Document input system 20 Host side subsystem 30 Client side subsystem 100 Control device 110, 370 Control unit 120 Program transmission unit 130, 320 Data reception unit 140, 330 Data transmission unit 200 Input device 210 Division image data reception unit 220 Division image Data display unit 230 Character input unit 240 Character input data transmission unit 300 Terminal device 310 Program reception unit 340 Judgment unit 350 Image data processing unit 360 Data configuration unit 400 Storage device 500 Image processing unit 510 Image processing unit 520 Document image data transmission unit

Claims (9)

制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、
画像処理装置と、端末装置と記憶装置と、を含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有し、
前記制御装置は、画像データを分割するために予め作成され保存された画像分割プログラムを前記端末装置に送信するプログラム送信部と、前記端末装置から送信された分割画像データまたは前記入力装置から送信された文字入力データを受信するデータ受信部と、前記分割画像データを前記入力装置に送信又は、前記文字入力データを前記端末装置に送信するデータ送信部と、受信した前記分割画像データに対応する前記文字入力データの管理と前記ホスト側サブシステム制御のための制御部とを備え、
前記入力装置は、前記制御装置から送信された分割画像データを受信する分割画像データ受信部と、前記分割画像データを表示する分割画像データ表示部と、前記分割画像データに対応する文字を入力する文字入力部と文字入力データを前記制御装置に送信する文字入力データ送信部とを備え、
前記画像処理装置は、書類をスキャンまたは撮影して書類画像データを作成する画像処理部と、前記書類画像データを送信する書類画像データ送信部を備え、
前記端末装置は、前記画像処理装置から送信された書類画像データまたは前記制御装置から送信された前記文字入力データを受信するデータ受信部と、前記制御装置から送信された画像分割プログラムを受信するプログラム受信部と、前記画像分割プログラムに従い、前記書類画像データの文字認識の結果から抽出されたキーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断する判断部と、前記書類データリスト中にすべての前記キーワードが一致する書類データがない場合に前記書類画像データを複数の分割画像データに分割する画像データ処理部と、前記分割画像データを前記制御装置に送信するデータ送信部と、前記書類画像データに対応して前記文字入力データから書類構成データを生成するデータ構成部とを備え、
前記画像分割プログラムは所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように構成されることを特徴とする書類入力システム。
A host-side subsystem including a controller and at least one input device;
An image processing device, a terminal device, and a storage device, the client side subsystem connected to the host side subsystem through a communication line;
The control device is transmitted from a program transmission unit that transmits an image division program created and stored in advance to divide image data to the terminal device, and divided image data transmitted from the terminal device or the input device. A data receiving unit for receiving the character input data, and transmitting the divided image data to the input device, or a data transmitting unit for transmitting the character input data to the terminal device, and the data corresponding to the received divided image data. A control unit for managing character input data and controlling the host side subsystem;
The input device inputs a divided image data receiving unit that receives the divided image data transmitted from the control device, a divided image data display unit that displays the divided image data, and characters corresponding to the divided image data. A character input unit and a character input data transmitter for transmitting character input data to the control device;
The image processing apparatus includes an image processing unit that creates document image data by scanning or photographing a document, and a document image data transmission unit that transmits the document image data.
The terminal device includes a data receiving unit that receives document image data transmitted from the image processing device or the character input data transmitted from the control device, and a program that receives an image division program transmitted from the control device. In accordance with the receiving unit and the image dividing program, whether or not document data in which all the keywords extracted from the result of character recognition of the document image data match is in the document data list created in advance and stored in the storage device A determination unit for determining; an image data processing unit for dividing the document image data into a plurality of divided image data when there is no document data in which all the keywords match in the document data list; and A data transmission unit for transmitting to the control device, and the character input corresponding to the document image data And a data structuring unit that generates a document configuration data from over data,
A document input system configured to stop a subprogram including at least image division when the image division program satisfies a predetermined condition.
前記書類画像データの文字認識の結果から抽出された前記キーワードが、予め前記書類に付与された固有のID番号とレビジョン番号を含むことを特徴とする請求項1に記載の書類入力システム。   2. The document input system according to claim 1, wherein the keyword extracted from the result of character recognition of the document image data includes a unique ID number and a revision number assigned to the document in advance. 前記画像分割プログラムが少なくとも画像分割を含むサブプログラムを停止するのは前記端末装置が前記制御装置から送信された作業完了フラグを受信することによってなされることを特徴とする請求項1または2に記載の書類入力システム。   3. The image division program stops a subprogram including at least image division when the terminal device receives a work completion flag transmitted from the control device. Document input system. 制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、画像処理装置と、端末装置と、記憶装置とを含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有する書類入力システムにおいて、
前記制御装置より前記端末装置に送信され、前記端末装置にて実行されるプログラムであって、
前記端末装置が、前記画像処理装置によって書類をスキャンまたは撮影することによって得られ前記画像処理装置から受信した書類画像データから、文字を認識してキーワードとして抽出し、前記キーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断し、前記書類データリスト中にすべての前記キーワードが一致する書類データがない場合に前記書類画像データを複数の分割画像データに分割し、前記複数の分割画像データを前記制御装置に送信するように制御し、
前記端末装置が、前記分割画像データを基に生成され前記制御装置から送信された文字入力データを受信すると、前記書類画像データに対応して前記文字入力データから書類構成データを生成するように制御し、
所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように制御することを特徴とするプログラム。
A client-side subsystem including a control device, a host-side subsystem including at least one input device, an image processing device, a terminal device, and a storage device, and connected to the host-side subsystem through a communication line; In a document input system having
A program transmitted from the control device to the terminal device and executed by the terminal device,
Document data in which the terminal device recognizes characters and extracts them as keywords from document image data received from the image processing device obtained by scanning or photographing a document with the image processing device, and the keywords all match. In the document data list created in advance and stored in the storage device, and the document image data is divided into a plurality of divisions when there is no document data in which all the keywords match in the document data list. Dividing into image data and controlling to send the plurality of divided image data to the control device,
When the terminal device receives character input data generated based on the divided image data and transmitted from the control device, control is performed so as to generate document configuration data from the character input data corresponding to the document image data. And
A program that controls to stop a subprogram including at least image division when a predetermined condition is satisfied.
前記書類画像データから文字を認識して抽出された前記キーワードが、予め前記書類に付与された固有のID番号とレビジョン番号を含むことを特徴とする請求項4に記載のプログラム。   The program according to claim 4, wherein the keyword extracted by recognizing characters from the document image data includes a unique ID number and a revision number assigned to the document in advance. 前記所定の条件は前記端末装置が前記制御装置から送信された作業完了フラグを受信することであることを特徴とする請求項4または5に記載のプログラム。   6. The program according to claim 4, wherein the predetermined condition is that the terminal device receives a work completion flag transmitted from the control device. 制御装置と、少なくとも1つの入力装置とを含むホスト側サブシステムと、画像処理装置と、端末装置と、記憶装置とを含み、前記ホスト側サブシステムと通信回線を通じて接続されるクライアント側サブシステムとを有する書類入力システムにおける書類入力方法であって、
前記画像処理装置が、書類をスキャンまたは撮影して書類画像データを作成するステップと、
前記端末装置が前記画像処理装置から前記書類画像データを受信して、書類識別番号を付加して前記記憶装置に保存するステップと、
前記端末装置が、予め作成され保存された画像分割プログラムを前記制御装置から受信するステップと、
前記端末装置が前記画像分割プログラムを実行し、該画像分割プログラムに従い、前記書類画像データを読み出し、書類画像データから文字を認識してキーワードとして抽出し、前記キーワードがすべて一致する書類データがあらかじめ作成され前記記憶装置に保存された書類データリスト中にあるかどうかを判断するステップと、
前記画像分割プログラムに従い、前記書類データリスト中にすべての前記キーワードが一致する書類データがある場合は、前記書類画像データは削除するステップと、
すべての前記キーワードが一致する書類データがない場合は、前記書類画像データを複数の分割画像データに分割し、前記複数の分割画像データを前記制御装置に送信するステップと、
前記制御装置が、前記複数の分割画像データを受信し、少なくとも1つの入力装置に前記分割画像データを配信するステップと、
前記入力装置により前記複数の分割画像データを基に、オペレータによって入力された文字データにしたがい電子化された文字入力データを生成するステップと、
前記制御装置が、前記文字入力データを前記入力装置より受信して、前記端末装置に送信するステップと、
前記端末装置が前記画像分割プログラムに従い、受信した前記文字入力データを基に、前記書類画像データに対応して前記文字入力データから書類構成データを生成するステップと、を有し、
前記画像分割プログラムは所定の条件を満たした場合に、少なくとも画像分割を含むサブプログラムを停止するように構成されることを特徴とする書類入力システムの運用方法。
A client-side subsystem including a control device, a host-side subsystem including at least one input device, an image processing device, a terminal device, and a storage device, and connected to the host-side subsystem through a communication line; A document input method in a document input system having
The image processing device scans or photographs a document to create document image data;
The terminal device receiving the document image data from the image processing device, adding a document identification number and storing it in the storage device;
The terminal device receiving an image segmentation program created and stored in advance from the control device;
The terminal device executes the image division program, reads the document image data in accordance with the image division program, recognizes characters from the document image data, extracts them as keywords, and creates document data in which all the keywords match Determining whether it is in a document data list stored in the storage device;
In accordance with the image segmentation program, if there is document data that matches all the keywords in the document data list, the document image data is deleted;
If there is no document data that matches all the keywords, dividing the document image data into a plurality of divided image data, and transmitting the plurality of divided image data to the control device;
The control device receiving the plurality of divided image data and distributing the divided image data to at least one input device;
Generating digitized character input data according to character data input by an operator based on the plurality of divided image data by the input device;
The control device receives the character input data from the input device, and transmits to the terminal device;
Generating the document configuration data from the character input data corresponding to the document image data based on the character input data received by the terminal device according to the image division program,
An operation method of a document input system, wherein the image division program is configured to stop a subprogram including at least image division when a predetermined condition is satisfied.
前記書類画像データから文字を認識して抽出された前記キーワードが予め前記書類に付与された固有のID番号とレビジョン番号を含むことを特徴とする請求項7に記載の書類入力システムの運用方法。   8. The method for operating a document input system according to claim 7, wherein the keyword extracted by recognizing characters from the document image data includes a unique ID number and a revision number previously assigned to the document. 前記所定の条件は前記端末装置が前記制御装置から送信された作業完了フラグを受信することであることを特徴とする請求項7または8に記載の書類入力システムの運用方法。   The document input system operating method according to claim 7, wherein the predetermined condition is that the terminal device receives a work completion flag transmitted from the control device.
JP2015083200A 2015-04-15 2015-04-15 Document input system, program, and operation method for document input system Pending JP2016208074A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015083200A JP2016208074A (en) 2015-04-15 2015-04-15 Document input system, program, and operation method for document input system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015083200A JP2016208074A (en) 2015-04-15 2015-04-15 Document input system, program, and operation method for document input system

Publications (1)

Publication Number Publication Date
JP2016208074A true JP2016208074A (en) 2016-12-08

Family

ID=57490415

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015083200A Pending JP2016208074A (en) 2015-04-15 2015-04-15 Document input system, program, and operation method for document input system

Country Status (1)

Country Link
JP (1) JP2016208074A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020067914A (en) * 2018-10-25 2020-04-30 株式会社東芝 Information processing apparatus, information processing method, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020067914A (en) * 2018-10-25 2020-04-30 株式会社東芝 Information processing apparatus, information processing method, and program
JP7237518B2 (en) 2018-10-25 2023-03-13 株式会社東芝 Information processing device, information processing method, and program

Similar Documents

Publication Publication Date Title
US11151367B2 (en) Image processing apparatus and image processing program
US10949662B2 (en) Image processing apparatus
CN102236537A (en) Print system
US20150220866A1 (en) Data processing apparatus, data processing system, and data processing method
US11749008B2 (en) Image processing apparatus and image processing program
CN106326332A (en) Retrieval device, retrieval method
US10203844B2 (en) Information processing apparatus, information processing system, and method
JP4172478B2 (en) Document management apparatus and document management method
JP2014175978A (en) Information processing apparatus, control method of the same, and program
JP7390071B2 (en) Document processing devices, document processing methods, and programs
US8561141B2 (en) Information input assistance device, computer-readable medium, and information input assistance method
JP2016208074A (en) Document input system, program, and operation method for document input system
JP2003030211A (en) Electronic name card, method for managing electronic name card and program thereof
JP2021103592A (en) Document management device and method for managing document
CN112149679B (en) Method and device for extracting document elements based on OCR character recognition
JP2017021654A (en) Document management server and system
JP2018092569A (en) Information processing system, information processing device, information processing method, and program
JP2014063457A (en) Annotation management system, and program for making computer execute the same
JP5515481B2 (en) Document processing apparatus, document processing system, and program
KR101809362B1 (en) Transaction Information Managing System using Optical Character Reader System and Computerized Transaction Information Managing Method using It
JP4736995B2 (en) Electronic approval system
US20200372469A1 (en) Business card information management system and business card information management program
JP2014048837A (en) Conference information management system and image forming apparatus
JP2009193487A (en) Document arranging system, document arranging method, and document-arranging program
US20220222362A1 (en) Method and apparatus for document processing