JP2002133358A - Document reading method - Google Patents

Document reading method

Info

Publication number
JP2002133358A
JP2002133358A JP2000323304A JP2000323304A JP2002133358A JP 2002133358 A JP2002133358 A JP 2002133358A JP 2000323304 A JP2000323304 A JP 2000323304A JP 2000323304 A JP2000323304 A JP 2000323304A JP 2002133358 A JP2002133358 A JP 2002133358A
Authority
JP
Japan
Prior art keywords
database
reading
character
contents
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000323304A
Other languages
Japanese (ja)
Other versions
JP2002133358A5 (en
Inventor
Yoshihiro Shima
好博 嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000323304A priority Critical patent/JP2002133358A/en
Publication of JP2002133358A publication Critical patent/JP2002133358A/en
Publication of JP2002133358A5 publication Critical patent/JP2002133358A5/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)

Abstract

PROBLEM TO BE SOLVED: To enter update information by, for example, handwritten characters in the contents of a first database printed on a paper document, read the document and generate a second database efficiently, in a system that prohibits direct access to the first database for the purpose of protecting the first database. SOLUTION: Information about a two-dimensional bar code printed in advance on a document is used to determine which item a handwritten change character string corresponds to in a database. The item value of the corresponding item is replaced with the change data, which is registered in a second database.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、データベースの保
護目的のため、直接データベースにアクセスすることを
禁止するシステムにおいて、データベースの内容を紙の
帳票に印刷し、当該帳票に手書き文字等によって変更情
報を記入した帳票に対して、帳票画像を読み取り、別個
のデータベースを生成する帳票読み取り方法に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for prohibiting direct access to a database for the purpose of protecting the database. The present invention relates to a form reading method for reading a form image with respect to a form in which is filled in, and generating a separate database.

【0002】[0002]

【従来の技術】バーコードを帳票に印刷し、当該バーコ
ードを読み取ることにより、指定の帳票を探索する技術
が特開平7−114616号公報に開示されている。し
かしながら、この従来方式ではバーコードの読み取り結
果を手書き文字等に対する文字認識結果によって変更す
る方法は考慮されていない。また、この従来方式ではデ
ータベースのアクセス禁止に関する記述はなされていな
い。
2. Description of the Related Art Japanese Patent Application Laid-Open No. Hei 7-114616 discloses a technique of printing a barcode on a form and reading the barcode to search for a specified form. However, this conventional method does not consider a method of changing a barcode reading result based on a character recognition result of a handwritten character or the like. Further, in this conventional method, there is no description about access prohibition of a database.

【0003】また、二次元バーコードの読み取り方法に
関する技術が特開平5−290204号、特開平6−1
2515、特開平7−254037号に開示されてい
る。しかしながら、これらの従来方式では、バーコード
の読み取り結果を手書き文字等に対する文字認識結果に
よって変更する方法に関しては記述されていない。
Further, a technique relating to a method of reading a two-dimensional bar code is disclosed in Japanese Patent Application Laid-Open Nos. 5-290204 and 6-1.
2515, and JP-A-7-254037. However, these conventional methods do not describe a method of changing a barcode reading result based on a character recognition result of a handwritten character or the like.

【0004】[0004]

【発明が解決しようとする課題】従来、データベースの
機密保護のため、ネットワークを介してデータベースに
直接アクセスして新しいデータベースを生成することが
禁止されているシステムにおいては、データベースの内
容を帳票に文字列として印刷し、当該文字列を人手でキ
ー入力して新しいデータベースに登録していた。また、
別の方法として、帳票画像から印刷された文字列を文字
認識することにより、新しいデータベースに登録してい
た。
Conventionally, in a system in which it is prohibited to directly access a database via a network to create a new database in order to protect the security of the database, the contents of the database are stored in a form as a character string. , And the character string is manually entered by key and registered in a new database. Also,
As another method, a character string printed from a form image is recognized as a character to register the character string in a new database.

【0005】ところで、従来の人手でキー入力する方法
では文字列全数を入力する必要があり、入力作業が多大
となる。また、人手によるキー入力のため、入力誤りが
発生していた。また、帳票画像から文字列を文字認識し
て入力する方法では、文字認識の誤りを完全には回避で
きず、全数を目視チェックし、誤認識については修正入
力作業が必要となり、やはり作業が多大となるという問
題があった。
In the conventional manual key input method, it is necessary to input the entire character string, which requires a large amount of input work. In addition, an input error has occurred due to manual key input. In the method of inputting a character string by character recognition from a form image, an error in character recognition cannot be completely avoided. There was a problem that.

【0006】さらに、データベースの内容を印刷した帳
票に対して、内容データに変更がある場合、上記変更箇
所の項目と変更内容とを対応付けする必要があるが、帳
票に記入した変更内容に関して、変更箇所を項目と内容
を対応付けして検出する方法については、従来技術では
開示されていなかった。
Further, when there is a change in the contents data of a form on which the contents of the database are printed, it is necessary to associate the above-mentioned changed item with the contents of the change. A method of detecting a changed portion by associating items with contents has not been disclosed in the related art.

【0007】また、帳票に印刷された2次元バーコード
の内容を、手書きで記入された変更文字列によって置き
換え、それをデータベースに登録する方法については知
られていない。
[0007] Further, there is no known method for replacing the contents of a two-dimensional barcode printed on a form with a modified character string entered by hand and registering it in a database.

【0008】また、機密保護のため、帳票上に印刷され
た2次元バーコードの該当する内容を、容易には読み取
れないように暗号化された2次元バーコードを利用する
ことが知られているが、機密性をさらに向上させるた
め、帳票の種類ごとにその暗号化の方法を可変とする方
法については知られていない。
[0008] It is also known to use an encrypted two-dimensional bar code so that the corresponding contents of the two-dimensional bar code printed on the form cannot be easily read for security. However, there is no known method of making the encryption method variable for each type of form in order to further improve confidentiality.

【0009】[0009]

【課題を解決するための手段】前記課題を解決するため
に、本発明の第1の発明は、第1のデータベースの内容
を選択する手段と、2次元バーコードを帳票に印刷する
とともに文字を帳票に印刷する手段と、当該印刷済み帳
票に対して変更情報を記入した帳票に対して表面画像を
採取する手段と、2次元バーコードを読み取るとともに
上記変更情報を文字認識により読み取り、2次元バーコ
ードの内容に当該変更を加えた情報をもとに第2のデー
タベースを生成する手段とが設けられている。
Means for Solving the Problems In order to solve the above problems, a first invention of the present invention comprises means for selecting the contents of a first database, printing a two-dimensional barcode on a form, and writing characters. Means for printing on a form, means for collecting a surface image from a form in which change information has been entered for the printed form, and reading the two-dimensional bar code and reading the change information by character recognition. Means for generating a second database based on the information obtained by changing the contents of the code.

【0010】第2の発明は、第1の発明における変更情
報の読み取り手段として、記入済み帳票画像から訂正線
を検出する手段と、当該訂正線の近傍に存在する文字列
の外接矩形を、変更情報が記載された文字列として抽出
する手段と、変更情報に対応した項目を抽出する手段と
が設けられている。
According to a second aspect of the present invention, as means for reading change information in the first aspect, a means for detecting a correction line from a filled-out form image and a circumscribed rectangle of a character string existing near the correction line are changed. Means are provided for extracting a character string in which information is described, and means for extracting an item corresponding to the change information.

【0011】第3の発明は、第1の発明における第2の
データベース生成において、変更情報に対応する項目お
よび内容を文字認識の読み取り結果を用いて2次元バー
コードの内容を置き換える手段が設けられている。
According to a third aspect of the present invention, in the second database generation of the first aspect, there is provided means for replacing the contents and the items corresponding to the change information with the contents of the two-dimensional barcode using the read result of the character recognition. ing.

【0012】第4の発明は、帳票に印刷された2次元バ
ーコードの読み取りにおいて、帳票の種類ごとに具備さ
れるフォーマット情報から2次元バーコードの暗号化の
種類を特定する手段と、当該帳票上の2次元バーコード
を暗号化の種類に応じて復号化する手段とが設けられて
いる。
According to a fourth aspect of the present invention, in reading a two-dimensional barcode printed on a form, means for specifying the type of encryption of the two-dimensional barcode from format information provided for each type of form is provided. Means for decrypting the above two-dimensional barcode in accordance with the type of encryption is provided.

【0013】[0013]

【発明の実施の形態】図1は、本発明の実施形態を示す
帳票読み取り方法の構成図である。第1データベース1
00と第2データベース116とが具備されている。図
7は第1データベースの構成例であり、このデータベー
ス700には、701で示すデータベースの構成要素
(レコード)が複数個存在している。例えば顧客データ
ベースの場合、個々の構成要素には一人一人の個人情報
が割り当てられている。構成要素内の項目(フィール
ド)の例としては、住所(710)、氏名(711)、
生年月日(712)、所属(713)、金額(714)
があり、それぞれの項目に項目値となるデータ内容72
0、721、722、723、724が登録されてい
る。
FIG. 1 is a block diagram of a form reading method according to an embodiment of the present invention. First database 1
00 and a second database 116. FIG. 7 shows an example of the configuration of the first database. This database 700 includes a plurality of components (records) of the database 701. For example, in the case of a customer database, individual information is assigned to each component. Examples of items (fields) in the component include an address (710), a name (711),
Date of birth (712), affiliation (713), amount of money (714)
, And the data content 72 which becomes the item value for each item
0, 721, 722, 723, and 724 are registered.

【0014】また、図8は第2データベース116の構
成の一例であり、このデータベース800には、801
で示すデータベースの構成要素が複数個存在している。
例えば顧客データベースの場合は、構成要素として一人
一人の個人情報が割り当てられ、その構成要素の項目と
して、住所(810)、氏名(811)、生年月日(8
12)、金額(813)があり、それぞれの項目値82
0、821、822、823が登録されている。この第
2データベース116には、第1データベース100の
内容を変更した結果が格納されることになる。なお、第
2データベースに必要な項目と内容は第1データベース
100から選択され、格納される。
FIG. 8 shows an example of the configuration of the second database 116.
There are a plurality of components of the database indicated by.
For example, in the case of a customer database, personal information of each person is assigned as a component, and the address (810), name (811), date of birth (8)
12) and the amount of money (813).
0, 821, 822, and 823 are registered. The result obtained by changing the contents of the first database 100 is stored in the second database 116. Note that items and contents required for the second database are selected from the first database 100 and stored.

【0015】図1において、第1データベース100と
第2データベース116はネットワーク102で接続さ
れているが、機密の保護の観点から、直接第1データベ
ース100を直接アクセスし、第2データベース116
に登録することは禁止されているものとする。
In FIG. 1, the first database 100 and the second database 116 are connected via a network 102. From the viewpoint of security protection, the first database 100 is directly accessed and the second database 116 is accessed.
It is forbidden to register with.

【0016】印刷制御部103はネットワーク102に
接続しており、帳票を印刷するプリンタ104を制御す
る。第1データベース100の内容は印刷制御部103
を介してプリンタ104において印刷され、印刷帳票1
05を出力する。印刷帳票105には、選択された第1
データベースの内容が、印刷文字列と2次元バーコード
として印刷されている。
A print control unit 103 is connected to the network 102 and controls a printer 104 for printing a form. The contents of the first database 100 are the print control unit 103
Is printed on the printer 104 via the
05 is output. The print form 105 includes the selected first
The contents of the database are printed as a print character string and a two-dimensional barcode.

【0017】図3は印刷された帳票の一例である。紙の
帳票300において、項目と内容が枠内に印刷されてい
る。項目の枠として、住所(301)、氏名(30
2)、生年月日(303)、金額(304)、備考(3
05)があり、それぞれの項目値に対応した内容枠31
1、312、313、314、315に内容情報が印刷
されている。ここで、二次元バーコード316には、印
刷帳票の内容がすべて含まれている。
FIG. 3 shows an example of a printed form. In the paper form 300, items and contents are printed in a frame. Address (301), name (30)
2), date of birth (303), amount of money (304), remarks (3
05), and a content frame 31 corresponding to each item value
1, 312, 313, 314, and 315 are printed with content information. Here, the two-dimensional barcode 316 includes all the contents of the print form.

【0018】印刷帳票105に対して、変更部分を手書
きで記入し、記入済み帳票110を得る。記入済み帳票
105の表面画像をイメージスキャナ111で採取す
る。2次元バーコード読み取り部112において、帳票
105の2次元バーコードを読み取る。また、文字読み
取り部113において、帳票に記入された変更部分の文
字認識を行う。統合部114は上記2次元バーコードの
読み取り結果と文字読み取り結果とを統合する。ここで
は、記入した変更部分の読み取り結果を2次元バーコー
ドの読み取り結果と置き換える。修正登録部115では
文字読み取り結果の誤り部分や不読部分を画面を介して
修正し、第2データベース116に登録する。
The changed portion is manually entered in the print form 105 to obtain a filled-out form 110. A surface image of the filled-out form 105 is collected by the image scanner 111. The two-dimensional barcode reading unit 112 reads the two-dimensional barcode of the form 105. Further, the character reading unit 113 performs character recognition of the changed portion entered in the form. The integrating unit 114 integrates the two-dimensional bar code reading result and the character reading result. Here, the read result of the written changed portion is replaced with the read result of the two-dimensional barcode. The correction registration unit 115 corrects an erroneous part or an unread part of the character reading result via the screen, and registers it in the second database 116.

【0019】図2は、本実施形態における帳票読み取り
方法の手順を示す図である。第1データベース200の
内容を選択処理201で指定の項目、指定の構成要素を
検索して出力する。当該出力内容は、暗号化処理202
で暗号化を行い、2次元バーコード生成処理203で2
次元バーコードが生成される。この暗号化処理202に
おいては、帳票の書式情報をもとに暗号化の方法を指定
することができる。なお、書式情報は、あらかじめ帳票
ごとに設定しておいてもよいし、帳票の枠構造や行構造
をもとに自動的に書式を抽出してもよい。
FIG. 2 is a diagram showing a procedure of a form reading method according to the present embodiment. The contents of the first database 200 are retrieved and output in a selection process 201 for a specified item and a specified component. The output contents are encrypted 202
And two-dimensional barcode generation processing 203
A dimensional barcode is generated. In the encryption process 202, an encryption method can be specified based on the format information of the form. The format information may be set in advance for each form, or the format may be automatically extracted based on the frame structure and line structure of the form.

【0020】一方、文字・記号生成処理204におい
て、上記の出力内容が文字コードに変換される。帳票印
刷処理205において、2次元バーコードおよび文字コ
ードが紙面上に印刷される。
On the other hand, in the character / symbol generation processing 204, the output contents are converted into character codes. In the form printing process 205, a two-dimensional barcode and a character code are printed on the paper.

【0021】このように、第1データベース200の内
容の一部が印刷された帳票206に対して、変更する箇
所に手書きにて変更内容が記入される。この記入済みの
帳票206に対して、帳票画像入力処理207において
表面画像を採取する。そして、2次元バーコード読み取
り処理208において帳票表面上の2次元バーコードを
読み取り、復号化処理209において先に暗号化した2
次元バーコードを復号する。この復号化処理209にお
いては、帳票の書式情報をもとに暗号化の方法を指定し
ているので、書式情報に対応して複号化処理を行えばよ
い。なお、書式情報は、あらかじめ帳票ごとに設定して
おいてもよいし、帳票の枠構造や行構造をもとに自動的
に書式を抽出してもよい。
As described above, in the form 206 on which a part of the contents of the first database 200 has been printed, the changed contents are entered by hand at the portions to be changed. A surface image is collected from the completed form 206 in a form image input process 207. Then, in a two-dimensional barcode reading process 208, a two-dimensional barcode on the form surface is read, and in a decrypting process 209, the two-dimensional barcode previously encrypted is read.
Decode a dimensional barcode. In the decryption process 209, since the encryption method is specified based on the format information of the form, the decryption process may be performed according to the format information. Note that the format information may be set in advance for each form, or the format may be automatically extracted based on the frame structure and line structure of the form.

【0022】一方、文字・記号読み取り処理210にお
いては変更された箇所を検出して文字認識を行い、変更
内容を文字・記号コードに変換する。上記文字認識には
誤読や不読が含まれるおそれがあるため、文字・記号読
み取り処理の結果は画面を介して出力コードを修正(2
11)する。
On the other hand, in the character / symbol reading process 210, the changed portion is detected and character recognition is performed, and the changed content is converted into a character / symbol code. Since the character recognition may include erroneous reading or unreading, the result of the character / symbol reading processing may be modified through the screen to correct the output code (2.
11).

【0023】統合処理212において、2次元バーコー
ドの読み取り結果に対して、文字・記号読み取り処理の
結果である変更内容でデータを置き換え、第2データベ
ース213に格納する。第2データベース213には、
第1データベース200の一部分であり、かつそれに変
更を加えた更新データが蓄積される。
In the integration process 212, the data is replaced with the changed result as a result of the character / symbol reading process with respect to the reading result of the two-dimensional barcode, and stored in the second database 213. In the second database 213,
Update data that is a part of the first database 200 and that has been changed is stored.

【0024】図4は、変更を加えた記入済み帳票の例で
ある。第1データベースから印字出力された紙の帳票4
00において、住所部分410と金額411の各内容に
変更が加えられている。訂正線(401と402)によ
って、印刷された住所が見え消しとされ、新たに手書き
で住所文字列403が記入されている。また、別の訂正
線(404と405)により、印刷された金額が見え消
しとされ、新たに手書きで金額文字列406が記入され
ている。なお、二次元バーコード407の内容は訂正前
の印刷文字列の内容となっており、二次元バーコードの
みを読み取っても変更内容を第2データベース213に
反映することはできない。従って、訂正線を検出して、
訂正文字列を読み取る。
FIG. 4 shows an example of a filled-out form with a change. Paper form 4 printed out from the first database
At 00, the contents of the address portion 410 and the amount of money 411 are changed. The printed address is erased by the correction lines (401 and 402), and the address character string 403 is newly written by hand. Further, the printed amount is erased by another correction line (404 and 405), and the amount character string 406 is newly written by hand. Note that the content of the two-dimensional barcode 407 is the content of the print character string before correction, and even if only the two-dimensional barcode is read, the changed content cannot be reflected in the second database 213. Therefore, by detecting the correction line,
Read the correction string.

【0025】図5は文字読み取り部113の処理過程を
示す。ステップ500は文字読み取り処理の開始を示
し、ステップ509は文字読み取り処理の終了を示す。
まず、ステップ501で帳票画像から帳票の書式を識別
する。ここでは帳票のレイアウトを罫線や文字行の空間
的な配置をもとに書式を識別する。
FIG. 5 shows the processing steps of the character reading unit 113. Step 500 indicates the start of the character reading process, and step 509 indicates the end of the character reading process.
First, in step 501, the form of the form is identified from the form image. Here, the format of the form is identified based on the spatial arrangement of ruled lines and character lines.

【0026】次に、ステップ502で項目と内容を対応
付ける。すなわち図3の帳票300の例でいえば氏名の
項目枠302などと、それらに対応する内容枠312な
どとの対応付けを行う。
Next, in step 502, the items are associated with the contents. That is, in the example of the form 300 shown in FIG. 3, the name frame 302 and the like are associated with the corresponding content frame 312 and the like.

【0027】次いで、ステップ503で訂正線の検出を
行う。ここでは、黒画像が横方向に連続する線分を検出
する。そのとき、線分の検出方法としては近隣に訂正線
が2本存在するという特徴を利用してもよい。ステップ
504では、帳票内にある文字列、すなわち横方向に文
字の構成要素である黒画像の塊が配置されている領域を
抽出する。
Next, in step 503, a correction line is detected. Here, a line segment in which the black image continues in the horizontal direction is detected. At this time, the feature that two correction lines exist in the vicinity may be used as a line segment detection method. In step 504, a character string in the form, that is, an area where a block of black images, which are components of a character, are arranged in the horizontal direction is extracted.

【0028】さらに、ステップ505では、抽出した文
字列の中から、訂正文字列を選択する。ここではステッ
プ503で検出した訂正線の位置座標を利用して、訂正
文字列を決定する。ステップ506では、選択した訂正
文字列の内部画像に対して、文字パターンの切り出しを
行う。そして、ステップ507で切り出した文字パター
ンに対して文字識別を行う。ステップ508で訂正文字
列に対応する項目と内容を対応付けて出力する。
In step 505, a corrected character string is selected from the extracted character strings. Here, a corrected character string is determined using the position coordinates of the correction line detected in step 503. In step 506, a character pattern is cut out from the internal image of the selected corrected character string. Then, character identification is performed on the character pattern cut out in step 507. In step 508, the item corresponding to the corrected character string is output in association with the content.

【0029】図6は統合部114での読み取り結果の統
合処理過程を示す図である。ステップ600で処理が開
始され、ステップ608で終了する。ステップ601で
2次元バーコードの復号データが2次元バーコード読み
取り部112から入力される。また、ステップ602で
文字読み取り部113のから文字読み取り結果が入力さ
れる。
FIG. 6 is a diagram showing a process of integrating read results in the integrating unit 114. The process starts at step 600 and ends at step 608. In step 601, decoded data of a two-dimensional barcode is input from the two-dimensional barcode reading unit 112. In step 602, a character reading result is input from the character reading unit 113.

【0030】ステップ603では、第2データベース1
16に登録されている項目が尽きるまで、以下のステッ
プ604および607を繰り返す。すなわちステップ6
04では文字読み取り結果に対応する項目があるかどう
かを判定し、もし項目が「あり(605)」ならば、ス
テップ607で対応する内容を2次元バーコードの復号
データから文字読み取り結果に置き換える。
In step 603, the second database 1
Steps 604 and 607 described below are repeated until the items registered in No. 16 are exhausted. That is, step 6
In step 04, it is determined whether or not there is an item corresponding to the character reading result. If the item is "present (605)", in step 607, the corresponding contents are replaced with the character reading result from the decoded data of the two-dimensional barcode.

【0031】図9は前記ステップ503の訂正線の検出
過程を説明する図である。訂正データを手書き記入した
帳票400の画像から、黒画像からなる線分が横方向に
連なる部分を検出し、この連なる部分を横線として抽出
して画像900とする。この画像900中の横線として
は、枠線901、904、905、906、909,9
10が抽出され、また訂正線として902、903およ
び907,908が抽出される。
FIG. 9 is a diagram for explaining the process of detecting the correction line in step 503. From the image of the form 400 in which the correction data is entered by hand, a portion where a line segment composed of a black image continues in the horizontal direction is detected, and the continuous portion is extracted as a horizontal line to obtain an image 900. As horizontal lines in the image 900, frame lines 901, 904, 905, 906, 909, 9
10 are extracted, and 902, 903 and 907, 908 are extracted as correction lines.

【0032】図10は、上記ステップ503の詳細過程
である。ステップ1000で訂正線の検出処理を開始す
る。まず、ステップ1001で横線を抽出する。ここで
は、黒画素が横方向に連続して配置している部分を抽出
して横線としている。なお、黒画素の連続する線分であ
る黒ランを用いて、横線を抽出してもよい。
FIG. 10 is a detailed process of step 503. In step 1000, the process of detecting a correction line is started. First, in step 1001, a horizontal line is extracted. Here, the portion where the black pixels are continuously arranged in the horizontal direction is extracted as a horizontal line. Note that a horizontal line may be extracted using a black run that is a continuous line segment of black pixels.

【0033】次いで、ステップ1002で先に抽出した
横線が尽きるまで、ステップ1003および1006の
処理を繰り返す。すなわちステップ1003では注目す
る横線の近辺に類似の横線があるかどうかを判定する。
上記類似の横線が「あり(1004)」の場合、ステッ
プ1006で当該横線を訂正線として登録する。このよ
うに、ステップ1003および1006を繰り返すこと
により、抽出した横線群の中からすべての訂正線を検出
することができる。
Next, the processing of steps 1003 and 1006 is repeated until the horizontal line previously extracted in step 1002 is exhausted. That is, in step 1003, it is determined whether there is a similar horizontal line near the horizontal line of interest.
If the similar horizontal line is “present (1004)”, the horizontal line is registered as a correction line in step 1006. Thus, by repeating steps 1003 and 1006, all correction lines can be detected from the extracted horizontal line group.

【0034】図11はステップ505の訂正文字列の選
択処理過程を説明する図である。400で示す記入済み
帳票画像から文字行を抽出した結果を1100に示す。
ここでは、文字成分の外接矩形を横方向に融合し、文字
行として当該融合矩形を抽出する。記入済み帳票画像4
00から、文字行矩形として、1101ないし1111
が抽出される。
FIG. 11 is a diagram for explaining the process of selecting a corrected character string in step 505. A result 1100 of extracting a character line from the completed form image 400 is shown in 1100.
Here, the circumscribed rectangle of the character component is merged in the horizontal direction, and the merged rectangle is extracted as a character line. Completed form image 4
From 00, character line rectangles 1101 to 1111
Is extracted.

【0035】これら抽出した文字行矩形の内で、矩形の
位置座標値を、ステップ503の訂正線の検出過程で求
めた訂正線の位置座標値と比較することによって、訂正
文字列を抽出する。例えば、訂正線として、902と9
03が検出されており、当該訂正線の最も近傍にある文
字行1102を訂正文字列とする。なお、文字列110
3は、訂正線で見え消しにされた、元々の印刷文字行で
ある。
From among the extracted character line rectangles, a corrected character string is extracted by comparing the position coordinate value of the rectangle with the position coordinate value of the correction line obtained in the process of detecting the correction line in step 503. For example, as correction lines, 902 and 9
03 is detected, and the character line 1102 closest to the correction line is set as a corrected character string. Note that the character string 110
Numeral 3 is the original printed character line, which is erased by the correction line.

【0036】[0036]

【発明の効果】本発明によれば、データベースの機密保
護のためにデータベースをネットワークを介し直接アク
セスして新しいデータベースを生成することが禁止され
ているシステムにおいて、帳票に一旦、印刷したデータ
ベースを入力する際、2次元バーコード読み取りと変更
箇所に対する文字認識を併用することにより、新しいデ
ータベースの入力作業を軽減できる効果がある。
According to the present invention, in a system in which it is prohibited to create a new database by directly accessing the database via a network for security of the database, the database once printed is input to the form. At this time, by using both the two-dimensional barcode reading and the character recognition for the changed part, there is an effect that the input work of a new database can be reduced.

【0037】さらに、変更箇所を項目と内容とを対応付
けて自動検出するため、変更箇所のデータベース登録が
容易となる。また、帳票に印刷された2次元バーコード
の内容を手書きで記入された変更文字列によって置き換
えてデータベースに登録するため、変更情報の登録が自
動的に行えるという利点がある。
Further, since the changed part is automatically detected by associating the item with the contents, the database of the changed part can be easily registered. In addition, since the contents of the two-dimensional barcode printed on the form are replaced with a changed character string entered by hand and registered in the database, there is an advantage that change information can be registered automatically.

【0038】また、機密保護のため、帳票の種類ごと
に、2次元バーコードの暗号化の方法を可変としてお
り、機密保護の信頼性を向上させることができる。
Further, for security, the encryption method of the two-dimensional bar code is variable for each type of form, so that the reliability of security can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の帳票読み取り方法を実施するシステム
構成の一例を示すブロック図。
FIG. 1 is a block diagram showing an example of a system configuration for implementing a form reading method according to the present invention.

【図2】帳票読み取り方法の手順を示すブロック図。FIG. 2 is a block diagram showing a procedure of a form reading method.

【図3】印刷された帳票の一例を示す図。FIG. 3 is a diagram illustrating an example of a printed form.

【図4】変更を加えた記入済みの帳票の例を示す図。FIG. 4 is a diagram showing an example of a filled-out form with a change.

【図5】文字読み取り部の処理過程を示すフロー図。FIG. 5 is a flowchart showing the processing steps of a character reading unit.

【図6】読み取り結果の統合処理過程を示すフロー図。FIG. 6 is a flowchart showing a process of integrating read results;

【図7】第1データベースの構成例を示す説明図。FIG. 7 is an explanatory diagram showing a configuration example of a first database.

【図8】第2データベースの構成例を示す説明図。FIG. 8 is an explanatory diagram showing a configuration example of a second database.

【図9】訂正線の検出過程の説明図。FIG. 9 is an explanatory diagram of a process of detecting a correction line.

【図10】訂正線の検出過程の詳細過程を示すフロー
図。
FIG. 10 is a flowchart showing a detailed process of detecting a correction line.

【図11】訂正文字列の選択処理過程の説明図。FIG. 11 is an explanatory diagram of a process of selecting a corrected character string.

【符号の説明】[Explanation of symbols]

100…第1データベース、116…第2データベー
ス、112…2次元バーコード読み取り部、113…文
字読み取り部、114…統合部、202…暗号化処理、
209…復号化処理、316…二次元バーコード、40
1…訂正線、403…訂正文字列、502…項目内容の
対応つけ、505…訂正文字列の選択、607…データ
置換え処理過程、701…第1データベースの構成要
素、801…第2データベースの構成要素、901…枠
線、902…訂正線、1102…訂正文字列。
100: first database, 116: second database, 112: two-dimensional barcode reading unit, 113: character reading unit, 114: integration unit, 202: encryption processing,
209: decoding process, 316: two-dimensional barcode, 40
1 ... Correction line, 403 ... Correction character string, 502 ... Correlation of item contents, 505 ... Correction character string selection, 607 ... Data replacement processing process, 701 ... Constituent elements of the first database, 801 ... Constitution of the second database Element, 901 ... frame line, 902 ... correction line, 1102 ... correction character string.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06K 17/00 G06K 17/00 A ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) G06K 17/00 G06K 17/00 A

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】帳票上の訂正前の記載情報に対応するバー
コードを上記帳票上から読み取るステップと、上記帳票
上の訂正線を検出し、訂正文字列を文字認識するステッ
プと、上記バーコード内の上記訂正文字列に対応する情
報を、上記訂正文字列の情報に置き換えるステップとを
有することを特徴とする帳票読み取り方法。
A step of reading, from the form, a bar code corresponding to the written information before correction on the form, a step of detecting a correction line on the form, and recognizing a corrected character string as a character; Replacing the information corresponding to the corrected character string with the information of the corrected character string.
【請求項2】第1のデータベースと第2のデータベース
を具備した帳票読み取りシステムであって、第1のデー
タベースをネットワークを介し直接アクセスして第2の
データベースを生成することを禁止している帳票読み取
りシステムにおいて、第1のデータベースの内容を選択
して2次元バーコードを帳票に印刷するとともに文字を
帳票に印刷し、当該印刷済み帳票に対して変更情報を記
入した帳票に対して表面画像を採取し、2次元バーコー
ドを読み取るとともに変更情報を文字認識によって読み
取り、上記2次元バーコードの内容に当該変更を加えた
情報をもとに第2のデータベースを生成することを特徴
とする帳票読み取り方法。
2. A form reading system comprising a first database and a second database, wherein the form reading is prohibited in which the first database is not directly accessed via a network to generate the second database. In the system, the contents of the first database are selected, the two-dimensional barcode is printed on the form, the characters are printed on the form, and the surface image is collected from the form in which the change information is entered for the printed form. And reading a two-dimensional bar code and reading change information by character recognition, and generating a second database based on the information obtained by adding the change to the contents of the two-dimensional bar code. .
【請求項3】請求項2の変更情報の読み取り方法は、記
入済み帳票画像から訂正線を検出し、当該訂正線の近隣
に存在する文字列の外接矩形を変更情報が記載された文
字列として抽出するとともに、変更情報に対応した項目
を抽出することを特徴とする帳票読み取り方法。
3. A method of reading change information according to claim 2, wherein a correction line is detected from the filled-out form image, and a circumscribed rectangle of a character string existing near the correction line is set as a character string in which the change information is described. A form reading method characterized by extracting items corresponding to change information as well as extracting items.
【請求項4】請求項2の第2のデータベース生成におい
て、変更情報に対応する項目および内容を文字認識の読
み取り結果を用いて2次元バーコードの内容を置き換え
ることを特徴とする帳票読み取り方法。
4. A form reading method according to claim 2, wherein in the generation of the second database, the contents and the items corresponding to the change information are replaced with the contents of the two-dimensional barcode by using the result of the character recognition reading.
【請求項5】帳票に印刷された2次元バーコードの読み
取りにおいて、帳票の種類ごとに具備されるフォーマッ
ト情報より2次元バーコードの暗号化の種類を特定し
て、当該帳票上の2次元バーコードを復号化することを
特徴とする帳票読み取り方法。
5. When reading a two-dimensional barcode printed on a form, a type of encryption of the two-dimensional barcode is specified from format information provided for each type of form, and a two-dimensional barcode on the form is specified. A form reading method characterized by decoding a code.
JP2000323304A 2000-10-18 2000-10-18 Document reading method Pending JP2002133358A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000323304A JP2002133358A (en) 2000-10-18 2000-10-18 Document reading method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000323304A JP2002133358A (en) 2000-10-18 2000-10-18 Document reading method

Publications (2)

Publication Number Publication Date
JP2002133358A true JP2002133358A (en) 2002-05-10
JP2002133358A5 JP2002133358A5 (en) 2004-12-24

Family

ID=18800999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000323304A Pending JP2002133358A (en) 2000-10-18 2000-10-18 Document reading method

Country Status (1)

Country Link
JP (1) JP2002133358A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280285A (en) * 2006-04-11 2007-10-25 Denso Wave Inc Image scanner, information medium and image information processing system
JP2014219819A (en) * 2013-05-08 2014-11-20 日立オムロンターミナルソリューションズ株式会社 Character recognition device and method therefor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280285A (en) * 2006-04-11 2007-10-25 Denso Wave Inc Image scanner, information medium and image information processing system
JP2014219819A (en) * 2013-05-08 2014-11-20 日立オムロンターミナルソリューションズ株式会社 Character recognition device and method therefor

Similar Documents

Publication Publication Date Title
US8154769B2 (en) Systems and methods for generating and processing evolutionary documents
JP5396852B2 (en) Signature system, signature device, signature verification device, and program
JP4557765B2 (en) Image processing apparatus and method
JP4854491B2 (en) Image processing apparatus and control method thereof
JP2002290714A (en) Scanner and printer integrated device, and document authentication method
JP4557875B2 (en) Image processing method and apparatus
JP2004341764A (en) Recognition method and recognition device
JP2008282094A (en) Character recognition processing apparatus
JP4935459B2 (en) Character recognition method, character recognition program, and character recognition device
JP2002133358A (en) Document reading method
JPH05120356A (en) Personal information reading storage device
JP2000181988A (en) Optical character reader
JP2875450B2 (en) Electronic approval information printing device and print verification device
JP4281236B2 (en) Image recognition apparatus, image recognition method, and computer-readable recording medium storing image recognition program
JP2006259795A (en) Business form for character recognition, and character recognition device, program, and method
JP4510371B2 (en) Document / information input system
US20220012481A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP4158681B2 (en) Image processing system
JP3959451B2 (en) Image reading system
JP4093035B2 (en) ENCRYPTION SYSTEM, ENCRYPTION METHOD, AND ENCRYPTION PROGRAM
JP2000331117A (en) Document reading system
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program
JP2556476B2 (en) Identifier registration method
JP2601253B2 (en) Image processing device
JP2006072707A (en) Authentication device, authentication program and authentication method

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060410

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060410

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060418

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060725