JPH08221508A - Character recognition processor - Google Patents

Character recognition processor

Info

Publication number
JPH08221508A
JPH08221508A JP7021499A JP2149995A JPH08221508A JP H08221508 A JPH08221508 A JP H08221508A JP 7021499 A JP7021499 A JP 7021499A JP 2149995 A JP2149995 A JP 2149995A JP H08221508 A JPH08221508 A JP H08221508A
Authority
JP
Japan
Prior art keywords
field
processing unit
kana
knowledge
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7021499A
Other languages
Japanese (ja)
Other versions
JP3335494B2 (en
Inventor
Naoyoshi Kiku
直嘉 菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP02149995A priority Critical patent/JP3335494B2/en
Publication of JPH08221508A publication Critical patent/JPH08221508A/en
Application granted granted Critical
Publication of JP3335494B2 publication Critical patent/JP3335494B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE: To automatically recognize fields to be subjected to a link knowledge processing and to link them. CONSTITUTION: A candidate character string 9 is obtained by reading characters, which are described on a form 1 having plural fields, and performs character recognition processing. An automatic Japanese syllabary (KANA)/Chinese character (KANJI) link processing part 3A retrieves a handwritten KANA field and a handwritten KANJI field, whose positions of the form 1 are in the previously decided relation, and links these fields. For the respective linked fields in the candidate character string 9, a link knowledge processing part 5 performs the link knowledge processing. For the other fields, a single knowledge processing part 4 performs a single knowledge processing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識処理装置に関
し、特に、帳票に記入されたカナ文字及び漢字の文字認
識処理においてこれらを自動的に連携させて知識処理を
行う文字認識処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition processing apparatus, and more particularly, to a character recognition processing apparatus for automatically cooperating with each other in the character recognition processing of kana and kanji written on a form to perform knowledge processing. .

【0002】[0002]

【従来の技術】図6は本発明の背景説明図であり、OC
R(光学式文字読み取り装置)等の文字認識処理装置に
おいて用いられる一般的な帳票の一例を示す。
2. Description of the Related Art FIG. 6 is a background illustration of the present invention.
An example of a general form used in a character recognition processing device such as an R (optical character reading device) is shown.

【0003】図6の帳票1には、上から順に会員番号、
申込日、郵便番号、電話番号、住所(カナ)、住所(漢
字)、氏名(カナ)、氏名(漢字)、生年月日、職業、
年令、性別が、各々、予め指定された領域(フィール
ド)に記入される。
In the form 1 in FIG. 6, the member number,
Application date, zip code, telephone number, address (kana), address (kanji), name (kana), name (kanji), date of birth, occupation,
The age and gender are entered in predesignated areas (fields).

【0004】この内、会員番号のみが活字文字で予め記
入される活字フィールドであり、他は帳票記入者によっ
て手書き文字で記入される手書きフィールドである。手
書きフィールドの内、申込日、郵便番号、電話番号、生
年月日(その後半部分)、職業、年令は数字で記入され
る数字フィールドであり、生年月日(その前半部分)、
性別は予め記入された活字文字にマーク(丸印)を付け
る記入方法で記入されるマークフィールドであり、住所
カナ、氏名カナの各フィールドはカナ文字で記入される
カナフィールドであり、住所漢字、氏名漢字の各フィー
ルドは漢字で記入される漢字フィールドである。
Of these, only the member number is a type field in which type characters are pre-filled, and the other is a handwriting field in which handwriting characters are written by the person who fills out the form. Of the handwritten fields, the date of application, zip code, telephone number, date of birth (the latter half), occupation, and age are numerical fields filled in with numbers, and the date of birth (the first half),
Gender is a mark field that is filled in by a method of putting a mark (circle mark) on a previously written type character, and each address kana, name kana field is a kana field written in kana characters, address kanji, Each field of the name and kanji is a kanji field written in kanji.

【0005】文字認識処理装置は図6に示すような帳票
に記入された文字を読み取って文字認識処理を行う。こ
の文字認識処理において、文字認識率(記入された文字
を正しく読み取った割合)を向上するために、住所及び
氏名については、カナ及び漢字の各フィールドから一旦
読み取って認識した文字列(候補文字列)につき所定の
知識処理(単独知識処理)を行う。この単独知識処理
は、各フィールド毎に行われ、予め用意された住所辞書
及び氏名辞書を用いて候補文字列を補正する処理であ
る。例えば、住所カナフィールドから読み取って認識し
た候補文字列と住所カナ辞書とを照合して、候補文字列
が2文字乃至3文字の誤りを含んでいても、これを正し
い文字列に補正して出力する。
The character recognition processing device reads characters entered in a form as shown in FIG. 6 and performs character recognition processing. In this character recognition process, in order to improve the character recognition rate (the rate at which the written characters are correctly read), for addresses and names, the character strings that were once read and recognized from the Kana and Kanji fields (candidate character strings) ), A predetermined knowledge process (independent knowledge process) is performed. This independent knowledge process is performed for each field and is a process of correcting a candidate character string using an address dictionary and a name dictionary prepared in advance. For example, the candidate character string read and recognized from the address kana field is collated with the address kana dictionary, and even if the candidate character string contains an error of 2 to 3 characters, this is corrected and output as a correct character string. To do.

【0006】更に、知識処理の一つとして、住所及び氏
名についてのカナフィールドと漢字フィールドとの連携
処理(連携知識処理)を行う。この連携知識処理は、カ
ナフィールドと漢字フィールドとから読み取った候補文
字列について、各々、独立に知識処理を行うのみでな
く、予め指定された2つのフィールドを連携させて行う
知識処理である。
Further, as one of the knowledge processes, a kana field and kanji field cooperation process (cooperation knowledge process) for an address and a name are performed. This cooperative knowledge process is a knowledge process in which not only the knowledge process is independently performed for each candidate character string read from the kana field and the kanji field, but also two fields designated in advance are cooperated.

【0007】上述の帳票1においては、例えば「住所」
を記入するフィールドとして、カナフィールドと漢字フ
ィールドの2個が存在する。そこで、例えば住所カナフ
ィールドから得た候補文字列を用いて住所漢字フィール
ドから得た候補文字列を補正し、及び/又は、住所漢字
フィールドから得た候補文字列を用いて住所カナフィー
ルドから得た候補文字列を補正する。これにより、文字
認識処理における文字認識率を高めることができる。
In the above-mentioned form 1, for example, "address"
There are two fields for entering "Kana" and "Kanji". Therefore, for example, the candidate character string obtained from the address Kanji field is corrected using the candidate character string obtained from the address Kana field, and / or the candidate character string obtained from the address Kana field is obtained using the candidate character string obtained from the address Kanji field. Correct the candidate character string. Thereby, the character recognition rate in the character recognition processing can be increased.

【0008】[0008]

【発明が解決しようとする課題】前述の従来技術によれ
ば、記入される文字の種類が多くかつ手書きであるため
にその認識が比較的困難であるカナフィールドと漢字フ
ィールドについて、連携知識処理によって文字認識率を
向上することができる。
According to the above-mentioned conventional technique, the kana field and the kanji field, which are relatively difficult to recognize because of the large number of characters to be entered and the handwriting, are processed by cooperative knowledge processing. The character recognition rate can be improved.

【0009】しかし、前述の従来技術においては、連携
知識処理を行うべきカナフィールドと漢字フィールドと
を予めオペレータが認識情報定義処理において指定する
必要がある。
However, in the above-mentioned conventional technique, it is necessary for the operator to previously specify the kana field and the kanji field for which the cooperative knowledge process should be performed in the recognition information definition process.

【0010】例えば、図6に示した帳票について文字認
識処理を行う場合、連携知識処理を行うべき部分は2個
所ある。即ち、住所カナフィールドと住所漢字フィール
ド、及び、氏名カナフィールドと氏名漢字フィールドで
ある。この場合、文字認識処理に先立って、オペレータ
が認識情報定義処理において住所カナフィールドと住所
漢字フィールドとを連携させることを指示する入力と、
氏名カナフィールドと氏名漢字フィールドとを連携させ
ることを指示する入力とを行う。
For example, when character recognition processing is performed on the form shown in FIG. 6, there are two portions where cooperative knowledge processing should be performed. That is, an address kana field and an address kanji field, and a name kana field and a name kanji field. In this case, prior to the character recognition processing, the operator inputs an instruction to link the address kana field and the address kanji field in the recognition information definition processing,
Input to instruct to link the name kana field and the name kanji field.

【0011】この連携知識処理の指示入力は、認識情報
定義処理において次のように行われる。例えば、オペレ
ータが、各フィールドを認識すべき領域(認識フィール
ド)として指定し、この後各フィールドの属性を入力
し、各フィールドに項目番号を付与する。そして、ある
フィールドについて、これと連携させたいフィールドが
あれば、項目番号を用いて連携させたいフィールドを指
定し、次にこれらを連携する指示を入力する。
The input of the instruction for the cooperative knowledge process is performed as follows in the recognition information definition process. For example, the operator designates each field as an area to be recognized (recognition field), thereafter inputs the attribute of each field, and gives an item number to each field. Then, for a certain field, if there is a field to be linked with this, the field to be linked is specified using the item number, and then an instruction to link these is input.

【0012】このように、前述の従来技術によれば、オ
ペレータは、帳票において連携知識処理を行うべき部分
の回数だけ、当該フィールドを連携させることを指示す
る入力を行う必要がある。従って、連携知識処理を行う
べき部分の数が増すと、それだけオペレータの負担が増
加する。また、帳票1の種類毎にこの指示入力を行う必
要があり、オペレータの負担になっていた。また、オペ
レータによる文字認識処理装置の操作回数が多いため
に、文字認識処理装置自体の高速化は進んでいるもの
の、文字認識処理の効率を向上できなかった。更に、オ
ペレータの入力によるため、連携知識処理の指示入力の
誤り等が発生する可能性があった。
As described above, according to the above-mentioned conventional technique, the operator needs to make an input for instructing the fields to be linked as many times as the number of portions of the form for which the linking knowledge processing should be performed. Therefore, as the number of parts to be subjected to cooperative knowledge processing increases, the burden on the operator increases accordingly. Further, it is necessary to input this instruction for each type of form 1, which is a burden on the operator. Further, since the number of times the operator operates the character recognition processing device is large, the character recognition processing device itself has been accelerated, but the efficiency of the character recognition processing cannot be improved. Further, since the input is made by the operator, there is a possibility that an error in inputting the instruction of the cooperative knowledge processing may occur.

【0013】本発明は、連携知識処理を行うべきフィー
ルドを自動的に認識してこれらを連携させる文字認識処
理装置を提供することを目的とする。また、本発明は、
連携知識処理を行うべき手書きカナフィールドと手書き
漢字フィールドとを自動的に認識してこれらを連携させ
る文字認識処理装置を提供することを目的とする。
It is an object of the present invention to provide a character recognition processing device that automatically recognizes fields for which cooperative knowledge processing should be performed and links them. Also, the present invention
An object of the present invention is to provide a character recognition processing device that automatically recognizes a handwritten kana field and a handwritten kanji field for which cooperative knowledge processing should be performed and links them.

【0014】[0014]

【課題を解決するための手段】図1は、本発明の原理構
成図であり、本発明による文字認識処理装置の構成を示
す。この文字認識処理装置は、予め定められた複数のフ
ィールドを備えた帳票1の各フィールドに記入された文
字を読み込んで、各フィールドについての文字認識処理
を行い文字認識出力6を得る文字認識処理装置である。
FIG. 1 is a principle block diagram of the present invention, showing a configuration of a character recognition processing apparatus according to the present invention. This character recognition processing device reads characters entered in each field of a form 1 having a plurality of predetermined fields, performs character recognition processing for each field, and obtains a character recognition output 6 Is.

【0015】この文字認識処理装置は、単独知識処理部
4、連携知識処理部5及び自動連携処理部3を備える。
単独知識処理部4は、所定のフィールドについての文字
認識処理における知識処理を、そのフィールド単独で行
う。連携知識処理部5は、所定のフィールドについての
文字認識処理における知識処理を、そのフィールド及び
これと連携させられた他のフィールドを連携させて行
う。自動連携処理部3は、複数のフィールドの内から、
帳票1上の位置が予め定められた関係にある複数のフィ
ールドを検索しこれらを連携させる。この時、特に、自
動連携処理部3は手書きカナフィールドと手書き漢字フ
ィールドとを連携させる。自動連携処理部3によって連
携させられた複数のフィールドについて、連携知識処理
部5がこれらを連携させてその知識処理を行う。
This character recognition processing device comprises an independent knowledge processing unit 4, a cooperative knowledge processing unit 5, and an automatic cooperation processing unit 3.
The independent knowledge processing unit 4 performs the knowledge process in the character recognition process for a predetermined field by itself. The cooperative knowledge processing unit 5 performs the knowledge process in the character recognition process for a predetermined field in cooperation with the field and other fields associated with the field. The automatic cooperation processing unit 3 selects from among a plurality of fields
A plurality of fields whose positions on the form 1 have a predetermined relationship are searched and linked. At this time, in particular, the automatic cooperation processing unit 3 cooperates the handwritten kana field and the handwritten kanji field. For a plurality of fields linked by the automatic link processing unit 3, the link knowledge processing unit 5 links these to perform the knowledge processing.

【0016】[0016]

【作用】文字認識処理における知識処理において連携さ
せるべきカナフィールドと漢字フィールド、特に、手書
きカナフィールドと手書き漢字フィールドとは、殆どの
場合、帳票1上において予め定められた関係にある。例
えば、これらは極めて近い位置や隣接する位置に設けら
れている。そこで、これを利用して、自動連携処理部3
は、帳票1上において予め定められた関係にある複数の
フィールド、特に手書きカナフィールドと手書き漢字フ
ィールドとを自動的に検索し、これらを連携させる。
In most cases, the kana field and the kanji field to be linked in the knowledge processing in the character recognition process, especially the handwritten kana field and the handwritten kanji field, have a predetermined relationship on the form 1. For example, they are provided at extremely close positions or adjacent positions. Therefore, using this, the automatic cooperation processing unit 3
Automatically retrieves a plurality of fields having a predetermined relationship on the form 1, particularly a handwritten kana field and a handwritten kanji field, and links them.

【0017】従って、本発明の文字認識処理装置によれ
ば、帳票1上において対応関係にある複数のフィール
ド、特に、手書きカナフィールドと手書き漢字フィール
ドとを自動的に連携させることができる。これにより、
殆どの帳票1において、所定の複数のフィールド、特
に、手書きカナフィールドと手書き漢字フィールドとを
連携させ、これらについて連携知識処理を行うことがで
きる。
Therefore, according to the character recognition processing apparatus of the present invention, it is possible to automatically associate a plurality of fields in correspondence on the form 1, particularly a handwritten kana field and a handwritten kanji field. This allows
In most of the forms 1, a plurality of predetermined fields, in particular, a handwritten kana field and a handwritten kanji field can be made to cooperate with each other, and cooperative knowledge processing can be performed for these fields.

【0018】これにより、連携知識処理を行うべきカナ
フィールドと漢字フィールドとを認識情報定義処理にお
いて指定する必要をなくすことができる。この結果、文
字認識処理を行う場合、オペレータが連携知識処理の指
示入力を行う必要をなくし、オペレータの負担を極めて
少なくでき、また、連携知識処理の指示入力の誤り等の
発生を防止することができる。更に、帳票1の種類が異
なる場合であっても、その都度連携知識処理の指示入力
を行う必要をなくすことができる。また、オペレータに
よる操作を少なくできるので、文字認識処理の効率を向
上することができる。
As a result, it is possible to eliminate the need to specify the kana field and the kanji field for which the cooperative knowledge process should be performed in the recognition information definition process. As a result, when performing character recognition processing, the operator does not need to input instructions for cooperative knowledge processing, the burden on the operator can be extremely reduced, and errors in instruction input for cooperative knowledge processing can be prevented. it can. Further, even when the types of the form 1 are different, it is possible to eliminate the need to input the instruction of the cooperative knowledge processing each time. Moreover, since the number of operations by the operator can be reduced, the efficiency of character recognition processing can be improved.

【0019】[0019]

【実施例】図2は実施例構成図であり、文字認識処理装
置を示す。本実施例の文字認識処理装置は、帳票1に記
入された文字を読み取る読み取り処理部7、これが読み
取った結果について文字認識処理を行って候補文字列9
を得る文字認識処理部8及び候補文字列9について知識
処理を行って文字認識出力6を得る知識処理部11を備
える。読み取り処理部7、文字認識処理部8及び知識処
理部11は処理装置2に設けられる。処理装置2は、当
該文字認識処理装置のCPU(中央演算処理装置)と、
文字認識処理装置のメモリ上の各処理プログラムとから
なる。処理プログラムは、例えば読み取り処理部7を構
成する読み取り処理プログラム、文字認識処理部8を構
成する文字認識処理プログラム、知識処理部11を構成
する知識処理プログラム等を含む。
FIG. 2 is a block diagram of an embodiment, showing a character recognition processing device. The character recognition processing apparatus according to the present embodiment reads a character written on the form 1, a reading processing unit 7, performs a character recognition process on a result read by the reading processing unit 7, and a candidate character string 9
And a knowledge processing unit 11 that obtains a character recognition output 6 by performing knowledge processing on the candidate character string 9. The reading processing unit 7, the character recognition processing unit 8, and the knowledge processing unit 11 are provided in the processing device 2. The processing device 2 includes a CPU (central processing unit) of the character recognition processing device,
Each processing program on the memory of the character recognition processing device. The processing programs include, for example, a reading processing program forming the reading processing unit 7, a character recognition processing program forming the character recognition processing unit 8, a knowledge processing program forming the knowledge processing unit 11, and the like.

【0020】読み取り処理部7は、帳票1が所定の入力
装置(図示せず)から入力されると、これに記入された
活字文字、手書き文字及びマークを読み取る。帳票1は
予め定められた複数のフィールドを備え、その各フィー
ルドには文字等が記入されている。読み取り処理部7は
各フィールドに記入された文字等を各フィールドの内容
として読み取る。読み取り処理部7は、複数枚の帳票1
の読み取りを終了すると、帳票1毎にその読み取りの結
果を予め定められた所定の記憶領域に格納した上で、文
字認識処理部8を起動する。
When the form 1 is input from a predetermined input device (not shown), the reading processing unit 7 reads the type characters, handwritten characters and marks written on the form 1. The form 1 is provided with a plurality of predetermined fields, and characters or the like are entered in each of the fields. The reading processing unit 7 reads characters and the like written in each field as the contents of each field. The reading processing unit 7 includes a plurality of forms 1
When the reading is completed, the result of the reading for each form 1 is stored in a predetermined storage area, and the character recognition processing unit 8 is activated.

【0021】ここで、帳票1としては、例えば図6に示
した帳票が用いられる。従って、この帳票1には、上か
ら順に会員番号、申込日、郵便番号、電話番号、住所
(カナ)、住所(漢字)、氏名(カナ)、氏名(漢
字)、生年月日、職業、年令、性別が、各々、予め指定
されたフィールドに記入される。
Here, as the form 1, for example, the form shown in FIG. 6 is used. Therefore, this form 1 has a membership number, application date, postal code, telephone number, address (kana), address (kanji), name (kana), name (kanji), date of birth, occupation, year in order from the top. The age and gender are entered in predesignated fields.

【0022】前述のように、会員番号のみが活字フィー
ルドであり、他は手書きフィールドである。手書きフィ
ールドの内、申込日、郵便番号、電話番号、生年月日、
職業、年令のフィールドは数字フィールドであり、生年
月日、性別のフィールドはマークフィールドであり、住
所カナ、氏名カナの各フィールドはカナフィールドであ
り、住所漢字、氏名漢字の各フィールドは漢字フィール
ドである。申込日、郵便番号、住所、氏名等は、当該各
フィールドに記入されたデータ(即ち、知識)の属性で
ある。
As described above, only the member number is the print field and the others are the handwritten fields. In the handwritten field, application date, zip code, telephone number, date of birth,
Occupation and age fields are numeric fields, date of birth and gender fields are mark fields, address kana and name kana fields are kana fields, and address kanji and name kanji fields are kanji fields. Is. The application date, postal code, address, name, etc. are attributes of the data (that is, knowledge) entered in the respective fields.

【0023】文字認識処理部8は、読み取り処理部7か
ら起動されると、所定の記憶領域に格納されている複数
枚の帳票1の読み取り結果について文字認識処理を行
い、文字認識結果である候補文字列9を得る。候補文字
列9は所定の様式で所定のファイルに格納される。候補
文字列9は1個の帳票1毎に得られる。1個の帳票1に
ついての候補文字列9(1個の候補文字列9)は、1個
の帳票1の各フィールド毎の候補文字列からなる。文字
認識処理部8は、帳票1についての文字認識により候補
文字列9を得ると、知識処理部11を起動して候補文字
列9についての知識処理を行わせる。なお、知識処理部
11は文字認識処理部8に含まれるものであってもよ
い。
When the character recognition processing unit 8 is activated by the reading processing unit 7, the character recognition processing unit 8 performs character recognition processing on the reading results of a plurality of sheets 1 stored in a predetermined storage area, and candidates for the character recognition results are obtained. Get the character string 9. The candidate character string 9 is stored in a predetermined file in a predetermined format. The candidate character string 9 is obtained for each form 1. The candidate character string 9 (one candidate character string 9) for one form 1 is composed of candidate character strings for each field of one form 1. When the character recognition processing unit 8 obtains the candidate character string 9 by character recognition of the form 1, the knowledge processing unit 11 is activated to perform the knowledge processing on the candidate character string 9. The knowledge processing unit 11 may be included in the character recognition processing unit 8.

【0024】知識処理部11は、文字認識処理部8から
起動されると、候補文字列9についての知識処理を行い
文字認識出力6を得る。この知識処理は、1個の候補文
字列9毎に行われ、1個の候補文字列9において各フィ
ールド毎の候補文字列を処理単位として行われる。
When the knowledge processing unit 11 is activated by the character recognition processing unit 8, the knowledge processing unit 11 performs knowledge processing on the candidate character string 9 to obtain the character recognition output 6. This knowledge processing is performed for each one candidate character string 9 and is performed for each candidate character string 9 in each candidate field as a processing unit.

【0025】知識処理部11は、知識処理の前処理を行
うカナ漢字自動連携処理部3A、前処理の結果に従って
知識処理を行う単独知識処理部4及び連携知識処理部
5、主として単独知識処理部4及び連携知識処理部5が
知識処理のために用いる属性データ10及び辞書14を
備える。
The knowledge processing section 11 is a kana-kanji automatic cooperation processing section 3A for performing preprocessing of knowledge processing, an independent knowledge processing section 4 and an associated knowledge processing section 5 for performing knowledge processing according to the result of the preprocessing, mainly an independent knowledge processing section. 4 and the associated knowledge processing unit 5 includes attribute data 10 and a dictionary 14 used for knowledge processing.

【0026】カナ漢字自動連携処理部3Aは、図1の自
動連携処理部3に対応し、知識処理の前処理として各フ
ィールド毎の候補文字列について、知識処理の対象とす
るか、単独知識処理の対象とするか、連携知識処理の対
象とするかを決定する。
The kana-kanji automatic cooperation processing unit 3A corresponds to the automatic cooperation processing unit 3 of FIG. 1 and, as a preprocessing of the knowledge processing, the candidate character strings for each field are targeted for the knowledge processing or the independent knowledge processing. Or the target of the collaborative knowledge processing is determined.

【0027】まず、カナ漢字自動連携処理部3Aは、候
補文字列9の各フィールド毎の候補文字列について、知
識処理の対象とするか否かの決定を行う。この決定処理
において、カナ漢字自動連携処理部3Aは、本来は単独
知識処理部4及び連携知識処理部5が知識処理のために
用いるデータである属性データ10を参照する。
First, the kana-kanji automatic cooperation processing unit 3A determines whether or not the candidate character string for each field of the candidate character string 9 is to be the target of knowledge processing. In this determination processing, the Kana-Kanji automatic cooperation processing unit 3A refers to the attribute data 10 which is originally data used by the independent knowledge processing unit 4 and the cooperation knowledge processing unit 5 for knowledge processing.

【0028】属性データ10は帳票1の種類毎に予め用
意される。即ち、図中点線で示すように、帳票1の種類
と属性データ10とは1対1に対応する。属性データ1
0は、1種類の帳票1において、各フィールド毎にその
属性を格納する。格納される属性としては、記入方法に
よって定まる属性である手書き/活字の種別、記入され
る文字の種類によって定まる属性であるカナ/漢字/数
字/英字/混在の種別、当該フィールドの帳票1上の位
置によって定まる属性である位置情報、当該フィールド
について知識処理が必要かによって定まる属性である知
識処理の要否がある。
The attribute data 10 is prepared in advance for each type of form 1. That is, as shown by the dotted line in the figure, the type of the form 1 and the attribute data 10 have a one-to-one correspondence. Attribute data 1
0 stores the attribute for each field in one type of form 1. The attributes to be stored are the type of handwriting / printing, which is determined by the writing method, the type of kana / kanji / numeric / alphabetic / mixed, which is the attribute determined by the type of written characters, and the type 1 of the field There is necessity of position information, which is an attribute determined by the position, and knowledge processing, which is an attribute determined by whether knowledge processing is required for the field.

【0029】例えば図6に示した帳票1については、会
員番号フィールドの属性は「活字、数字、位置情報、知
識処理不要」とされる。申込日、郵便番号、電話番号、
生年月日(前半部分)、職業、年令の各フィールドの属
性は「手書き、数字、位置情報、知識処理不要」とされ
る。生年月日(後半部分)、性別の各フィールドの属性
は「手書き、マーク、位置情報、知識処理不要」とされ
る。住所カナ、氏名カナの各フィールドの属性は「手書
き、カナ、位置情報、知識処理必要」とされる。住所漢
字、氏名漢字の各フィールドの属性は「手書き、漢字、
位置情報、知識処理必要」とされる。
For example, in the form 1 shown in FIG. 6, the attribute of the member number field is "print type, number, position information, knowledge processing not required". Application date, zip code, phone number,
The attributes of the fields of birth (first half), occupation, and age are "handwriting, numbers, position information, and knowledge processing is not required". The attributes of the fields of birth (second half) and gender are "handwriting, marks, position information, and no knowledge processing required". The attributes of the fields of address kana and name kana are "handwriting, kana, position information, knowledge processing required". The attributes of the address Kanji and name Kanji fields are "Handwriting, Kanji,
Position information and knowledge processing are required ”.

【0030】なお、以上の他に、各フィールドの項目番
号(例えば、会員番号フィールドの項目番号は「1」で
ある)、各フィールドに記入されるデータ(知識)の内
容によって定まる属性(知識属性)である「会員番号」
等も、各フィールドについて、その属性として記述され
る。
In addition to the above, the item number of each field (for example, the item number of the member number field is "1") and the attribute (knowledge attribute) determined by the content of the data (knowledge) entered in each field. ) Is the "membership number"
Etc. are described as attributes of each field.

【0031】このような属性データ10は、文字認識処
理の開始に先立って実行される認識情報定義処理におい
て、文字認識処理装置の備える入出力装置(図示せず)
からオペレータによって予め入力され、所定のファイル
に格納される。例えば、オペレータが未記入の帳票1を
読み込ませると、これを文字認識処理装置がその入出力
装置の表示画面に表示する。そこで、オペレータが、マ
ウス等を用いてこの画面から各フィールドを定義し、定
義した各フィールドについての各属性(位置情報を除
く)を入出力装置から入力する。このような属性データ
10の作成及び管理は所定の処理プログラムが行う。
Such attribute data 10 is input / output device (not shown) included in the character recognition processing device in the recognition information definition process executed prior to the start of the character recognition process.
Is input in advance by the operator from and is stored in a predetermined file. For example, when the operator reads the blank form 1, the character recognition processing device displays it on the display screen of the input / output device. Therefore, the operator defines each field from this screen using a mouse or the like, and inputs each attribute (excluding position information) for each defined field from the input / output device. A predetermined processing program creates and manages such attribute data 10.

【0032】属性の内の位置情報については、当該処理
プログラムによって自動的に設定される。即ち、オペレ
ータが各フィールドを定義した際に、画面上において入
力した点のX座標(位置)及びY座標(位置)が、その
まま当該フィールドの位置情報とされる。
The position information in the attributes is automatically set by the processing program. That is, when the operator defines each field, the X coordinate (position) and the Y coordinate (position) of the point input on the screen are used as the position information of the field.

【0033】この位置情報について図3により説明す
る。図3は図6に示す帳票1の一部を拡大して示す。帳
票1上の位置情報は、マーク1Aを基準として、X座標
(位置)及びY座標(位置)により定められる。図中、
横方向をX方向とし、縦方向(検索の方向)をY方向と
する。なお、マーク1Aが印刷されていない場合、帳票
1の端部を基準として定められる。即ち、帳票1上の各
フィールドの位置は、マーク1Aの開始X位置であるX
S からの距離と、マーク1Aの開始Y位置であるYS
らの距離とによって表される。
This position information will be described with reference to FIG. FIG. 3 shows an enlarged part of the form 1 shown in FIG. The position information on the form 1 is defined by the X coordinate (position) and the Y coordinate (position) with reference to the mark 1A. In the figure,
The horizontal direction is the X direction, and the vertical direction (search direction) is the Y direction. When the mark 1A is not printed, the end of the form 1 is set as a reference. That is, the position of each field on the form 1 is the start X position of the mark 1A.
The distance from S, is represented by the distance from Y S is the starting Y position of the mark 1A.

【0034】例えば、図3において、帳票1の先頭から
5番目(項目番号が5)のフィールドである住所カナフ
ィールドの開始X位置はX51であり、開始Y位置はY51
であり、終了Y位置はY52である。なお、終了X位置X
52(図示省略)も同様に定まる。また、他の各フィール
ドについても同様である。位置情報の開始X位置及び開
始Y位置は、各々、X方向及びY方向に帳票1を検索す
る場合において当該フィールドが開始される位置を示
す。
For example, in FIG. 3, the start X position of the address kana field, which is the fifth field (item number 5) from the beginning of the form 1, is X 51 , and the start Y position is Y 51.
And the end Y position is Y 52 . Note that the end X position X
52 (not shown) is similarly determined. The same applies to other fields. The start X position and the start Y position of the position information indicate the position where the field is started when the form 1 is searched in the X direction and the Y direction, respectively.

【0035】図3に示すような帳票1が入出力装置の表
示画面に表示された状態において、オペレータが、当該
フィールドの左上端1B及び右下端(左上端1Bの対
角、図示せず)等にマウスを位置付けて、当該住所カナ
フィールドを指定する。この時、処理プログラムが、住
所カナフィールドの開始X位置、開始Y位置、終了X位
置、終了Y位置を、その位置情報として属性データ10
に書き込む。これは各フィールドについて行われる。こ
れにより、各フィールドの位置情報は当該処理プログラ
ムによって自動的に設定される。
When the form 1 as shown in FIG. 3 is displayed on the display screen of the input / output device, the operator operates the upper left corner 1B and the lower right corner (diagonal of the upper left corner 1B, not shown) of the field. Position the mouse on and specify the address kana field. At this time, the processing program sets the start X position, the start Y position, the end X position, and the end Y position of the address kana field as position information of the attribute data 10
Write in. This is done for each field. Thereby, the position information of each field is automatically set by the processing program.

【0036】このような属性データ10を参照して、カ
ナ漢字自動連携処理部3Aは、帳票1の各フィールドの
内、手書きであって、かつ、カナ文字又は漢字の記入さ
れているフィールドを知識処理の対象とする。即ち、手
書きカナフィールド及び手書き漢字フィールドは、記入
される文字の種類が多くて字形が記入者の個性に依存す
るために、文字認識処理のみでは文字認識率を高めるこ
とが難しいので、知識処理によって候補文字列9を補正
する。一方、カナ漢字自動連携処理部3Aは活字フィー
ルド及び数字フィールドを知識処理の対象から除く。
With reference to such attribute data 10, the kana-kanji automatic linkage processing unit 3A knows, among the fields of the form 1, a field that is handwritten and has kana characters or kanji written therein. Target for processing. That is, in the handwritten kana field and the handwritten kanji field, it is difficult to increase the character recognition rate only by the character recognition process because the type of characters to be entered is large and the character shape depends on the personality of the writer. The candidate character string 9 is corrected. On the other hand, the kana-kanji automatic cooperation processing unit 3A excludes the type field and the number field from the knowledge processing targets.

【0037】例えば図6に示した帳票1においては、会
員番号フィールドはその属性が「活字」であるので知識
処理の対象から除かれ、申込日、郵便番号、電話番号、
生年月日、職業、年令、性別の各フィールドも属性が
「数字」であるので除かれる。一方、手書きカナフィー
ルドである住所カナ、氏名カナの各フィールドと、手書
き漢字フィールドである住所漢字、氏名漢字の各フィー
ルドとが、知識処理の対象とされる。
For example, in the form 1 shown in FIG. 6, since the attribute of the member number field is "print", it is excluded from the knowledge processing target, and the application date, postal code, telephone number,
The birth date, occupation, age, and sex fields are also excluded because their attributes are "numbers". On the other hand, the address kana and name kana fields, which are handwritten kana fields, and the address kanji and name kanji fields, which are handwritten kanji fields, are subjected to knowledge processing.

【0038】次に、カナ漢字自動連携処理部3Aは、知
識処理の対象とすると決定した各フィールド毎の候補文
字列について、単独知識処理又は連携知識処理のいずれ
の対象とするかを決定する。即ち、帳票1上のフィール
ドを他のフィールドと連携させるか否かを決定する。連
携知識処理の対象とされなかったフィールドは単独知識
処理の対象とされる。
Next, the kana-kanji automatic cooperation processing unit 3A determines whether the candidate character string for each field determined to be the target of the knowledge processing is to be the target of the independent knowledge processing or the cooperative knowledge processing. That is, it is determined whether or not the fields on the form 1 are to be linked with other fields. Fields that have not been subjected to cooperative knowledge processing are subject to independent knowledge processing.

【0039】連携知識処理の対象とすべきフィールド
は、手書きであって、かつ、カナ又は漢字の記入されて
いるフィールドである。例えば図6に示した帳票1にお
いては、住所カナフィールドと住所漢字フィールド、及
び、氏名カナフィールドと氏名漢字フィールドが各々連
携させるべき対象である。
The field to be the target of the collaborative knowledge processing is a field which is handwritten and in which kana or kanji is entered. For example, in the form 1 shown in FIG. 6, the address kana field and the address kanji field, and the name kana field and the name kanji field are targets to be linked.

【0040】なお、図6に示した帳票1においては、知
識処理の対象とすべきフィールドは全て連携知識処理の
対象とすべきフィールドであったが、帳票1の種類によ
っては、知識処理の対象とすべきフィールドの中に連携
知識処理の対象とすべきでないフィールドが含まれる場
合もある。
In the form 1 shown in FIG. 6, all the fields to be the target of the knowledge processing are the fields to be the target of the collaborative knowledge processing, but depending on the type of the form 1, the target of the knowledge processing. In some cases, the fields that should be included include fields that should not be the target of the cooperative knowledge processing.

【0041】ここで、図6及び図3からも判るように、
連携知識処理の対象とすべきフィールドは、帳票1上に
おける位置が予め定められており、極めて近い位置にあ
るか又は隣接している。そこで、カナ漢字自動連携処理
部3Aは、帳票1上の複数のフィールドの内から、帳票
1上の位置が予め定められた関係にあるカナフィールド
と漢字フィールドとを検索する。即ち、「帳票1上の位
置が予め定められた関係にある」ことを検索条件として
検索を行う。そして、検索の結果、抽出されたカナフィ
ールドと漢字フィールドとを連携させる。特に、このよ
うな位置関係にある手書きカナフィールド及び手書き漢
字フィールドを連携させる。
Here, as can be seen from FIGS. 6 and 3,
The fields to be subjected to the cooperative knowledge processing have predetermined positions on the form 1, and are located at extremely close positions or adjacent to each other. Therefore, the kana-kanji automatic cooperation processing unit 3A searches the plurality of fields on the form 1 for a kana field and a kanji field whose positions on the form 1 have a predetermined relationship. That is, the search is performed with "the positions on the form 1 having a predetermined relationship" as the search condition. Then, as a result of the search, the extracted kana field and the kanji field are linked. In particular, the handwritten kana field and the handwritten kanji field having such a positional relationship are linked.

【0042】帳票1上の位置が予め定められた関係にあ
るカナフィールドと漢字フィールドとを検索するため
に、カナ漢字自動連携処理部3Aは、横書き用認識フィ
ールド検索処理部12及び縦書き用認識フィールド検索
処理部13を備える。
In order to search a kana field and a kanji field whose positions on the form 1 have a predetermined relationship, the kana-kanji automatic cooperation processing section 3A recognizes the horizontal writing recognition field search processing section 12 and the vertical writing recognition. A field search processing unit 13 is provided.

【0043】横書き用認識フィールド検索処理部12
は、帳票1が図6及び図3のように横書きである場合に
おいて、連携すべきフィールドを検索する。横書き用認
識フィールド検索処理部12は、横書き用の帳票1をそ
の上から下方向(Y方向)に向かって検索し、帳票1上
の複数のフィールドの内から、帳票1上において互いの
開始X位置が実質的に同一で、かつ、より下方のフィー
ルドの開始Y位置がその上方のフィールドに極めて近い
位置にあるカナフィールドと漢字フィールドとを検索す
る。即ち、「帳票1上において互いの開始X位置が実質
的に同一で、かつ、より下方のフィールドの開始Y位置
がその上方のフィールドに極めて近い位置にある」こと
を検索条件として検索を行う。
Horizontal writing recognition field search processing unit 12
Searches for fields to be linked when the form 1 is horizontally written as shown in FIGS. 6 and 3. The horizontal writing recognition field search processing unit 12 searches for the horizontal writing form 1 from the upper side to the lower side (Y direction), and finds the start X of each other on the form 1 from among the plurality of fields on the form 1. A kana field and a kanji field whose positions are substantially the same and whose starting Y position of the lower field is extremely close to the upper field are searched. That is, the search is performed under the search condition that "the starting X positions of the forms 1 are substantially the same on the form 1 and the starting Y positions of the lower fields are extremely close to the upper fields".

【0044】例えば、図3の帳票1においては、住所カ
ナフィールドと住所漢字フィールドとは、互いの開始X
位置X51とX61とが同一で、かつ、より下方の住所漢字
フィールドの開始Y位置Y61がその上方の住所カナフィ
ールドの終了Y位置Y52に極めて近い位置にある。氏名
カナフィールドと氏名漢字フィールドとについても同一
である。従って、これらが連携すべきフィールドとして
検索される。
For example, in the form 1 of FIG. 3, the address Kana field and the address Kanji field are the start X of each other.
The positions X 51 and X 61 are the same, and the starting Y position Y 61 of the lower address Kanji field is extremely close to the ending Y position Y 52 of the upper address Kana field. The same applies to the name kana field and the name kanji field. Therefore, these are searched as fields to be linked.

【0045】開始X位置が実質的に同一か否かの判断
は、住所カナフィールドと住所漢字フィールドの開始X
位置の差(X61−X51)が所定の値Aより小さいか否か
によって行う。所定の値Aは、極めて小さい値とされ、
予め与えられる。
Whether or not the start X positions are substantially the same is determined by the start X of the address Kana field and the address Kanji field.
This is performed depending on whether or not the position difference (X 61 -X 51 ) is smaller than the predetermined value A. The predetermined value A is an extremely small value,
Given in advance.

【0046】また、開始Y位置が極めて近い位置にある
か否かの判断は、住所カナフィールドの終了Y位置と住
所漢字フィールドの開始Y位置との差(Y61−Y52)が
所定の値Bより小さいか否かによって行う。所定の値B
は予め与えられる。所定の値Bは、例えば1文字分の記
入領域の1辺の値(Y62−Y61)又は(X52−X51)と
される。なお、所定の値Aは、所定の値Bよりも十分に
小さい値とされる。
Further, the judgment as to whether or not the start Y position is extremely close is made by determining the difference (Y 61 -Y 52 ) between the end Y position of the address kana field and the start Y position of the address kanji field as a predetermined value. It is performed depending on whether it is smaller than B or not. Predetermined value B
Is given in advance. The predetermined value B is, for example, a value (Y 62 -Y 61 ) or (X 52 -X 51 ) on one side of the writing area for one character. Note that the predetermined value A is a value that is sufficiently smaller than the predetermined value B.

【0047】なお、連携すべきフィールドを検索する条
件は、上述の検索条件には限られない。例えば、手書き
カナフィールドと手書き漢字フィールドとが同一の知識
属性を有することを検索条件としてもよい。また、帳票
1上において、手書きカナフィールドと手書き漢字フィ
ールドとが隣接していることを検索条件としてもよい。
更に、これらの検索条件を必要に応じて変更できるよう
にしてもよい。
The conditions for searching the fields to be linked are not limited to the above search conditions. For example, the handwriting kana field and the handwriting kanji field may have the same knowledge attribute as the search condition. Further, on the form 1, the handwritten kana field and the handwritten kanji field may be adjacent to each other as a search condition.
Further, these search conditions may be changed as needed.

【0048】横書き用認識フィールド検索処理部12
は、この検索を次のように行う。帳票1をY方向に検索
するために、検索対象のY位置を用いて属性データ10
を参照する。各フィールドの開始Y位置と検索対象Y位
置とが等しくなった時、当該フィールドが検索されたこ
とになる。検索対象Y位置は値YSからインクリメント
される。なお、例えば、会員番号フィールドと申込日フ
ィールドのように開始Y位置の等しいフィールドが複数
ある場合、更に、属性データ10の開始X位置が参照さ
れ、より小さい値を持つフィールド(例えば、会員番号
フィールド)が先に検索される。
Horizontal writing recognition field search processing unit 12
Performs this search as follows: In order to search the form 1 in the Y direction, the attribute data 10 is searched using the Y position of the search target.
Refer to. When the start Y position of each field is equal to the search target Y position, the field is searched. The search target Y position is incremented from the value Y S. Note that, for example, when there are a plurality of fields having the same starting Y position, such as the membership number field and the application date field, the starting X position of the attribute data 10 is further referred to, and a field having a smaller value (for example, the membership number field). ) Is searched first.

【0049】縦書き用認識フィールド検索処理部13
は、帳票1が縦書きである場合において、連携すべきフ
ィールドを検索する。縦書き用認識フィールド検索処理
部13は、縦書き用の帳票をその右から左方向に向かっ
て検索し、帳票上の複数のフィールドの内から、帳票1
上において互いの開始Y位置が実質的に同一で、かつ、
より左方のフィールドの開始X位置がその右方のフィー
ルドに極めて近い位置にあるカナフィールドと漢字フィ
ールドとを検索する。即ち、「帳票1上において互いの
開始Y位置が実質的に同一で、かつ、より左方のフィー
ルドの開始X位置がその右方のフィールドに極めて近い
位置にある」ことを検索条件として検索を行う。
Vertical writing recognition field search processing unit 13
Searches for fields to be linked when the form 1 is vertically written. The vertical writing recognition field search processing unit 13 searches for a vertical writing form from the right to the left, and selects a form 1 from a plurality of fields on the form.
The starting Y positions of each other are substantially the same, and
The Kana field and the Kanji field in which the start X position of the field on the left side is extremely close to the field on the right side are searched. In other words, the search is performed with the search condition that "the start Y positions of the two are substantially the same on the form 1 and the start X position of the left field is extremely close to the right field". To do.

【0050】例えば、図3又は図6の帳票1を90度回
転させて、会員番号フィールドが帳票1の右端において
縦書きの領域となるような帳票を考える。X方向及びY
方向は図3又は図6の例とは逆になる。このような帳票
においては、住所カナフィールドと住所漢字フィールド
とは、互いの開始Y位置が同一で、かつ、互いの開始X
位置が極めて近い位置にある。氏名カナフィールドと氏
名漢字フィールドとについても同一である。従って、こ
れらが連携すべきフィールドとして検索される。検索条
件及び検索方法は上記の場合と同様である。
For example, consider a form in which the form 1 in FIG. 3 or FIG. 6 is rotated 90 degrees so that the member number field becomes a vertical writing area at the right end of the form 1. X direction and Y
The direction is opposite to that in the example of FIG. 3 or FIG. In such a form, the address Kana field and the address Kanji field have the same starting Y position and the starting X position.
The position is extremely close. The same applies to the name kana field and the name kanji field. Therefore, these are searched as fields to be linked. The search condition and the search method are the same as in the above case.

【0051】以上の処理によって、カナ漢字自動連携処
理部3Aは、知識処理の対象とされた各フィールドの
内、住所カナフィールドと住所漢字フィールドとを連携
させ、氏名カナフィールドと氏名漢字フィールドとを連
携させる。
Through the above processing, the kana-kanji automatic linkage processing section 3A links the address kana field and the address kanji field among the fields subjected to the knowledge processing, and creates the name kana field and the name kanji field. Make them work together.

【0052】カナ漢字自動連携処理部3Aは、この連携
処理を次のように行う。便宜的に、先に検索された住所
カナフィールドを連携される側とし、後に検索された住
所漢字フィールドを連携する側とする。属性データ10
において、連携される側の住所カナフィールドの属性
に、連携フラグを立て、連携する側の住所漢字フィール
ドの項目番号「6」を設定する。氏名フィールドについ
ても同様である。
The Kana-Kanji automatic cooperation processing unit 3A performs this cooperation processing as follows. For convenience, the previously searched address kana field is set as the side to be linked, and the subsequently searched address kanji field is set as the side to be linked. Attribute data 10
In step 3, the cooperation flag is set in the attribute of the address kana field of the cooperation side, and the item number “6” of the address kanji field of the cooperation side is set. The same applies to the name field.

【0053】カナ漢字自動連携処理部3Aは、以上の前
処理の結果に従って、単独知識処理部4又は連携知識処
理部5に制御を渡す。単独知識処理部4又は連携知識処
理部5は辞書14を用いて知識処理を行う。
The kana-kanji automatic cooperation processing unit 3A transfers control to the independent knowledge processing unit 4 or the cooperation knowledge processing unit 5 according to the result of the above preprocessing. The independent knowledge processing unit 4 or the cooperative knowledge processing unit 5 uses the dictionary 14 to perform knowledge processing.

【0054】辞書14は、氏名カナ辞書、氏名漢字辞
書、住所カナ辞書、住所漢字辞書からなる。例えば、氏
名カナ辞書は氏名カナフィールドの知識処理のための辞
書であり、存在する氏及び名をカナで記述したデータか
らなる。氏名漢字辞書、住所カナ辞書、住所漢字辞書に
ついても同様である。
The dictionary 14 includes a name kana dictionary, a name kanji dictionary, an address kana dictionary, and an address kanji dictionary. For example, the name / kana dictionary is a dictionary for knowledge processing of the name / kana field, and is composed of data in which existing names and names are described in kana. The same applies to the name / kanji dictionary, address kana dictionary, and address kanji dictionary.

【0055】単独知識処理部4は、所定のフィールドに
ついての文字認識処理における知識処理を、そのフィー
ルド単独で行う。即ち、カナ漢字自動連携処理部3Aに
おいて、他のフィールドと連携されなかったフィールド
について、以下の単独知識処理を行う。
The independent knowledge processing unit 4 performs the knowledge processing in the character recognition processing for a predetermined field by the field alone. That is, in the Kana-Kanji automatic cooperation processing unit 3A, the following independent knowledge processing is performed for fields that are not cooperated with other fields.

【0056】単独知識処理部4は、カナ漢字自動連携処
理部3Aから処理対象であるフィールドの項目番号と共
に制御を渡されると、その項目番号の示すフィールドに
ついての単独知識処理を行う。
When the independent knowledge processing unit 4 is given control from the Kana-Kanji automatic cooperation processing unit 3A together with the item number of the field to be processed, the independent knowledge processing unit 4 carries out independent knowledge processing for the field indicated by the item number.

【0057】即ち、項目番号を用いて候補文字列9から
当該フィールドから得た候補文字列を取り出す。また、
属性データ10の当該項目番号の属性を参照し、その属
性を知る。そこで、取り出した候補文字列を用いて該当
する辞書14を照合して、その候補文字列が存在するか
否かを調べ、存在する場合はそのままとし、存在しない
場合は辞書14に存在する近い文字列を候補文字列とす
る補正を行う。
That is, the candidate character string obtained from the field is extracted from the candidate character string 9 using the item number. Also,
By referring to the attribute of the item number of the attribute data 10, the attribute is known. Therefore, the extracted candidate character string is used to collate the corresponding dictionary 14 to check whether or not the candidate character string exists. If the candidate character string exists, the candidate character string is left as it is. Correction is performed using the columns as candidate character strings.

【0058】連携知識処理部5は、所定のフィールドに
ついての文字認識処理における知識処理を、そのフィー
ルドとこれと連携させられた他のフィールドとを連携さ
せて行う。即ち、カナ漢字自動連携処理部3Aによって
連携させられた手書きカナフィールドと手書き漢字フィ
ールドとについて、以下の連携知識処理を行う。
The cooperative knowledge processing unit 5 performs knowledge processing in character recognition processing for a predetermined field by coordinating that field with other fields associated with this field. That is, the following collaborative knowledge process is performed on the handwritten kana field and the handwritten kanji field that are collaborated by the kana-kanji automatic collaboration processing unit 3A.

【0059】具体的には、カナ漢字自動連携処理部3A
から処理対象であるフィールドの項目番号と共に制御を
渡されると、その項目番号の示すフィールドについての
連携知識処理を行う。
Specifically, the kana-kanji automatic cooperation processing unit 3A
When the control is passed from the item together with the item number of the field to be processed, cooperative knowledge processing for the field indicated by the item number is performed.

【0060】例えば、項目番号が氏名カナフィールドを
示す「7」である場合、氏名カナフィールドから得た候
補文字列を候補文字列9から取り出す。また、属性デー
タ10の項目番号「7」の属性(氏名カナフィールドの
属性)を参照し、その属性として氏名及びカナを知る。
更に、氏名カナフィールドの属性として、連携フラグが
立っていることと、連携の対象が項目番号「8」の氏名
漢字フィールドであることを知る。
For example, when the item number is “7” indicating the name and kana field, the candidate character string obtained from the name and kana field is extracted from the candidate character string 9. Further, the attribute (name and kana field attribute) of the item number “7” of the attribute data 10 is referred to, and the name and kana are known as the attributes.
Further, it is known that the cooperation flag is set as the attribute of the name and kana field and that the object of cooperation is the name and kanji field of the item number “8”.

【0061】そこで、取り出した候補文字列を用いて氏
名カナ辞書を照合して、その候補文字列が存在するか否
かを調べ、存在する場合はそのままとし、存在しない場
合は氏名カナ辞書に存在する近い文字列を候補文字列と
する補正を行う(単独知識処理を行う)。例えば、この
結果が「タナカ」であるとする。
Therefore, the extracted candidate character string is used to collate the name kana dictionary to check whether the candidate character string exists. If it exists, leave it as it is. If it does not exist, it exists in the name kana dictionary. Corrects a character string that is close to the candidate character string (performs independent knowledge processing). For example, assume that the result is "Tanaka".

【0062】次に、連携対象とされた氏名漢字フィール
ドから得た候補文字列を候補文字列9から取り出し、属
性データ10からその属性を知る。そして、取り出した
候補文字列を用いて氏名漢字辞書を照合して、その候補
文字列が存在するか否かを調べ、存在する場合はそのま
まとし、存在しない場合は氏名漢字辞書に存在する近い
文字列を候補文字列とする補正を行う(単独知識処理を
行う)。例えば、この結果が「由中」であるとする。
Next, the candidate character string obtained from the name / kanji field to be linked is extracted from the candidate character string 9 and the attribute is known from the attribute data 10. Then, using the extracted candidate character string, the name / kanji dictionary is checked to see if the candidate character string exists. If it exists, leave it as it is. If it does not exist, close characters that exist in the name / kanji dictionary. Correction is performed using strings as candidate character strings (single knowledge processing is performed). For example, assume that this result is "Yunaka".

【0063】ここで、氏名カナフィールドから得た候補
文字列「タナカ」は正しく、氏名漢字フィールドから得
た候補文字列「由中」は誤りであるとする。また、これ
らの文字列が共に氏名カナ辞書及び氏名漢字辞書に存在
するとする。この場合、単独知識処理によっては候補文
字列を補正できない。
Here, it is assumed that the candidate character string "Tanaka" obtained from the name kana field is correct and the candidate character string "Yanaka" obtained from the name kanji field is incorrect. Further, it is assumed that these character strings are both present in the name kana dictionary and the name kanji dictionary. In this case, the candidate character string cannot be corrected by the independent knowledge processing.

【0064】連携知識処理部5は、氏名カナフィールド
から得た候補文字列「タナカ」が3文字であり、一方、
氏名漢字フィールドから得た候補文字列「由中」の読み
が「ヨシナカ」の4文字となることに基づいて、候補文
字列「タナカ」が正しいと判断する。これは、通常、氏
名カナフィールドから得る候補文字列の字数を誤ること
は有り得ないからである。
In the cooperation knowledge processing unit 5, the candidate character string "Tanaka" obtained from the name Kana field has three characters, while
It is determined that the candidate character string "Tanaka" is correct based on the fact that the reading of the candidate character string "Yunaka" obtained from the name and kanji field becomes four characters "Yoshinaka". This is because normally, the number of characters of the candidate character string obtained from the name kana field cannot be wrong.

【0065】次に、連携知識処理部5は、正しいと判断
した候補文字列「タナカ」を用いて氏名漢字辞書を参照
し、氏名漢字フィールドから得た候補文字列「由中」に
近い字形を持ち、その読みが「タナカ」である文字列
「田中」を候補文字列とするように補正する。
Next, the cooperation knowledge processing unit 5 refers to the name / kanji dictionary by using the candidate character string “Tanaka” which is determined to be correct, and creates a character shape close to the candidate character string “Yanaka” obtained from the name / kanji field. The character string "Tanaka" whose reading is "Tanaka" is corrected to be a candidate character string.

【0066】なお、以上の知識処理についての説明は、
その一例を示したものであって、実際には、単独知識処
理部4及び連携知識処理部5は他の種々の知識処理を行
う。図4は知識処理フローであり、カナ漢字自動連携処
理部3A及び横書き用認識フィールド検索処理部12が
行う処理を示す。この処理フローは、帳票1を検索する
場合において、連携すべきフィールドの内、手書きカナ
フィールドが手書き漢字フィールドより先に検索され、
かつ、これらが連続して検索される帳票1を処理する場
合について示す。
The above description of the knowledge processing is as follows.
This is an example, and in practice, the independent knowledge processing unit 4 and the cooperative knowledge processing unit 5 perform other various kinds of knowledge processing. FIG. 4 is a knowledge processing flow, and shows processing performed by the kana-kanji automatic cooperation processing unit 3A and the horizontal writing recognition field search processing unit 12. In this processing flow, when searching the form 1, the handwritten kana field is searched before the handwritten kanji field among the fields to be linked,
In addition, a case where the form 1 in which these are continuously searched is processed will be described.

【0067】文字認識処理部8が知識処理部11を起動
すると、知識処理部11が処理対象である帳票1が図3
に示すような横書きのものか否かを調べる(S1)。横
書き出ない場合、図5に示す処理を行う。横書きである
場合、横書き用認識フィールド検索処理部12に制御を
渡す。
When the character recognition processing unit 8 starts the knowledge processing unit 11, the knowledge processing unit 11 processes the form 1 shown in FIG.
It is checked whether or not it is the horizontal writing as shown in (S1). If horizontal writing is not possible, the processing shown in FIG. 5 is performed. In the case of horizontal writing, control is passed to the horizontal writing recognition field search processing unit 12.

【0068】制御を渡された横書き用認識フィールド検
索処理部12が、処理対象である帳票1をその上から下
の方向に向けてフィールドの有無を検索する(S2)。
この検索によりフィールドを検出すると、横書き用認識
フィールド検索処理部12が、属性データ10を参照し
て、当該フィールドが手書きカナフィールドか否かを調
べる(S3)。
The control field for horizontal writing recognition field 12 to which the control is passed searches the form 1 to be processed from the top to the bottom for the presence or absence of a field (S2).
When a field is detected by this search, the horizontal writing recognition field search processing unit 12 refers to the attribute data 10 to check whether or not the field is a handwritten Kana field (S3).

【0069】手書きカナフィールドでない場合、横書き
用認識フィールド検索処理部12がこの旨を知識処理部
11に通知し、知識処理部11がS2で検索されたフィ
ールドが最終フィールドか否かを調べる(S4)。この
ために、予め帳票1の項目番号の最大の値を所定のレジ
スタにセットし、S2及びS6でフィールドを検索する
毎にレジスタの内容から1を引く。レジスタの内容が0
となった場合、最終フィールドとされる。
If it is not a handwritten Kana field, the horizontal recognition field search processing unit 12 notifies the knowledge processing unit 11 of this fact, and the knowledge processing unit 11 checks whether the field searched in S2 is the final field (S4). ). Therefore, the maximum value of the item number of the form 1 is set in a predetermined register in advance, and 1 is subtracted from the contents of the register every time the field is searched in S2 and S6. Register contents are 0
If it becomes, it is regarded as the final field.

【0070】最終フィールドである場合、知識処理部1
1は知識処理を終了する。最終フィールドでない場合、
知識処理部11が横書き用認識フィールド検索処理部1
2に制御を渡して、S2以下を繰り返す。
If it is the final field, the knowledge processing unit 1
1 ends knowledge processing. If not the last field,
The knowledge processing unit 11 is a horizontal recognition field search processing unit 1.
Control is passed to step 2, and steps S2 and below are repeated.

【0071】手書きカナフィールドである場合、更に、
横書き用認識フィールド検索処理部12が、属性データ
10を参照して、S2で検索されたフィールドが知識フ
ィールドか否かを調べる(S5)。
In the case of a handwritten Kana field,
The recognition field search processing unit 12 for horizontal writing refers to the attribute data 10 to check whether the field searched in S2 is a knowledge field (S5).

【0072】知識フィールドでない場合、S2で検索さ
れたフィールドについてS4以下を実行する。知識フィ
ールドである場合、横書き用認識フィールド検索処理部
12が、帳票1をS2で検索されたフィールドの位置か
ら更に下の方向に向けて、次フィールドの有無を検索す
る(S6)。次フィールドは、通常、図3に示すよう
に、その開始X位置がS2で検索されたフィールドのX
位置と略同一であり、その開始Y位置がS2で検索され
たフィールドのY位置と極めて近い位置にある。
If it is not a knowledge field, S4 and subsequent steps are executed for the field retrieved in S2. If the field is a knowledge field, the horizontal writing recognition field search processing unit 12 searches the form 1 further downward from the position of the field searched in S2, and searches for the next field (S6). The next field is usually the X of the field whose start X position was retrieved in S2, as shown in FIG.
The position is almost the same as the position, and the starting Y position is extremely close to the Y position of the field searched in S2.

【0073】この検索により次フィールドを検出する
と、横書き用認識フィールド検索処理部12が、属性デ
ータ10を参照して、当該次フィールドが手書き漢字フ
ィールドか否かを調べる(S7)。
When the next field is detected by this search, the horizontal writing recognition field search processing unit 12 refers to the attribute data 10 to check whether or not the next field is a handwritten Chinese character field (S7).

【0074】手書き漢字フィールドでない場合、横書き
用認識フィールド検索処理部12が単独知識処理部4に
制御を渡し、単独知識処理部4が、S2で検索されたフ
ィールド及びS6で検索されたフィールドについて、各
々、独立に単独知識処理を実行する(S8)。S8の終
了の後、後に検索された方のフィールドであるS6で検
索されたフィールドについてS4以下を実行する。
If it is not a handwritten Chinese character field, the horizontal recognition field search processing unit 12 transfers control to the independent knowledge processing unit 4, and the independent knowledge processing unit 4 determines that the field searched in S2 and the field searched in S6 are: Each independently executes independent knowledge processing (S8). After S8 ends, S4 and subsequent steps are executed for the field retrieved in S6, which is the later retrieved field.

【0075】手書き漢字フィールドである場合、更に、
横書き用認識フィールド検索処理部12が、属性データ
10を参照して、当該次フィールドが知識フィールドで
あってかつ知識属性がS2で検索されたフィールドと同
一か否かを調べる(S9)。
In the case of a handwritten Kanji field, further
The horizontal writing recognition field search processing unit 12 refers to the attribute data 10 to check whether the next field is the knowledge field and the knowledge attribute is the same as the field searched in S2 (S9).

【0076】知識フィールドであってかつ知識属性が同
一でない場合、S8を実行する。即ち、横書き用認識フ
ィールド検索処理部12が単独知識処理部4に制御を渡
し、単独知識処理部4が、S2で検索されたフィールド
及びS6で検索されたフィールドについて、各々、独立
に単独知識処理を実行する(S8)。S8の終了の後、
後に検索された方のフィールドであるS6で検索された
フィールドについてS4以下を実行する。
If they are knowledge fields and the knowledge attributes are not the same, S8 is executed. That is, the horizontal writing recognition field search processing unit 12 transfers control to the independent knowledge processing unit 4, and the independent knowledge processing unit 4 independently performs independent knowledge processing for each of the field searched in S2 and the field searched in S6. Is executed (S8). After the end of S8,
S4 and the following steps are executed for the field retrieved in S6, which is the field retrieved later.

【0077】知識フィールドであってかつ知識属性が同
一である場合、横書き用認識フィールド検索処理部12
がこの旨をカナ漢字自動連携処理部3Aに通知し、カナ
漢字自動連携処理部3Aが、S6で検索された漢字フィ
ールドとS2で検索されたカナフィールドとを連携させ
る(S10)。
If the knowledge fields are the same and the knowledge attributes are the same, the horizontal recognition field search processing unit 12
Notifies the effect to the Kana-Kanji automatic cooperation processing unit 3A, and the Kana-Kanji automatic cooperation processing unit 3A cooperates the Kanji field searched in S6 with the Kana field searched in S2 (S10).

【0078】この後、横書き用認識フィールド検索処理
部12が連携知識処理部5に制御を渡し、連携知識処理
部5が連携知識処理を実行する(S11)。この連携知
識処理の後、後に検索された方のフィールドであるS6
で検索されたフィールドについてS4以下を実行する。
Then, the horizontal writing recognition field search processing unit 12 transfers control to the cooperation knowledge processing unit 5, and the cooperation knowledge processing unit 5 executes cooperation knowledge processing (S11). After this cooperative knowledge processing, the field S6 which is the one retrieved later is used.
The step S4 and the following steps are executed for the field retrieved in step S4.

【0079】図5は知識処理フローであり、カナ漢字自
動連携処理部及び縦書き用認識フィールド検索処理部1
3が行う処理を示す。この処理フローは、図4のS1に
続いて実行される処理を示す。従って、手書きカナフィ
ールドが手書き漢字フィールドより先に検索され、か
つ、これらが連続して検索される帳票1を処理する場合
について示す。
FIG. 5 is a knowledge processing flow. The kana-kanji automatic cooperation processing section and the vertical writing recognition field search processing section 1
3 shows the processing performed by 3. This processing flow shows processing that is executed subsequent to S1 in FIG. Therefore, the case where the handwritten kana field is searched before the handwritten kanji field and these are continuously searched is processed.

【0080】図4のS1において処理対象である帳票1
が縦書きであることが認識されると、カナ漢字自動連携
処理部3Aは縦書き用認識フィールド検索処理部13に
制御を渡す。
Form 1 to be processed in S1 of FIG.
When it is recognized that is written vertically, the Kana-Kanji automatic cooperation processing unit 3A transfers control to the vertical writing recognition field search processing unit 13.

【0081】制御を渡された縦書き用認識フィールド検
索処理部13が、処理対象である帳票1をその右から左
の方向に向けてフィールドの有無を検索する(S1
2)。この検索によりフィールドを検出すると、縦書き
用認識フィールド検索処理部13が、S3と同様に、当
該フィールドが手書きカナフィールドか否かを調べる
(S13)。
The vertical writing recognition field search processing unit 13 to which the control is passed searches the form 1 to be processed from the right to the left for the presence or absence of a field (S1).
2). When the field is detected by this search, the vertical writing recognition field search processing unit 13 checks whether or not the field is a handwritten Kana field, as in S3 (S13).

【0082】手書きカナフィールドでない場合、S4と
同様に、知識処理部11がS12で検索されたフィール
ドが最終フィールドか否かを調べる(S14)。最終フ
ィールドである場合、知識処理部11は知識処理を終了
する。最終フィールドでない場合、知識処理部11が縦
書き用認識フィールド検索処理部13に制御を渡して、
S12以下を繰り返す。
If it is not the handwritten Kana field, the knowledge processing unit 11 checks whether or not the field searched in S12 is the final field, as in S4 (S14). If it is the final field, the knowledge processing unit 11 ends the knowledge processing. If it is not the final field, the knowledge processing unit 11 passes control to the vertical writing recognition field search processing unit 13,
The steps from S12 onward are repeated.

【0083】手書きカナフィールドである場合、更に、
縦書き用認識フィールド検索処理部13が、S5と同様
に、S12で検索されたフィールドが知識フィールドか
否かを調べる(S15)。
In the case of a handwritten Kana field, further
Similar to S5, the vertical writing recognition field search processing unit 13 checks whether or not the field searched in S12 is a knowledge field (S15).

【0084】知識フィールドでない場合、S14以下を
実行する。知識フィールドである場合、縦書き用認識フ
ィールド検索処理部13が、帳票1をS12で検索され
たフィールドの位置から更に左の方向に向けて、次フィ
ールドの有無を検索する(S16)。次フィールドは、
その開始Y位置がS12で検索されたフィールドのY位
置と略同一であり、その開始X位置がS12で検索され
たフィールドのX位置と極めて近い位置にある。
If it is not the knowledge field, the steps from S14 are executed. If it is a knowledge field, the vertical writing recognition field search processing unit 13 turns the form 1 further leftward from the position of the field searched in S12, and searches for the presence or absence of the next field (S16). The next field is
The starting Y position is substantially the same as the Y position of the field searched in S12, and the starting X position is extremely close to the X position of the field searched in S12.

【0085】この検索により次フィールドを検出する
と、縦書き用認識フィールド検索処理部13が、S7と
同様に、当該次フィールドが手書き漢字フィールドか否
かを調べる(S17)。
When the next field is detected by this search, the vertical writing recognition field search processing unit 13 checks whether or not the next field is a handwritten Chinese character field as in S7 (S17).

【0086】手書き漢字フィールドでない場合、縦書き
用認識フィールド検索処理部13が単独知識処理部4に
制御を渡し、単独知識処理部4が単独知識処理を実行す
る(S18)。この後、S14以下を実行する。
If it is not a handwritten Chinese character field, the vertical writing recognition field search processing unit 13 transfers control to the independent knowledge processing unit 4, and the independent knowledge processing unit 4 executes the independent knowledge processing (S18). After that, S14 and subsequent steps are executed.

【0087】手書き漢字フィールドである場合、更に、
縦書き用認識フィールド検索処理部13が、S9と同様
に、当該次フィールドが知識フィールドであってかつ知
識属性がS12で検索されたフィールドと同一か否かを
調べる(S19)。
In the case of a handwritten Chinese character field,
As in S9, the vertical writing recognition field search processing unit 13 checks whether or not the next field is the knowledge field and the knowledge attribute is the same as the field searched in S12 (S19).

【0088】知識フィールドであってかつ知識属性が同
一でない場合、S18を実行する。即ち、単独知識処理
部4が単独知識処理を実行する(S18)。知識フィー
ルドであってかつ知識属性が同一である場合、S10と
同様に、カナ漢字自動連携処理部3Aが、S16で検索
された漢字フィールドとS12で検索されたカナフィー
ルドとを連携させる(S20)。
If they are knowledge fields and the knowledge attributes are not the same, S18 is executed. That is, the independent knowledge processing unit 4 executes the independent knowledge processing (S18). If the knowledge fields are the same and the knowledge attributes are the same, the Kana-Kanji automatic linkage processing unit 3A links the Kanji field searched in S16 and the Kana field searched in S12, as in S10 (S20). .

【0089】この後、縦書き用認識フィールド検索処理
部13が連携知識処理部5を起動し、連携知識処理部5
が連携知識処理を実行する(S21)。この後、S12
以下を実行する。
After that, the vertical writing recognition field search processing unit 13 activates the cooperation knowledge processing unit 5, and the cooperation knowledge processing unit 5
Executes cooperative knowledge processing (S21). After this, S12
Do the following:

【0090】図4及び図5に示した処理フローは、知識
処理における自動連携処理の一例を示すものであって、
帳票1におけるフィールドの各属性等に応じて、種々変
更可能である。即ち、この処理フローは、手書きカナフ
ィールドが手書き漢字フィールドより先に検索され、か
つ、これらが連続して検索される帳票1を処理する場合
についてのものである。従って、帳票1において、検出
の順が逆である場合や連続して検索されない場合等には
処理フローが変更される。
The processing flows shown in FIGS. 4 and 5 show an example of automatic cooperation processing in the knowledge processing.
Various changes can be made according to each attribute of the fields in the form 1. That is, this processing flow is for processing the form 1 in which the handwritten kana field is searched before the handwritten kanji field and these are continuously searched. Therefore, in the form 1, the processing flow is changed when the order of detection is reversed or when continuous search is not performed.

【0091】次に、図3及び図6に示した帳票について
の図4の処理フローによる連携処理について、簡単に説
明する。この帳票1は横書きであるので、知識処理部1
1は、S1において処理対象である帳票1が横書きであ
ることを認識して、横書き用認識フィールド検索処理部
12に制御を渡す。横書き用認識フィールド検索処理部
12は、まず、S2において会員番号フィールドを検出
するが、これは活字フィールドであり手書きカナフィー
ルドでないので(S3)、知識処理は行わない。次に、
S4を経て、S2において申込日フィールドを検出する
が、これも数字フィールドであり手書きカナフィールド
でないので(S3)、知識処理は行わない。郵便番号フ
ィールド及び電話番号フィールドについても同様であ
る。
Next, the cooperation process of the forms shown in FIGS. 3 and 6 according to the process flow of FIG. 4 will be briefly described. Since this form 1 is written horizontally, the knowledge processing unit 1
1 recognizes that the form 1 to be processed is horizontal writing in S1 and passes control to the horizontal writing recognition field search processing unit 12. First, the recognition field search processing unit 12 for horizontal writing detects the member number field in S2, but since this is a type field and not a handwritten Kana field (S3), no knowledge processing is performed. next,
After S4, the application date field is detected in S2, but since this is also a numeric field and not a handwritten Kana field (S3), knowledge processing is not performed. The same applies to the postal code field and the telephone number field.

【0092】次に、横書き用認識フィールド検索処理部
12が、S2において住所カナフィールドを検出する。
これは手書きカナフィールドであり(S3)、かつ、知
識フィールドであるので(S5)、S6において下方向
への他のフィールドの検索が行われ住所漢字フィールド
が検出される。これは手書き漢字フィールドであり(S
7)、かつ、知識属性が「住所」で同一であるので(S
9)、横書き用認識フィールド検索処理部12は、S1
0においてこの住所漢字フィールドと住所カナフィール
ドを連携させる。これにより、住所漢字フィールドと住
所カナフィールドとについて、連携知識処理が行われる
(S11)。
Next, the horizontal writing recognition field search processing section 12 detects the address kana field in S2.
Since this is a handwritten kana field (S3) and a knowledge field (S5), another field is searched downward in S6 to detect the address Kanji field. This is a handwritten Kanji field (S
7) and the knowledge attribute is the same for "address" (S
9), the recognition field search processing unit 12 for horizontal writing, S1
In 0, the address Kanji field and the address Kana field are linked. As a result, cooperative knowledge processing is performed for the address Kanji field and the address Kana field (S11).

【0093】次に、横書き用認識フィールド検索処理部
12が、S2において氏名カナフィールドを検出する。
これは手書きカナフィールドであり(S3)、かつ、知
識フィールドであるので(S5)、S6において下方向
への他のフィールドの検索が行われ氏名漢字フィールド
が検出される。これは手書き漢字フィールドであり(S
7)、かつ、知識属性が「氏名」で同一であるので(S
9)、横書き用認識フィールド検索処理部12は、S1
0においてこの氏名漢字フィールドと氏名カナフィール
ドを連携させる。これにより、氏名漢字フィールドと氏
名カナフィールドとについて、連携知識処理が行われる
(S11)。
Next, the horizontal writing recognition field search processing section 12 detects the name kana field in S2.
Since this is a handwritten kana field (S3) and a knowledge field (S5), another field is searched downward in S6 to detect the name / kanji field. This is a handwritten Kanji field (S
7) and since the knowledge attribute is the same for "name" (S)
9), the recognition field search processing unit 12 for horizontal writing, S1
In 0, the name kanji field and the name kana field are linked. As a result, cooperative knowledge processing is performed for the name / kanji field and the name / kana field (S11).

【0094】[0094]

【発明の効果】以上説明したように、本発明によれば、
文字認識処理装置において、連携知識処理の対象とすべ
き手書きカナフィールドと手書き漢字フィールドとの帳
票上における位置が所定の関係にあることを利用するこ
とにより、手書きカナフィールドと手書き漢字フィール
ドとを自動的に検索することができるので、殆どの帳票
においてこれらを自動的に連携させ連携知識処理を行う
ことができ、これにより、連携知識処理の指示入力を行
う必要をなくしてオペレータの負担を少なくでき、指示
入力の誤り等の発生を防止でき、文字認識処理の効率を
向上することができる。
As described above, according to the present invention,
In the character recognition processing device, the handwritten kana field and the handwritten kanji field are automatically calculated by utilizing the fact that the positions of the handwritten kana field and the handwritten kanji field, which should be subject to cooperative knowledge processing, have a predetermined relationship on the form. Since it is possible to perform automatic search, it is possible to automatically link these in most forms and perform cooperative knowledge processing. This reduces the burden on the operator without the need to input instructions for cooperative knowledge processing. It is possible to prevent the occurrence of an error in the instruction input, and improve the efficiency of character recognition processing.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】実施例構成図である。FIG. 2 is a configuration diagram of an embodiment.

【図3】実施例説明図である。FIG. 3 is an explanatory view of an embodiment.

【図4】知識処理フローである。FIG. 4 is a knowledge processing flow.

【図5】知識処理フローである。FIG. 5 is a knowledge processing flow.

【図6】本発明の背景説明図である。FIG. 6 is a background explanatory diagram of the present invention.

【符号の説明】[Explanation of symbols]

1 帳票 2 処理装置 3 自動連携処理部 3A カナ漢字自動連携処理部 4 単独知識処理部 5 連携知識処理部 6 文字認識出力 7 読み取り処理部 8 文字認識処理部 9 候補文字列 10 属性データ 11 知識処理部 12 横書き用認識フィールド検索処理部 13 縦書き用認識フィールド検索処理部 14 辞書 1 form 2 processing device 3 automatic cooperation processing unit 3A kana-Kanji automatic cooperation processing unit 4 independent knowledge processing unit 5 cooperation knowledge processing unit 6 character recognition output 7 reading processing unit 8 character recognition processing unit 9 candidate character string 10 attribute data 11 knowledge processing Part 12 Horizontal writing recognition field search processing unit 13 Vertical writing recognition field search processing unit 14 Dictionary

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 予め定められた複数のフィールドを備え
た帳票の各フィールドに記入された文字を読み込んで、
これについての文字認識処理を行う文字認識処理装置に
おいて、 所定のフィールドについての文字認識処理における知識
処理を、そのフィールド単独で行う単独知識処理部と、 所定のフィールドについての文字認識処理における知識
処理を、そのフィールドと、これと連携させられた他の
フィールドとを連携させて行う連携知識処理部と、 複数のフィールドの内から、帳票上の位置が予め定めら
れた関係にある複数のフィールドを検索し、これらを連
携させる自動連携処理部を備え、 前記自動連携処理部によって連携させられた複数のフィ
ールドについて、前記連携知識処理部がこれらを連携さ
せてその知識処理を行うことを特徴とする文字認識処理
装置。
1. A character written in each field of a form having a plurality of predetermined fields is read,
In a character recognition processing device that performs character recognition processing for this, a knowledge processing in character recognition processing for a predetermined field is performed by an independent knowledge processing unit that performs the field alone and a knowledge processing in character recognition processing for a predetermined field. , A field for collaborative knowledge processing that links the field with other fields linked to this field, and searches for a plurality of fields whose positions on the form have a predetermined relationship from among the plurality of fields. However, a character that is provided with an automatic cooperation processing unit for coordinating these, and for the plurality of fields that are cooperated by the automatic cooperation processing unit, the cooperation knowledge processing unit performs the knowledge processing by coordinating them Recognition processing device.
【請求項2】 前記自動連携処理部はカナ漢字自動連携
処理部からなり、 前記カナ漢字自動連携処理部が手書きカナフィールド及
び手書き漢字フィールドを連携させることを特徴とする
請求項1に記載の文字認識処理装置。
2. The character according to claim 1, wherein the automatic cooperation processing unit includes a Kana-Kanji automatic cooperation processing unit, and the Kana-Kanji automatic cooperation processing unit cooperates a handwritten Kana field and a handwritten Kanji field. Recognition processing device.
【請求項3】 前記カナ漢字自動連携処理部は、 横書き用の帳票をその上から下方向に向かって検索し、
帳票上の複数のフィールドの内から、帳票上において互
いの開始X位置が実質的に同一で、かつ、より下方のフ
ィールドの開始Y位置がその上方のフィールドに極めて
近い位置にある手書きカナフィールドと手書き漢字フィ
ールドとを検索する横書き用認識フィールド検索処理部
と、 縦書き用の帳票をその右から左方向に向かって検索し、
帳票上の複数のフィールドの内から、帳票上において互
いの開始Y位置が実質的に同一で、かつ、より左方のフ
ィールドの開始X位置がその右方のフィールドに極めて
近い位置にある手書きカナフィールドと手書き漢字フィ
ールドとを検索する縦書用認識フィールド検索処理部と
を備えることを特徴とする請求項2に記載の文字認識処
理装置。
3. The kana-kanji automatic linkage processing unit searches for a form for horizontal writing from top to bottom,
From a plurality of fields on the form, a handwritten Kana field whose start X positions are substantially the same on the form and the start Y position of the lower field is extremely close to the upper field. The recognition field search processing unit for horizontal writing that searches the handwritten Kanji field, and the form for vertical writing are searched from the right to the left,
From the plurality of fields on the form, the start Y positions of the two are substantially the same on the form, and the start X position of the left field is very close to the right field. The character recognition processing device according to claim 2, further comprising: a vertical text recognition field search processing unit that searches the field and the handwritten Chinese character field.
JP02149995A 1995-02-09 1995-02-09 Character recognition processor Expired - Fee Related JP3335494B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02149995A JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02149995A JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Publications (2)

Publication Number Publication Date
JPH08221508A true JPH08221508A (en) 1996-08-30
JP3335494B2 JP3335494B2 (en) 2002-10-15

Family

ID=12056669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02149995A Expired - Fee Related JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Country Status (1)

Country Link
JP (1) JP3335494B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015876A (en) * 2008-10-23 2009-01-22 Fujitsu Ltd Character recognition method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6334680A (en) * 1986-07-29 1988-02-15 Toshiba Corp Character reader
JPH05189614A (en) * 1992-01-10 1993-07-30 Toshiba Corp Optical character reader
JPH05258099A (en) * 1992-03-16 1993-10-08 Fujitsu Ltd Character recognition processor
JPH06266888A (en) * 1993-03-12 1994-09-22 Fujitsu Ltd Character recognizing device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6334680A (en) * 1986-07-29 1988-02-15 Toshiba Corp Character reader
JPH05189614A (en) * 1992-01-10 1993-07-30 Toshiba Corp Optical character reader
JPH05258099A (en) * 1992-03-16 1993-10-08 Fujitsu Ltd Character recognition processor
JPH06266888A (en) * 1993-03-12 1994-09-22 Fujitsu Ltd Character recognizing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015876A (en) * 2008-10-23 2009-01-22 Fujitsu Ltd Character recognition method

Also Published As

Publication number Publication date
JP3335494B2 (en) 2002-10-15

Similar Documents

Publication Publication Date Title
CN111753767A (en) Method and device for automatically correcting operation, electronic equipment and storage medium
KR100570224B1 (en) Form definition data creation method and form handling machines
US6958755B1 (en) Personalized computer fonts
JP2003242441A (en) Document processing method, apparatus and program
JPH08221508A (en) Character recognition processor
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
JPH1173472A (en) Format information registering method and ocr system
JPH09282309A (en) Document editing and proofreading processor
JP6994727B1 (en) Reading system, reading program and reading method
JP6960646B6 (en) Reading system, reading program and reading method
JP2870375B2 (en) Sentence correction device
JPS60217483A (en) Recognizer of character
US11481544B2 (en) Form processing apparatus and non-transitory computer readable medium
JP7404625B2 (en) Information processing device and program
JP2731394B2 (en) Character input device
JP2698345B2 (en) Document processing method
JPH0562008A (en) Character recognition method
JPH07134750A (en) Document image recognizing device
JPH09138835A (en) Character recognition system
JPH11120294A (en) Character recognition device and medium
JPH06251187A (en) Method and device for correcting character recognition error
JPH05120472A (en) Character recognizing device
JPH11316792A (en) Information processor and slip creating method
JP4081074B2 (en) Form processing apparatus, form processing method, and form processing program
JP2024003769A (en) Character recognition system, method of recognizing character by computer, and character search system

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees