JP3335494B2 - Character recognition processor - Google Patents

Character recognition processor

Info

Publication number
JP3335494B2
JP3335494B2 JP02149995A JP2149995A JP3335494B2 JP 3335494 B2 JP3335494 B2 JP 3335494B2 JP 02149995 A JP02149995 A JP 02149995A JP 2149995 A JP2149995 A JP 2149995A JP 3335494 B2 JP3335494 B2 JP 3335494B2
Authority
JP
Japan
Prior art keywords
field
processing unit
knowledge
kana
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02149995A
Other languages
Japanese (ja)
Other versions
JPH08221508A (en
Inventor
直嘉 菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PFU Ltd
Original Assignee
PFU Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PFU Ltd filed Critical PFU Ltd
Priority to JP02149995A priority Critical patent/JP3335494B2/en
Publication of JPH08221508A publication Critical patent/JPH08221508A/en
Application granted granted Critical
Publication of JP3335494B2 publication Critical patent/JP3335494B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、文字認識処理装置に関
し、特に、帳票に記入されたカナ文字及び漢字の文字認
識処理においてこれらを自動的に連携させて知識処理を
行う文字認識処理装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition processing apparatus and, more particularly, to a character recognition processing apparatus for automatically and cooperatively performing knowledge processing in character recognition processing of kana characters and kanji written on a form. .

【0002】[0002]

【従来の技術】図6は本発明の背景説明図であり、OC
R(光学式文字読み取り装置)等の文字認識処理装置に
おいて用いられる一般的な帳票の一例を示す。
2. Description of the Related Art FIG. 6 is a diagram for explaining the background of the present invention.
1 shows an example of a general form used in a character recognition processing device such as an R (optical character reading device).

【0003】図6の帳票1には、上から順に会員番号、
申込日、郵便番号、電話番号、住所(カナ)、住所(漢
字)、氏名(カナ)、氏名(漢字)、生年月日、職業、
年令、性別が、各々、予め指定された領域(フィール
ド)に記入される。
[0006] Form 1 in FIG. 6 includes a member number,
Application date, postal code, telephone number, address (kana), address (kanji), name (kana), name (kanji), date of birth, occupation,
Age and gender are respectively entered in the designated fields (fields).

【0004】この内、会員番号のみが活字文字で予め記
入される活字フィールドであり、他は帳票記入者によっ
て手書き文字で記入される手書きフィールドである。手
書きフィールドの内、申込日、郵便番号、電話番号、生
年月日(その後半部分)、職業、年令は数字で記入され
る数字フィールドであり、生年月日(その前半部分)、
性別は予め記入された活字文字にマーク(丸印)を付け
る記入方法で記入されるマークフィールドであり、住所
カナ、氏名カナの各フィールドはカナ文字で記入される
カナフィールドであり、住所漢字、氏名漢字の各フィー
ルドは漢字で記入される漢字フィールドである。
[0004] Of these, only the member number is a print field in which print characters are preliminarily written, and the other is a handwritten field in which a form writer writes in handwriting characters. Of the handwritten fields, the application date, zip code, telephone number, date of birth (the latter part), occupation and age are numeric fields that are entered numerically, and the date of birth (the first part),
Gender is a mark field that is filled in by a method of adding a mark (circle) to the pre-filled print characters. Each of the address kana and name kana fields is a kana field filled with kana characters. Each field of the full name kanji is a kanji field filled in with kanji.

【0005】文字認識処理装置は図6に示すような帳票
に記入された文字を読み取って文字認識処理を行う。こ
の文字認識処理において、文字認識率(記入された文字
を正しく読み取った割合)を向上するために、住所及び
氏名については、カナ及び漢字の各フィールドから一旦
読み取って認識した文字列(候補文字列)につき所定の
知識処理(単独知識処理)を行う。この単独知識処理
は、各フィールド毎に行われ、予め用意された住所辞書
及び氏名辞書を用いて候補文字列を補正する処理であ
る。例えば、住所カナフィールドから読み取って認識し
た候補文字列と住所カナ辞書とを照合して、候補文字列
が2文字乃至3文字の誤りを含んでいても、これを正し
い文字列に補正して出力する。
[0005] The character recognition processing device reads characters written on a form as shown in FIG. 6 and performs a character recognition process. In this character recognition process, in order to improve the character recognition rate (the ratio of correctly reading the entered characters), for the address and name, a character string once read and recognized from each of the kana and kanji fields (candidate character string ), Predetermined knowledge processing (single knowledge processing) is performed. The independent knowledge process is performed for each field, and is a process of correcting a candidate character string using an address dictionary and a name dictionary prepared in advance. For example, a candidate character string read and recognized from an address kana field is collated with an address kana dictionary, and even if the candidate character string contains an error of two or three characters, this is corrected to a correct character string and output. I do.

【0006】更に、知識処理の一つとして、住所及び氏
名についてのカナフィールドと漢字フィールドとの連携
処理(連携知識処理)を行う。この連携知識処理は、カ
ナフィールドと漢字フィールドとから読み取った候補文
字列について、各々、独立に知識処理を行うのみでな
く、予め指定された2つのフィールドを連携させて行う
知識処理である。
Further, as one of the knowledge processes, a cooperative process (cooperative knowledge process) between a kana field and a kanji field for an address and a name is performed. This cooperative knowledge process is a knowledge process that not only performs knowledge processing independently on candidate character strings read from a kana field and a kanji field, but also cooperates two previously specified fields.

【0007】上述の帳票1においては、例えば「住所」
を記入するフィールドとして、カナフィールドと漢字フ
ィールドの2個が存在する。そこで、例えば住所カナフ
ィールドから得た候補文字列を用いて住所漢字フィール
ドから得た候補文字列を補正し、及び/又は、住所漢字
フィールドから得た候補文字列を用いて住所カナフィー
ルドから得た候補文字列を補正する。これにより、文字
認識処理における文字認識率を高めることができる。
In the above-mentioned form 1, for example, "address"
There are two fields for entering a field, a kana field and a kanji field. Thus, for example, the candidate character string obtained from the address kanji field was corrected using the candidate character string obtained from the address kana field, and / or the candidate character string obtained from the address kana field was obtained from the address kana field using the address kanji field. Correct the candidate character string. Thereby, the character recognition rate in the character recognition processing can be increased.

【0008】[0008]

【発明が解決しようとする課題】前述の従来技術によれ
ば、記入される文字の種類が多くかつ手書きであるため
にその認識が比較的困難であるカナフィールドと漢字フ
ィールドについて、連携知識処理によって文字認識率を
向上することができる。
According to the above-mentioned prior art, the kana field and the kanji field, which have many types of characters to be entered and are relatively difficult to recognize because they are handwritten, are processed by the cooperative knowledge processing. The character recognition rate can be improved.

【0009】しかし、前述の従来技術においては、連携
知識処理を行うべきカナフィールドと漢字フィールドと
を予めオペレータが認識情報定義処理において指定する
必要がある。
However, in the above-mentioned prior art, it is necessary for the operator to specify in advance the kana field and the kanji field to be subjected to the cooperative knowledge processing in the recognition information definition processing.

【0010】例えば、図6に示した帳票について文字認
識処理を行う場合、連携知識処理を行うべき部分は2個
所ある。即ち、住所カナフィールドと住所漢字フィール
ド、及び、氏名カナフィールドと氏名漢字フィールドで
ある。この場合、文字認識処理に先立って、オペレータ
が認識情報定義処理において住所カナフィールドと住所
漢字フィールドとを連携させることを指示する入力と、
氏名カナフィールドと氏名漢字フィールドとを連携させ
ることを指示する入力とを行う。
For example, when performing the character recognition processing on the form shown in FIG. 6, there are two parts where the cooperative knowledge processing should be performed. That is, there are an address kana field and an address kanji field, and a name kana field and a name kanji field. In this case, prior to the character recognition processing, the operator inputs instructing to link the address kana field and the address kanji field in the recognition information definition processing,
An input for instructing that the name kana field and the name kanji field are linked is performed.

【0011】この連携知識処理の指示入力は、認識情報
定義処理において次のように行われる。例えば、オペレ
ータが、各フィールドを認識すべき領域(認識フィール
ド)として指定し、この後各フィールドの属性を入力
し、各フィールドに項目番号を付与する。そして、ある
フィールドについて、これと連携させたいフィールドが
あれば、項目番号を用いて連携させたいフィールドを指
定し、次にこれらを連携する指示を入力する。
The instruction input of the cooperative knowledge processing is performed in the recognition information definition processing as follows. For example, the operator designates each field as an area to be recognized (recognition field), thereafter inputs the attribute of each field, and assigns an item number to each field. Then, for a certain field, if there is a field to be linked with this field, the field to be linked is specified using the item number, and then an instruction to link these fields is input.

【0012】このように、前述の従来技術によれば、オ
ペレータは、帳票において連携知識処理を行うべき部分
の回数だけ、当該フィールドを連携させることを指示す
る入力を行う必要がある。従って、連携知識処理を行う
べき部分の数が増すと、それだけオペレータの負担が増
加する。また、帳票1の種類毎にこの指示入力を行う必
要があり、オペレータの負担になっていた。また、オペ
レータによる文字認識処理装置の操作回数が多いため
に、文字認識処理装置自体の高速化は進んでいるもの
の、文字認識処理の効率を向上できなかった。更に、オ
ペレータの入力によるため、連携知識処理の指示入力の
誤り等が発生する可能性があった。
As described above, according to the above-described prior art, the operator needs to perform an input for instructing the field to be linked the number of times in the form where the link knowledge processing is to be performed. Therefore, as the number of parts to perform the cooperative knowledge processing increases, the burden on the operator increases accordingly. Further, it is necessary to input this instruction for each type of the form 1, which is a burden on the operator. Further, since the number of times that the operator operates the character recognition processing device is large, the speed of the character recognition processing device itself is increasing, but the efficiency of the character recognition processing cannot be improved. Further, since the input is made by the operator, there is a possibility that an error in inputting the instruction of the cooperative knowledge processing or the like may occur.

【0013】本発明は、連携知識処理を行うべきフィー
ルドを自動的に認識してこれらを連携させる文字認識処
理装置を提供することを目的とする。また、本発明は、
連携知識処理を行うべき手書きカナフィールドと手書き
漢字フィールドとを自動的に認識してこれらを連携させ
る文字認識処理装置を提供することを目的とする。
An object of the present invention is to provide a character recognition processing apparatus for automatically recognizing fields to be subjected to cooperative knowledge processing and cooperating them. Also, the present invention
It is an object of the present invention to provide a character recognition processing device for automatically recognizing a handwritten kana field and a handwritten kanji field for which cooperative knowledge processing is to be performed and linking them.

【0014】[0014]

【課題を解決するための手段】図1は、本発明の原理構
成図であり、本発明による文字認識処理装置の構成を示
す。この文字認識処理装置は、予め定められた複数のフ
ィールドを備えた帳票1の各フィールドに記入された文
字を読み込んで、各フィールドについての文字認識処理
を行い文字認識出力6を得る文字認識処理装置である。
FIG. 1 is a block diagram showing the principle of the present invention, and shows the configuration of a character recognition processing apparatus according to the present invention. This character recognition processing device reads a character entered in each field of a form 1 having a plurality of predetermined fields, performs a character recognition process on each field, and obtains a character recognition output 6. It is.

【0015】この文字認識処理装置は、単独知識処理部
4、連携知識処理部5及び自動連携処理部3を備える。
単独知識処理部4は、所定のフィールドについての文字
認識処理における知識処理を、そのフィールド単独で行
う。連携知識処理部5は、所定のフィールドについての
文字認識処理における知識処理を、そのフィールド及び
これと連携させられた他のフィールドを連携させて行
う。自動連携処理部3は、複数のフィールドの内から、
帳票1上の位置が予め定められた関係にある複数のフィ
ールドを検索しこれらを連携させる。この時、特に、自
動連携処理部3は手書きカナフィールドと手書き漢字フ
ィールドとを連携させる。自動連携処理部3によって連
携させられた複数のフィールドについて、連携知識処理
部5がこれらを連携させてその知識処理を行う。
This character recognition processing device includes a single knowledge processing unit 4, a cooperative knowledge processing unit 5, and an automatic cooperative processing unit 3.
The independent knowledge processing unit 4 performs the knowledge processing in the character recognition processing for a predetermined field in the field alone. The cooperative knowledge processing unit 5 performs the knowledge processing in the character recognition processing for a predetermined field by cooperating the field and another field associated therewith. The automatic cooperation processing unit 3 determines, from among a plurality of fields,
A plurality of fields whose positions on the form 1 have a predetermined relationship are searched for and linked together. At this time, in particular, the automatic cooperation processing unit 3 makes the handwritten kana field and the handwritten kanji field cooperate. For a plurality of fields linked by the automatic link processing unit 3, the link knowledge processing unit 5 links these to perform the knowledge processing.

【0016】[0016]

【作用】文字認識処理における知識処理において連携さ
せるべきカナフィールドと漢字フィールド、特に、手書
きカナフィールドと手書き漢字フィールドとは、殆どの
場合、帳票1上において予め定められた関係にある。例
えば、これらは極めて近い位置や隣接する位置に設けら
れている。そこで、これを利用して、自動連携処理部3
は、帳票1上において予め定められた関係にある複数の
フィールド、特に手書きカナフィールドと手書き漢字フ
ィールドとを自動的に検索し、これらを連携させる。
The kana field and the kanji field to be linked in the knowledge processing in the character recognition processing, in particular, the handwritten kana field and the handwritten kanji field have a predetermined relationship on the form 1 in most cases. For example, they are provided at a very close position or an adjacent position. Therefore, using this, the automatic cooperation processing unit 3
Automatically retrieves a plurality of fields having a predetermined relationship on the form 1, in particular, a handwritten kana field and a handwritten kanji field, and associates them.

【0017】従って、本発明の文字認識処理装置によれ
ば、帳票1上において対応関係にある複数のフィール
ド、特に、手書きカナフィールドと手書き漢字フィール
ドとを自動的に連携させることができる。これにより、
殆どの帳票1において、所定の複数のフィールド、特
に、手書きカナフィールドと手書き漢字フィールドとを
連携させ、これらについて連携知識処理を行うことがで
きる。
Therefore, according to the character recognition processing device of the present invention, it is possible to automatically associate a plurality of fields having a corresponding relationship on the form 1, particularly a handwritten kana field and a handwritten kanji field. This allows
In most forms 1, a plurality of predetermined fields, in particular, a handwritten kana field and a handwritten kanji field can be linked, and linked knowledge processing can be performed on these fields.

【0018】これにより、連携知識処理を行うべきカナ
フィールドと漢字フィールドとを認識情報定義処理にお
いて指定する必要をなくすことができる。この結果、文
字認識処理を行う場合、オペレータが連携知識処理の指
示入力を行う必要をなくし、オペレータの負担を極めて
少なくでき、また、連携知識処理の指示入力の誤り等の
発生を防止することができる。更に、帳票1の種類が異
なる場合であっても、その都度連携知識処理の指示入力
を行う必要をなくすことができる。また、オペレータに
よる操作を少なくできるので、文字認識処理の効率を向
上することができる。
This eliminates the need to specify the kana field and the kanji field to be subjected to the cooperative knowledge processing in the recognition information definition processing. As a result, when performing the character recognition processing, the operator does not need to input an instruction for the cooperative knowledge processing, the burden on the operator can be extremely reduced, and the occurrence of an error in the input of the instruction for the cooperative knowledge processing can be prevented. it can. Further, even when the type of the form 1 is different, it is not necessary to input the instruction of the cooperative knowledge processing every time. In addition, since the number of operations by the operator can be reduced, the efficiency of the character recognition processing can be improved.

【0019】[0019]

【実施例】図2は実施例構成図であり、文字認識処理装
置を示す。本実施例の文字認識処理装置は、帳票1に記
入された文字を読み取る読み取り処理部7、これが読み
取った結果について文字認識処理を行って候補文字列9
を得る文字認識処理部8及び候補文字列9について知識
処理を行って文字認識出力6を得る知識処理部11を備
える。読み取り処理部7、文字認識処理部8及び知識処
理部11は処理装置2に設けられる。処理装置2は、当
該文字認識処理装置のCPU(中央演算処理装置)と、
文字認識処理装置のメモリ上の各処理プログラムとから
なる。処理プログラムは、例えば読み取り処理部7を構
成する読み取り処理プログラム、文字認識処理部8を構
成する文字認識処理プログラム、知識処理部11を構成
する知識処理プログラム等を含む。
FIG. 2 is a block diagram of an embodiment, showing a character recognition processing apparatus. The character recognition processing apparatus according to the present embodiment includes a reading processing unit 7 that reads a character written on a form 1, performs a character recognition process on a result read by the reading processing unit 7, and performs a candidate character string 9.
And a knowledge processing unit 11 that performs a knowledge process on the candidate character string 9 to obtain a character recognition output 6. The reading processing unit 7, the character recognition processing unit 8, and the knowledge processing unit 11 are provided in the processing device 2. The processing device 2 includes a CPU (central processing unit) of the character recognition processing device,
It consists of each processing program on the memory of the character recognition processing device. The processing programs include, for example, a reading processing program forming the reading processing section 7, a character recognition processing program forming the character recognition processing section 8, a knowledge processing program forming the knowledge processing section 11, and the like.

【0020】読み取り処理部7は、帳票1が所定の入力
装置(図示せず)から入力されると、これに記入された
活字文字、手書き文字及びマークを読み取る。帳票1は
予め定められた複数のフィールドを備え、その各フィー
ルドには文字等が記入されている。読み取り処理部7は
各フィールドに記入された文字等を各フィールドの内容
として読み取る。読み取り処理部7は、複数枚の帳票1
の読み取りを終了すると、帳票1毎にその読み取りの結
果を予め定められた所定の記憶領域に格納した上で、文
字認識処理部8を起動する。
When the form 1 is input from a predetermined input device (not shown), the reading processing section 7 reads the printed characters, handwritten characters, and marks entered therein. The form 1 has a plurality of predetermined fields, and characters and the like are entered in each of the fields. The read processing unit 7 reads characters and the like written in each field as the contents of each field. The reading processing unit 7 includes a plurality of forms 1
When the reading of the document is completed, the result of the reading is stored in a predetermined storage area for each form 1, and then the character recognition processing unit 8 is started.

【0021】ここで、帳票1としては、例えば図6に示
した帳票が用いられる。従って、この帳票1には、上か
ら順に会員番号、申込日、郵便番号、電話番号、住所
(カナ)、住所(漢字)、氏名(カナ)、氏名(漢
字)、生年月日、職業、年令、性別が、各々、予め指定
されたフィールドに記入される。
Here, as the form 1, for example, the form shown in FIG. 6 is used. Therefore, this form 1 includes the member number, application date, postal code, telephone number, address (kana), address (kanji), name (kana), name (kanji), date of birth, occupation, year The order and gender are respectively entered in the fields designated in advance.

【0022】前述のように、会員番号のみが活字フィー
ルドであり、他は手書きフィールドである。手書きフィ
ールドの内、申込日、郵便番号、電話番号、生年月日、
職業、年令のフィールドは数字フィールドであり、生年
月日、性別のフィールドはマークフィールドであり、住
所カナ、氏名カナの各フィールドはカナフィールドであ
り、住所漢字、氏名漢字の各フィールドは漢字フィール
ドである。申込日、郵便番号、住所、氏名等は、当該各
フィールドに記入されたデータ(即ち、知識)の属性で
ある。
As described above, only the member number is a print field, and the others are handwritten fields. In the handwritten field, application date, zip code, phone number, date of birth,
The fields of occupation and age are numeric fields, the fields of date of birth and gender are mark fields, the fields of address kana and name kana are kana fields, and the fields of address kanji and name kanji are kanji fields It is. The application date, postal code, address, name, etc. are attributes of the data (that is, knowledge) entered in the respective fields.

【0023】文字認識処理部8は、読み取り処理部7か
ら起動されると、所定の記憶領域に格納されている複数
枚の帳票1の読み取り結果について文字認識処理を行
い、文字認識結果である候補文字列9を得る。候補文字
列9は所定の様式で所定のファイルに格納される。候補
文字列9は1個の帳票1毎に得られる。1個の帳票1に
ついての候補文字列9(1個の候補文字列9)は、1個
の帳票1の各フィールド毎の候補文字列からなる。文字
認識処理部8は、帳票1についての文字認識により候補
文字列9を得ると、知識処理部11を起動して候補文字
列9についての知識処理を行わせる。なお、知識処理部
11は文字認識処理部8に含まれるものであってもよ
い。
When activated by the reading processing unit 7, the character recognizing processing unit 8 performs a character recognizing process on the reading results of the plurality of forms 1 stored in a predetermined storage area, and obtains a candidate character recognizing result. Get character string 9. The candidate character string 9 is stored in a predetermined file in a predetermined format. The candidate character string 9 is obtained for each form 1. The candidate character string 9 for one form 1 (one candidate character string 9) is composed of candidate character strings for each field of one form 1. When the character recognition processing unit 8 obtains the candidate character string 9 by character recognition on the form 1, the character recognition processing unit 8 activates the knowledge processing unit 11 to perform the knowledge processing on the candidate character string 9. Note that the knowledge processing unit 11 may be included in the character recognition processing unit 8.

【0024】知識処理部11は、文字認識処理部8から
起動されると、候補文字列9についての知識処理を行い
文字認識出力6を得る。この知識処理は、1個の候補文
字列9毎に行われ、1個の候補文字列9において各フィ
ールド毎の候補文字列を処理単位として行われる。
When activated by the character recognition processing unit 8, the knowledge processing unit 11 performs knowledge processing on the candidate character string 9 and obtains a character recognition output 6. This knowledge processing is performed for each candidate character string 9, and the candidate character string for each field in one candidate character string 9 is used as a processing unit.

【0025】知識処理部11は、知識処理の前処理を行
うカナ漢字自動連携処理部3A、前処理の結果に従って
知識処理を行う単独知識処理部4及び連携知識処理部
5、主として単独知識処理部4及び連携知識処理部5が
知識処理のために用いる属性データ10及び辞書14を
備える。
The knowledge processing unit 11 includes a kana-kanji automatic cooperation processing unit 3A for performing preprocessing of knowledge processing, a single knowledge processing unit 4 and a cooperative knowledge processing unit 5 for performing knowledge processing according to the result of the preprocessing, and mainly a single knowledge processing unit. 4 and attribute data 10 and a dictionary 14 used by the cooperative knowledge processing unit 5 for knowledge processing.

【0026】カナ漢字自動連携処理部3Aは、図1の自
動連携処理部3に対応し、知識処理の前処理として各フ
ィールド毎の候補文字列について、知識処理の対象とす
るか、単独知識処理の対象とするか、連携知識処理の対
象とするかを決定する。
The kana-kanji automatic cooperation processing unit 3A corresponds to the automatic cooperation processing unit 3 in FIG. 1, and as a pre-processing of the knowledge processing, a candidate character string for each field is subjected to knowledge processing or independent knowledge processing. It is determined whether the target is a target of the cooperative knowledge processing.

【0027】まず、カナ漢字自動連携処理部3Aは、候
補文字列9の各フィールド毎の候補文字列について、知
識処理の対象とするか否かの決定を行う。この決定処理
において、カナ漢字自動連携処理部3Aは、本来は単独
知識処理部4及び連携知識処理部5が知識処理のために
用いるデータである属性データ10を参照する。
First, the kana-kanji automatic cooperation processing unit 3A determines whether or not a candidate character string for each field of the candidate character string 9 is to be subjected to knowledge processing. In this determination process, the kana-kanji automatic cooperation processing unit 3A refers to the attribute data 10 which is originally data used by the single knowledge processing unit 4 and the cooperation knowledge processing unit 5 for knowledge processing.

【0028】属性データ10は帳票1の種類毎に予め用
意される。即ち、図中点線で示すように、帳票1の種類
と属性データ10とは1対1に対応する。属性データ1
0は、1種類の帳票1において、各フィールド毎にその
属性を格納する。格納される属性としては、記入方法に
よって定まる属性である手書き/活字の種別、記入され
る文字の種類によって定まる属性であるカナ/漢字/数
字/英字/混在の種別、当該フィールドの帳票1上の位
置によって定まる属性である位置情報、当該フィールド
について知識処理が必要かによって定まる属性である知
識処理の要否がある。
The attribute data 10 is prepared in advance for each type of the form 1. That is, as shown by the dotted line in the figure, the type of the form 1 and the attribute data 10 correspond one to one. Attribute data 1
0 stores the attribute of each field in one type of form 1. The attributes to be stored include the type of handwriting / printing, which is an attribute determined by the entry method, the type of kana / kanji / numerical / alphabet / mixed, which is an attribute determined by the type of character to be entered, and There are position information, which is an attribute determined by the position, and necessity of knowledge processing, which is an attribute determined by whether knowledge processing is required for the field.

【0029】例えば図6に示した帳票1については、会
員番号フィールドの属性は「活字、数字、位置情報、知
識処理不要」とされる。申込日、郵便番号、電話番号、
生年月日(前半部分)、職業、年令の各フィールドの属
性は「手書き、数字、位置情報、知識処理不要」とされ
る。生年月日(後半部分)、性別の各フィールドの属性
は「手書き、マーク、位置情報、知識処理不要」とされ
る。住所カナ、氏名カナの各フィールドの属性は「手書
き、カナ、位置情報、知識処理必要」とされる。住所漢
字、氏名漢字の各フィールドの属性は「手書き、漢字、
位置情報、知識処理必要」とされる。
For example, for the form 1 shown in FIG. 6, the attribute of the member number field is set to "print, numeral, position information, and knowledge processing unnecessary". Application date, postal code, phone number,
The attributes of the fields of the date of birth (first half), occupation, and age are "handwritten, numbers, location information, and no knowledge processing required". The attributes of each field of the date of birth (the latter half) and gender are "handwritten, mark, position information, no knowledge processing required". The attributes of the address kana and name kana fields are "handwritten, kana, positional information, knowledge processing required". The attributes of the address kanji and full name kanji fields are "handwritten, kanji,
Location information and knowledge processing are required. "

【0030】なお、以上の他に、各フィールドの項目番
号(例えば、会員番号フィールドの項目番号は「1」で
ある)、各フィールドに記入されるデータ(知識)の内
容によって定まる属性(知識属性)である「会員番号」
等も、各フィールドについて、その属性として記述され
る。
In addition to the above, an attribute (knowledge attribute) determined by the item number of each field (for example, the item number of the member number field is "1") and the contents of data (knowledge) written in each field ) "Member number"
Is described as an attribute of each field.

【0031】このような属性データ10は、文字認識処
理の開始に先立って実行される認識情報定義処理におい
て、文字認識処理装置の備える入出力装置(図示せず)
からオペレータによって予め入力され、所定のファイル
に格納される。例えば、オペレータが未記入の帳票1を
読み込ませると、これを文字認識処理装置がその入出力
装置の表示画面に表示する。そこで、オペレータが、マ
ウス等を用いてこの画面から各フィールドを定義し、定
義した各フィールドについての各属性(位置情報を除
く)を入出力装置から入力する。このような属性データ
10の作成及び管理は所定の処理プログラムが行う。
Such attribute data 10 is used as an input / output device (not shown) provided in the character recognition processing device in the recognition information defining process executed prior to the start of the character recognition process.
Is input in advance by the operator and stored in a predetermined file. For example, when an operator reads a blank form 1, the character recognition processing device displays the form 1 on a display screen of the input / output device. Then, the operator defines each field from this screen using a mouse or the like, and inputs each attribute (excluding position information) of each defined field from the input / output device. The creation and management of such attribute data 10 is performed by a predetermined processing program.

【0032】属性の内の位置情報については、当該処理
プログラムによって自動的に設定される。即ち、オペレ
ータが各フィールドを定義した際に、画面上において入
力した点のX座標(位置)及びY座標(位置)が、その
まま当該フィールドの位置情報とされる。
The position information in the attributes is automatically set by the processing program. That is, when the operator defines each field, the X coordinate (position) and the Y coordinate (position) of the point input on the screen are directly used as the position information of the field.

【0033】この位置情報について図3により説明す
る。図3は図6に示す帳票1の一部を拡大して示す。帳
票1上の位置情報は、マーク1Aを基準として、X座標
(位置)及びY座標(位置)により定められる。図中、
横方向をX方向とし、縦方向(検索の方向)をY方向と
する。なお、マーク1Aが印刷されていない場合、帳票
1の端部を基準として定められる。即ち、帳票1上の各
フィールドの位置は、マーク1Aの開始X位置であるX
S からの距離と、マーク1Aの開始Y位置であるYS
らの距離とによって表される。
This position information will be described with reference to FIG. FIG. 3 shows an enlarged part of the form 1 shown in FIG. Position information on the form 1 is determined by an X coordinate (position) and a Y coordinate (position) with reference to the mark 1A. In the figure,
The horizontal direction is defined as the X direction, and the vertical direction (search direction) is defined as the Y direction. When the mark 1A is not printed, the mark 1A is determined based on the end of the form 1. That is, the position of each field on the form 1 is X, which is the start X position of the mark 1A.
The distance from S, is represented by the distance from Y S is the starting Y position of the mark 1A.

【0034】例えば、図3において、帳票1の先頭から
5番目(項目番号が5)のフィールドである住所カナフ
ィールドの開始X位置はX51であり、開始Y位置はY51
であり、終了Y位置はY52である。なお、終了X位置X
52(図示省略)も同様に定まる。また、他の各フィール
ドについても同様である。位置情報の開始X位置及び開
始Y位置は、各々、X方向及びY方向に帳票1を検索す
る場合において当該フィールドが開始される位置を示
す。
[0034] For example, in FIG. 3, the starting X location address kana field is a field of 5 th from the head of the form 1 (item number 5) is X 51, starting Y position Y 51
, And the termination Y position is Y 52. Note that the end X position X
52 (not shown) is similarly determined. The same applies to the other fields. The start X position and the start Y position of the position information indicate the position where the field is started when the document 1 is searched in the X direction and the Y direction, respectively.

【0035】図3に示すような帳票1が入出力装置の表
示画面に表示された状態において、オペレータが、当該
フィールドの左上端1B及び右下端(左上端1Bの対
角、図示せず)等にマウスを位置付けて、当該住所カナ
フィールドを指定する。この時、処理プログラムが、住
所カナフィールドの開始X位置、開始Y位置、終了X位
置、終了Y位置を、その位置情報として属性データ10
に書き込む。これは各フィールドについて行われる。こ
れにより、各フィールドの位置情報は当該処理プログラ
ムによって自動的に設定される。
In a state where the form 1 as shown in FIG. 3 is displayed on the display screen of the input / output device, the operator operates the upper left corner 1B and the lower right corner (diagonal of the upper left corner 1B, not shown) of the field. Position the mouse on and specify the address kana field. At this time, the processing program sets the start X position, start Y position, end X position, and end Y position of the address kana field as attribute information in the attribute data 10.
Write to. This is done for each field. Thereby, the position information of each field is automatically set by the processing program.

【0036】このような属性データ10を参照して、カ
ナ漢字自動連携処理部3Aは、帳票1の各フィールドの
内、手書きであって、かつ、カナ文字又は漢字の記入さ
れているフィールドを知識処理の対象とする。即ち、手
書きカナフィールド及び手書き漢字フィールドは、記入
される文字の種類が多くて字形が記入者の個性に依存す
るために、文字認識処理のみでは文字認識率を高めるこ
とが難しいので、知識処理によって候補文字列9を補正
する。一方、カナ漢字自動連携処理部3Aは活字フィー
ルド及び数字フィールドを知識処理の対象から除く。
With reference to the attribute data 10, the automatic kana-kanji processing unit 3 A knows, among the fields of the form 1, the fields which are handwritten and in which kana or kanji are entered. Target for processing. That is, since the handwritten kana field and the handwritten kanji field have many types of characters to be entered and the character shape depends on the personality of the writer, it is difficult to increase the character recognition rate only by the character recognition process. The candidate character string 9 is corrected. On the other hand, the kana-kanji automatic cooperation processing unit 3A excludes the type field and the number field from the target of the knowledge processing.

【0037】例えば図6に示した帳票1においては、会
員番号フィールドはその属性が「活字」であるので知識
処理の対象から除かれ、申込日、郵便番号、電話番号、
生年月日、職業、年令、性別の各フィールドも属性が
「数字」であるので除かれる。一方、手書きカナフィー
ルドである住所カナ、氏名カナの各フィールドと、手書
き漢字フィールドである住所漢字、氏名漢字の各フィー
ルドとが、知識処理の対象とされる。
For example, in the form 1 shown in FIG. 6, the attribute of the member number field is “print”, so that the member number field is excluded from the subject of the knowledge processing, and the application date, postal code, telephone number,
The fields of date of birth, occupation, age, and gender are also excluded because the attribute is “number”. On the other hand, the fields of address kana and name kana, which are handwritten kana fields, and the fields of address kanji and name kanji, which are handwritten kanji fields, are subjected to knowledge processing.

【0038】次に、カナ漢字自動連携処理部3Aは、知
識処理の対象とすると決定した各フィールド毎の候補文
字列について、単独知識処理又は連携知識処理のいずれ
の対象とするかを決定する。即ち、帳票1上のフィール
ドを他のフィールドと連携させるか否かを決定する。連
携知識処理の対象とされなかったフィールドは単独知識
処理の対象とされる。
Next, the kana-kanji automatic cooperation processing unit 3A determines whether the candidate character string for each field determined to be subjected to the knowledge processing is to be subjected to the single knowledge processing or the cooperation knowledge processing. That is, it is determined whether or not a field on the form 1 is linked with another field. Fields that are not targeted for cooperative knowledge processing are targeted for single knowledge processing.

【0039】連携知識処理の対象とすべきフィールド
は、手書きであって、かつ、カナ又は漢字の記入されて
いるフィールドである。例えば図6に示した帳票1にお
いては、住所カナフィールドと住所漢字フィールド、及
び、氏名カナフィールドと氏名漢字フィールドが各々連
携させるべき対象である。
The field to be subjected to the cooperative knowledge processing is a field which is handwritten and in which kana or kanji is entered. For example, in the form 1 shown in FIG. 6, the address kana field and the address kanji field, and the name kana field and the name kanji field are objects to be linked with each other.

【0040】なお、図6に示した帳票1においては、知
識処理の対象とすべきフィールドは全て連携知識処理の
対象とすべきフィールドであったが、帳票1の種類によ
っては、知識処理の対象とすべきフィールドの中に連携
知識処理の対象とすべきでないフィールドが含まれる場
合もある。
In the form 1 shown in FIG. 6, the fields to be subjected to the knowledge processing are all the fields to be subjected to the cooperative knowledge processing. In some cases, fields that should not be included include fields that should not be subjected to the cooperative knowledge processing.

【0041】ここで、図6及び図3からも判るように、
連携知識処理の対象とすべきフィールドは、帳票1上に
おける位置が予め定められており、極めて近い位置にあ
るか又は隣接している。そこで、カナ漢字自動連携処理
部3Aは、帳票1上の複数のフィールドの内から、帳票
1上の位置が予め定められた関係にあるカナフィールド
と漢字フィールドとを検索する。即ち、「帳票1上の位
置が予め定められた関係にある」ことを検索条件として
検索を行う。そして、検索の結果、抽出されたカナフィ
ールドと漢字フィールドとを連携させる。特に、このよ
うな位置関係にある手書きカナフィールド及び手書き漢
字フィールドを連携させる。
Here, as can be seen from FIGS. 6 and 3,
The field to be subjected to the cooperative knowledge processing has a predetermined position on the form 1, and is located at a very close position or adjacent. Therefore, the kana-kanji automatic cooperation processing unit 3A searches a plurality of fields on the form 1 for a kana field and a kanji field whose positions on the form 1 have a predetermined relationship. In other words, the search is performed using "the position on the form 1 has a predetermined relationship" as a search condition. Then, the kana field and the kanji field extracted as a result of the search are linked. In particular, the handwritten kana field and the handwritten kanji field having such a positional relationship are linked.

【0042】帳票1上の位置が予め定められた関係にあ
るカナフィールドと漢字フィールドとを検索するため
に、カナ漢字自動連携処理部3Aは、横書き用認識フィ
ールド検索処理部12及び縦書き用認識フィールド検索
処理部13を備える。
In order to search for a kana field and a kanji field whose positions on the form 1 are in a predetermined relationship, the kana-kanji automatic cooperation processing unit 3A includes a horizontal writing recognition field search processing unit 12 and a vertical writing recognition A field search processing unit 13 is provided.

【0043】横書き用認識フィールド検索処理部12
は、帳票1が図6及び図3のように横書きである場合に
おいて、連携すべきフィールドを検索する。横書き用認
識フィールド検索処理部12は、横書き用の帳票1をそ
の上から下方向(Y方向)に向かって検索し、帳票1上
の複数のフィールドの内から、帳票1上において互いの
開始X位置が実質的に同一で、かつ、より下方のフィー
ルドの開始Y位置がその上方のフィールドに極めて近い
位置にあるカナフィールドと漢字フィールドとを検索す
る。即ち、「帳票1上において互いの開始X位置が実質
的に同一で、かつ、より下方のフィールドの開始Y位置
がその上方のフィールドに極めて近い位置にある」こと
を検索条件として検索を行う。
Recognition field search processing unit 12 for horizontal writing
Searches for a field to be linked when the form 1 is written horizontally as shown in FIGS. The horizontal writing recognition field search processing unit 12 searches the horizontal writing form 1 in a downward direction (Y direction) from above, and starts each other on the form 1 from among a plurality of fields on the form 1. A kana field and a kanji field whose positions are substantially the same and whose start Y position of the lower field is very close to the field above it are searched. In other words, the search is performed using the search condition that “the start X positions of each other on the form 1 are substantially the same and the start Y position of the lower field is extremely close to the field above”.

【0044】例えば、図3の帳票1においては、住所カ
ナフィールドと住所漢字フィールドとは、互いの開始X
位置X51とX61とが同一で、かつ、より下方の住所漢字
フィールドの開始Y位置Y61がその上方の住所カナフィ
ールドの終了Y位置Y52に極めて近い位置にある。氏名
カナフィールドと氏名漢字フィールドとについても同一
である。従って、これらが連携すべきフィールドとして
検索される。
For example, in the form 1 shown in FIG. 3, the address kana field and the address kanji field have a mutual start X
In the position X 51 and X 61 are the same, and, more starting Y position Y 61 below the address kanji field is very close to the end Y-position Y 52 Address Kana fields thereabove. The same applies to the name kana field and the name kanji field. Therefore, these are searched as fields to be linked.

【0045】開始X位置が実質的に同一か否かの判断
は、住所カナフィールドと住所漢字フィールドの開始X
位置の差(X61−X51)が所定の値Aより小さいか否か
によって行う。所定の値Aは、極めて小さい値とされ、
予め与えられる。
Whether or not the start X positions are substantially the same is determined by determining whether the start X position of the address kana field and the start X
The determination is made based on whether or not the position difference (X 61 −X 51 ) is smaller than a predetermined value A. The predetermined value A is an extremely small value,
Given in advance.

【0046】また、開始Y位置が極めて近い位置にある
か否かの判断は、住所カナフィールドの終了Y位置と住
所漢字フィールドの開始Y位置との差(Y61−Y52)が
所定の値Bより小さいか否かによって行う。所定の値B
は予め与えられる。所定の値Bは、例えば1文字分の記
入領域の1辺の値(Y62−Y61)又は(X52−X51)と
される。なお、所定の値Aは、所定の値Bよりも十分に
小さい値とされる。
[0046] Furthermore, starting Y position is whether very close position determination, the difference (Y 61 -Y 52) is a predetermined value of the starting Y position of the end Y position and address Kanji fields Address Kana Field It depends on whether it is smaller than B or not. Predetermined value B
Is given in advance. Predetermined value B is, for example, 1 one side of the value of the character in the entry region (Y 62 -Y 61) or (X 52 -X 51). Note that the predetermined value A is a value sufficiently smaller than the predetermined value B.

【0047】[0047]

【0048】横書き用認識フィールド検索処理部12
は、この検索を次のように行う。帳票1をY方向に検索
するために、検索対象のY位置を用いて属性データ10
を参照する。各フィールドの開始Y位置と検索対象Y位
置とが等しくなった時、当該フィールドが検索されたこ
とになる。検索対象Y位置は値YSからインクリメント
される。なお、例えば、会員番号フィールドと申込日フ
ィールドのように開始Y位置の等しいフィールドが複数
ある場合、更に、属性データ10の開始X位置が参照さ
れ、より小さい値を持つフィールド(例えば、会員番号
フィールド)が先に検索される。
Recognition field search processing unit 12 for horizontal writing
Performs this search as follows: In order to search the form 1 in the Y direction, the attribute data 10 is searched using the Y position of the search target.
See When the start Y position of each field is equal to the search target Y position, this field has been searched. Searched Y position is incremented from the value Y S. For example, when there are a plurality of fields having the same start Y position such as a member number field and an application date field, the start X position of the attribute data 10 is further referred to and a field having a smaller value (for example, a member number field) ) Is searched first.

【0049】縦書き用認識フィールド検索処理部13
は、帳票1が縦書きである場合において、連携すべきフ
ィールドを検索する。縦書き用認識フィールド検索処理
部13は、縦書き用の帳票をその右から左方向に向かっ
て検索し、帳票上の複数のフィールドの内から、帳票1
上において互いの開始Y位置が実質的に同一で、かつ、
より左方のフィールドの開始X位置がその右方のフィー
ルドに極めて近い位置にあるカナフィールドと漢字フィ
ールドとを検索する。即ち、「帳票1上において互いの
開始Y位置が実質的に同一で、かつ、より左方のフィー
ルドの開始X位置がその右方のフィールドに極めて近い
位置にある」ことを検索条件として検索を行う。
Recognition field search processing unit 13 for vertical writing
Searches for a field to be linked when the form 1 is written vertically. The recognition field search processing unit 13 for vertical writing searches for a form for vertical writing from right to left, and finds a form 1 from a plurality of fields on the form.
The starting Y positions of each other are substantially the same, and
A kana field and a kanji field in which the starting X position of the left field is very close to the right field are searched. That is, the search is performed using the search condition that “the start Y positions of the respective fields are substantially the same on the form 1 and the start X position of the left field is extremely close to the right field”. Do.

【0050】例えば、図3又は図6の帳票1を90度回
転させて、会員番号フィールドが帳票1の右端において
縦書きの領域となるような帳票を考える。X方向及びY
方向は図3又は図6の例とは逆になる。このような帳票
においては、住所カナフィールドと住所漢字フィールド
とは、互いの開始Y位置が同一で、かつ、互いの開始X
位置が極めて近い位置にある。氏名カナフィールドと氏
名漢字フィールドとについても同一である。従って、こ
れらが連携すべきフィールドとして検索される。検索条
件及び検索方法は上記の場合と同様である。
For example, consider a form in which the form 1 of FIG. 3 or FIG. 6 is rotated by 90 degrees so that the member number field is a vertically written area at the right end of the form 1. X direction and Y
The direction is opposite to the example of FIG. 3 or FIG. In such a form, the address kana field and the address kanji field have the same start Y position, and have the same start X position.
The location is very close. The same applies to the name kana field and the name kanji field. Therefore, these are searched as fields to be linked. The search conditions and the search method are the same as those described above.

【0051】以上の処理によって、カナ漢字自動連携処
理部3Aは、知識処理の対象とされた各フィールドの
内、住所カナフィールドと住所漢字フィールドとを連携
させ、氏名カナフィールドと氏名漢字フィールドとを連
携させる。
With the above processing, the kana-kanji automatic cooperation processing unit 3A links the address kana field and the address kanji field among the fields subjected to the knowledge processing, and converts the name kana field and the name kanji field. Cooperate.

【0052】カナ漢字自動連携処理部3Aは、この連携
処理を次のように行う。便宜的に、先に検索された住所
カナフィールドを連携される側とし、後に検索された住
所漢字フィールドを連携する側とする。属性データ10
において、連携される側の住所カナフィールドの属性
に、連携フラグを立て、連携する側の住所漢字フィール
ドの項目番号「6」を設定する。氏名フィールドについ
ても同様である。
The kana-kanji automatic cooperation processing section 3A performs this cooperation processing as follows. For convenience, the address kana field searched first is the linked side, and the address kanji field searched later is the linked side. Attribute data 10
In, a linking flag is set in the attribute of the address kana field on the linked side, and the item number “6” of the address kanji field on the linked side is set. The same applies to the name field.

【0053】カナ漢字自動連携処理部3Aは、以上の前
処理の結果に従って、単独知識処理部4又は連携知識処
理部5に制御を渡す。単独知識処理部4又は連携知識処
理部5は辞書14を用いて知識処理を行う。
The kana-kanji automatic cooperation processing unit 3A transfers control to the independent knowledge processing unit 4 or the cooperation knowledge processing unit 5 according to the result of the above preprocessing. The independent knowledge processing unit 4 or the cooperative knowledge processing unit 5 performs knowledge processing using the dictionary 14.

【0054】辞書14は、氏名カナ辞書、氏名漢字辞
書、住所カナ辞書、住所漢字辞書からなる。例えば、氏
名カナ辞書は氏名カナフィールドの知識処理のための辞
書であり、存在する氏及び名をカナで記述したデータか
らなる。氏名漢字辞書、住所カナ辞書、住所漢字辞書に
ついても同様である。
The dictionary 14 includes a name kana dictionary, a name kanji dictionary, an address kana dictionary, and an address kanji dictionary. For example, the name kana dictionary is a dictionary for knowledge processing of the name kana field, and is composed of data in which existing names and names are described in kana. The same applies to the name kanji dictionary, the address kana dictionary, and the address kanji dictionary.

【0055】単独知識処理部4は、所定のフィールドに
ついての文字認識処理における知識処理を、そのフィー
ルド単独で行う。即ち、カナ漢字自動連携処理部3Aに
おいて、他のフィールドと連携されなかったフィールド
について、以下の単独知識処理を行う。
The independent knowledge processing section 4 performs the knowledge processing in the character recognition processing for a predetermined field in the field alone. That is, in the kana-kanji automatic cooperation processing unit 3A, the following independent knowledge processing is performed on a field that is not linked with another field.

【0056】単独知識処理部4は、カナ漢字自動連携処
理部3Aから処理対象であるフィールドの項目番号と共
に制御を渡されると、その項目番号の示すフィールドに
ついての単独知識処理を行う。
When the independent knowledge processing section 4 receives control from the automatic kana / kanji cooperation section 3A together with the item number of the field to be processed, it performs independent knowledge processing on the field indicated by the item number.

【0057】即ち、項目番号を用いて候補文字列9から
当該フィールドから得た候補文字列を取り出す。また、
属性データ10の当該項目番号の属性を参照し、その属
性を知る。そこで、取り出した候補文字列を用いて該当
する辞書14を照合して、その候補文字列が存在するか
否かを調べ、存在する場合はそのままとし、存在しない
場合は辞書14に存在する近い文字列を候補文字列とす
る補正を行う。
That is, the candidate character string obtained from the field is extracted from the candidate character string 9 using the item number. Also,
The attribute of the item number in the attribute data 10 is referred to and the attribute is known. Then, using the extracted candidate character string, the corresponding dictionary 14 is checked to determine whether or not the candidate character string exists. If the candidate character string exists, it is left as it is. Correction is performed using a column as a candidate character string.

【0058】連携知識処理部5は、所定のフィールドに
ついての文字認識処理における知識処理を、そのフィー
ルドとこれと連携させられた他のフィールドとを連携さ
せて行う。即ち、カナ漢字自動連携処理部3Aによって
連携させられた手書きカナフィールドと手書き漢字フィ
ールドとについて、以下の連携知識処理を行う。
The cooperative knowledge processing section 5 performs the knowledge processing in the character recognition processing for a predetermined field by cooperating the field with another field associated therewith. That is, the following cooperative knowledge processing is performed on the handwritten kana field and the handwritten kanji field linked by the kana / kanji automatic cooperation processing unit 3A.

【0059】具体的には、カナ漢字自動連携処理部3A
から処理対象であるフィールドの項目番号と共に制御を
渡されると、その項目番号の示すフィールドについての
連携知識処理を行う。
Specifically, the kana-kanji automatic cooperation processing unit 3A
When the control is passed along with the item number of the field to be processed from, the cooperative knowledge processing for the field indicated by the item number is performed.

【0060】例えば、項目番号が氏名カナフィールドを
示す「7」である場合、氏名カナフィールドから得た候
補文字列を候補文字列9から取り出す。また、属性デー
タ10の項目番号「7」の属性(氏名カナフィールドの
属性)を参照し、その属性として氏名及びカナを知る。
更に、氏名カナフィールドの属性として、連携フラグが
立っていることと、連携の対象が項目番号「8」の氏名
漢字フィールドであることを知る。
For example, when the item number is “7” indicating the name kana field, the candidate character string obtained from the name kana field is extracted from the candidate character string 9. Also, the attribute of item number “7” (the attribute of the name kana field) of the attribute data 10 is referred to, and the name and kana are known as the attributes.
Further, it is known that the cooperation flag is set as the attribute of the name kana field and that the object of the cooperation is the name kanji field of the item number “8”.

【0061】そこで、取り出した候補文字列を用いて氏
名カナ辞書を照合して、その候補文字列が存在するか否
かを調べ、存在する場合はそのままとし、存在しない場
合は氏名カナ辞書に存在する近い文字列を候補文字列と
する補正を行う(単独知識処理を行う)。例えば、この
結果が「タナカ」であるとする。
Then, using the extracted candidate character string, the name kana dictionary is checked to determine whether or not the candidate character string exists. If the candidate character string exists, it is left as it is. Correction is performed using a close character string as a candidate character string (independent knowledge processing is performed). For example, suppose that the result is “Tanaka”.

【0062】次に、連携対象とされた氏名漢字フィール
ドから得た候補文字列を候補文字列9から取り出し、属
性データ10からその属性を知る。そして、取り出した
候補文字列を用いて氏名漢字辞書を照合して、その候補
文字列が存在するか否かを調べ、存在する場合はそのま
まとし、存在しない場合は氏名漢字辞書に存在する近い
文字列を候補文字列とする補正を行う(単独知識処理を
行う)。例えば、この結果が「由中」であるとする。
Next, a candidate character string obtained from the name / kanji field to be linked is extracted from the candidate character string 9 and its attribute is known from the attribute data 10. Then, using the extracted candidate character string, the name / kanji dictionary is checked to determine whether or not the candidate character string exists. If the candidate character string exists, it is left as it is. Correction is performed using a column as a candidate character string (independent knowledge processing is performed). For example, assume that the result is “Yunaka”.

【0063】ここで、氏名カナフィールドから得た候補
文字列「タナカ」は正しく、氏名漢字フィールドから得
た候補文字列「由中」は誤りであるとする。また、これ
らの文字列が共に氏名カナ辞書及び氏名漢字辞書に存在
するとする。この場合、単独知識処理によっては候補文
字列を補正できない。
Here, it is assumed that the candidate character string “Tanaka” obtained from the name kana field is correct, and the candidate character string “Yunaka” obtained from the name kanji field is incorrect. It is also assumed that these character strings are both present in the full name kana dictionary and the full name kanji dictionary. In this case, the candidate character string cannot be corrected by the independent knowledge processing.

【0064】連携知識処理部5は、氏名カナフィールド
から得た候補文字列「タナカ」が3文字であり、一方、
氏名漢字フィールドから得た候補文字列「由中」の読み
が「ヨシナカ」の4文字となることに基づいて、候補文
字列「タナカ」が正しいと判断する。これは、通常、氏
名カナフィールドから得る候補文字列の字数を誤ること
は有り得ないからである。
The cooperation knowledge processing unit 5 determines that the candidate character string “Tanaka” obtained from the name kana field is three characters,
The candidate character string “Tanaka” is determined to be correct based on the fact that the reading of the candidate character string “Yunaka” obtained from the full name kanji field is the four characters “Yoshinaka”. This is because the number of characters in the candidate character string obtained from the name kana field cannot be wrong.

【0065】次に、連携知識処理部5は、正しいと判断
した候補文字列「タナカ」を用いて氏名漢字辞書を参照
し、氏名漢字フィールドから得た候補文字列「由中」に
近い字形を持ち、その読みが「タナカ」である文字列
「田中」を候補文字列とするように補正する。
Next, the cooperative knowledge processing unit 5 refers to the full name kanji dictionary using the candidate character string “Tanaka” determined to be correct, and extracts a character form close to the candidate character string “Yunaka” obtained from the full name kanji field. The character string “Tanaka” whose reading is “Tanaka” is corrected to be a candidate character string.

【0066】なお、以上の知識処理についての説明は、
その一例を示したものであって、実際には、単独知識処
理部4及び連携知識処理部5は他の種々の知識処理を行
う。図4は知識処理フローであり、カナ漢字自動連携処
理部3A及び横書き用認識フィールド検索処理部12が
行う処理を示す。この処理フローは、帳票1を検索する
場合において、連携すべきフィールドの内、手書きカナ
フィールドが手書き漢字フィールドより先に検索され、
かつ、これらが連続して検索される帳票1を処理する場
合について示す。
The explanation of the above knowledge processing is as follows.
This is an example, and in practice, the single knowledge processing unit 4 and the cooperative knowledge processing unit 5 perform various other knowledge processes. FIG. 4 is a flow of the knowledge processing, and shows the processing performed by the kana-kanji automatic cooperation processing unit 3A and the recognition field search processing unit 12 for horizontal writing. In this processing flow, when the form 1 is searched, the handwritten kana field is searched before the handwritten kanji field among the fields to be linked,
Further, a case will be described in which the form 1 in which these are successively searched is processed.

【0067】文字認識処理部8が知識処理部11を起動
すると、知識処理部11が処理対象である帳票1が図3
に示すような横書きのものか否かを調べる(S1)。横
書き出ない場合、図5に示す処理を行う。横書きである
場合、横書き用認識フィールド検索処理部12に制御を
渡す。
When the character recognition processing unit 8 activates the knowledge processing unit 11, the form 1 to be processed by the knowledge processing unit 11 is
(S1). If horizontal writing is not performed, the processing shown in FIG. 5 is performed. In the case of horizontal writing, control is passed to the recognition field search processing unit 12 for horizontal writing.

【0068】制御を渡された横書き用認識フィールド検
索処理部12が、処理対象である帳票1をその上から下
の方向に向けてフィールドの有無を検索する(S2)。
この検索によりフィールドを検出すると、横書き用認識
フィールド検索処理部12が、属性データ10を参照し
て、当該フィールドが手書きカナフィールドか否かを調
べる(S3)。
The horizontal writing recognition field search processing unit 12 to which the control has been passed searches the form 1 to be processed in a downward direction from the top to search for a field (S2).
When a field is detected by this search, the recognition field search processing unit 12 for horizontal writing refers to the attribute data 10 and checks whether or not the field is a handwritten Kana field (S3).

【0069】手書きカナフィールドでない場合、横書き
用認識フィールド検索処理部12がこの旨を知識処理部
11に通知し、知識処理部11がS2で検索されたフィ
ールドが最終フィールドか否かを調べる(S4)。この
ために、予め帳票1の項目番号の最大の値を所定のレジ
スタにセットし、S2及びS6でフィールドを検索する
毎にレジスタの内容から1を引く。レジスタの内容が0
となった場合、最終フィールドとされる。
If the field is not a handwritten kana field, the horizontal writing recognition field search processing section 12 notifies the knowledge processing section 11 of this fact, and the knowledge processing section 11 checks whether or not the field searched in S2 is the last field (S4). ). For this purpose, the maximum value of the item number of the form 1 is set in a predetermined register in advance, and 1 is subtracted from the contents of the register every time the field is searched in S2 and S6. Register contents are 0
If it becomes, it is the last field.

【0070】最終フィールドである場合、知識処理部1
1は知識処理を終了する。最終フィールドでない場合、
知識処理部11が横書き用認識フィールド検索処理部1
2に制御を渡して、S2以下を繰り返す。
If it is the last field, the knowledge processing unit 1
1 ends the knowledge processing. If not the last field,
The knowledge processing unit 11 is used for the horizontal writing recognition field search processing unit 1
Then, control is passed to S2 and S2 and subsequent steps are repeated.

【0071】手書きカナフィールドである場合、更に、
横書き用認識フィールド検索処理部12が、属性データ
10を参照して、S2で検索されたフィールドが知識フ
ィールドか否かを調べる(S5)。
In the case of a handwritten kana field,
The horizontal writing recognition field search processing unit 12 refers to the attribute data 10 and checks whether or not the field searched in S2 is a knowledge field (S5).

【0072】知識フィールドでない場合、S2で検索さ
れたフィールドについてS4以下を実行する。知識フィ
ールドである場合、横書き用認識フィールド検索処理部
12が、帳票1をS2で検索されたフィールドの位置か
ら更に下の方向に向けて、次フィールドの有無を検索す
る(S6)。次フィールドは、通常、図3に示すよう
に、その開始X位置がS2で検索されたフィールドのX
位置と略同一であり、その開始Y位置がS2で検索され
たフィールドのY位置と極めて近い位置にある。
If it is not a knowledge field, S4 and subsequent steps are executed for the field searched in S2. If the field is a knowledge field, the horizontal writing recognition field search processing unit 12 searches the form 1 further downward from the position of the field searched in S2 to search for the next field (S6). Normally, the next field is, as shown in FIG. 3, the start X position of which is the X of the field searched in S2.
The position is substantially the same as the position, and the start Y position is very close to the Y position of the field searched in S2.

【0073】この検索により次フィールドを検出する
と、横書き用認識フィールド検索処理部12が、属性デ
ータ10を参照して、当該次フィールドが手書き漢字フ
ィールドか否かを調べる(S7)。
When the next field is detected by this search, the horizontal writing recognition field search processing unit 12 refers to the attribute data 10 and checks whether or not the next field is a handwritten kanji field (S7).

【0074】手書き漢字フィールドでない場合、横書き
用認識フィールド検索処理部12が単独知識処理部4に
制御を渡し、単独知識処理部4が、S2で検索されたフ
ィールド及びS6で検索されたフィールドについて、各
々、独立に単独知識処理を実行する(S8)。S8の終
了の後、後に検索された方のフィールドであるS6で検
索されたフィールドについてS4以下を実行する。
If the field is not a handwritten kanji field, the horizontal writing recognition field search processing unit 12 passes control to the single knowledge processing unit 4, and the single knowledge processing unit 4 determines whether the field searched in S2 and the field searched in S6 Each independently executes independent knowledge processing (S8). After the end of S8, S4 and subsequent steps are executed for the field searched in S6, which is the field searched later.

【0075】手書き漢字フィールドである場合、更に、
横書き用認識フィールド検索処理部12が、属性データ
10を参照して、当該次フィールドが知識フィールドで
あってかつ知識属性がS2で検索されたフィールドと同
一か否かを調べる(S9)。
In the case of a handwritten kanji field,
The horizontal writing recognition field search processing unit 12 refers to the attribute data 10 and checks whether the next field is a knowledge field and the knowledge attribute is the same as the field searched in S2 (S9).

【0076】知識フィールドであってかつ知識属性が同
一でない場合、S8を実行する。即ち、横書き用認識フ
ィールド検索処理部12が単独知識処理部4に制御を渡
し、単独知識処理部4が、S2で検索されたフィールド
及びS6で検索されたフィールドについて、各々、独立
に単独知識処理を実行する(S8)。S8の終了の後、
後に検索された方のフィールドであるS6で検索された
フィールドについてS4以下を実行する。
If it is a knowledge field and the knowledge attributes are not the same, S8 is executed. That is, the horizontal writing recognition field search processing unit 12 passes control to the single knowledge processing unit 4, and the single knowledge processing unit 4 independently executes the single knowledge processing for the field searched in S2 and the field searched in S6. Is executed (S8). After the end of S8,
S4 and subsequent steps are executed for the field retrieved in S6, which is the field retrieved later.

【0077】知識フィールドであってかつ知識属性が同
一である場合、横書き用認識フィールド検索処理部12
がこの旨をカナ漢字自動連携処理部3Aに通知し、カナ
漢字自動連携処理部3Aが、S6で検索された漢字フィ
ールドとS2で検索されたカナフィールドとを連携させ
る(S10)。
If the knowledge fields are the same and the knowledge attributes are the same, the recognition field search processing unit for horizontal writing 12
Notifies the kana-kanji automatic cooperation processing unit 3A of this fact, and the kana-kanji automatic cooperation processing unit 3A associates the kanji field searched in S6 with the kana field searched in S2 (S10).

【0078】この後、横書き用認識フィールド検索処理
部12が連携知識処理部5に制御を渡し、連携知識処理
部5が連携知識処理を実行する(S11)。この連携知
識処理の後、後に検索された方のフィールドであるS6
で検索されたフィールドについてS4以下を実行する。
Thereafter, the horizontal writing recognition field search processing unit 12 passes control to the cooperative knowledge processing unit 5, and the cooperative knowledge processing unit 5 executes cooperative knowledge processing (S11). After this linkage knowledge processing, S6, which is the field searched later
Step S4 and subsequent steps are executed for the field searched by.

【0079】図5は知識処理フローであり、カナ漢字自
動連携処理部及び縦書き用認識フィールド検索処理部1
3が行う処理を示す。この処理フローは、図4のS1に
続いて実行される処理を示す。従って、手書きカナフィ
ールドが手書き漢字フィールドより先に検索され、か
つ、これらが連続して検索される帳票1を処理する場合
について示す。
FIG. 5 is a flowchart of the knowledge processing, in which the kana-kanji automatic cooperation processing unit and the recognition field search processing unit 1 for vertical writing are used.
3 shows the processing performed. This processing flow shows processing executed after S1 of FIG. Therefore, a case will be described in which the handwritten Kana field is searched before the handwritten Kanji field, and the form 1 in which these are continuously searched is processed.

【0080】図4のS1において処理対象である帳票1
が縦書きであることが認識されると、カナ漢字自動連携
処理部3Aは縦書き用認識フィールド検索処理部13に
制御を渡す。
Form 1 to be processed in S1 of FIG.
Is recognized as vertical writing, the kana-kanji automatic cooperation processing unit 3A passes control to the recognition field search processing unit 13 for vertical writing.

【0081】制御を渡された縦書き用認識フィールド検
索処理部13が、処理対象である帳票1をその右から左
の方向に向けてフィールドの有無を検索する(S1
2)。この検索によりフィールドを検出すると、縦書き
用認識フィールド検索処理部13が、S3と同様に、当
該フィールドが手書きカナフィールドか否かを調べる
(S13)。
The recognition field search processing unit 13 for vertical writing to which control has been passed searches the form 1 to be processed from right to left to search for a field (S1).
2). When a field is detected by this search, the recognition field search processing unit 13 for vertical writing checks whether or not the field is a handwritten Kana field, similarly to S3 (S13).

【0082】手書きカナフィールドでない場合、S4と
同様に、知識処理部11がS12で検索されたフィール
ドが最終フィールドか否かを調べる(S14)。最終フ
ィールドである場合、知識処理部11は知識処理を終了
する。最終フィールドでない場合、知識処理部11が縦
書き用認識フィールド検索処理部13に制御を渡して、
S12以下を繰り返す。
If the field is not a handwritten kana field, the knowledge processing unit 11 checks whether or not the field searched in S12 is the last field, as in S4 (S14). If it is the last field, the knowledge processing section 11 ends the knowledge processing. If it is not the last field, the knowledge processing unit 11 passes control to the recognition field search processing unit 13 for vertical writing, and
Step S12 and subsequent steps are repeated.

【0083】手書きカナフィールドである場合、更に、
縦書き用認識フィールド検索処理部13が、S5と同様
に、S12で検索されたフィールドが知識フィールドか
否かを調べる(S15)。
In the case of a handwritten Kana field,
The recognition field search processing unit 13 for vertical writing checks whether the field searched in S12 is a knowledge field as in S5 (S15).

【0084】知識フィールドでない場合、S14以下を
実行する。知識フィールドである場合、縦書き用認識フ
ィールド検索処理部13が、帳票1をS12で検索され
たフィールドの位置から更に左の方向に向けて、次フィ
ールドの有無を検索する(S16)。次フィールドは、
その開始Y位置がS12で検索されたフィールドのY位
置と略同一であり、その開始X位置がS12で検索され
たフィールドのX位置と極めて近い位置にある。
If it is not a knowledge field, S14 and subsequent steps are executed. If it is a knowledge field, the recognition field search processing unit 13 for vertical writing searches the form 1 further leftward from the position of the field searched in S12 to search for the presence of the next field (S16). The next field is
The start Y position is substantially the same as the Y position of the field searched in S12, and the start X position is extremely close to the X position of the field searched in S12.

【0085】この検索により次フィールドを検出する
と、縦書き用認識フィールド検索処理部13が、S7と
同様に、当該次フィールドが手書き漢字フィールドか否
かを調べる(S17)。
When the next field is detected by this search, the recognition field search processing unit 13 for vertical writing checks whether or not the next field is a handwritten kanji field as in S7 (S17).

【0086】手書き漢字フィールドでない場合、縦書き
用認識フィールド検索処理部13が単独知識処理部4に
制御を渡し、単独知識処理部4が単独知識処理を実行す
る(S18)。この後、S14以下を実行する。
If it is not a handwritten kanji field, the recognition field search processing unit 13 for vertical writing passes control to the single knowledge processing unit 4, and the single knowledge processing unit 4 executes single knowledge processing (S18). Thereafter, S14 and subsequent steps are executed.

【0087】手書き漢字フィールドである場合、更に、
縦書き用認識フィールド検索処理部13が、S9と同様
に、当該次フィールドが知識フィールドであってかつ知
識属性がS12で検索されたフィールドと同一か否かを
調べる(S19)。
In the case of a handwritten kanji field,
The recognition field search processing unit 13 for vertical writing checks whether the next field is a knowledge field and the knowledge attribute is the same as the field searched in S12, as in S9 (S19).

【0088】知識フィールドであってかつ知識属性が同
一でない場合、S18を実行する。即ち、単独知識処理
部4が単独知識処理を実行する(S18)。知識フィー
ルドであってかつ知識属性が同一である場合、S10と
同様に、カナ漢字自動連携処理部3Aが、S16で検索
された漢字フィールドとS12で検索されたカナフィー
ルドとを連携させる(S20)。
If it is a knowledge field and the knowledge attributes are not the same, S18 is executed. That is, the independent knowledge processing unit 4 executes the independent knowledge processing (S18). If it is a knowledge field and the knowledge attributes are the same, as in S10, the kana-kanji automatic cooperation processing unit 3A associates the kanji field searched in S16 with the kana field searched in S12 (S20). .

【0089】この後、縦書き用認識フィールド検索処理
部13が連携知識処理部5を起動し、連携知識処理部5
が連携知識処理を実行する(S21)。この後、S12
以下を実行する。
After that, the recognition field search processing unit 13 for vertical writing activates the cooperative knowledge processing unit 5, and the cooperative knowledge processing unit 5
Executes the cooperative knowledge processing (S21). After this, S12
Do the following:

【0090】図4及び図5に示した処理フローは、知識
処理における自動連携処理の一例を示すものであって、
帳票1におけるフィールドの各属性等に応じて、種々変
更可能である。即ち、この処理フローは、手書きカナフ
ィールドが手書き漢字フィールドより先に検索され、か
つ、これらが連続して検索される帳票1を処理する場合
についてのものである。従って、帳票1において、検出
の順が逆である場合や連続して検索されない場合等には
処理フローが変更される。
The processing flows shown in FIGS. 4 and 5 show an example of the automatic cooperation processing in the knowledge processing.
Various changes can be made in accordance with each attribute of the field in the form 1. That is, this processing flow is for the case where the form 1 in which the handwritten kana field is searched for before the handwritten kanji field is searched and these are successively searched is processed. Therefore, in the form 1, when the order of detection is reversed or when the search is not performed continuously, the processing flow is changed.

【0091】次に、図3及び図6に示した帳票について
の図4の処理フローによる連携処理について、簡単に説
明する。この帳票1は横書きであるので、知識処理部1
1は、S1において処理対象である帳票1が横書きであ
ることを認識して、横書き用認識フィールド検索処理部
12に制御を渡す。横書き用認識フィールド検索処理部
12は、まず、S2において会員番号フィールドを検出
するが、これは活字フィールドであり手書きカナフィー
ルドでないので(S3)、知識処理は行わない。次に、
S4を経て、S2において申込日フィールドを検出する
が、これも数字フィールドであり手書きカナフィールド
でないので(S3)、知識処理は行わない。郵便番号フ
ィールド及び電話番号フィールドについても同様であ
る。
Next, the cooperative processing based on the processing flow of FIG. 4 for the forms shown in FIGS. 3 and 6 will be briefly described. Since this form 1 is written horizontally, the knowledge processing unit 1
1 recognizes that the form 1 to be processed in S1 is horizontal writing, and passes control to the horizontal writing recognition field search processing unit 12. The recognition field search processing unit 12 for horizontal writing first detects the member number field in S2, but since this is a print field and not a handwritten Kana field (S3), no knowledge processing is performed. next,
After S4, the application date field is detected in S2, but since this is also a numeric field and not a handwritten Kana field (S3), no knowledge processing is performed. The same applies to the postal code field and the telephone number field.

【0092】次に、横書き用認識フィールド検索処理部
12が、S2において住所カナフィールドを検出する。
これは手書きカナフィールドであり(S3)、かつ、知
識フィールドであるので(S5)、S6において下方向
への他のフィールドの検索が行われ住所漢字フィールド
が検出される。これは手書き漢字フィールドであり(S
7)、かつ、知識属性が「住所」で同一であるので(S
9)、横書き用認識フィールド検索処理部12は、S1
0においてこの住所漢字フィールドと住所カナフィール
ドを連携させる。これにより、住所漢字フィールドと住
所カナフィールドとについて、連携知識処理が行われる
(S11)。
Next, the horizontal writing recognition field search processing section 12 detects an address kana field in S2.
Since this is a handwritten Kana field (S3) and a knowledge field (S5), another field is searched downward in S6 to detect an address kanji field. This is a handwritten kanji field (S
7) Since the knowledge attribute is the same for "address" (S
9), the horizontal writing recognition field search processing unit 12 executes S1
At 0, the address kanji field and the address kana field are linked. Thereby, the cooperative knowledge processing is performed on the address kanji field and the address kana field (S11).

【0093】次に、横書き用認識フィールド検索処理部
12が、S2において氏名カナフィールドを検出する。
これは手書きカナフィールドであり(S3)、かつ、知
識フィールドであるので(S5)、S6において下方向
への他のフィールドの検索が行われ氏名漢字フィールド
が検出される。これは手書き漢字フィールドであり(S
7)、かつ、知識属性が「氏名」で同一であるので(S
9)、横書き用認識フィールド検索処理部12は、S1
0においてこの氏名漢字フィールドと氏名カナフィール
ドを連携させる。これにより、氏名漢字フィールドと氏
名カナフィールドとについて、連携知識処理が行われる
(S11)。
Next, the recognition field search processing unit 12 for horizontal writing detects the name kana field in S2.
Since this is a handwritten kana field (S3) and a knowledge field (S5), another field is searched downward in S6 to detect a name kanji field. This is a handwritten kanji field (S
7) Since the knowledge attribute is the same for "name" (S
9), the horizontal writing recognition field search processing unit 12 executes S1
At 0, the name kanji field and the name kana field are linked. Thereby, the cooperative knowledge processing is performed for the name kanji field and the name kana field (S11).

【0094】[0094]

【発明の効果】以上説明したように、本発明によれば、
文字認識処理装置において、連携知識処理の対象とすべ
き手書きカナフィールドと手書き漢字フィールドとの帳
票上における位置が所定の関係にあることを利用するこ
とにより、手書きカナフィールドと手書き漢字フィール
ドとを自動的に検索することができるので、殆どの帳票
においてこれらを自動的に連携させ連携知識処理を行う
ことができ、これにより、連携知識処理の指示入力を行
う必要をなくしてオペレータの負担を少なくでき、指示
入力の誤り等の発生を防止でき、文字認識処理の効率を
向上することができる。
As described above, according to the present invention,
In the character recognition processing device, the handwritten kana field and the handwritten kanji field are automatically set by utilizing that the positions of the handwritten kana field and the handwritten kanji field to be subjected to the cooperative knowledge processing on the form are in a predetermined relationship. Since most of the forms can be automatically linked to perform cooperative knowledge processing, there is no need to input instructions for cooperative knowledge processing, thereby reducing the burden on the operator. In addition, it is possible to prevent an error in instruction input or the like, thereby improving the efficiency of character recognition processing.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理構成図である。FIG. 1 is a principle configuration diagram of the present invention.

【図2】実施例構成図である。FIG. 2 is a configuration diagram of an embodiment.

【図3】実施例説明図である。FIG. 3 is an explanatory view of an embodiment.

【図4】知識処理フローである。FIG. 4 is a knowledge processing flow.

【図5】知識処理フローである。FIG. 5 is a knowledge processing flow.

【図6】本発明の背景説明図である。FIG. 6 is a background explanatory diagram of the present invention.

【符号の説明】[Explanation of symbols]

1 帳票 2 処理装置 3 自動連携処理部 3A カナ漢字自動連携処理部 4 単独知識処理部 5 連携知識処理部 6 文字認識出力 7 読み取り処理部 8 文字認識処理部 9 候補文字列 10 属性データ 11 知識処理部 12 横書き用認識フィールド検索処理部 13 縦書き用認識フィールド検索処理部 14 辞書 REFERENCE SIGNS LIST 1 form 2 processing device 3 automatic cooperation processing unit 3A kana-kanji automatic cooperation processing unit 4 independent knowledge processing unit 5 cooperation knowledge processing unit 6 character recognition output 7 reading processing unit 8 character recognition processing unit 9 candidate character string 10 attribute data 11 knowledge processing Unit 12 Recognition field search processing unit for horizontal writing 13 Recognition field search processing unit for vertical writing 14 Dictionary

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−266888(JP,A) 特開 平5−258099(JP,A) 特開 平5−189614(JP,A) 特開 昭63−34680(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/03,9/72 ──────────────────────────────────────────────────続 き Continuation of the front page (56) References JP-A-6-266888 (JP, A) JP-A-5-258099 (JP, A) JP-A-5-189614 (JP, A) JP-A-63-1988 34680 (JP, A) (58) Field surveyed (Int. Cl. 7 , DB name) G06K 9/03, 9/72

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 予め定められた複数のフィールドを備え
た帳票の各フィールドに記入された文字を読み込んで、
これについての文字認識処理を行う文字認識処理装置に
おいて、 所定のフィールドについての当該フィールド内の文字認
識処理における知識処理を、そのフィールド単独で行う
単独知識処理部と、 所定のフィールドについての当該フィールド内の文字認
識処理における知識処理を、そのフィールドと、これと
連携させられた他のフィールドとで連携させて行うべき
旨を指示する情報を、処理対象である帳票に対応させか
つ処理対象であるフィールドに対応させて、選択可能に
記述した属性データの保持部と、 所定のフィールドについての当該フィールド内の文字認
識処理における知識処理を、そのフィールド内の文字
と、これと連携させられた他のフィールド内の文字とで
連携させて行う連携知識処理部と、 複数のフィールドの内から、帳票上の位置が予め定めら
れた関係にある複数のフィールドを検索し、これらを連
携させる自動連携処理部であって、横書き用の帳票をそ
の上から下方向に向かって検索し、帳票上の複数のフィ
ールドの内から、帳票上において互いの開始X位置が実
質的に同一で、かつ、より下方のフィールドの開始Y位
置がその上方のフィールドに極めて近い位置にある手書
きカナフィールドと手書き漢字フィールドとを検索する
横書き用認識フィールド検索処理部と、縦書き用の帳票
をその右から左方向に向かって検索し、帳票上の複数の
フィールドの内から、帳票上において互いの開始Y位置
が実質的に同一で、かつ、より左方のフィールドの開始
X位置がその右方のフィールドに極めて近い位置にある
手書きカナフィールドと手書き漢字フィールドとを検索
する縦書き用認識フィールド検索処理部との少なくとも
2つのフィールド検索処理部を有する自動連携処理部
と、 当該自動連携処理部が、前記横書き用認識フィールド検
索処理部による処理および/または前記縦書き用認識フ
ィールド検索処理部による処理にもとづいて連携知識処
理の必要性を指示し、かつ前記連携知識処理部が前記フ
ィールドに対応して記述されている属性データをチェッ
クして対応する当該複数のフィールド の文字について
連携させてその知識処理を行うようにしたことを特徴と
する文字認識処理装置。
An apparatus comprising a plurality of predetermined fields.
Read the characters entered in each field of the form
A character recognition processor that performs character recognition processing for this
In the given fieldIn that fieldCharacter recognition
Perform knowledge processing in the knowledge processing in the field alone
A single knowledge processing unit,In that fieldCharacter recognition
Knowledge processing in knowledge processing, its fields and this
Should be done in cooperation with other linked fields
Whether the information instructing the fact corresponds to the form to be processed
Corresponding to the field to be processed,Selectable
The holding part of the described attribute data, and theIn that fieldCharacter recognition
Knowledge processing in knowledge processingCharacters in
And other fields associated with itCharacters inAnd in
A cooperative knowledge processing unit that performs coordination, and a position on a form is determined in advance from among a plurality of fields.
Search for multiple fields in a related relationship and combine them.
This is an automatic cooperation processing unit that
Search from the top to the bottom of the
Field, the start X position of each other on the
Qualitatively identical and starting Y position of lower field
Handwriting in a position very close to the field above it
Search for Kana field and handwritten Kanji field
Recognition field search processing unit for horizontal writing and form for vertical writing
From the right to the left, and search multiple
From the field, start Y position of each other on the form
Start of the field that is substantially the same and to the left
X position is very close to the field to the right
Search handwritten kana field and handwritten kanji field
With the vertical writing recognition field search processing unit
Automatic cooperation processing unit having two field search processing units
And the automatic cooperation processing unitBut beforeRecognition field detection for horizontal writing
Processing by the search processing unit and / or the vertical writing recognition file.
Linked knowledge processing based on the processing by the field search
Dictate the need forAndThe cooperation knowledge processing unitThe said
Check the attribute data described corresponding to the field
ClickCorresponding multiple fieldsInside Characterabout
The feature is that the knowledge processing is performed in cooperation with
Character recognition processor.
【請求項2】 前記自動連携処理部はカナ漢字自動連携
処理部からなり、 前記カナ漢字自動連携処理部が手書きカナフィールド及
び手書き漢字フィールドを連携させることを特徴とする
請求項1に記載の文字認識処理装置。
2. The character according to claim 1, wherein the automatic cooperation processing unit comprises a kana-kanji automatic cooperation processing unit, and the kana-kanji automatic cooperation processing unit associates a handwritten kana field and a handwritten kanji field. Recognition processing device.
JP02149995A 1995-02-09 1995-02-09 Character recognition processor Expired - Fee Related JP3335494B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02149995A JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02149995A JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Publications (2)

Publication Number Publication Date
JPH08221508A JPH08221508A (en) 1996-08-30
JP3335494B2 true JP3335494B2 (en) 2002-10-15

Family

ID=12056669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02149995A Expired - Fee Related JP3335494B2 (en) 1995-02-09 1995-02-09 Character recognition processor

Country Status (1)

Country Link
JP (1) JP3335494B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4968236B2 (en) * 2008-10-23 2012-07-04 富士通株式会社 Character recognition method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6334680A (en) * 1986-07-29 1988-02-15 Toshiba Corp Character reader
JPH05189614A (en) * 1992-01-10 1993-07-30 Toshiba Corp Optical character reader
JPH05258099A (en) * 1992-03-16 1993-10-08 Fujitsu Ltd Character recognition processor
JPH06266888A (en) * 1993-03-12 1994-09-22 Fujitsu Ltd Character recognizing device

Also Published As

Publication number Publication date
JPH08221508A (en) 1996-08-30

Similar Documents

Publication Publication Date Title
US5812697A (en) Method and apparatus for recognizing hand-written characters using a weighting dictionary
JPH04343190A (en) Character data input system
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
KR100570224B1 (en) Form definition data creation method and form handling machines
JPH11120293A (en) Character recognition/correction system
JP3001065B2 (en) How to create a program
JPH11282955A (en) Character recognition device, its method and computer readable storage medium recording program for computer to execute the method
JP3335494B2 (en) Character recognition processor
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
JPH1173472A (en) Format information registering method and ocr system
JPH064717A (en) Kanji address correction processing method
JP2001014424A (en) Method and device for correcting character recognition error and computer readable recording medium recording character recognition error correction program
JP4466241B2 (en) Document processing method and document processing apparatus
JPH10302025A (en) Handwritten character recognizing device and its program recording medium
JP6960646B1 (en) Reading system, reading program and reading method
JP6994727B1 (en) Reading system, reading program and reading method
JP3128357B2 (en) Character recognition processor
JPS60217483A (en) Recognizer of character
JPH01292586A (en) Back-up device for recognition of character
JP2000132635A (en) Recognizing data confirming method
JPH09231310A (en) Information processor
JPH05303661A (en) Acquring/displaying device for partial image data
JPH06333083A (en) Optical character reader
JPH06251187A (en) Method and device for correcting character recognition error
JPH07134750A (en) Document image recognizing device

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees