JPS6336389A - Character reader - Google Patents
Character readerInfo
- Publication number
- JPS6336389A JPS6336389A JP61179108A JP17910886A JPS6336389A JP S6336389 A JPS6336389 A JP S6336389A JP 61179108 A JP61179108 A JP 61179108A JP 17910886 A JP17910886 A JP 17910886A JP S6336389 A JPS6336389 A JP S6336389A
- Authority
- JP
- Japan
- Prior art keywords
- character
- kanji
- recognition
- word
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims 2
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 8
- 240000000220 Panda oleosa Species 0.000 abstract description 8
- 238000007781 pre-processing Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【発明の詳細な説明】
[発明の目的コ
(産業上の利用分野)
本発明は、特に手書き漢字を認識するための文字読取装
置に関する。DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention (Field of Industrial Application) The present invention particularly relates to a character reading device for recognizing handwritten Chinese characters.
(従来の技術)
近年、手書き漢字用の文字読取装置(OCR)には、認
識精度を向上させるために手書き漢字に対応する振り仮
名文字(通常片仮名文字)の読取り結果をガイドとして
、漢字の認識処理を行なう方式のものが開発されている
。(Prior art) In recent years, character reading devices (OCR) for handwritten kanji have been developed to recognize kanji using the reading results of furigana characters (usually katakana characters) corresponding to handwritten kanji as a guide in order to improve recognition accuracy. A method of processing has been developed.
この方式の文字読取装置では、帳票上に予め漢字に対応
する振り仮名文字が記入されており、この振り仮名文字
の読取り結果に基づいて漢字の認識結果から得られる複
数の候補から答となる認識結果が選択されるように構成
されている。In this type of character reading device, furigana characters corresponding to kanji are written on the form in advance, and based on the reading results of these furigana characters, the answer is recognized from among multiple candidates obtained from the kanji recognition results. The results are configured to be selected.
しかしながら、上記のような方式の文字読取装置は、漢
字の認識精度が振り仮名文字(片仮名文字)の認識結果
に依存しており、振り仮名文字の認識処理が高精度で行
われることにより有効となる方式であり、現状では振り
仮名文字である片仮名文字を完全に認識することは不可
能であるため、高い精度で漢字を読取ることは困難であ
る。However, in the above-mentioned type of character reading device, the accuracy of kanji recognition depends on the recognition result of furigana characters (katakana characters), and it is only effective if the recognition process of furigana characters is performed with high accuracy. Currently, it is impossible to completely recognize katakana characters, which are furigana characters, so it is difficult to read kanji with high accuracy.
そこで、従来は、高い精度で漢字の認識を行なうため、
漢字およびその漢字に対する振り仮名文字が記録された
帳票に対し、各文字を文字単位で認識する文字認識手段
と、この認識手段から出力される文字中位の認識結果に
基づいて上記漢字および振り仮名文字のそれぞれからな
る単語を認識する単語ルΣ識手段を設け、この単語認識
手段から(qられる漢字文字および振り仮名文字の各単
語単位の認識結果を照合し、相互に対応する漢字および
振り仮名文字の組合わせを最終的答としていた。Therefore, in the past, in order to recognize kanji with high accuracy,
A character recognition means that recognizes each character character by character for a form in which kanji and furigana characters corresponding to the kanji characters are recorded, and a character recognition means that recognizes the above kanji and furigana characters based on the recognition result of the medium character output from this recognition means. A word recognition means for recognizing words made up of each character is provided, and the word recognition means collates the recognition results of each word of kanji characters and furigana characters (q), and calculates mutually corresponding kanji and furigana characters. The final answer was a combination of letters.
しかしながら、上記のような方式の文字読取装置では、
帳票に記録された振り仮名文字の文字認識結果の候補文
字が多い場合には、必然的に照合する文字数が多くなる
ため処理に時間がかかり、正読率の低下を招くものであ
った。However, in the above-mentioned character reading device,
When there are many candidate characters as a result of character recognition of furigana characters recorded on a form, the number of characters to be compared inevitably increases, which takes time to process, leading to a decrease in the correct reading rate.
(発明が解決しようとする問題点)
上記した如く、従来の文字読取装置にあっては、帳票に
記録された振り仮名文字の文字認識結果の候補文字が多
い場合には、処理に時間がかかり、正統率の低下を招く
ものであった。(Problems to be Solved by the Invention) As described above, in the conventional character reading device, when there are many candidate characters as a result of character recognition of furigana characters recorded on a form, processing takes a long time. , which led to a decline in the rate of legitimacy.
本発明は上記のような点に鑑みなされたもので、振り仮
名文字の認識結果を参照して漢字の認識を行なう文字読
取装置において、正読率の向上と処理の高速化を可能と
した文字読取装置を提供することを目的とする。The present invention has been made in view of the above points, and is a character reading device that makes it possible to improve the correct reading rate and speed up processing in a character reading device that recognizes kanji by referring to the recognition results of furigana characters. The purpose is to provide a reading device.
[発明の構成]
(問題点を解決するための手段〉
すなわち、本発明に係わる文字読取装置にあっては、漢
字およびその漢字に対応する振り仮名文字が記録された
帳票に対して、各文字をそれぞれ文字単位で認識する文
字認識手段と、この文字認識手段から出力される文字認
識結果に基づいて、それぞれ単語単位で単語認識する単
語認識手段とを備え、上記単8n認識手没から出力され
る上記振り仮名文字に対する単語認識結果により上記文
字認識処理手段における上記漢字に対する文字認識を制
御し、同振り仮名文字に対する単語認識結果と上記単語
認識結果から出力される上記漢字に対する単語認識結果
とを照合し、その照合結果において振り仮名文字および
漢字の各単語単位の認識結果が相互に対応する場合に、
その各認識結果を最終的答として出力するようにしたこ
とを特徴とする。[Structure of the Invention] (Means for Solving the Problems) In other words, in the character reading device according to the present invention, each character is and a word recognition means for recognizing each word on a word-by-word basis based on the character recognition results output from the character recognition means. controlling the character recognition for the kanji in the character recognition processing means based on the word recognition result for the furigana character, and controlling the word recognition result for the kanji character outputted from the word recognition result for the furigana character and the word recognition result for the furigana character. When the recognition results for each word of furigana characters and kanji correspond to each other,
A feature of the present invention is that each recognition result is output as a final answer.
(作用)
上記のようにして構成される文字読取装置にあっては、
まず、帳票に記録された振り仮名文字に対しての文字認
識が行われ、その認識結果に基づいて単語認識が行われ
る。次に、帳票に記録された漢字に対しての文字認識が
行われるものであるが、この場合、上記振り仮名文字に
対する単語認識結果によって、この漢字に対する文字認
識が制御されるようになる。(Function) In the character reading device configured as described above,
First, character recognition is performed on furigana characters recorded on a form, and word recognition is performed based on the recognition results. Next, character recognition is performed for the kanji characters recorded on the form, and in this case, the character recognition for the kanji characters is controlled by the word recognition result for the furigana characters.
すなわち、上記振り仮名文字に対する単語認識結果から
漢字部分の候補文字が限定され、この限定された候補文
字によって、漢字の文字Onが行われるようになる。That is, the candidate characters for the kanji part are limited based on the word recognition results for the furigana characters, and the kanji character On is performed using the limited candidate characters.
したがって、振り仮名文字に対する単語λΣ識結果と漢
字に対する単語認識結果との照合文字数が減少するよう
になり、結果的に正続率の向上と処理速度の高速化が計
れるようになる。Therefore, the number of characters to be compared between the word λΣ recognition results for furigana characters and the word recognition results for kanji characters is reduced, and as a result, the success rate can be improved and the processing speed can be increased.
(実施例)
以下、図面を参照して本発明の一実施例を説明する。第
1図は本発明による文字読取装置の構成を説明するため
のブロック図である。(Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram for explaining the configuration of a character reading device according to the present invention.
第1図において、100は搬送走査部であり、この圃送
走査部100は帳票(第2図に示す)を搬送走査し、こ
の帳票に記録された漢字文字および振り仮名文字の各々
を光電変換してω子化パターン(2値化信号からなる文
字パターン)を前処理部110に出力する。この前処理
部110は、入力した団子化パターンに前処理な施し、
データライン117を介して前処理後の量子化パターン
(文字パターン)を文字認識処理部120に出力する。In FIG. 1, 100 is a conveyance scanning section, and this field conveyance scanning section 100 conveys and scans a form (shown in FIG. 2), and photoelectrically converts each of the kanji characters and furigana characters recorded on this form. Then, an ω child pattern (a character pattern consisting of a binary signal) is output to the preprocessing section 110. This preprocessing unit 110 performs preprocessing on the input dumpling pattern,
The preprocessed quantization pattern (character pattern) is output to the character recognition processing section 120 via the data line 117.
文字認識処理部120は、後述する辞書選択制卸信号d
1により英字、数字、片仮名文字辞書(以下、ANK辞
書と称す)121と、漢字辞書122を選択して文字中
位の認識を行なう礪能を有しており、データライン12
3を介して、その文字単位の認識結果を単語認識部13
0に出力する。The character recognition processing unit 120 receives a dictionary selection control signal d, which will be described later.
1, the data line 12 has the ability to select an alphabetic, numeric, and katakana character dictionary (hereinafter referred to as ANK dictionary) 121 and a kanji dictionary 122 to perform medium-level character recognition.
3, the recognition result of each character is sent to the word recognition unit 13.
Output to 0.
なお、上記漢字辞@122は、後述する認識文字種選択
制御信号d2により格納されている文字種の選択(以下
、この文字種の選択をキャラクタセットと称す)を可能
とする漢字辞書である。The kanji dictionary @122 is a kanji dictionary that allows selection of stored character types (hereinafter, this selection of character types is referred to as a character set) using a recognition character type selection control signal d2, which will be described later.
単語認識部?30は、上記辞書選択制卯信@d1により
ANK単語辞書131と漢字単語辞書132を選択して
文字単位の単語認識を行なうR能を有しており、データ
ライン133およびデータライン134を介して振り仮
名文字単語認識結果および漢字単語認識結果を制御部1
40に出力する。Word recognition section? 30 has an R function that selects the ANK word dictionary 131 and the Kanji word dictionary 132 using the dictionary selection system Usin@d1 and performs word recognition character by character. The furigana character word recognition results and the kanji word recognition results are sent to the control unit 1.
Output to 40.
なお、上記ANK単語辞書131はANK単語辞占とそ
の属性が格納された辞書であり、上記漢字単語辞書13
2は漢字単語辞書が格納された辞書である。The ANK word dictionary 131 is a dictionary storing ANK word dictionaries and their attributes, and the Kanji word dictionary 13 is a dictionary that stores ANK word dictionaries and their attributes.
2 is a dictionary in which a kanji word dictionary is stored.
制御部140は、本装置全体の制御を司どる渫能を有し
ており、上記認識文字種選択制1i(I信号d2および
上記辞書選択制御信@d1をそれぞれ信号ライン141
および信号ライン142を介して漢字辞書122、文字
認識処理部120および単語、i¥!識部130に出力
する。また、この制御部140は、単語認識部130か
らの振り仮名文字中庸ルΣ識結果および漢字単語認識結
果によって最終認識結果を判定し、この判定した結果を
データライン143に出力する。The control unit 140 has the ability to control the entire device, and sends the recognition character type selection system 1i (I signal d2 and the dictionary selection control signal @d1 to the signal line 141).
and the kanji dictionary 122, the character recognition processing section 120, and the word i\! via the signal line 142. It is output to the identification section 130. Further, the control unit 140 determines the final recognition result based on the furigana character moderation Σ recognition result and the kanji word recognition result from the word recognition unit 130, and outputs the determined result to the data line 143.
以下、上記構成の文字読取装置の動作を説明する。まず
、第2図に示すような帳票が搬送走査部100により搬
送走査されて、その帳票上に記録された漢字およびその
振り仮名文字がそれぞれ母子化パターンに変換されて前
処理部110に送られる。The operation of the character reading device having the above configuration will be explained below. First, a form as shown in FIG. 2 is conveyed and scanned by the conveyance scanning unit 100, and the kanji and furigana characters recorded on the form are respectively converted into maternalization patterns and sent to the preprocessing unit 110. .
第2図は、帳票の一例であり、200と210はそれぞ
れANK文字(特に、片仮名)および漢字を記入する文
字エリアであり、どちらもOCRでは検出不可能な色で
印刷されているものとする。また、220と230は筆
記者により記入された文字であり、振り仮名となるAN
Kフィールドには「ヤマモト」と片仮名で4文字、漢字
フィールドには「山水」と漢字で2文字記入されたもの
とする。Figure 2 shows an example of a form, and 200 and 210 are character areas for writing ANK characters (particularly katakana) and kanji, respectively, and both are printed in colors that cannot be detected by OCR. . Also, 220 and 230 are characters written by a scribe, and the furigana are AN.
It is assumed that ``Yamamoto'' and 4 characters in katakana are entered in the K field, and ``Sansui'' and 2 kanji characters are entered in the kanji field.
したがって、搬送走査部100からは、帳票上の1辰り
仮名文字220および漢字230に対応する各量子化パ
ターンが前処理部110に送られるようになる。前処理
部110は、入力した量子化パターンにFil理を施し
、前処理後の量子化パターンをデータライン111を介
して文字認識処理部120に送る。Therefore, the conveyance scanning unit 100 sends each quantization pattern corresponding to the one-line kana characters 220 and kanji characters 230 on the form to the preprocessing unit 110. The preprocessing unit 110 performs a FIL operation on the input quantization pattern, and sends the preprocessed quantization pattern to the character recognition processing unit 120 via the data line 111.
ここで、文字認識処理部120は、前処理部110から
の振り仮名文字220および漢字230の里子化パター
ンに基づいて文字単位の認識処理を行なものであるが、
この場合、制御部140からの辞書選択制御信号d1に
従い、ANK辞書121を参照して1股り仮名文字22
0の文字認識を行ない、第3図に示すような文字認識結
果を単語認識部130に出力する。Here, the character recognition processing unit 120 performs character-by-character recognition processing based on the adoption pattern of furigana characters 220 and kanji 230 from the preprocessing unit 110.
In this case, according to the dictionary selection control signal d1 from the control unit 140, the ANK dictionary 121 is referred to and the one-curved kana character 22 is selected.
The character 0 is recognized and the character recognition result as shown in FIG. 3 is output to the word recognition section 130.
第3図は、上記第2図の帳票に記録された振り仮名文字
対する振り仮名文字認識結果の一例であり、300の「
?」はりジエクト文字であることを示し、310のUヤ
」および311の「カJはそれぞれ上記リジェクト文字
300に対する候補文字である。FIG. 3 is an example of the furigana character recognition results for the furigana characters recorded in the form shown in FIG.
? ” indicates a reject character, and 310 “Uya” and 311 “kaJ” are candidate characters for the above-mentioned reject character 300, respectively.
単語認識部130は、上記第3図に示すような振り仮名
文字の文字認識結果を入力すると、上記辞書選択制御信
号d1によりANK単語辞工131を参照して、第4図
に示すような振り仮名文字単語認識結果と、同振り仮名
文字!!1語認識結果の属性である漢字単語を制御部1
40に出力する。When the word recognition unit 130 receives the result of character recognition of furigana characters as shown in FIG. Character word recognition results and the same kana characters! ! The kanji word that is the attribute of the one-word recognition result is sent to the control unit 1.
Output to 40.
ここで、第4図は上記第3図の振り仮名文字の文字認識
結果に対する成り仮名文字単語認識結果の一例であり、
410.420 、430の順に認識結果の1位、2位
、3位に相当する。また、第5図はANKIi語認識に
参照する!11語辞書の一例であり、510は片仮名の
単語辞書列であり、本例では4種示す。また、520は
それぞれ片仮名(または振り仮名)に対応する漢字単語
であり、単語辞書列510の属性として位ゴする。Here, FIG. 4 is an example of the recognition result of a kana character word for the furigana character recognition result of the above-mentioned FIG. 3,
410, 420, and 430 correspond to the first, second, and third place in the recognition results. Also, FIG. 5 refers to ANKIi word recognition! This is an example of an 11-word dictionary, and 510 is a katakana word dictionary string, and in this example, four types are shown. Further, 520 is a Kanji word corresponding to each katakana (or furigana), and is ranked as an attribute of the word dictionary string 510.
制御部140は、上記第4図に示すような振り仮名文字
単語認識結果およびその属性である漢字単語列520を
入力すると、まず、この漢字単語列520の論理輪演算
により第6図に示すような漢字文字列61(lを構成す
る。When the control unit 140 inputs the furigana character/word recognition result as shown in FIG. 4 and its attribute, the kanji word string 520, the control section 140 first performs a logical wheel operation on the kanji word string 520 to generate the result as shown in FIG. 6. A kanji character string 61 (consists of l).
次に、制御部140は上記第6図に示した漢字文字列6
10を第2図に示す帳票の漢字230に対するキャラク
タセットとして漢字辞書122に認識文字種選択制御信
号d2として出力すると共に、文字認識処理部120が
漢字辞書122を参照するように、また、単語認識部1
30が漢字単語認識132を参照するように辞書選択制
御信号d1を出力する。Next, the control unit 140 controls the kanji character string 6 shown in FIG. 6 above.
10 is output as a recognition character type selection control signal d2 to the kanji dictionary 122 as a character set for the kanji 230 of the form shown in FIG. 1
30 outputs a dictionary selection control signal d1 so as to refer to the Kanji word recognition 132.
このようにして、制御部140から認識文字種選択制開
信号d2および辞書選択制御信号d1が出力されると、
文字認識処理部120において、漢字辞書122を参照
することにより第2図に示した帳票の漢字230の文字
&X識を行ない、その漢字認識結果を単R認識部130
に出力する。この場合、上記漢字辞書122は認識文字
種選択制御信号d2によりキャラクタセットされている
ため、文字認識処理部120はキャラクタセットされた
漢字辞書122を参照して文字Hy4を行なうことがで
きる。In this way, when the recognition character type selection control signal d2 and the dictionary selection control signal d1 are output from the control unit 140,
The character recognition processing unit 120 performs character &X recognition for the kanji 230 on the form shown in FIG.
Output to. In this case, since the character of the kanji dictionary 122 has been set by the recognition character type selection control signal d2, the character recognition processing section 120 can perform the character Hy4 by referring to the kanji dictionary 122 in which the character has been set.
すなわち、文字認識処理部120は、第2図の帳票に記
録されたF山」、「本Jに対する漢字認識を行なう場合
に、第6図に示すような「川」、「本」、「河」、「元
」、「沢」、「山」の候補文字のみを参照することに漢
字認識を行なうことができる。That is, when performing kanji recognition for ``Fyama'' and ``Book J'' recorded in the form shown in FIG. Kanji recognition can be performed by referring only to candidate characters such as ",""gen,""sawa," and "yama."
このようにして、文字認識処理部120の漢字認識が終
了すると、その漢字認識結果が単語認識部130に入力
され、この単語認識部130によって漢字単語辞@13
2を参照することにより漢字単語認識が行われる。In this way, when the kanji recognition by the character recognition processing unit 120 is completed, the kanji recognition result is input to the word recognition unit 130, and the kanji word dictionary @13 is inputted to the word recognition unit 130.
Kanji word recognition is performed by referring to 2.
制御部140は、単語認識部130における漢字の単語
認識結果をデータライン134を介して入力し、この入
力した漢字の11語認識結果と上記第4図に示した1位
の振り仮名文字の単語認識結果とを照合する。そして、
各単語単位の振り仮名文字および漢字の両者が相互に対
応する場合に最終内容として出力する。すなわち、この
場合は、第7図に示すうな答が制御部140から出力さ
れるようになる。The control unit 140 receives the kanji word recognition results from the word recognition unit 130 via the data line 134, and uses the input 11 kanji recognition results and the furigana character word ranked No. 1 shown in FIG. 4 above. Compare with recognition results. and,
When both the furigana characters and kanji of each word correspond to each other, it is output as the final content. That is, in this case, the control section 140 outputs the answer shown in FIG.
このようにして、本発明の文字読取装置にあっては、ま
ず、帳票上に記録された振り仮名文字が文字Ll ’I
Aされ、この文字認識した結果に基づいて単語認識が行
われる。次に、帳票に記録された漢字に対しての文字認
識が行われるものであるが、この場合、上記振り仮名文
字に対する単語認識結果によって、この漢字に対する文
字認識が制御されるようになる。すなわち、上記振り仮
名文字に対する単語認識から漢字の候補文字が限定され
るようになり、この限定された候補文字によって漢字の
文字HF2aが行われる。In this way, in the character reading device of the present invention, first, the furigana characters recorded on the form are the characters Ll 'I
A, and word recognition is performed based on the result of this character recognition. Next, character recognition is performed for the kanji characters recorded on the form, and in this case, the character recognition for the kanji characters is controlled by the word recognition result for the furigana characters. That is, the candidate characters for Kanji are limited from the word recognition for the furigana characters, and the Kanji character HF2a is performed using these limited candidate characters.
したがって、例えば帳票に記録された振り仮名文字を文
字認識し、その文字認識結果の候補文字が多くなった場
合でも、帳票に記録された漢字の認識を行なう場合の漢
字候補文字が限定されているため、漢字に対する文字認
識に時間がかからない。Therefore, for example, even if furigana characters recorded on a form are recognized and the number of candidate characters increases as a result of character recognition, the number of kanji candidate characters when recognizing kanji recorded on a form is limited. Therefore, character recognition for kanji does not take much time.
また、このようにして限定された候補文字にょつて漢字
の文字認識が行われるため、後に行なう漢字の単語認識
にも時間がかからず、その単語認識結果の候補文字も少
なくなる。よって、最終的な振り仮名文字の単語認識結
果と漢字の単語認識結果との照合を行なう場合の照合文
字数が減少し、結果的に正続率が向上し、処理速度が高
速化するようになる。Furthermore, since Kanji character recognition is performed using the limited candidate characters in this manner, the subsequent Kanji word recognition does not take much time, and the number of candidate characters in the word recognition result is reduced. Therefore, when comparing the final furigana word recognition results with the kanji word recognition results, the number of characters to be matched is reduced, resulting in an improved continuation rate and faster processing speed. .
[発明の効果コ
以上のように本発明によれば、帳票に記録された振り仮
名文字を文字認識し、その文字認識した結果に基づく単
語認識を行なった後で、この単語識結果によって帳票に
記録された漢字に対する候補文字を限定させて、上記漢
字の文字認識を行なうようにしたことにより、正続率の
向上と処理速度の高速化を実現することができる。[Effects of the Invention] As described above, according to the present invention, furigana characters recorded on a form are recognized, and word recognition is performed based on the result of the character recognition. By limiting the candidate characters for the recorded Kanji characters and performing character recognition for the Kanji characters, it is possible to improve the success rate and increase the processing speed.
図面は本発明の一実廠例を示すものであり、第1図は回
路構成を示すブロック図、第2図は帳票の一例を示す図
、第3図は同帳票の振り仮名文字に対する文字認識結果
の一例を示す図、第4図は同文字認識結果に対する単語
認識結果の一例を示す図、第5図はANK単語&Σ識時
に参照する単gR辞書の一例を示す図、第6図は漢字文
字列の一例を示す図、第7図は上記第2図に示した帳票
に対する最終結果の一例を示す図である。
120・・・文字認識処理部、121・・・ANK辞書
、122・・・漢字辞書、131・・・ANK単語辞書
、132・・・漢字単語辞書、140・・・制御部。The drawings show a practical example of the present invention; Fig. 1 is a block diagram showing the circuit configuration, Fig. 2 is a diagram showing an example of a form, and Fig. 3 is character recognition for furigana characters on the same form. Figure 4 shows an example of word recognition results for the same character recognition results. Figure 5 shows an example of a single gR dictionary that is referenced when recognizing ANK words and Σ. Figure 6 shows kanji. FIG. 7 is a diagram showing an example of a character string, and FIG. 7 is a diagram showing an example of the final result for the form shown in FIG. 2 above. 120... Character recognition processing unit, 121... ANK dictionary, 122... Kanji dictionary, 131... ANK word dictionary, 132... Kanji word dictionary, 140... Control unit.
Claims (1)
する振り仮名文字を記録するための文字エリアを有する
帳票と、 この帳票を搬送走査し、この帳票に記録された上記漢字
および上記振り仮名文字を光電変換して文字パターンを
出力する光電変換部と、 この光電変換部から出力される文字パターンに基づいて
、上記振り仮名文字および上記漢字のそれぞれを文字単
位で文字認識する文字認識手段と、この文字認識手段か
ら出力される文字認識結果に基づいて、それぞれ単語単
位で単語認識する単語認識手段と、 この単語認識手段から出力される上記振り仮名文字に対
する単語認識結果により上記文字認識処理手段における
上記漢字に対する文字認識を制御し、上記振り仮名文字
に対する単語認識結果と上記単語認識手段から出力され
る上記漢字に対する単語認識結果とを照合し、その照合
結果において振り仮名文字および漢字の各文字単位の認
識結果が相互に対応する場合に、その各認識結果を最終
的答として出力する制御手段とを具備したことを特徴と
する文字読取装置。[Scope of Claims] A form having a character area for recording a kanji and a character area for recording furigana characters corresponding to the kanji, and the above-mentioned kanji recorded on the form by conveying and scanning the form. and a photoelectric conversion unit that photoelectrically converts the furigana characters and outputs a character pattern, and recognizes each of the furigana characters and kanji character by character based on the character pattern output from the photoelectric conversion unit. a character recognition means; a word recognition means that recognizes each word on a word-by-word basis based on the character recognition results outputted from the character recognition means; The character recognition processing means controls the character recognition for the above-mentioned kanji, and compares the word recognition result for the above-mentioned furigana characters with the word recognition result for the above-mentioned kanji output from the word recognition means, and in the comparison result, the furigana characters and 1. A character reading device comprising: control means for outputting each recognition result as a final answer when the recognition results for each character of a kanji character correspond to each other.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61179108A JPS6336389A (en) | 1986-07-30 | 1986-07-30 | Character reader |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61179108A JPS6336389A (en) | 1986-07-30 | 1986-07-30 | Character reader |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6336389A true JPS6336389A (en) | 1988-02-17 |
Family
ID=16060157
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61179108A Pending JPS6336389A (en) | 1986-07-30 | 1986-07-30 | Character reader |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6336389A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01231185A (en) * | 1988-03-11 | 1989-09-14 | Toshiba Corp | Character recognizing device |
JPH04123185A (en) * | 1990-09-14 | 1992-04-23 | Hitachi Ltd | Document recognizing system |
JPH04274580A (en) * | 1991-02-28 | 1992-09-30 | Oki Electric Ind Co Ltd | Optical character reader |
US6795579B2 (en) | 1998-04-16 | 2004-09-21 | International Business Machines Corporation | Method and apparatus for recognizing handwritten chinese characters |
-
1986
- 1986-07-30 JP JP61179108A patent/JPS6336389A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01231185A (en) * | 1988-03-11 | 1989-09-14 | Toshiba Corp | Character recognizing device |
JPH04123185A (en) * | 1990-09-14 | 1992-04-23 | Hitachi Ltd | Document recognizing system |
JPH04274580A (en) * | 1991-02-28 | 1992-09-30 | Oki Electric Ind Co Ltd | Optical character reader |
US6795579B2 (en) | 1998-04-16 | 2004-09-21 | International Business Machines Corporation | Method and apparatus for recognizing handwritten chinese characters |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4075605A (en) | Character recognition unit | |
CA1317377C (en) | Image recognition apparatus | |
JPS6336389A (en) | Character reader | |
JPS59158482A (en) | Character recognizing device | |
JPS6095689A (en) | Optical character reader | |
JPS61114388A (en) | Character input device | |
JPS6146573A (en) | Character recognizing device | |
JPS60160481A (en) | Reader of character | |
JPH05282484A (en) | Optical character reader | |
JPS6115288A (en) | Optical character reader | |
JPS6139175A (en) | Optical character reading device | |
JPS60110089A (en) | Character recognizer | |
JPS6120180A (en) | Optical character recognizing device | |
JPH0484380A (en) | Character recognizing device | |
JPS63263588A (en) | Character reader | |
JPS6061875A (en) | Generation system of standard pattern | |
JPS6095688A (en) | Character recognizing device | |
JPS6129976A (en) | Character recognition | |
JPS60254388A (en) | Optical character reader | |
JPS59188783A (en) | Character discriminating and processing system | |
JPS61226883A (en) | Character recognizing device | |
JPS63155385A (en) | Optical character reader | |
JPH076213A (en) | Character string recognition device | |
JPS6143383A (en) | Character recognizer | |
JPH06243285A (en) | Character recognition method |