JPS61121159A - Character input device - Google Patents

Character input device

Info

Publication number
JPS61121159A
JPS61121159A JP59243653A JP24365384A JPS61121159A JP S61121159 A JPS61121159 A JP S61121159A JP 59243653 A JP59243653 A JP 59243653A JP 24365384 A JP24365384 A JP 24365384A JP S61121159 A JPS61121159 A JP S61121159A
Authority
JP
Japan
Prior art keywords
character
code string
kana
bunsetsu
control means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59243653A
Other languages
Japanese (ja)
Inventor
Tetsuo Tomimoto
富本 哲雄
Yutaka Ota
裕 大田
Yasushi Nishimura
康 西村
Toshio Shimizu
敏夫 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59243653A priority Critical patent/JPS61121159A/en
Publication of JPS61121159A publication Critical patent/JPS61121159A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To simplify the constitution of an input device for Japanese sentences by attaining the effective combination between the character pattern described on a form and the reading information on the character strings of the character pattern for processing and therefore ensuring the solid-written KANA (Japanese syllabary)/ KANJI (Chinese character) conversion with high performance. CONSTITUTION:An image input means 1 of a character input device reads optically the information given from an original and converts it to electric signals. A character pattern segmenting means 2 segments the characters of electric signals for each character. These segmented characters are compared with a character pattern of a standard character pattern memory means 4 by a character pattern comparing means 3. The coincidence signal given from the means 4 is applied to a control means 5 which performs the overall control. The means 5 detects the coincidence between said coincidence signal and the read code given from a read input means. The means 3 is controlled by the character code string given from the means 5. This character code string is used for control of a KANA character converting means 7 which supplies the character codes given from a Japanese dictionary memory means 8. Then the character code string given from the means 7 is applied to the means 5. Thus the solid-written KANA/KANJI conversion is possible with high performance.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は日本語ワードプロセッサやパーソナルコンピュ
ータをはじめ多くの日本語情報処理装置に使用される日
本語の入力装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION Field of Industrial Application The present invention relates to a Japanese language input device used in many Japanese language information processing devices including Japanese word processors and personal computers.

従来の技術 従来紙の上に印刷されたり書かれた漢字やひらがなを認
識する所謂OCRの技術は、例えば「大分類の段階がほ
ぼ完成した手書き漢字認識の研究」(日経エレクトロニ
クス1981年12月7日号)に記載されているように
、高い認識率を達成しようとすると処理時間が長くなる
か又は非常に高価格の回路を多量に使う必要があった。
Conventional technology The so-called OCR technology that recognizes kanji and hiragana that are printed or written on paper is known, for example, as described in ``Research on handwritten kanji recognition that has almost completed the stage of major classification'' (Nikkei Electronics, December 7, 1981). As described in 1996, achieving a high recognition rate either requires a long processing time or requires the use of a large amount of very expensive circuitry.

特に手書き文字の認識ではまだまだ認識率も低く十分な
性能は達成されていない。
In particular, recognition rates for handwritten characters are still low and sufficient performance has not been achieved.

一方日本語の入力方法には、日本文の読みをキーボード
等から入力してその読み情報から漢字カナ混じり文に変
換するごとき所謂カナ漢字変換方式が公知になっている
。しかしこのカナ漢字変換では一般に文節の区切をオペ
レータが指定する方法が使われており操作が繁雑であっ
た。この問題を解決するため文節の区切を入力する必要
のない所謂ベタ書きのカナ漢字変換技術が各方面で研究
されている。例えば、牧野、木沢二ペタ書き文のカナ漢
字変換システムとその同音語処理、情報処理学界論文誌
、Vol、22.No、1.pp、59−67(198
1)に代表的な方式が記載されている。しかしベタ書き
カナ漢字変換の場合高い変換率を実現しようとすると、
やはり多くのメモリーを使用して複雑な文法処理をする
必要があり、処理時間や匍1格の面で実用的でない。こ
の様に従来の技術では操作が簡単でしかも性能が良い日
本語入力装置を低価格で実現することが出来なかった。
On the other hand, as a Japanese input method, a so-called kana-kanji conversion method is known, in which the pronunciation of a Japanese sentence is input from a keyboard or the like and the pronunciation information is converted into a sentence containing kanji and kana. However, this kana-kanji conversion generally requires an operator to specify the break between phrases, making the operation complicated. In order to solve this problem, research is being carried out in various fields on so-called kana-kanji conversion technology that does not require the input of phrase breaks. For example, Makino, Kizawa Nipeta written text kana-kanji conversion system and its homophone processing, Information Processing Academic Journal, Vol. 22. No, 1. pp, 59-67 (198
A typical method is described in 1). However, when trying to achieve a high conversion rate in the case of solid kana-kanji conversion,
After all, it requires a lot of memory to perform complex grammar processing, making it impractical in terms of processing time and 匍 1 case. As described above, with the conventional technology, it has not been possible to realize a Japanese input device that is easy to operate and has good performance at a low price.

発明が解決しようとする問題点 従来技術では下記の問題点がある。The problem that the invention aims to solve The conventional technology has the following problems.

上記のととくベタ書きカナ漢字変換の場合高い閲換率を
実現しようとすると、多くのメモリーを使用して複雑な
文法処理をする必要があり、処理11近間や価格の面で
実用的でない。また実用的な規模でベタ書きカナ漢字変
換を実現すると、読みを自動的に文節に区切る際に誤り
が多くなり、これに同音異義語の誤りが重なって非常に
カナ漢字変換性能の悪いものになる。一方OCR技術に
より紙に書かれた文字を自動的に読み取らせる場合には
、高い認識率を達成しようとすると処理時間が長くなる
か、又は非常に高価格の処理回路を多量に使う必要があ
った。特に手書き文字の認識ではまだまだ認識率も低く
十分な性能は達成されていない。このように従来技術で
は極めて性能の限られた日本語入力しか実現されていな
かった。
In the case of the above-mentioned solid-written kana-kanji conversion, in order to achieve a high conversion rate, it is necessary to use a large amount of memory and perform complex grammar processing, which is impractical in terms of processing time and cost. . Furthermore, if we were to realize solid kana-kanji conversion on a practical scale, there would be many errors when automatically dividing readings into phrases, and this, combined with errors in homophones, would result in extremely poor kana-kanji conversion performance. Become. On the other hand, when OCR technology is used to automatically read characters written on paper, achieving a high recognition rate requires a long processing time or requires the use of a large amount of extremely expensive processing circuitry. Ta. In particular, recognition rates for handwritten characters are still low and sufficient performance has not been achieved. As described above, the conventional technology has only been able to realize Japanese input with extremely limited performance.

は 本発明1のような欠点を除去し、文節の区切を打鍵せず
に高い確率でカナ漢字変換が行なえるようにすることを
目的とする。
It is an object of the present invention to eliminate the drawbacks of the first invention and to enable kana-kanji conversion to be performed with high probability without having to press keys to separate phrases.

疑、。Doubt.

間6解決するための手段 本発明は上記の目的を達成するため、紙の上に記載され
た文字パターンを光学的に読み取り、別に供給された文
字コード列の情報と照合して両名に矛盾がないかどうか
を調べるための手段、入力したい文字列の読み方を入力
されて、その読みから文節の区切を自動判別し、得られ
た文節に適応する漢字やカナの文字コード列を出力する
手段、および上記の二つの部分それぞれと情報のやりと
りを行ない、最終的に紙上の文字と読みで与えられた文
章とが矛盾なく一致するごとき日本語の文字コードを出
力するための制御手段を備えだものである。
In order to achieve the above-mentioned object, the present invention optically reads character patterns written on paper, collates them with information on a separately supplied character code string, and identifies discrepancies between the two characters. A method for checking whether there are any characters, a means for inputting the pronunciation of the character string you want to input, automatically determining the break between clauses from that pronunciation, and outputting a character code string of kanji or kana suitable for the obtained clause. , and a control means for exchanging information with each of the above two parts and finally outputting a Japanese character code such that the characters on the paper and the sentence given in pronunciation match without contradiction. It is something.

作用 上記構成の本発明はイメージ入力手段により文字、情報
が記録されている用紙から該イメージを光学的に読み取
り電気信号に変換して文字パターン切出し手段に伝送し
、文字パターン切出し手段により前記用紙上に記録され
た各文字を1文字毎に切り出すことにより、各文字の占
める用紙上の領 。
Effects of the present invention having the above configuration, the image input means optically reads the image from a sheet of paper on which characters and information are recorded, converts it into an electrical signal, and transmits the electrical signal to the character pattern cutting means. By cutting out each character recorded on the paper, you can calculate the area on the paper that each character occupies.

域を決定し、各文字に対応するイメージ情報を文字パタ
ーン比較手段に伝送し、標準文字パターン記憶手段に標
準的な文字の形に対応する情報を各文字毎に記憶し、文
字パターン比較手段により供給された文字コード列と切
り出された文字パターンの文字対応の程度を検出して、
一致度を示す一致信号を制御手段に出力し、国語辞書記
憶手段によりカナ漢字変換手段に接続され、読み方を表
す読みコードに対応づけて文字コードを記憶し、カナ漢
字変換手段により供給された読みコード列を複数の文節
に区切るとともに、区切った結果得られた読みコードに
対応する文字コードを国語辞書記憶手段内より検索して
制御手段に出力し、さらにその制御手段は文字パターン
比較手段、読み入力手段、カナ漢字変換手段に接続され
、文字のパターン情報と読み情報とから両者が矛盾なく
一致する文字コード列を探し出して出力する。
image information corresponding to each character is transmitted to the character pattern comparison means, information corresponding to the standard character shape is stored for each character in the standard character pattern storage means, and the image information corresponding to each character is transmitted to the character pattern comparison means. Detects the degree of character correspondence between the supplied character code string and the extracted character pattern,
A match signal indicating the degree of matching is output to the control means, the Japanese language dictionary storage means is connected to the kana-kanji conversion means, the character code is stored in association with the reading code representing the reading, and the reading supplied by the kana-kanji conversion means is stored. The code string is divided into a plurality of clauses, and the character code corresponding to the reading code obtained as a result of the division is retrieved from the Japanese language dictionary storage means and outputted to the control means. It is connected to an input means and a kana-kanji conversion means, and searches out and outputs a character code string that matches character pattern information and reading information without any contradiction.

実施例 まず上記構成による本発明の実施例の作用の概要を第1
図に従って説明する。第2図&は読み入力手段から入力
される読み方の例である。この読みに該当する日本文の
解釈は第2図す、cに示す2皿類が考えられ確定しない
。本実施例では第1図す又はCに示す原稿がイメージ情
報としてイメージ入力手段より供給される。カナ漢字変
換手段では第1図aの読みをまず1そうい くふう」と
いう2文節に区切り、「創意工夫」を出力する。
Embodiment First, the operation of the embodiment of the present invention having the above configuration will be summarized in the first part.
This will be explained according to the diagram. FIG. 2 & is an example of the reading inputted from the reading input means. The interpretation of the Japanese text that corresponds to this reading is shown in Figure 2, and the two dishes shown in c are considered, but the interpretation is not determined. In this embodiment, the original shown in FIG. 1 or C is supplied as image information from the image input means. The kana-kanji conversion means first divides the reading in Figure 1 a into two phrases, 1 soikufuu, and outputs ``ingenuity.''

もしイメージ入力として第1図すが入力されている時に
は、文字パターン比1校手段により上記漢字列と第1図
すのパターンとが!1.4j合されて、正しい漢字列が
確定する。またイメージ入力として第1図Cのパターン
が入力されている時には、文字パターン比較手段により
「創意工夫」と「そう行く」とがQi(合され、一致し
ないという結果かえられる。
If Figure 1 is input as an image input, the above kanji string and the pattern of Figure 1 are combined using the character pattern ratio 1 method! 1.4j are combined to determine the correct kanji string. Furthermore, when the pattern shown in FIG. 1C is input as an image input, the character pattern comparison means combines the words "ingenuity" and "so go" (Qi), and returns the result that they do not match.

この場合には次の文節区切りが試みられ「そう行く」と
いう漢字ひらがな列が得られる。この文字列が第1図C
の文字パターンと比較されて一致が確認されて正しい文
字列コードが制御手段より出力される。このように本発
明はカナ漢字変換の手法では確定しない文字列をパター
ン情報を参考にして確定させる効果を持つ。
In this case, the next bunsetsu break is attempted and the kanji hiragana string ``Souyuki'' is obtained. This character string is shown in Figure 1C
The character string code is compared with the character pattern of , a match is confirmed, and a correct character string code is output from the control means. In this manner, the present invention has the effect of determining character strings that cannot be determined using the kana-kanji conversion method by referring to pattern information.

第1図は本発明の具体的な実施例を示す図である。制御
手段5は本実施例の全体を制御するもので、最終的には
イメージ入力手段1から入力される文字のイメージ情報
と読み入力手段6から入力される読みの情報が矛盾なく
一致するごとき文字コード列を出力する。イメージ入力
手段1は文字情報が記録されている用紙から該イメージ
を光学的に読み取り電気信号に変換するもので、上記文
字情報は印刷されたものであっても手書きにより筆記さ
れたものであっても良い。文字パターン切出し手段2は
イメージ入力手段1に接続され、このイメージ入力手段
1から出力される電気信号に変換されたイメージ情報を
供給されて、il+紙上に記録された各文字を1文字毎
に切り出すことにより、各文字の占める用紙上の領域を
決定し、各文字に対応するイメージ情報を出力して文字
パターン切出し手段2に供給する。切り出し方はあらか
じめ用紙上に設けた筆記枠により行なっても良いし、文
字の図形的な情報を参考にして行なっても良い。標準文
字パターン記憶手段4は漢字やひらがなの標準的な図形
情報を平均パターン情報として記憶しておくか、又は文
字の構造的な特徴情報として記憶しておくことにより、
文字パターン比較手段3が比較処理を行なう時に標準文
字パターン情報として使用される。文字パターン比較手
段3は文字パターン切出し手段2と標準文字パターン記
憶手段4と制御手段6に接続されており、制御手段5よ
り供給される文字コード列と切り出された文字パターン
の文字がどの程度一致するかを調べ、一致度を示す一致
信号を出力して制御手段5に供給する。文字パターン比
較手段3のこの比較動作は、供給される文字コード列が
しめす文字についてだけ行なえば良いので、従来の漢字
認識OCRが約3000字(JIS第1水準の漢字の場
合)の文字と照合する必要があったのに比較すると極め
て処理時間が速く、従って低価格の回路で実現すること
ができる。読み入力手段6は用紙に記録された文字情報
に対応する文字の読み方を入力して制御手段6に転送す
るためのものである。国語辞書記憶手段8は、読み方を
表す読みコードに対応づけて文字コードを記憶しておく
もので、所謂国語辞書を電子的に構成したものであって
も良い。
FIG. 1 is a diagram showing a specific embodiment of the present invention. The control means 5 controls the entire embodiment, and ultimately produces characters whose image information input from the image input means 1 and reading information input from the reading input means 6 match without contradiction. Output code string. The image input means 1 optically reads an image from a sheet of paper on which character information is recorded and converts it into an electrical signal, and the character information may be printed or handwritten. Also good. The character pattern cutting means 2 is connected to the image input means 1, and is supplied with image information converted into an electrical signal outputted from the image input means 1, and cuts out each character recorded on the paper one by one. By doing this, the area occupied by each character on the paper is determined, and image information corresponding to each character is output and supplied to the character pattern cutting means 2. The cutting may be performed using a writing frame provided on the paper in advance, or may be performed by referring to the graphical information of the characters. The standard character pattern storage means 4 stores standard graphic information of kanji and hiragana as average pattern information or as structural characteristic information of characters.
This is used as standard character pattern information when the character pattern comparison means 3 performs comparison processing. The character pattern comparison means 3 is connected to the character pattern extraction means 2, the standard character pattern storage means 4, and the control means 6, and determines to what extent the character code string supplied from the control means 5 matches the characters of the extracted character pattern. A matching signal indicating the degree of matching is outputted and supplied to the control means 5. This comparison operation of the character pattern comparison means 3 only needs to be performed on the characters indicated by the supplied character code string, so that conventional kanji recognition OCR can compare approximately 3000 characters (in the case of JIS 1st level kanji). The processing time is extremely fast compared to the previous one, and therefore it can be realized with a low-cost circuit. The reading input means 6 is for inputting the reading of characters corresponding to the character information recorded on the paper and transmitting it to the control means 6. The Japanese language dictionary storage means 8 stores character codes in association with reading codes representing reading methods, and may be an electronically constructed so-called Japanese language dictionary.

1−f1語辞書記憶手段8はカナ漢字変換手段7がカナ
漢字変換を行なう時に参照するものである。カナ漢字変
換手段7は、国語辞書記憶手段8と制御手段5に接続さ
れている。このカナ漢字変換手段7は制御手段6より供
給される読みコード列を複数の文節に区切るとともに区
切った結果得られた読みコードに対応する文字コードを
国語辞書記憶手段8内の情報より検索する。その結果得
られた文字コード列を制御手段5に供給する。制御手段
5は文字パターン切出し手段2、読み入力手段6、カナ
漢字変換手段7に接続されている。制御手段5はまず読
み入力手段6より供給される読みコード列をカナ漢字変
換手段7に転送するとともに、読みコード列を文節に区
切る区切り方を指令する文節区切り指令信号をカナ漢字
変換手段7に供給する。最初に供給される文節区切り指
令信号は2−文節の長さが最も長くなるような文節区切
を指令するものであっても良いし、1文節の長さが最も
長くなるような文節区切を指令するものであっても良い
。カナ漢字変換手段γは該指令信号に基いて文節の区切
り操作と国語辞書記憶手段8の中の国語辞書情報の検索
を行う。カナ漢字変換手段7は、その結果得られた文字
コード列を制御手段5に供給する。文字コード列を供給
された制(財)手段Sは該文字コード列を文字パターン
比較手段3に転送する。文字パターン比較手段3は該文
字コード列に基いて前記用紙に記録された文字のパター
ン情報と文字コード列の表す文字情報が一致するかどう
かを比較する。その結果得られた一致信号を制御手段5
に供給する。続いて制御手段5は該一致信号を受信して
、該一致信号が実質的に一致を示している時には、カナ
漢字変換手段7が出力した文字コード列を正しいものと
して出力する。
The 1-f1 word dictionary storage means 8 is referred to by the kana-kanji conversion means 7 when performing kana-kanji conversion. The kana-kanji conversion means 7 is connected to the Japanese language dictionary storage means 8 and the control means 5. The kana-kanji conversion means 7 divides the reading code string supplied from the control means 6 into a plurality of clauses, and searches the information in the Japanese language dictionary storage means 8 for character codes corresponding to the reading codes obtained as a result of the division. The character code string obtained as a result is supplied to the control means 5. The control means 5 is connected to the character pattern extraction means 2, the reading input means 6, and the kana-kanji conversion means 7. The control means 5 first transfers the reading code string supplied from the reading input means 6 to the kana-kanji converting means 7, and also sends a phrase separation command signal to the kana-kanji converting means 7, which instructs how to divide the reading code string into phrases. supply The bunsetsu break command signal supplied first may be one that commands a bunsetsu break that makes the length of 2-bunsetsu the longest, or it may command a bunsetsu break that makes the length of one bunsetsu the longest. It may be something that you do. Based on the command signal, the kana-kanji conversion means γ performs segmentation operations and searches for Japanese language dictionary information in the Japanese language dictionary storage means 8. The kana-kanji conversion means 7 supplies the resulting character code string to the control means 5. The control means S supplied with the character code string transfers the character code string to the character pattern comparison means 3. The character pattern comparison means 3 compares, based on the character code string, whether or not the character pattern information recorded on the sheet matches the character information represented by the character code string. The control means 5 transmits the coincidence signal obtained as a result.
supply to. Subsequently, the control means 5 receives the coincidence signal, and when the coincidence signal substantially indicates a coincidence, outputs the character code string outputted by the kana-kanji conversion means 7 as correct.

しかし一致信号が実質的に一致を示していない時には、
読みコード列を再びカナ漢字変換手段7に供給するとと
もに、文節区切り指令信号を前回と異なる文節区切りの
区切り方を指令する信号に変えて送信する。この場合の
文節区切り指令信号は、単に最初の文節区切り指令信号
と異なっていれば良いのであって、2文節の長さが最も
長くなるような文節区切を指令するものであっても良い
し、1文節の長さが最も長くなるような文節区切を指令
するものであっても良い。また単に前回の区切りより短
い区切りかたを指令するごときものでも良い。これによ
り制御手段5はカナ漢字変換手段7から前回と異なる文
節区切りとそれに対応する文字コード列を受信してこの
文字コード列を再度文字パターン比較手段3に転送する
。このように制御手段5は、カナ漢字変換手段7が出力
する文字コード列に対して、文字パターン比較手段3が
一致を示す一致信号を出力するまでカナ漢字変換手段7
への指令と文字パターン比較手段3への指令を繰り返す
ようにして、最終的にイメージ入力手段1より入力され
た文字のイメージと読み入力手段6より入力された読み
方が矛盾なく一致する文字コード列を出力するように動
作する。
However, when the match signal does not substantially indicate a match,
The reading code string is again supplied to the kana-kanji converting means 7, and the bunsetsu break command signal is changed to a signal instructing a different bunsetsu break method from the previous time and transmitted. The clause break command signal in this case only needs to be different from the first clause break command signal, and may be one that commands a clause break that makes the length of the two clauses the longest, It may be possible to instruct the phrase break such that the length of one phrase is the longest. Alternatively, it may be something like simply instructing a shorter delimiter than the previous delimiter. As a result, the control means 5 receives from the kana-kanji conversion means 7 a clause break different from the previous one and a character code string corresponding thereto, and transfers this character code string to the character pattern comparison means 3 again. In this way, the control means 5 controls the kana-kanji conversion means 7 until the character pattern comparison means 3 outputs a match signal indicating a match with respect to the character code string outputted by the kana-kanji conversion means 7.
By repeating the commands to and the commands to the character pattern comparison means 3, a character code string is finally created in which the image of the character input from the image input means 1 and the reading input from the reading input means 6 match without contradiction. It operates to output .

発明の効果 以上詳細に説明したように、本発明は従来の方法が持っ
ていた問題を解決し、紙の上に記載された文字のパター
ン情報とその文字列の持つ読みの情報を有効に組み合し
て処理することにより、俺めて性能の良いベタ書きカナ
漢字変換による日本語文章の入力装置を低価格で実現し
て提供するものである。
Effects of the Invention As explained in detail above, the present invention solves the problems of conventional methods and effectively combines character pattern information written on paper with reading information of the character string. By processing them together, we are able to realize and provide a low-cost input device for Japanese text that converts solid kana-kanji with good performance.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例による文字入力装置のブロッ
ク図、第2図は本発明の実施例の作用の概要を示す図で
ある。 1・・・・・イメージ入力手段、2・・・・−・文字パ
ターン切出し手段、3・・・・・・文字パターン比較手
段、4・−・・・標準文字パターン記憶手段、5・・・
・・・制御手段、6・・・・・読み入力手段、7・・・
・・カナ漢字変換手段、28・・・・国語辞書記憶手段
。 代理人の氏名 弁理士 中 尾 敏 男 はが1名第1
FIG. 1 is a block diagram of a character input device according to an embodiment of the present invention, and FIG. 2 is a diagram showing an overview of the operation of the embodiment of the present invention. 1... Image input means, 2... Character pattern cutting means, 3... Character pattern comparison means, 4... Standard character pattern storage means, 5...
...Control means, 6...Reading input means, 7...
...Kana-kanji conversion means, 28...Japanese language dictionary storage means. Name of agent: Patent attorney Toshio Nakao (1st person)
figure

Claims (3)

【特許請求の範囲】[Claims] (1)各種信号を制御する制御手段と、文字情報が記録
されている用紙からそのイメージを光学的に読み取り電
気信号に変換するイメージ入力手段と、前記イメージ入
力手段に接続され、前記イメージ入力手段から出力され
る電気信号に変換されたイメージ情報を供給されて、前
記用紙上に記録された各文字を1文字毎に切り出すこと
により、各文字の占める用紙上の領域を決定し、各文字
に対応するイメージ情報を出力する文字パターン切出し
手段と、標準的な文字の形に対応する情報を各文字毎に
記憶させる標準文字パターン記憶手段と、前記文字パタ
ーン切出し手段と標準文字パターン記憶手段と前記制御
手段に接続され、前記制御手段より供給される文字コー
ド列と前記切り出された文字パターンの文字対応の程度
を検出して一致度を示す一致信号を前記制御手段に供給
する文字パターン比較手段と、前記用紙に記録された文
字情報に対応する文字の読み方を入力して前記制御手段
に転送するための読み入力手段と、読み方を表す読みコ
ードに対応づけて文字コードを記憶しておく国語辞書記
憶手段と、前記国語辞書記憶手段と前記制御手段に接続
され、前記制御手段より供給される読みコード列を文節
に区切るとともに区切った結果得られた読みコードに対
応する文字コードを前記国語辞書記憶手段内より検索し
てその結果を前記制御手段に供給するカナ漢字変換手段
を備え、前記制御手段は前記読み入力手段より供給され
る読みコード列を前記カナ漢字変換手段に転送するとと
もに、前記読みコード列を文節に区切る区切り方を指令
する文節区切り指令信号を前記カナ漢字変換手段に供給
し、前記カナ漢字変換手段は該指令信号に基いて文節の
区切り操作と国語辞書の検索を行いその結果得られた文
字コード列を前記制御手段に供給し、続いて前記制御手
段は該文字コード列を前記文字パターン比較手段に供給
し、前記文字パターン比較手段は該文字コード列に基い
て前記用紙に記録された文字情報と前記文字コード列が
一致するかどうかを比較してその結果得られた一致信号
を前記制御手段に供給し、続いて前記制御手段は該一致
信号を受信して該一致信号が実質的に一致を示している
時には前記カナ漢字変換手段が出力した前記文字コード
列を正しいものとして出力し、前記一致信号が実質的に
一致を示していない時には前記読みコード列を再び前記
カナ漢字変換手段に供給するとともに、前記文節区切り
指令信号を前回と異なる文節区切りの区切り方を指令す
る信号に変えて送信することにより、前記カナ漢字変換
手段から前回と異なる文節区切りとそれに対応する文字
コード列を受信して、その受信信号を再度前記文字パタ
ーン比較手段に転送し、該文字コード列に対して前記文
字パターン比較手段が一致を示す一致信号を出力するま
で前記カナ漢字変換手段への指令と前記文字パターン比
較手段への指令を繰り返すようにして、最終的に前記イ
メージ入力手段より入力された文字のイメージと前記読
み入力手段より入力された読み方が矛盾なく一致する文
字コード列を前記制御手段が出力するように構成したこ
とを特徴とする文字入力装置。
(1) A control means for controlling various signals, an image input means for optically reading an image from paper on which character information is recorded and converting it into an electrical signal, and an image input means connected to the image input means; The area occupied by each character on the paper is determined by cutting out each character recorded on the paper one by one by supplying the image information converted into an electrical signal output from the a character pattern cutting means for outputting corresponding image information; a standard character pattern storage means for storing information corresponding to a standard character shape for each character; the character pattern cutting means, the standard character pattern storage means, and the character pattern comparison means connected to the control means, detecting the degree of character correspondence between the character code string supplied from the control means and the cut-out character pattern, and supplying a coincidence signal indicating the degree of correspondence to the control means; , a reading input means for inputting the reading of the character corresponding to the character information recorded on the paper and transmitting it to the control means, and a Japanese language dictionary storing the character code in association with the reading code representing the reading. a storage means, connected to the Japanese language dictionary storage means and the control means, which divides the reading code string supplied from the control means into clauses and stores character codes corresponding to the reading codes obtained as a result of the separation in the Japanese language dictionary; Kana-Kanji conversion means searches from within the means and supplies the result to the control means, and the control means transfers the reading code string supplied from the reading input means to the Kana-Kanji conversion means, and A phrase separation command signal that instructs how to divide the code string into phrases is supplied to the kana-kanji conversion means, and the kana-kanji conversion means performs a phrase separation operation and a search in a Japanese dictionary based on the command signal. The obtained character code string is supplied to the control means, and then the control means supplies the character code string to the character pattern comparison means, and the character pattern comparison means compares the sheet with the character code string based on the character code string. The recorded character information and the character code string are compared to see if they match, and the resulting match signal is supplied to the control means, and then the control means receives the match signal and outputs the match signal. When the character code strings outputted by the kana-kanji conversion means are substantially matched, the character code string outputted by the kana-kanji conversion means is outputted as correct, and when the match signals do not substantially match, the reading code strings are converted into the kana characters again. By supplying the phrase to the kanji conversion means and changing the bunsetsu delimitation command signal to a signal instructing a bunsetsu delimitation method different from the previous one, the kana-kanji conversion means can output the bunsetsu delimitation different from the previous one and its corresponding character. A code string is received, the received signal is transferred to the character pattern comparison means again, and the received signal is transferred to the kana-kanji conversion means until the character pattern comparison means outputs a matching signal indicating a match for the character code string. By repeating the command and the command to the character pattern comparing means, the character code string in which the image of the character inputted from the image inputting means and the reading inputted from the reading inputting means match without contradiction is finally determined. A character input device characterized in that the character input device is configured such that a control means outputs the output.
(2)制御手段は前記カナ漢字変換手段に対し最初の文
節区切り指令信号として1文節の区切りが最も長くなる
ような文節区切りの方法を指令する信号を送信し、その
結果得られた文字コード列に対し前記文字パターン比較
手段が不一致を示した場合には、続いて文節区切り指令
信号として前回よりさらに短い文節区切りを指令するよ
うにし、前記文字パターン比較手段が一致を示す一致信
号を出力するまで次々と文節区切りを短かく指令するよ
うに構成したことを特徴とする特許請求の範囲第1項記
載の文字入力装置。
(2) The control means transmits a signal to the kana-kanji conversion means, as an initial bunsetsu break command signal, instructing a bunsetsu break method that makes the break of one bunsetsu the longest, and the character code string obtained as a result. If the character pattern comparison means indicates a mismatch, a phrase break that is shorter than the previous one is then issued as a bunsetsu break command signal, until the character pattern comparison means outputs a match signal indicating a match. 2. The character input device according to claim 1, wherein the character input device is configured to issue short phrase breaks one after another.
(3)制御手段は前記カナ漢字変換手段に対し最初の文
節区切り指令信号として2文節の区切が最も長くなるよ
うな文節区切りの方法を指令する信号を送信し、その結
果得られた文字コード列に対し前記文字パターン比較手
段が不一致を示した場合には、続いて文節区切り指令信
号として1文節の区切りが最も長くなるような文節区切
りの方法を指令する信号を送信し、その結果得られた文
字コード列に対し前記文字パターン比較手段が不一致を
示した場合には、さらに文節区切り指令信号として前回
よりさらに短い文節区切りを指令するようにし、前記文
字パターン比較手段が一致を示す一致信号を出力するま
で次々と短かい文節区切りを指令するように構成したこ
とを特徴とする特許請求の範囲第1項記載の文字入力装
置。
(3) The control means transmits a signal to the kana-kanji conversion means as an initial bunsetsu break command signal instructing a bunsetsu break method that makes the break between two bunsetsu the longest, and the character code string obtained as a result. If the character pattern comparison means indicates a mismatch, then a signal is sent as a bunsetsu break command signal instructing a bunsetsu break method that makes the break of one bunsetsu the longest, and the resulting bunsetsu break command signal is transmitted. If the character pattern comparison means indicates a mismatch with respect to the character code string, a bunsetsu break that is shorter than the previous one is further commanded as a bunsetsu break command signal, and the character pattern comparison means outputs a match signal indicating a match. 2. The character input device according to claim 1, wherein the character input device is configured to issue commands for short phrase breaks one after another until the character input device reads the text.
JP59243653A 1984-11-19 1984-11-19 Character input device Pending JPS61121159A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59243653A JPS61121159A (en) 1984-11-19 1984-11-19 Character input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59243653A JPS61121159A (en) 1984-11-19 1984-11-19 Character input device

Publications (1)

Publication Number Publication Date
JPS61121159A true JPS61121159A (en) 1986-06-09

Family

ID=17107012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59243653A Pending JPS61121159A (en) 1984-11-19 1984-11-19 Character input device

Country Status (1)

Country Link
JP (1) JPS61121159A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112058A (en) * 1988-10-20 1990-04-24 Sharp Corp Character recognition input system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02112058A (en) * 1988-10-20 1990-04-24 Sharp Corp Character recognition input system

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
US4468756A (en) Method and apparatus for processing languages
JPS61121159A (en) Character input device
JPS634206B2 (en)
JPH033260B2 (en)
JPS607514A (en) Word processor
JPS6154559A (en) Japanese word processor
JPS603018A (en) Romaji-kanji conversion system
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH0630052B2 (en) Voice recognition display
JPH06103457B2 (en) Voice typewriter
Shi et al. Chinese online-problems and solutions
JPS59121425A (en) Chinese phonetic alphabet of kanji converter
JPH0380363A (en) Document processor
JPS62117060A (en) Character/voice input conversion system
JPS5927338A (en) "kana" (japanese syllabary) and "kanji" (chinese character) conversion and processing system
JPH0574867B2 (en)
JPS61233862A (en) Kana-kanji converter
JPH06259413A (en) Japanese language input system
JP2629946B2 (en) Document processing device
JP3344793B2 (en) Kana-Kanji conversion device
JPH0414168A (en) Word processor
JPS5827268A (en) Japanese word processing device
JPS61223971A (en) Sentence generating device
JPS60207983A (en) Production system of dictionary for recognizing character