JPS581821B2 - Japanese data input device - Google Patents

Japanese data input device

Info

Publication number
JPS581821B2
JPS581821B2 JP53115853A JP11585378A JPS581821B2 JP S581821 B2 JPS581821 B2 JP S581821B2 JP 53115853 A JP53115853 A JP 53115853A JP 11585378 A JP11585378 A JP 11585378A JP S581821 B2 JPS581821 B2 JP S581821B2
Authority
JP
Japan
Prior art keywords
kanji
kana
recognition
japanese
identification symbols
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53115853A
Other languages
Japanese (ja)
Other versions
JPS5543621A (en
Inventor
原辰次
高野陸男
石川浩一郎
白鳥嘉勇
木村久正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP53115853A priority Critical patent/JPS581821B2/en
Publication of JPS5543621A publication Critical patent/JPS5543621A/en
Publication of JPS581821B2 publication Critical patent/JPS581821B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 この発明は、漢字、ひらがな、カタカナなどで表記され
る日本語データを記号、英数字、仮名文字の認識を用い
て簡易に投入することを目的とした日本語データ投入装
置に関するものである。
[Detailed Description of the Invention] This invention aims to easily input Japanese data written in kanji, hiragana, katakana, etc. by using symbols, alphanumeric characters, and kana character recognition. It is related to the device.

従来の記号・文字認識にはOCR(OpticalCh
aracter Reader)等による手書き、ある
いは印刷文字のオフライン認識(すでに書かれたあるい
は印刷された文字の認識)と、デイジタイザー等を用い
た手書き文字のオンライン認識(手書き中に筆順なども
考慮して認識する)とがあった。
OCR (Optical Channel) is used for conventional symbol/character recognition.
offline recognition of handwritten or printed characters (recognition of characters that have already been written or printed) using a digitizer, etc., and online recognition of handwritten characters using a digitizer (recognition that takes into account stroke order while handwriting). ).

そして両認識方法とも記号、英数字、カタカナに対する
認識技術はほとんど完成されており、またひらがな文字
認識に対する技術もある程度完成されてきた。
For both recognition methods, the recognition technology for symbols, alphanumeric characters, and katakana has almost been completed, and the technology for hiragana character recognition has also been completed to some extent.

しかし、日本語表記における最も重要な漢字に対する認
識は、■漢字は他の文字に比べ複雑であるため、高い読
取り分解能が要求される、■漢字は字種が多いので、高
い識別能力が要求される、などのため記号、英数字、カ
タカナ、ひらがなの昭識に比べハード的にもソフト的に
も難かしく、高い認識率が得られないばかりでなく、読
取認識装置が非常に高価になるという欠点があった。
However, the recognition of the most important kanji in Japanese notation is: ■ Kanji are more complex than other characters, so high reading resolution is required. ■ Kanji has many types, so high discrimination ability is required. This makes it more difficult in terms of both hardware and software compared to the knowledge of symbols, alphanumeric characters, katakana, and hiragana, and not only is it difficult to achieve a high recognition rate, but the reading recognition equipment is also very expensive. There were drawbacks.

この発明は、これらの欠点を除去するためになされたも
ので、記号、英数字、カタカナ文字のみの認識を用いて
簡易に漢字を含む日本語データの投入を行うようにした
ものである。
This invention was made to eliminate these drawbacks, and is designed to easily input Japanese data including Kanji characters by recognizing only symbols, alphanumeric characters, and katakana characters.

以下この発明について詳細に説明する。This invention will be explained in detail below.

なお、この明細書においては、仮名は平仮名と片仮名を
意味し、平仮名の場合には「かな」または「ひらがな」
と、片仮名の場合には「カナ」または「カタカナ」と表
わすことにする。
In this specification, kana means hiragana and katakana, and in the case of hiragana, it is written as "kana" or "hiragana".
In the case of katakana, it will be expressed as ``kana'' or ``katakana.''

第1図はこの発明の一実施例の構成をブロック図で示し
た情報の流れ図で、1は漢字を含む日本語データ、2は
漢字の特徴を表わす識別記号を付帯したカタカナ表記の
日本語を読み取るスキャナ一部、3は前記スキャナ一部
2からのパターン情報を認識する認識部、4は前記認識
部3で認識されたカタカナ表記の日本語を漢字カナ混り
文に変換する変換部である。
FIG. 1 is an information flow diagram showing the configuration of an embodiment of the present invention in a block diagram. 1 is Japanese data including kanji, and 2 is Japanese data written in katakana with identification symbols representing the characteristics of kanji. 3 is a recognition section that recognizes the pattern information from the scanner section 2; 4 is a conversion section that converts the katakana written Japanese recognized by the recognition section 3 into a sentence containing kanji and kana; .

第2図aはこの発明に用いられる手書きあるいは印刷に
よる日本語文の一例を示すもので、第2図bは第2図a
の日本語文を後述する入力用けん盤部によって記号付カ
タカナ文で表わした例を示すものである。
Figure 2a shows an example of a handwritten or printed Japanese text used in this invention, and Figure 2b shows an example of the Japanese text used in this invention.
This figure shows an example of a Japanese sentence expressed as a katakana sentence with symbols using the input keyboard section, which will be described later.

前記入力用けん盤部の一例の詳細を第3図に示す。FIG. 3 shows details of an example of the input keyboard section.

第3図において、入力用けん盤部1Aはカナけん盤1B
および漢字情報付加けん盤1Cとからなり、カナけん盤
1Bはカタカナキー1B1を有し、また漢字情報付加け
ん盤1Cは、漢字の特徴を表わす付加情報を付加するた
めのパターンキー1C,、人名(人名・地名)キー1C
2、区切キー1C3、および送りキー1C4を備えてい
る。
In Fig. 3, the input keyboard section 1A is the keyboard section 1B.
and a kanji information adding keyboard 1C, the kana writing board 1B has a katakana key 1B1, and the kanji information adding keyboard 1C has a pattern key 1C for adding additional information representing the characteristics of the kanji. place name) key 1C
2, a separator key 1C3, and a feed key 1C4.

再び第2図bにおいて、5は前述した第3図の入力用け
ん排部1Aにより付加された漢字の特徴を表わすパター
ン(以後、特徴識別記号と呼ぶ)、6はカタカナ文字で
あり、日本語データは特徴識別記号5で分ち書きされた
ものである。
Again in FIG. 2b, 5 is a pattern representing the characteristics of a kanji character (hereinafter referred to as a feature identification symbol) added by the input extractor 1A of FIG. 3, and 6 is a katakana character, which is a Japanese The data is separated by feature identification symbol 5.

第2図bに示すような形で手書きあるいは印刷された日
本語(以後、記号付カタカナ文と呼ぶ)はスキャナ一部
2によりパターン情報に変換され、次に認識部3により
その記号付カタカナ文に対応するカタカナ符号と特徴識
別記号5に変換され、さらに変換部4により、語単位に
漢字カナ混り文に対応する文字(漢字)符号に変換され
る。
Japanese handwritten or printed in the form shown in Figure 2b (hereinafter referred to as katakana text with symbols) is converted into pattern information by the scanner part 2, and then converted into katakana text with symbols by the recognition unit 3. is converted into a katakana code and a feature identification symbol 5 corresponding to the character, and further converted word by word into a character (kanji) code corresponding to a sentence containing kanji and kana.

すなわち変換部4内の変換ファイルにはあらかじめ変換
が一義的になされるように登録されている。
That is, the conversion file in the conversion unit 4 is registered in advance so that conversion can be performed uniquely.

上記の「選挙」の場合で云えば、「■センキヨ■」の信
号コードで変換ファイル内を走査し、あらかじめ登録し
ておいた「選挙」のコードと合致した場合、「選挙」に
対応する漢字コードを読出すわけである。
In the case of "election" above, the conversion file is scanned with the signal code "■senkiyo■", and if it matches the pre-registered code for "election", the kanji corresponding to "election" is detected. This is how the code is read.

次にこの発明によるシステム構成の各種の応用例を示す
Next, various application examples of the system configuration according to the present invention will be shown.

第4図は端末装置10内に各機能、すなわちスキャナ一
部2、認識部3、変換部4、伝送制御部7を有し、これ
により通信綱11を介して、フロントエンドプロセッサ
8および中央処理装置9を有するセンター12に文字符
号を送り、ここで漢字カナ混りの日本語文に認識変換せ
しめるものである。
In FIG. 4, a terminal device 10 has various functions, namely a scanner section 2, a recognition section 3, a conversion section 4, and a transmission control section 7, which connect a front end processor 8 and a central processing section via a communication line 11. The character code is sent to a center 12 having a device 9, where it is recognized and converted into a Japanese sentence mixed with Kanji and Kana.

第5図〜第7図はファクシミリ符号を利用して端末装置
10からパターン情報を送り、通信綱11を介して文字
符号をセンター12に送り、この通信綱11中またはセ
ンター12で漢字カナ混りの日本語文に認識変換せしめ
るものである。
In FIGS. 5 to 7, pattern information is sent from the terminal device 10 using facsimile codes, character codes are sent to the center 12 via the communication line 11, and kanji and kana are mixed in the communication line 11 or at the center 12. This allows the recognition and conversion of the text into Japanese sentences.

第8図、第9図は特徴識別記号、カナ文字符号を送るこ
とにより通信網11を介してセンター12に送り、この
通信網11中またはセンター12で漢字カナ混りの日本
語文に認識変換せしめるものである。
In FIGS. 8 and 9, characteristic identification symbols and kana character codes are sent to the center 12 via the communication network 11, and are recognized and converted into Japanese sentences containing kanji and kana in the communication network 11 or at the center 12. It is something.

このようにこの発明は、ローカルに処理するのみでなく
、回線を用いた種々の構成のシステムが実現できる。
In this way, the present invention enables not only local processing but also systems with various configurations using lines to be realized.

なお、この発明はオンライン認識、オフライン認識は問
わず、また特徴識別記号は上述のものに限らず、他の記
号、文字と区別できるものならどのような記号であって
もよい。
Note that the present invention is applicable to both online recognition and offline recognition, and the characteristic identification symbol is not limited to those described above, but may be any symbol that can be distinguished from other symbols or characters.

また、カナのみならすかなでもよいことは云うまでもな
い。
Also, it goes without saying that if it's only kana, it's fine to write only kana.

以上説明したようにこの発明によれば、下記のような幾
多の利点を有する。
As explained above, the present invention has many advantages as described below.

■ 英数仮名と有限個である10種類程度の簡単な記号
を用いた分ち書きであるため、手書き入力、タイプ入力
を問わず、データを投入する人間の負担は非常に小さい
■ Since the data is written in parts using alphanumeric and kana characters and a limited number of about 10 types of simple symbols, the burden on humans inputting data is extremely small, regardless of whether it is handwritten or typed.

■ 英数仮名と10種類程度の簡単な記号の認識である
ため、従来の認識技術がそのまま使用でき、高級な漢字
認識が不要であるため、スキャナ一部および認識部が安
価にでき、認識率が向上する。
■ Because it recognizes alphanumeric kana and about 10 simple symbols, conventional recognition technology can be used as is, and advanced kanji recognition is not required, so the scanner and recognition unit can be made inexpensive and the recognition rate can be improved. will improve.

■ 語単位、すなわち、特徴識別記号の奇数番目と偶数
番目の特徴識別記号およびこの特徴識別記号に挾まれた
仮名文字列を、漢字仮名混り文に変換するので、認識部
において文字単位ではloo%の認識が達成されなくて
も、語単位では正しく変換できる可能性があり、必要以
上に認識率を向上させる必要はない。
■ Since the word unit, that is, the odd-numbered and even-numbered feature identification symbols and the kana character string sandwiched between these feature identification symbols, is converted into a sentence containing kanji and kana, the recognition unit Even if % recognition is not achieved, there is a possibility of correct conversion on a word-by-word basis, and there is no need to improve the recognition rate more than necessary.

かようにこの発明によれば、英数仮名文字にわずかの特
徴識別記号を用いた記号付仮名文で認識変換するため、
従来の英数カタカナの文字認識技術を用いて安価で認識
変換率の高い日本語データの投入が可能であるとともに
、機能分散が容易にできるので、効率のよいシステムの
構成が可能である等の利点を有する。
According to this invention, alphanumeric and kana characters are recognized and converted into kana sentences with symbols using a few feature identification symbols.
It is possible to input Japanese data that is inexpensive and has a high recognition conversion rate using conventional alphanumeric and katakana character recognition technology, and because functions can be easily distributed, it is possible to configure an efficient system. has advantages.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の一実施例の構成をブロック図で示し
た情報の流れ図、第2図aはこの発明に用いられる日本
語文の一例を示すものであり、第2図bは第2図aの日
本語文を記号付カタカナ文で表わした例を示す図、第3
図は入力用けん盤部の詳細を示す図、第4図〜第9図は
この発明によるシステムの構成例をそれぞれ示すブロッ
ク図である。 図中、1は日本語データ、2はスキャナ一部、3は認識
部、4は変換部、5は特徴識別記号、6はカタカナ文字
である。
FIG. 1 is an information flow diagram showing the configuration of an embodiment of this invention in a block diagram, FIG. 2 a shows an example of Japanese text used in this invention, and FIG. Figure 3 showing an example of the Japanese sentence a expressed in katakana sentences with symbols.
The figure shows details of the input keyboard section, and FIGS. 4 to 9 are block diagrams showing configuration examples of the system according to the present invention. In the figure, 1 is Japanese data, 2 is a part of the scanner, 3 is a recognition unit, 4 is a conversion unit, 5 is a feature identification symbol, and 6 is a katakana character.

Claims (1)

【特許請求の範囲】[Claims] 1 漢字表記された読み仮名の前後に漢字の図形的特徴
を表わす特徴識別記号を付加してなる手書あるいは印刷
された日本語の仮名データ文字列を光学的に読取るスキ
ャナ一部と、このスキャナ一部で読取られた奇数番目と
偶数番目の特徴識別記号およびこの特徴識別記号に挾ま
れた仮名文字列を識別する認識部と、あらかしめ前記仮
名文字列と特徴識別記号および漢字コードを収録した変
換ファイルを有する変換部さからなり、前記認識部の情
報を用いて変換ファイルを検索し、一致する場合、前記
変換部の漢字コードを出力することによって、前記手書
あるいは印刷された日本語データを該当する漢字コード
に変換することを特徴とする日本語データ投入装置。
1. A part of the scanner that optically reads handwritten or printed Japanese kana data character strings, which are formed by adding characteristic identification symbols representing the graphical characteristics of the kanji before and after the pronunciation kana written in kanji, and this scanner. A recognition unit that identifies the odd-numbered and even-numbered feature identification symbols read in part and the kana character strings interposed between the feature identification symbols, and a summary of the kana character strings, feature identification symbols, and kanji codes. It consists of a conversion unit having a conversion file, searches for the conversion file using the information of the recognition unit, and if it matches, outputs the kanji code of the conversion unit to convert the handwritten or printed Japanese data. A Japanese data input device characterized by converting the text into the corresponding kanji code.
JP53115853A 1978-09-22 1978-09-22 Japanese data input device Expired JPS581821B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP53115853A JPS581821B2 (en) 1978-09-22 1978-09-22 Japanese data input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53115853A JPS581821B2 (en) 1978-09-22 1978-09-22 Japanese data input device

Publications (2)

Publication Number Publication Date
JPS5543621A JPS5543621A (en) 1980-03-27
JPS581821B2 true JPS581821B2 (en) 1983-01-13

Family

ID=14672750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53115853A Expired JPS581821B2 (en) 1978-09-22 1978-09-22 Japanese data input device

Country Status (1)

Country Link
JP (1) JPS581821B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0411838Y2 (en) * 1988-02-26 1992-03-24
JPH0588990U (en) * 1992-05-07 1993-12-03 株式会社パイロット Writing board support device

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02289028A (en) * 1989-03-20 1990-11-29 Fujitsu Ltd Handwritten character recognizing device with conversion function for different types of character strings

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0411838Y2 (en) * 1988-02-26 1992-03-24
JPH0588990U (en) * 1992-05-07 1993-12-03 株式会社パイロット Writing board support device

Also Published As

Publication number Publication date
JPS5543621A (en) 1980-03-27

Similar Documents

Publication Publication Date Title
JP2713622B2 (en) Tabular document reader
JPH07121664A (en) Automatic decision apparatus of european language
JPS581821B2 (en) Japanese data input device
JP2681663B2 (en) Japanese sentence correction candidate character extraction method
JPS592191A (en) Recognizing and processing system of handwritten japanese sentence
JPS6022227A (en) European text processor
JPS6336389A (en) Character reader
JPH05210635A (en) Input device
JPH0365588B2 (en)
JP2939945B2 (en) Roman character address recognition device
JPS6095689A (en) Optical character reader
JPS6190282A (en) Input device using optical character reader
JP2931485B2 (en) Character extraction device and method
JPS63163586A (en) Document recognition system
JP2002245470A (en) Language specifying device, translating device, and language specifying method
JPS60110089A (en) Character recognizer
JPS6059489A (en) Character recognizer
JPS6120176A (en) Roman character/chinese character converter
JPH02114366A (en) Kanji input system
JP2000357207A (en) Character recognition method and character recognition device using this method
JPS61226883A (en) Character recognizing device
Goraine Machine recognition of Arabic text.
JPS60207983A (en) Production system of dictionary for recognizing character
JPS6356756A (en) Western language preparing device with correcting function
JPH011061A (en) information retrieval device