JP3233803B2 - Hard-to-read kanji search device - Google Patents

Hard-to-read kanji search device

Info

Publication number
JP3233803B2
JP3233803B2 JP32011994A JP32011994A JP3233803B2 JP 3233803 B2 JP3233803 B2 JP 3233803B2 JP 32011994 A JP32011994 A JP 32011994A JP 32011994 A JP32011994 A JP 32011994A JP 3233803 B2 JP3233803 B2 JP 3233803B2
Authority
JP
Japan
Prior art keywords
kanji
radical
pattern
search
strokes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32011994A
Other languages
Japanese (ja)
Other versions
JPH08180050A (en
Inventor
かよ子 川田
俊治 尾毛谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP32011994A priority Critical patent/JP3233803B2/en
Publication of JPH08180050A publication Critical patent/JPH08180050A/en
Application granted granted Critical
Publication of JP3233803B2 publication Critical patent/JP3233803B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】ワードプロセッサ等での漢字入力
において、読みが不明な漢字(難読漢字)を検索する難
読漢字検索装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an obfuscated kanji retrieval apparatus for retrieving kanji (obfuscated kanji) whose reading is unknown in kanji input by a word processor or the like.

【0002】[0002]

【従来の技術】従来、ワードプロセッサ等による文書作
成処理において、読みの不明な漢字、つまり、難読漢字
を検索する場合、 (1)総画数 (2)部首と部首以外の画数 の何れかの方式により漢字コード表から漢字検索を行な
っている。即ち、従来では、画数による方式を用いて難
読漢字の検索を行なっている。
2. Description of the Related Art Conventionally, in a document creation process using a word processor or the like, when searching for kanji whose reading is unknown, that is, obfuscated kanji, (1) the total number of strokes (2) the number of radicals and the number of strokes other than radicals Kanji search is performed from the Kanji code table by the method. That is, in the related art, retrieval of obfuscated kanji is performed using a method based on the number of strokes.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記画数方式
による難読漢字の検索には、次のような問題がある。 (1)難読漢字の大半は画数が多く、正確な画数の把握
には時間がかかる。一般に10画以上の正答率は特に低
い。
However, the search for obfuscated kanji by the stroke number method has the following problems. (1) Most of the difficult-to-read kanji have many strokes, and it takes time to grasp the exact stroke count. Generally, the correct answer rate for 10 or more strokes is particularly low.

【0004】(2)難読漢字は、一般的に当用漢字以外
であるので、旧字体が多く正確に画数を把握し難い場合
がある。 (3)漢字の画数は大部分が5画〜20画であり、十数
通りの区分けしかできない。このため同一画数に存在す
る漢字の個数は多く、画数を間違えた場合、検索に時間
を要する。
[0004] (2) Since difficult-to-read kanji are generally other than kanji for use, there are many cases where old characters are used and it is difficult to accurately determine the number of strokes. (3) The number of strokes of kanji is mostly 5 to 20 strokes, and can be divided into only a dozen or so. For this reason, the number of kanji existing in the same stroke count is large, and if the stroke count is wrong, it takes time to search.

【0005】(4)漢字文化圏(中国、朝鮮、日本、N
IES等)において、細部にわたり字体が異なるため、
画数を間違える場合が多い。近年、漢字文化圏の経済力
の急成長により、交流が急速に深まりつつある。このよ
うな環境において、相互の固有名詞(地名、人名など)
は翻訳不能のため、原字のまま表現することになるが、
この種の漢字には難読なものが多い。本発明は上記実情
に鑑みてなされたもので、短時間で難読漢字の検索が可
能な難読漢字検索装置を提供することを目的とする。
(4) Kanji cultural sphere (China, Korea, Japan, N
IES etc.), because the fonts differ in detail,
In many cases, the number of strokes is wrong. In recent years, exchange has been rapidly deepening due to the rapid growth of economic power in the kanji cultural sphere. In such an environment, mutual proper nouns (place names, person names, etc.)
Because it cannot be translated, it will be expressed as it is,
Many of these types of kanji are difficult to read. The present invention has been made in view of the above circumstances, and has as its object to provide an obfuscated kanji search device capable of searching for an obfuscated kanji in a short time.

【0006】[0006]

【課題を解決するための手段】本発明に係る難読漢字検
索装置は、各漢字の部首及び部首以外の部分の最初のN
画(Nは所望の自然数)の書き出し線を「\」,
「―」,「|」,「/」の4種類のパターンに分類して
記憶してなる総画数型辞書と、各漢字を部首別に分類す
ると共に、部首以外の部分の最初のN画の書き出し線を
「\」,「―」,「|」,「/」の4種類のパターンに
分類して記憶してなる部首別型辞書と、総画数モードあ
るいは部首別モードの検索モードを選択する検索モード
選択手段と、検索漢字に対する「\」,「―」,
「|」,「/」の4種類のパターンを入力するパターン
入力キーと、上記検索モード選択手段により総画数モー
ドが選択された場合に概略画数を入力する概略画数入力
手段と、上記検索モード選択手段により総画数モードが
選択された場合、上記パターン入力キーにより入力され
る検索漢字の部首及び部首以外の部分の最初のN画のパ
ターン並びに上記概略画数入力手段により入力される概
略画数に基づいて上記総画数型辞書を検索して候補漢字
を出力する総画数パターン検索手段と、上記検索モード
選択手段により部首別モードが選択された場合、部首入
力画面を表示し、この画面で入力される検索漢字の部首
及び上記パターン入力キーにより入力される検索漢字の
部首以外の部分の最初のN画のパターンにより上記部首
別辞書を検索して候補漢字を出力する部首別パターン検
索手段とを具備したことを特徴とする。
According to the present invention, there is provided an apparatus for retrieving obfuscated kanji characters, wherein a radical of each kanji and the first N of a part other than the radical are used.
Image (N is a desired natural number) "\" to write out lines of,
Classified into four types of "-", "|", "/"
Classification of the total stroke count dictionary and each kanji by radical
And the write-out line of the first N drawing except the radical
"\", "-", "|", "/"
A radical type dictionary that is classified and stored, and a total stroke count mode
Search mode for selecting the search mode
Selection means and "\", "-",
A pattern for inputting four types of patterns, "|" and "/"
Enter key and total search mode
Approximate stroke count input when a stroke is selected
Means and the search mode selection means set the total number of strokes mode.
If selected, enter it using the pattern input keys described above.
Of the first N strokes of the radical and non-radical part of the search kanji
The turn and the approximate stroke number input by the approximate stroke number input means
Search the total stroke count dictionary based on the stroke stroke count and select candidate Kanji
Means for outputting the total number of strokes pattern, and the above search mode
When the radical mode is selected by the selection means,
Display the input screen and enter the search kanji radical entered on this screen.
And the search kanji input with the pattern input key
According to the pattern of the first N pictures of the part other than the radical,
A radical pattern search that searches another dictionary and outputs candidate kanji
Cable means .

【0007】[0007]

【作用】上記記憶手段には、各漢字部首及び部首以外の
部分の最初のN画(Nは所望の自然数)の各画の最初の
書き出し線を「\」,「―」,「|」,「/」の4種類
にパターン分けして記憶する。そして、難読漢字を検索
する際、検索する各漢字の部首及び部首以外の部分の最
初のN画の各画の最初の書き出し線を上記4種類に分類
したパターンで入力する。そして、この入力されたパタ
ーンに基づいて上記記憶手段を参照して漢字検索を行な
い、その検索結果を候補漢字として画面上に表示する。
In the above-mentioned storage means, the first writing line of each of the first N strokes (N is a desired natural number) of each kanji radical and the portion other than the radical is set to "@", "-", "| , "/" Are stored in four patterns. Then, when retrieving the obfuscated kanji, the radicals of each kanji to be retrieved and the first writing line of each of the first N strokes other than the radicals are input in the patterns classified into the above four types. Then, a kanji search is performed by referring to the storage means based on the input pattern, and the search result is displayed on the screen as candidate kanji.

【0008】上記のように各漢字部首及び部首以外の部
分の最初のN画の各画の最初の書き出し線を4種類にパ
ターン分けして記憶手段に記憶し、入力されたN画分の
パターンに基づいて検索することにより、漢字の読みを
知らなくても4種類のパターンの組み合わせ入力によっ
て短時間で所望の漢字を検索することができる。
As described above, the first writing line of each of the first N strokes of each kanji radical and the portion other than the radical is divided into four types of patterns and stored in the storage means. Thus, a desired kanji can be searched in a short time by inputting a combination of four types of patterns without knowing how to read the kanji.

【0009】[0009]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1はワードプロセッサ等の漢字入力装置にお
ける難読漢字検索装置部分の機能的な構成を示したもの
である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a functional configuration of an obfuscated kanji search device in a kanji input device such as a word processor.

【0010】図1において、11は検索モード選択装置
で、総画数モードあるいは部首モードの二つの検索モー
ドを選択するようになっている。12はパターン入力装
置で、検索する各漢字の部首及び部首以外の部分の最初
のN画(Nは所望の自然数)の各画の最初の書き出し線
を「\」,「―」,「|」,「/」の4種類に分類した
パターンを入力する。この場合、総画数モードの場合
は、部首を含むN画のパターンを入力し、部首モードの
場合は部首指定を行なった後、部首以外の部分の最初の
N画のパターンを入力する。上記4種類のパターンは、
JISキーボードが一般的に備えている「\」,
「―」,「|」,「/」のキーを利用するが、パターン
入力用キーとして別個に設けても良い。
In FIG. 1, reference numeral 11 denotes a search mode selection device for selecting one of two search modes, that is, a total stroke number mode or a radical mode. Reference numeral 12 denotes a pattern input device, which sets the first writing lines of the first N strokes (N is a desired natural number) of the radicals and non-radical portions of each kanji to be searched by "@", "-", " | And "/" are input. In this case, in the case of the total stroke number mode, the pattern of the N picture including the radical is input. In the case of the radical mode, the radical is designated, and then the pattern of the first N picture other than the radical is inputted. I do. The above four patterns are
"\", Which JIS keyboards generally have,
The "-", "|", and "/" keys are used, but they may be separately provided as pattern input keys.

【0011】13は概略画数入力装置で、検索文字の概
略画数を例えば小画数(10画以下)、中画数(8〜1
6画)、大画数(14画以上)に分けて入力する。この
画数の分類に際しては、数画程度オーバーラップさせた
方が良い。なお、この概略画数入力装置13は、補助的
に用いられるものであるので、省略することが可能であ
る。
Reference numeral 13 denotes a rough stroke number input device, which is used to change the rough stroke number of the search character into, for example, a small stroke number (10 or less) and a medium stroke number (8 to 1).
6 strokes) and the number of large strokes (14 strokes or more). In classifying the number of strokes, it is better to overlap several strokes. Since the approximate stroke number input device 13 is used as an auxiliary device, it can be omitted.

【0012】14はパターン検索装置で、総画数型辞書
15及び部首別型辞書16を参照してパターンによる漢
字検索を行なう。上記総画数型辞書15には、部首を含
む漢字が「\」,「―」,「|」,「/」の4種類のパ
ターンに分類されて予め記憶されている。また、部首別
型辞書16には、漢字が部首別に分類され、部首以外の
部分が「\」,「―」,「|」,「/」の4種類のパタ
ーンに分類されて予め記憶されている。この総画数型辞
書15及び部首別型辞書16を作成するパターン辞書作
成装置については、詳細を後述する。
Reference numeral 14 denotes a pattern search device for performing a kanji search by a pattern with reference to a total stroke count dictionary 15 and a radical type dictionary 16. In the total stroke count dictionary 15, Chinese characters including radicals are classified and stored in advance in four types of patterns, "@", "-", "|", and "/". In the radical type dictionary 16, kanjis are classified by radical, and parts other than radicals are classified into four types of "@", "-", "|", and "/". It is remembered. The pattern dictionary creating apparatus for creating the total stroke count type dictionary 15 and the radical type dictionary 16 will be described later in detail.

【0013】17は候補漢字出力装置で、上記パターン
検索装置14で検索された漢字の中から正解確率の高い
漢字を選択する。この候補漢字出力装置17で選択され
た候補漢字は、抽出結果判定入力装置18へ送られて画
面上に表示される。この画面表示された候補漢字に対し
て操作者は、その成否を入力する。この入力に基づいて
判断部19が候補漢字が正しいか誤っているかを判断
し、候補漢字が誤っている場合には、パターン再入力装
置20でパターンを再入力するか、パターン追加入力装
置21でパターンを追加入力し、パターン検索装置14
へ送る。パターン検索装置14は、そのパターンに基づ
いてパターン検索を再度実行する。そして、正しい候補
漢字が抽出されることにより、漢字検索を終了する。
A candidate kanji output device 17 selects a kanji having a high correct answer probability from the kanji searched by the pattern search device 14. The candidate kanji selected by the candidate kanji output device 17 is sent to the extraction result determination input device 18 and displayed on the screen. The operator inputs the success or failure of the candidate kanji displayed on the screen. Based on the input, the determination unit 19 determines whether the candidate kanji is correct or incorrect. If the candidate kanji is incorrect, the pattern re-input device 20 re-inputs the pattern or the pattern additional input device 21 An additional pattern is input, and the pattern search device 14
Send to The pattern search device 14 executes the pattern search again based on the pattern. When the correct candidate kanji is extracted, the kanji search ends.

【0014】図2は、上記総画数型辞書15及び部首別
型辞書16を作成するパターン辞書作成装置30の概略
構成を示すブロック図である。パターン辞書作成装置3
0は、漢字の方向コード化装置31、総画数型パターン
抽出装置32、部首別型パターン抽出装置33、パター
ン分類装置34からなっている。上記漢字の方向コード
化装置31は、各対象漢字について、その筆順に従って
その書き方(一画相当)を、(1)「\」,(2)
「―」,(3)「|」,(4)「/」の4種類にパター
ン化する。即ち、各対象漢字を筆順に従って一画毎に上
記の4種類、つまり、(1)「右下斜めの線」、(2)
「横線」、(3)「縦線」、(4)「左下斜めの線」に
パターン化する。
FIG. 2 is a block diagram showing a schematic configuration of a pattern dictionary creating device 30 for creating the total stroke count dictionary 15 and the radical type dictionary 16. Pattern dictionary creation device 3
Numeral 0 comprises a kanji direction encoding device 31, a total stroke count type pattern extracting device 32, a radical type pattern extracting device 33, and a pattern classifying device. The kanji direction coding device 31 converts the writing method (corresponding to one stroke) for each target kanji in accordance with the stroke order, as follows: (1) “\”, (2)
It is patterned into four types of “-”, (3) “|”, and (4) “/”. That is, each target kanji is divided into the above four types for each stroke in accordance with the stroke order, that is, (1) "diagonal line at lower right", (2)
The pattern is formed into “horizontal line”, (3) “vertical line”, and (4) “lower left diagonal line”.

【0015】例えば「幅」という漢字の場合、部首の
「巾」は筆順で「縦」、「横」、「縦」、つまり、
「|」,「―」,「|」のパターンとなる。また、部首
以外の部分では、同様にして、筆順に従って「―」,
「|」,「―」,「―」,「|」,…のパターンとな
る。その他の漢字についても同様にして4種類のパター
ンを用いてコード化する。
For example, in the case of the Chinese character "width", the "width" of the radical is "vertical", "horizontal", "vertical" in the stroke order, that is,
The pattern is "|", "-", "|". In the same way, for parts other than the radical, "-",
"|", "-", "-", "|",... Other kanji are similarly coded using four types of patterns.

【0016】そして、総画数型パターン抽出装置32で
は、漢字の方向コード化装置31でコード化された漢字
について、部首を含んで最初のN画、例えば5画分のパ
ターンを抽出する。例えば上記「幅」という漢字の場合
は、「|」,「―」,「|」,「―」,「|」というパ
ターンの組み合わせになる。
The total stroke number type pattern extracting device 32 extracts the first N strokes including the radicals of the kanji coded by the kanji direction coding unit 31, for example, a pattern of five strokes. For example, in the case of the kanji “width”, a combination of patterns “|”, “−”, “|”, “—”, “|” is used.

【0017】また、部首別型パターン抽出装置33で
は、漢字の方向コード化装置31でコード化された漢字
について、部首以外の部分で最初のN画、例えば5画分
のパターンを抽出する。例えば上記「幅」という漢字の
場合は、「―」,「|」,「―」,「―」,「|」とい
うパターンの組み合わせになる。
The radical type pattern extracting device 33 extracts the first N strokes, for example, five strokes of the kanji characters coded by the kanji direction encoding device 31 except for the radicals. . For example, in the case of the kanji character "width", a combination of patterns "-", "|", "-", "-", "|"

【0018】そして、パターン分類装置34は、上記総
画数型パターン抽出装置32で抽出されたパターンを分
類して総画数型辞書15を作成すると共に、部首別型パ
ターン抽出装置33で抽出されたパターンを部首別に分
類して部首別型辞書16を作成する。
The pattern classifying device 34 classifies the patterns extracted by the total stroke number type pattern extracting device 32 to create the total stroke number type dictionary 15 and extracts the radical stroke type pattern extracting device 33. The patterns are classified according to radicals, and a radical-specific dictionary 16 is created.

【0019】図1に示した難読漢字検索装置は、上記の
ようにして作成された総画数型辞書15及び部首別型辞
書16を用いて難読漢字の検索処理を行なう。以下、こ
の難読漢字検索装置の検索動作について図3に示すフロ
ーチャートを参照して説明する。
The obfuscated kanji search device shown in FIG. 1 performs the obfuscated kanji search process using the total stroke count type dictionary 15 and the radical type dictionary 16 created as described above. Hereinafter, a search operation of the obfuscated kanji search device will be described with reference to a flowchart shown in FIG.

【0020】まず、文書作成の画面上において、検索モ
ード選択装置11の機能を用いて難読漢字検索モードを
指定する(ステップA1)。検索モード選択装置11
は、難読漢字検索モードが指定されると、次に「総画数
モード」又は「部首別モード」を選択するための画面を
表示する(ステップA2)。今、ここで「総画数モー
ド」を指定したとすると、パターン入力装置12により
難読漢字に対するパターン入力画面を表示する(ステッ
プA3)。この表示画面において、検索したい難読漢字
の総画数によるパターンを「\」,「―」,「|」,
「/」のキーにより例えば最初の5画まで入力する。例
えば、「幅」、「矣」、「徽」という漢字の場合、 「幅」:「|」,「―」,「|」,「―」,「|」 「矣」:「/」,「\」,「/」,「―」,「―」 「徽」:「/」,「/」,「|」,「|」,「|」 のように入力する。
First, an obfuscated kanji search mode is designated on the document creation screen by using the function of the search mode selection device 11 (step A1). Search mode selection device 11
When the obfuscated kanji search mode is designated, next, a screen for selecting the "total stroke number mode" or the "radical mode" is displayed (step A2). Now, assuming that the "total stroke number mode" is designated here, the pattern input device 12 displays a pattern input screen for obfuscated kanji (step A3). On this display screen, the pattern based on the total number of strokes of the obfuscated kanji that you want to search is "\", "-", "|"
Using the “/” key, for example, the first five strokes are input. For example, in the case of Chinese characters “width”, “ido”, and “hui”, “width”: “|”, “—”, “|”, “—”, “|” “ido”: “/”, “ "\", "/", "-", "-""Hui": Input as "/", "/", "|", "|", "|".

【0021】上記のようにパターンを入力した後は、概
略画数入力装置13の機能を用いて検索漢字の概略の画
数を入力する。例えば 小画数(10画以下) 中画数(8〜16画) 大画数(14画以上) に分けて入力する。
After the pattern is input as described above, the approximate stroke number of the search kanji is input using the function of the approximate stroke number input device 13. For example, the number of small strokes (10 strokes or less), the number of medium strokes (8 to 16 strokes), and the number of large strokes (14 strokes or more) are input separately.

【0022】パターン検索装置14は、上記のように
「総画数モード」が指定されている場合には、総画数型
辞書15を用いて指定画数の範囲で難読漢字を検索する
(ステップA5)。この場合、特に画数の指定がなくて
も難読漢字を検索することができるが、画数を指定した
方が効率的である。
When the "total stroke count mode" is designated as described above, the pattern retrieval device 14 retrieves obfuscated kanji characters using the total stroke count dictionary 15 within the designated stroke count (step A5). In this case, the obfuscated kanji can be searched without specifying the number of strokes, but it is more efficient to specify the number of strokes.

【0023】パターン検索装置14は、入力パターンに
基づいて総画数型辞書15を検索し、検索結果を候補漢
字出力装置17に出力する。候補漢字出力装置17は、
検索された漢字の中から最も正解確率の高い漢字を選択
して画面上の所定の位置に表示する(ステップA6)。
この表示された候補漢字が所望の漢字であった場合に
は、確定操作等を行なうことにより検索処理を終了する
が、所望の漢字でない場合には、次候補の漢字を次候補
キーの操作によって表示させる。候補漢字として所望の
漢字が得られない場合には、パターン入力が誤っている
場合あるいはパターンの入力画数が少なくて所望の漢字
を抽出できない場合がある。この場合には、パターン再
入力装置20の機能を用いて新たにパターンを再入力さ
せるか、あるいはパターン追加入力装置21の機能を用
いて6画目以降のパターンを追加入力させる。そして、
再度、パターン検索装置14により検索処理を実行す
る。このパターン検索の再実行により、所望の漢字が得
られると検索処理を終了する。
The pattern search device 14 searches the total stroke count dictionary 15 based on the input pattern, and outputs the search result to the candidate kanji output device 17. The candidate kanji output device 17
A kanji having the highest probability of a correct answer is selected from the searched kanji and displayed at a predetermined position on the screen (step A6).
If the displayed candidate kanji is the desired kanji, the search process is terminated by performing a confirmation operation or the like. If not, the next candidate kanji is changed by operating the next candidate key. Display. When a desired kanji cannot be obtained as a candidate kanji, the pattern input may be incorrect or the number of input strokes of the pattern may be too small to extract the desired kanji. In this case, a new pattern is re-input by using the function of the pattern re-input device 20, or a pattern of the sixth and subsequent strokes is additionally input by using the function of the pattern additional input device 21. And
The search process is executed again by the pattern search device 14. When the desired kanji is obtained by re-executing the pattern search, the search process is terminated.

【0024】また、上記ステップA2で「部首別モー
ド」を指定した場合、検索モード選択装置11は部首入
力の画面を表示して検索漢字の部首を入力させる(ステ
ップA7)。例えば「幅」、「矣」、「徽」という漢字
の場合、 「幅」→「巾」 「矣」→「ム」 「徽」→「彳」 の部首を入力する。部首が入力されると、パターン入力
装置12により難読漢字に対するパターン入力画面を表
示する(ステップA8)。この表示画面において、検索
したい難読漢字の部首以外の部分のパターンを「\」,
「―」,「|」,「/」のキーによりステップAの場合
と同様にして最初の5画まで入力する。例えば、
「幅」、「矣」、「徽」という漢字の場合、 「幅」:「―」,「|」,「―」,「―」,「|」 「矣」:「/」,「―」,「―」,「/」,「\」 「徽」:「|」,「|」,「|」,「/」,「/」 のように入力する。なお、この「部首別モード」の場
合、総画数の入力は不要である。
When the "radical mode" is designated in step A2, the search mode selection device 11 displays a radical input screen and allows the user to input the radical of the search kanji (step A7). For example, in the case of the kanji “width”, “dou”, and “hui”, enter the radicals of “width” → “width”, “ido” → “mu”, “hui” → “hi”. When the radical is input, a pattern input screen for obfuscated Chinese characters is displayed by the pattern input device 12 (step A8). In this display screen, the pattern of the part other than the radical of the obfuscated kanji to be searched is indicated by “\”,
Using the "-", "|", and "/" keys, the first five strokes are input in the same manner as in step A. For example,
For the kanji characters "width", "ido", and "hui", "width": "-", "|", "-", "-", "|""ido":"/","-" , “—”, “/”, “\” “Hu”: Input as “|”, “|”, “|”, “/”, “/”. In the case of the “radical mode”, it is not necessary to input the total number of strokes.

【0025】パターン検索装置14は、上記のように
「部首別モード」が指定されている場合には、入力パタ
ーンに基づいて部首別型辞書16を検索し、検索結果を
候補漢字出力装置17に出力する(ステップA9)。候
補漢字出力装置17は、検索された漢字の中から最も正
解確率の高い漢字を選択して画面上の所定の位置に表示
する(ステップA10)。この表示された候補漢字が所
望の漢字であった場合には、確定操作等を行なうことに
より検索処理を終了するが、所望の漢字でない場合に
は、次候補の漢字を次候補キーの操作によって表示させ
る。所望の漢字を抽出できない場合には、上記「総画数
モード」の場合と同様にパターンを再入力するか、ある
いは6画目以降のパターンを追加入力して検索処理を再
実行する。
When the "radical mode" is designated as described above, the pattern search device 14 searches the radical type dictionary 16 based on the input pattern, and outputs the search result to the candidate kanji output device. 17 (step A9). The candidate kanji output device 17 selects a kanji having the highest probability of correct answer from the searched kanji and displays it at a predetermined position on the screen (step A10). If the displayed candidate kanji is the desired kanji, the search process is terminated by performing a confirmation operation or the like. If not, the next candidate kanji is changed by operating the next candidate key. Display. If the desired kanji cannot be extracted, the pattern is re-input as in the case of the “total stroke number mode”, or the pattern after the sixth stroke is additionally input and the search process is executed again.

【0026】上記のようにして4種類のパターンを筆順
に従ってN画分入力することにより、短時間で難読漢字
を検索することができる。一般的に漢字の読みは知らな
くても、基本となる書き順を間違える人は少ない。ま
た、間違えたとしても2〜3ケースしかなく、容易に正
答を得ることができる。
By inputting four types of patterns for N strokes in the stroke order as described above, it is possible to search for obfuscated Chinese characters in a short time. In general, even if you do not know how to read kanji, there are few people who make a mistake in the basic writing order. In addition, even if a mistake is made, there are only a few cases, and a correct answer can be easily obtained.

【0027】上記実施例で示したように4種のパターン
を難読漢字の5画まで入力するようにした場合、その組
み合わせは、4の5乗、つまり「45 =1024」通り
あり、かなり細分化された検索が可能となる。また、例
えば康煕辞典で字数約5万字、これに字体の異なる文字
(簡体字、頻体字)を加えても10万字程度であり、全
文字をデータベース化してもデータ量はそれ程大規模と
はならない。
As shown in the above embodiment, when four types of patterns are input up to five strokes of obfuscated kanji, the combinations are 4 to the fifth power, that is, "4 5 = 1024". It is possible to perform a structured search. For example, in the Kangxi dictionary, the number of characters is about 50,000, and even if characters with different fonts (simplified characters, frequent characters) are added, it is about 100,000 characters. Even if all the characters are converted into a database, the data amount is not so large. .

【0028】なお、上記実施例では、難読漢字を検索し
た場合、抽出した漢字のみを表示するようにしたが、総
画数型辞書15及び部首別型辞書16に漢字と共に読み
を記憶しておき、検索を行なった場合に該当する漢字と
共に読みを表示するようにしても良い。
In the above-described embodiment, when a difficult-to-read kanji is searched, only the extracted kanji is displayed. However, the reading is stored in the total stroke count dictionary 15 and the radical type dictionary 16 together with the kanji. Alternatively, when a search is performed, the reading may be displayed together with the corresponding kanji.

【0029】また、本発明はワードプロセッサに限定さ
れるものではなく、その他、例えば漢字処理機能を備え
た計算機等においても上記実施例と同様にして実施し得
るものである。
The present invention is not limited to a word processor, but can be implemented in a computer having a kanji processing function in the same manner as in the above embodiment.

【0030】[0030]

【発明の効果】以上詳記したように本発明によれば、各
漢字部首及び部首以外の部分の最初のN画の各画の最初
の書き出し線を4種類にパターン分けして辞書に記憶
し、入力されたN画分のパターンに基づいて上記辞書を
検索するようにしたので、漢字の読みを知らなくても短
時間で所望の漢字を検索することができる。
As described in detail above, according to the present invention, the first writing line of each of the first N strokes of each kanji radical and the part other than the radical is divided into four types of patterns and stored in a dictionary. Since the dictionary is stored and searched based on the input patterns of N strokes, a desired kanji can be searched in a short time without knowing how to read the kanji.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例に係る難読漢字検索装置の構
成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of an obfuscated kanji search device according to one embodiment of the present invention.

【図2】同実施例における辞書を作成するパターン辞書
作成装置の概略構成を示すブロック図。
FIG. 2 is a block diagram showing a schematic configuration of a pattern dictionary creating apparatus for creating a dictionary in the embodiment.

【図3】同実施例の処理動作を示すフローチャート。FIG. 3 is a flowchart showing a processing operation of the embodiment.

【符号の説明】[Explanation of symbols]

11 検索モード選択装置 12 パターン入力装置 13 概略画数入力装置 14 パターン検索装置 15 総画数型辞書 16 部首別型辞書 17 候補漢字出力装置 18 抽出結果判定入力装置 19 判断部 20 パターン再入力装置 21 パターン追加入力装置 30 パターン辞書作成装置 31 漢字の方向コード化装置 32 総画数型パターン抽出装置 33 部首別型パターン抽出装置 34 パターン分類装置 11 Search Mode Selection Device 12 Pattern Input Device 13 Approximate Stroke Number Input Device 14 Pattern Search Device 15 Total Stroke Type Dictionary 16 Radical Type Dictionary 17 Candidate Kanji Output Device 18 Extraction Result Judgment Input Device 19 Judgment Unit 20 Pattern Reinput Device 21 Pattern Additional input device 30 Pattern dictionary creation device 31 Kanji direction coding device 32 Total stroke type pattern extraction device 33 Radical-specific pattern extraction device 34 Pattern classification device

フロントページの続き (56)参考文献 特開 昭63−182769(JP,A) 特開 平2−289100(JP,A) 特開 平6−96266(JP,A) 特開 平4−195671(JP,A) 特開 平2−18661(JP,A) 特開 昭55−66017(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/26 Continuation of the front page (56) References JP-A-63-182769 (JP, A) JP-A-2-289100 (JP, A) JP-A-6-96266 (JP, A) JP-A-4-195671 (JP) JP-A-2-18661 (JP, A) JP-A-55-66017 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G06F 17/21-17/26

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 各漢字の部首及び部首以外の部分の最初
のN画(Nは所望の自然数)の書き出し線を「\」,
「―」,「|」,「/」の4種類のパターンに分類して
記憶してなる総画数型辞書と各漢字を部首別に分類すると共に、部首以外の部分の最
初のN画の書き出し線を「\」,「―」,「|」,
「/」の4種類のパターンに分類して記憶してなる部首
別型辞書と、 総画数モードあるいは部首別モードの検索モードを選択
する検索モード選択手段と、 検索漢字に対する「\」,「―」,「|」,「/」の4
種類のパターンを入力するパターン入力キーと、 上記検索モード選択手段により総画数モードが選択され
た場合に概略画数を入力する概略画数入力手段と、 上記検索モード選択手段により総画数モードが選択され
た場合、上記パターン入力キーにより入力される検索漢
字の部首及び部首以外の部分の最初のN画のパターン並
びに上記概略画数入力手段により入力される概略画数に
基づいて上記総画数型辞書を検索して候補漢字を出力す
る総画数パターン検索手段と、 上記検索モード選択手段により部首別モードが選択され
た場合、部首入力画面を表示し、この画面で入力される
検索漢字の部首及び上記パターン入力キーにより入力さ
れる検索漢字の部首以外の部分の最初のN画のパターン
により上記部首別辞書を検索して候補漢字を出力する部
首別パターン検索手段と を具備したこと を特徴とする難
読漢字検索装置。
[Claim 1] "\" to write out lines of the first of the N image of a portion other than the radical and radical of each Chinese character (N is a desired natural number),
Classified into four types of "-", "|", "/"
The stored total stroke count dictionary and each kanji are classified by radical and the
The first N drawing lines are "\", "-", "|",
Radicals classified and stored in four patterns of "/"
Select different dictionary and search mode of total strokes mode or radical mode
Search mode selection means and four characters “検 索”, “-”, “|”, “/”
The pattern input key for inputting the type of pattern and the total number of strokes mode are selected by the search mode selection means.
In this case, the rough stroke number input means for inputting the rough stroke number and the search mode selecting means select the total stroke number mode.
Search key entered using the pattern input key
The pattern of the first N strokes of the radical of the character and the part other than the radical
And the approximate stroke number input by the above approximate stroke number input means.
Based on the above total stroke count dictionary and output candidate Kanji
The radical mode is selected by the total stroke number pattern searching means and the search mode selecting means.
Is displayed, the radical input screen is displayed and the
Enter using the search kanji radical and the pattern input keys described above.
Pattern of the first N strokes of the part other than the radical of the searched kanji
A section that searches the radical dictionary and outputs candidate kanji
A difficult-to-read kanji search device comprising: a neck-specific pattern search means .
JP32011994A 1994-12-22 1994-12-22 Hard-to-read kanji search device Expired - Fee Related JP3233803B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32011994A JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32011994A JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Publications (2)

Publication Number Publication Date
JPH08180050A JPH08180050A (en) 1996-07-12
JP3233803B2 true JP3233803B2 (en) 2001-12-04

Family

ID=18117911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32011994A Expired - Fee Related JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Country Status (1)

Country Link
JP (1) JP3233803B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8316295B2 (en) 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US8677237B2 (en) 2007-03-01 2014-03-18 Microsoft Corporation Integrated pinyin and stroke input
US20080211777A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input

Also Published As

Publication number Publication date
JPH08180050A (en) 1996-07-12

Similar Documents

Publication Publication Date Title
JP2726568B2 (en) Character recognition method and device
US6532461B2 (en) Apparatus and methodology for submitting search oueries
US7099507B2 (en) Method and system for extracting title from document image
KR102220894B1 (en) a communication typed question and answer system with data supplying in statistic database
US7889927B2 (en) Chinese character search method and apparatus thereof
JPH05225238A (en) Data base retrieval system
JP3233803B2 (en) Hard-to-read kanji search device
JP2001506383A (en) How to perform character recognition on a pixel matrix
JPH1091701A (en) Form document system
JPH0944521A (en) Index generating device and document retrieval device
JPH1097528A (en) Input method for hard-torread chinese character
JP3415012B2 (en) Post-processing device for character recognition
JP2001109740A (en) Device and method for preparing chinese document
KR20030018519A (en) The Easy Chinese Character Input and Correction Method using Image Retrieval Technologies
JPH0677252B2 (en) Japanese data input processor
JPH10307839A (en) Text retrieving device and its method
JP2000099635A (en) Device and method for predicting character string
JPS6059487A (en) Recognizer of handwritten character
JPH053631B2 (en)
JPH06333083A (en) Optical character reader
JP3472038B2 (en) Logical identification of document elements
JPH09134357A (en) Character processor
JP2000057315A (en) Document filing device and its method
JPH06119321A (en) Document preparing device
JP2002123815A (en) Filing device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010821

LAPS Cancellation because of no payment of annual fees