JPH08180050A - Hardly readable kanji retrieval device - Google Patents

Hardly readable kanji retrieval device

Info

Publication number
JPH08180050A
JPH08180050A JP6320119A JP32011994A JPH08180050A JP H08180050 A JPH08180050 A JP H08180050A JP 6320119 A JP6320119 A JP 6320119A JP 32011994 A JP32011994 A JP 32011994A JP H08180050 A JPH08180050 A JP H08180050A
Authority
JP
Japan
Prior art keywords
kanji
pattern
radical
strokes
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6320119A
Other languages
Japanese (ja)
Other versions
JP3233803B2 (en
Inventor
Kayoko Kawada
かよ子 川田
Toshiharu Okeya
俊治 尾毛谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP32011994A priority Critical patent/JP3233803B2/en
Publication of JPH08180050A publication Critical patent/JPH08180050A/en
Application granted granted Critical
Publication of JP3233803B2 publication Critical patent/JP3233803B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE: To provide a hardly readable KANJI (Chinese character) retrieval device capable of retrieving a hardly readable KANJI in a short time. CONSTITUTION: The KANJIs provided with radicals are classified into the four kinds of the patterns of '-', '|', '/' and 'reverse directional slash' and stored beforehand in a total stroke number type dictionary 15 and the KANJIs are classified by the respective radicals and parts other than the radicals are stored beforehand by the four kinds of the patterns in a respective-radical type dictionary 16. A retrieval mode selection device 11 selects the two retrieval modes of a total stroke number mode or a radical mode and a pattern input device 12 inputs the first write beginning line of the respective strokes of the first N strokes of the radicals and the parts other than the radicals of the respective KANJIs to be retrieved by the patterns classified into the four kinds. A pattern retrieval device 14 refers to the total stroke number type dictionary 15 and the respective-radical type dictionary 16, retrieves the KANJI by the patterns and outputs the retrieved result to a candidate KANJI output device 17 and the candidate KANJI output device 17 selects the KANJI of a high correct answer probability from the KANJIs retrieved in the pattern retrieval device 14 and displays it on a screen.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】ワードプロセッサ等での漢字入力
において、読みが不明な漢字(難読漢字)を検索する難
読漢字検索装置に関する。
[Industrial application] The present invention relates to a difficult-to-read kanji search device for searching kanji whose reading is unknown (hard-to-read kanji) when inputting kanji in a word processor or the like.

【0002】[0002]

【従来の技術】従来、ワードプロセッサ等による文書作
成処理において、読みの不明な漢字、つまり、難読漢字
を検索する場合、 (1)総画数 (2)部首と部首以外の画数 の何れかの方式により漢字コード表から漢字検索を行な
っている。即ち、従来では、画数による方式を用いて難
読漢字の検索を行なっている。
2. Description of the Related Art Conventionally, in a document creation process by a word processor or the like, when searching a kanji whose reading is unknown, that is, a difficult-to-read kanji, (1) total number of strokes, (2) radical and number of strokes other than radical Kanji search is performed from the Kanji code table according to the method. That is, conventionally, the obfuscation kanji is searched by using the stroke count method.

【0003】[0003]

【発明が解決しようとする課題】しかし、上記画数方式
による難読漢字の検索には、次のような問題がある。 (1)難読漢字の大半は画数が多く、正確な画数の把握
には時間がかかる。一般に10画以上の正答率は特に低
い。
However, the retrieval of obfuscated Kanji characters by the stroke number method has the following problems. (1) Most obfuscated Chinese characters have many strokes, and it takes time to accurately grasp the stroke count. In general, the correct answer rate for 10 strokes or more is particularly low.

【0004】(2)難読漢字は、一般的に当用漢字以外
であるので、旧字体が多く正確に画数を把握し難い場合
がある。 (3)漢字の画数は大部分が5画〜20画であり、十数
通りの区分けしかできない。このため同一画数に存在す
る漢字の個数は多く、画数を間違えた場合、検索に時間
を要する。
(2) Since difficult-to-read Kanji characters are generally other than the corresponding Kanji characters, there are many old fonts and it may be difficult to accurately grasp the number of strokes. (3) Most strokes of Chinese characters are 5 to 20 strokes, and only 10 or more divisions can be made. For this reason, the number of Chinese characters existing in the same number of strokes is large, and if the number of strokes is wrong, it takes time to search.

【0005】(4)漢字文化圏(中国、朝鮮、日本、N
IES等)において、細部にわたり字体が異なるため、
画数を間違える場合が多い。近年、漢字文化圏の経済力
の急成長により、交流が急速に深まりつつある。このよ
うな環境において、相互の固有名詞(地名、人名など)
は翻訳不能のため、原字のまま表現することになるが、
この種の漢字には難読なものが多い。本発明は上記実情
に鑑みてなされたもので、短時間で難読漢字の検索が可
能な難読漢字検索装置を提供することを目的とする。
(4) Kanji culture area (China, Korea, Japan, N
In IES etc.), the font is different in every detail,
The number of strokes is often wrong. In recent years, the rapid growth of economic power in the Kanji cultural area has led to a rapid increase in exchanges. In such an environment, mutual proper nouns (place names, personal names, etc.)
Is not translatable, so it will be expressed as it is, but
Many of these kanji are difficult to read. The present invention has been made in view of the above circumstances, and an object of the present invention is to provide an obfuscated Kanji search device capable of searching for obfuscated Kanji in a short time.

【0006】[0006]

【課題を解決するための手段】本発明に係る難読漢字検
索装置は、各漢字部首及び部首以外の部分の最初のN画
(Nは所望の自然数)の各画の最初の書き出し線を
「\」,「―」,「|」,「/」の4種類にパターン分
けして記憶する記憶手段と、検索対象漢字の部首及び部
首以外の部分のN画分の各画の最初の書き出し線を
「\」,「―」,「|」,「/」の4種類にパターン分
けしたときの、同部首及び部首以外の部分のN画分のパ
ターンを取り込む手段と、同手段により取り込んだ部首
及び部首以外の部分のN画分のパターンと上記記憶手段
のデータとをパターン検索し、検索対象漢字のデータを
抽出する手段とを有することを特徴とする。
The obfuscated Kanji search device according to the present invention is designed to display the first N strokes (N is a desired natural number) of each Kanji radical and the portion other than the radical. A storage means for storing four types of patterns, "\", "-", "|", and "/", and the beginning of each stroke of N strokes of the radical and non-radial portion of the search target kanji When the writing line of is divided into four types of "\", "-", "|", and "/", it is possible to capture the pattern of N fractions of the same radical and parts other than the radical. It is characterized in that it has means for pattern-searching the pattern of N fractions of the radical and the portion other than the radical captured by the means and the data of the storage means, and extracting the data of the Chinese character to be searched.

【0007】[0007]

【作用】上記記憶手段には、各漢字部首及び部首以外の
部分の最初のN画(Nは所望の自然数)の各画の最初の
書き出し線を「\」,「―」,「|」,「/」の4種類
にパターン分けして記憶する。そして、難読漢字を検索
する際、検索する各漢字の部首及び部首以外の部分の最
初のN画の各画の最初の書き出し線を上記4種類に分類
したパターンで入力する。そして、この入力されたパタ
ーンに基づいて上記記憶手段を参照して漢字検索を行な
い、その検索結果を候補漢字として画面上に表示する。
In the storage means, the first writing line of each stroke of the first N stroke (N is a desired natural number) of each kanji radical and the portion other than the radical is "\", "-", "|". , And “/” are divided into four patterns and stored. Then, when searching for obfuscated Kanji, the radicals of each Kanji to be retrieved and the first writing line of each stroke of the first N strokes of the portion other than the radical are input in the above four types of patterns. Then, based on this input pattern, a kanji search is performed by referring to the storage means, and the search result is displayed as a candidate kanji on the screen.

【0008】上記のように各漢字部首及び部首以外の部
分の最初のN画の各画の最初の書き出し線を4種類にパ
ターン分けして記憶手段に記憶し、入力されたN画分の
パターンに基づいて検索することにより、漢字の読みを
知らなくても4種類のパターンの組み合わせ入力によっ
て短時間で所望の漢字を検索することができる。
As described above, the first writing line of each stroke of the first N stroke of each kanji radical and the portion other than the radical is divided into four patterns and stored in the storage means. By searching based on the pattern, it is possible to search for a desired Chinese character in a short time by inputting a combination of four types of patterns without knowing the reading of the Chinese character.

【0009】[0009]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1はワードプロセッサ等の漢字入力装置にお
ける難読漢字検索装置部分の機能的な構成を示したもの
である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a functional configuration of a difficult-to-read kanji search device part in a kanji input device such as a word processor.

【0010】図1において、11は検索モード選択装置
で、総画数モードあるいは部首モードの二つの検索モー
ドを選択するようになっている。12はパターン入力装
置で、検索する各漢字の部首及び部首以外の部分の最初
のN画(Nは所望の自然数)の各画の最初の書き出し線
を「\」,「―」,「|」,「/」の4種類に分類した
パターンを入力する。この場合、総画数モードの場合
は、部首を含むN画のパターンを入力し、部首モードの
場合は部首指定を行なった後、部首以外の部分の最初の
N画のパターンを入力する。上記4種類のパターンは、
JISキーボードが一般的に備えている「\」,
「―」,「|」,「/」のキーを利用するが、パターン
入力用キーとして別個に設けても良い。
In FIG. 1, reference numeral 11 denotes a search mode selection device for selecting two search modes, a total stroke number mode or a radical mode. Reference numeral 12 is a pattern input device, and the first writing line of each stroke of the first N stroke (N is a desired natural number) of the radical of each kanji to be searched and the portion other than the radical is "\", "-", " Input a pattern classified into four types of "|" and "/". In this case, in the total stroke number mode, the N stroke pattern including the radical is input. In the radical stroke mode, the radical is designated, and then the first N stroke pattern other than the radical is input. To do. The above four patterns are
"\", Which a JIS keyboard generally has,
The "-", "|", and "/" keys are used, but they may be separately provided as pattern input keys.

【0011】13は概略画数入力装置で、検索文字の概
略画数を例えば小画数(10画以下)、中画数(8〜1
6画)、大画数(14画以上)に分けて入力する。この
画数の分類に際しては、数画程度オーバーラップさせた
方が良い。なお、この概略画数入力装置13は、補助的
に用いられるものであるので、省略することが可能であ
る。
Reference numeral 13 is a rough stroke number input device, for example, the rough stroke number of the search character is, for example, small stroke number (10 strokes or less), medium stroke number (8 to 1)
6 strokes) and the number of strokes (14 strokes or more). When classifying the number of strokes, it is better to overlap several strokes. Since the rough stroke number input device 13 is used as an auxiliary device, it can be omitted.

【0012】14はパターン検索装置で、総画数型辞書
15及び部首別型辞書16を参照してパターンによる漢
字検索を行なう。上記総画数型辞書15には、部首を含
む漢字が「\」,「―」,「|」,「/」の4種類のパ
ターンに分類されて予め記憶されている。また、部首別
型辞書16には、漢字が部首別に分類され、部首以外の
部分が「\」,「―」,「|」,「/」の4種類のパタ
ーンに分類されて予め記憶されている。この総画数型辞
書15及び部首別型辞書16を作成するパターン辞書作
成装置については、詳細を後述する。
Reference numeral 14 is a pattern search device, which refers to the total stroke number type dictionary 15 and the radical type type dictionary 16 to perform a kanji search by a pattern. In the total stroke number type dictionary 15, Chinese characters including radicals are classified into four types of patterns of "\", "-", "|" and "/" and stored in advance. In the radical-type dictionary 16, kanji are classified according to radicals, and the parts other than radicals are classified into four patterns of "\", "-", "|", and "/" in advance. Remembered Details of the pattern dictionary creating device for creating the total stroke number type dictionary 15 and the radical type type dictionary 16 will be described later.

【0013】17は候補漢字出力装置で、上記パターン
検索装置14で検索された漢字の中から正解確率の高い
漢字を選択する。この候補漢字出力装置17で選択され
た候補漢字は、抽出結果判定入力装置18へ送られて画
面上に表示される。この画面表示された候補漢字に対し
て操作者は、その成否を入力する。この入力に基づいて
判断部19が候補漢字が正しいか誤っているかを判断
し、候補漢字が誤っている場合には、パターン再入力装
置20でパターンを再入力するか、パターン追加入力装
置21でパターンを追加入力し、パターン検索装置14
へ送る。パターン検索装置14は、そのパターンに基づ
いてパターン検索を再度実行する。そして、正しい候補
漢字が抽出されることにより、漢字検索を終了する。
A candidate kanji output device 17 selects a kanji character having a high correct answer probability from the kanji characters retrieved by the pattern retrieval device 14. The candidate kanji selected by the candidate kanji output device 17 is sent to the extraction result judgment input device 18 and displayed on the screen. The operator inputs the success or failure of the candidate kanji displayed on this screen. Based on this input, the determination unit 19 determines whether the candidate Chinese character is correct or incorrect. If the candidate Chinese character is incorrect, the pattern re-input device 20 is used to re-input the pattern, or the pattern additional input device 21 is used. The pattern search device 14
Send to. The pattern search device 14 executes the pattern search again based on the pattern. Then, when the correct candidate kanji is extracted, the kanji search ends.

【0014】図2は、上記総画数型辞書15及び部首別
型辞書16を作成するパターン辞書作成装置30の概略
構成を示すブロック図である。パターン辞書作成装置3
0は、漢字の方向コード化装置31、総画数型パターン
抽出装置32、部首別型パターン抽出装置33、パター
ン分類装置34からなっている。上記漢字の方向コード
化装置31は、各対象漢字について、その筆順に従って
その書き方(一画相当)を、(1)「\」,(2)
「―」,(3)「|」,(4)「/」の4種類にパター
ン化する。即ち、各対象漢字を筆順に従って一画毎に上
記の4種類、つまり、(1)「右下斜めの線」、(2)
「横線」、(3)「縦線」、(4)「左下斜めの線」に
パターン化する。
FIG. 2 is a block diagram showing a schematic configuration of a pattern dictionary creating apparatus 30 for creating the total stroke number type dictionary 15 and the radical type type dictionary 16. Pattern dictionary creation device 3
Reference numeral 0 includes a kanji direction encoding device 31, a total stroke number type pattern extraction device 32, a radical type pattern extraction device 33, and a pattern classification device 34. The kanji character direction encoding device 31 writes (1) “\”, (2) for each target kanji according to the stroke order of the writing method (corresponding to one stroke).
There are four types of patterns, "-", (3) "|", and (4) "/". That is, the above-mentioned four types of each target kanji for each stroke according to the stroke order, that is, (1) "lower right diagonal line", (2)
The pattern is formed into "horizontal line", (3) "vertical line", and (4) "lower left diagonal line".

【0015】例えば「幅」という漢字の場合、部首の
「巾」は筆順で「縦」、「横」、「縦」、つまり、
「|」,「―」,「|」のパターンとなる。また、部首
以外の部分では、同様にして、筆順に従って「―」,
「|」,「―」,「―」,「|」,…のパターンとな
る。その他の漢字についても同様にして4種類のパター
ンを用いてコード化する。
For example, in the case of the Chinese character "width", the "width" of the radical is "vertical", "horizontal", "vertical" in the stroke order, that is,
The patterns are "|", "-", and "|". In addition, for parts other than the radical, in the same way, in accordance with the stroke order, "-",
The patterns are "|", "-", "-", "|", .... Similarly, other kanji are coded using four types of patterns.

【0016】そして、総画数型パターン抽出装置32で
は、漢字の方向コード化装置31でコード化された漢字
について、部首を含んで最初のN画、例えば5画分のパ
ターンを抽出する。例えば上記「幅」という漢字の場合
は、「|」,「―」,「|」,「―」,「|」というパ
ターンの組み合わせになる。
Then, the total stroke number type pattern extraction device 32 extracts the first N stroke patterns including the radical, for example, 5 stroke patterns of the kanji coded by the kanji direction coding device 31. For example, in the case of the Chinese character "width", the combination of patterns is "|", "-", "|", "-", "|".

【0017】また、部首別型パターン抽出装置33で
は、漢字の方向コード化装置31でコード化された漢字
について、部首以外の部分で最初のN画、例えば5画分
のパターンを抽出する。例えば上記「幅」という漢字の
場合は、「―」,「|」,「―」,「―」,「|」とい
うパターンの組み合わせになる。
Further, the radical-based pattern extraction device 33 extracts the first N strokes, for example, the strokes of 5 strokes, other than the radical, of the kanji coded by the kanji direction coding device 31. . For example, in the case of the Chinese character "width", the combination of patterns is "-", "|", "-", "-", "|".

【0018】そして、パターン分類装置34は、上記総
画数型パターン抽出装置32で抽出されたパターンを分
類して総画数型辞書15を作成すると共に、部首別型パ
ターン抽出装置33で抽出されたパターンを部首別に分
類して部首別型辞書16を作成する。
Then, the pattern classifying device 34 classifies the patterns extracted by the total stroke number type pattern extracting device 32 to create the total stroke number type dictionary 15, and extracts them by the radical type pattern extracting device 33. The patterns are classified by radicals and the radical-type dictionary 16 is created.

【0019】図1に示した難読漢字検索装置は、上記の
ようにして作成された総画数型辞書15及び部首別型辞
書16を用いて難読漢字の検索処理を行なう。以下、こ
の難読漢字検索装置の検索動作について図3に示すフロ
ーチャートを参照して説明する。
The obfuscated Kanji search device shown in FIG. 1 performs the obfuscated Kanji search process using the total stroke number type dictionary 15 and radical type type dictionary 16 created as described above. Hereinafter, the search operation of the obfuscated Chinese character search device will be described with reference to the flowchart shown in FIG.

【0020】まず、文書作成の画面上において、検索モ
ード選択装置11の機能を用いて難読漢字検索モードを
指定する(ステップA1)。検索モード選択装置11
は、難読漢字検索モードが指定されると、次に「総画数
モード」又は「部首別モード」を選択するための画面を
表示する(ステップA2)。今、ここで「総画数モー
ド」を指定したとすると、パターン入力装置12により
難読漢字に対するパターン入力画面を表示する(ステッ
プA3)。この表示画面において、検索したい難読漢字
の総画数によるパターンを「\」,「―」,「|」,
「/」のキーにより例えば最初の5画まで入力する。例
えば、「幅」、「矣」、「徽」という漢字の場合、 「幅」:「|」,「―」,「|」,「―」,「|」 「矣」:「/」,「\」,「/」,「―」,「―」 「徽」:「/」,「/」,「|」,「|」,「|」 のように入力する。
First, the obfuscated Kanji search mode is designated using the function of the search mode selection device 11 on the document creation screen (step A1). Search mode selection device 11
When the obfuscated Kanji search mode is designated, displays a screen for selecting "total stroke number mode" or "radius-specific mode" (step A2). If the "total stroke number mode" is specified here, the pattern input device 12 displays a pattern input screen for obfuscated Chinese characters (step A3). On this display screen, the pattern based on the total number of strokes of the obfuscated Kanji you want to search for is displayed as "\", "-", "|",
For example, input up to the first five strokes with the "/" key. For example, in the case of the Chinese characters "width", "矣" and "徽", "width": "|", "-", "|", "-", "|""矣":"/"," \ "," / ","-","-"" Hu ": Enter as" / "," / "," | "," | "," | ".

【0021】上記のようにパターンを入力した後は、概
略画数入力装置13の機能を用いて検索漢字の概略の画
数を入力する。例えば 小画数(10画以下) 中画数(8〜16画) 大画数(14画以上) に分けて入力する。
After the pattern is input as described above, the approximate number of strokes of the search Chinese character is input using the function of the approximate stroke number input device 13. For example, the number of small strokes (10 or less), the number of medium strokes (8 to 16), and the number of large strokes (14 or more) are input.

【0022】パターン検索装置14は、上記のように
「総画数モード」が指定されている場合には、総画数型
辞書15を用いて指定画数の範囲で難読漢字を検索する
(ステップA5)。この場合、特に画数の指定がなくて
も難読漢字を検索することができるが、画数を指定した
方が効率的である。
When the "total stroke number mode" is designated as described above, the pattern retrieval device 14 retrieves obfuscated Kanji characters within the designated stroke number using the total stroke number dictionary 15 (step A5). In this case, the obfuscated Kanji can be searched even if the number of strokes is not specified, but it is more efficient to specify the number of strokes.

【0023】パターン検索装置14は、入力パターンに
基づいて総画数型辞書15を検索し、検索結果を候補漢
字出力装置17に出力する。候補漢字出力装置17は、
検索された漢字の中から最も正解確率の高い漢字を選択
して画面上の所定の位置に表示する(ステップA6)。
この表示された候補漢字が所望の漢字であった場合に
は、確定操作等を行なうことにより検索処理を終了する
が、所望の漢字でない場合には、次候補の漢字を次候補
キーの操作によって表示させる。候補漢字として所望の
漢字が得られない場合には、パターン入力が誤っている
場合あるいはパターンの入力画数が少なくて所望の漢字
を抽出できない場合がある。この場合には、パターン再
入力装置20の機能を用いて新たにパターンを再入力さ
せるか、あるいはパターン追加入力装置21の機能を用
いて6画目以降のパターンを追加入力させる。そして、
再度、パターン検索装置14により検索処理を実行す
る。このパターン検索の再実行により、所望の漢字が得
られると検索処理を終了する。
The pattern search device 14 searches the total stroke number type dictionary 15 based on the input pattern, and outputs the search result to the candidate kanji character output device 17. The candidate kanji output device 17 is
The kanji having the highest correct answer probability is selected from the searched kanji and displayed at a predetermined position on the screen (step A6).
If the displayed candidate Kanji is the desired Kanji, the search process is terminated by performing a confirmation operation or the like, but if it is not the desired Kanji, the next candidate Kanji is selected by operating the next candidate key. Display it. If the desired kanji cannot be obtained as the candidate kanji, the pattern may be erroneously input, or the desired kanji may not be extracted due to the small number of input patterns. In this case, the function of the pattern re-input device 20 is used to re-input a new pattern, or the function of the pattern additional input device 21 is used to additionally input the patterns of the sixth and subsequent images. And
The search process is executed again by the pattern search device 14. When the desired kanji is obtained by re-execution of this pattern search, the search process ends.

【0024】また、上記ステップA2で「部首別モー
ド」を指定した場合、検索モード選択装置11は部首入
力の画面を表示して検索漢字の部首を入力させる(ステ
ップA7)。例えば「幅」、「矣」、「徽」という漢字
の場合、 「幅」→「巾」 「矣」→「ム」 「徽」→「彳」 の部首を入力する。部首が入力されると、パターン入力
装置12により難読漢字に対するパターン入力画面を表
示する(ステップA8)。この表示画面において、検索
したい難読漢字の部首以外の部分のパターンを「\」,
「―」,「|」,「/」のキーによりステップAの場合
と同様にして最初の5画まで入力する。例えば、
「幅」、「矣」、「徽」という漢字の場合、 「幅」:「―」,「|」,「―」,「―」,「|」 「矣」:「/」,「―」,「―」,「/」,「\」 「徽」:「|」,「|」,「|」,「/」,「/」 のように入力する。なお、この「部首別モード」の場
合、総画数の入力は不要である。
When the "radius-specific mode" is designated in step A2, the search mode selection device 11 displays a radical input screen and inputs the radical of the search kanji (step A7). For example, in the case of the Kanji characters "width", "矣", and "徽", enter the radicals "width" → "width""矣" → "mu""徽" → "彳". When the radical is input, the pattern input device 12 displays a pattern input screen for obfuscated Chinese characters (step A8). In this display screen, the pattern of the part of the obfuscated kanji you want to search other than the radical is "\",
In the same manner as in step A, input up to the first five strokes using the "-", "|", and "/" keys. For example,
In the case of the Chinese characters "width", "矣" and "徽", "width": "-", "|", "-", "-", "|""矣":"/","-" , "-", "/", "\""徽": Input as "|", "|", "|", "/", "/". It should be noted that in the case of this "radial mode", it is not necessary to input the total number of strokes.

【0025】パターン検索装置14は、上記のように
「部首別モード」が指定されている場合には、入力パタ
ーンに基づいて部首別型辞書16を検索し、検索結果を
候補漢字出力装置17に出力する(ステップA9)。候
補漢字出力装置17は、検索された漢字の中から最も正
解確率の高い漢字を選択して画面上の所定の位置に表示
する(ステップA10)。この表示された候補漢字が所
望の漢字であった場合には、確定操作等を行なうことに
より検索処理を終了するが、所望の漢字でない場合に
は、次候補の漢字を次候補キーの操作によって表示させ
る。所望の漢字を抽出できない場合には、上記「総画数
モード」の場合と同様にパターンを再入力するか、ある
いは6画目以降のパターンを追加入力して検索処理を再
実行する。
When the "radial mode" is designated as described above, the pattern retrieval device 14 retrieves the radical type dictionary 16 based on the input pattern and outputs the retrieval result to the candidate kanji output device. It is output to 17 (step A9). The candidate kanji output device 17 selects a kanji having the highest correct answer probability from the searched kanji and displays it at a predetermined position on the screen (step A10). If the displayed candidate Kanji is the desired Kanji, the search process is terminated by performing a confirmation operation or the like, but if it is not the desired Kanji, the next candidate Kanji is selected by operating the next candidate key. Display it. If the desired kanji cannot be extracted, the pattern is re-input as in the case of the "total stroke number mode", or the patterns of the sixth and subsequent strokes are additionally input and the search process is re-executed.

【0026】上記のようにして4種類のパターンを筆順
に従ってN画分入力することにより、短時間で難読漢字
を検索することができる。一般的に漢字の読みは知らな
くても、基本となる書き順を間違える人は少ない。ま
た、間違えたとしても2〜3ケースしかなく、容易に正
答を得ることができる。
By inputting N types of four types of patterns in the stroke order as described above, it is possible to search for obfuscated Kanji in a short time. Generally, even if you don't know how to read kanji, few people make a mistake in the basic writing order. Even if you make a mistake, there are only a few cases, and you can easily get the correct answer.

【0027】上記実施例で示したように4種のパターン
を難読漢字の5画まで入力するようにした場合、その組
み合わせは、4の5乗、つまり「45 =1024」通り
あり、かなり細分化された検索が可能となる。また、例
えば康煕辞典で字数約5万字、これに字体の異なる文字
(簡体字、頻体字)を加えても10万字程度であり、全
文字をデータベース化してもデータ量はそれ程大規模と
はならない。
As shown in the above embodiment, when four types of patterns are input up to five strokes of obfuscated Kanji, the combination is 4 to the fifth power, that is, "4 5 = 1024", which is considerably subdivided. It is possible to search by computerized. Also, for example, in the Kousui dictionary, the number of characters is about 50,000, and even if characters with different fonts (simplified characters and frequent characters) are added, it is about 100,000 characters. Even if all the characters are put into a database, the amount of data will not be so large. .

【0028】なお、上記実施例では、難読漢字を検索し
た場合、抽出した漢字のみを表示するようにしたが、総
画数型辞書15及び部首別型辞書16に漢字と共に読み
を記憶しておき、検索を行なった場合に該当する漢字と
共に読みを表示するようにしても良い。
In the above embodiment, when the obfuscated Kanji is searched, only the extracted Kanji is displayed. , When reading, the reading may be displayed together with the corresponding kanji.

【0029】また、本発明はワードプロセッサに限定さ
れるものではなく、その他、例えば漢字処理機能を備え
た計算機等においても上記実施例と同様にして実施し得
るものである。
Further, the present invention is not limited to a word processor, but can be carried out in the same manner as in the above embodiment in a computer having a kanji processing function, for example.

【0030】[0030]

【発明の効果】以上詳記したように本発明によれば、各
漢字部首及び部首以外の部分の最初のN画の各画の最初
の書き出し線を4種類にパターン分けして辞書に記憶
し、入力されたN画分のパターンに基づいて上記辞書を
検索するようにしたので、漢字の読みを知らなくても短
時間で所望の漢字を検索することができる。
As described above in detail, according to the present invention, the first writing line of each stroke of the kanji radical and the portion other than the radical of the kanji is divided into four types into a dictionary. Since the dictionary is searched based on the stored and input N stroke pattern, a desired kanji can be searched in a short time without knowing the kanji reading.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係る難読漢字検索装置の構
成を示すブロック図。
FIG. 1 is a block diagram showing the configuration of an obfuscated Chinese character search device according to an embodiment of the present invention.

【図2】同実施例における辞書を作成するパターン辞書
作成装置の概略構成を示すブロック図。
FIG. 2 is a block diagram showing a schematic configuration of a pattern dictionary creating device for creating a dictionary in the embodiment.

【図3】同実施例の処理動作を示すフローチャート。FIG. 3 is a flowchart showing a processing operation of the embodiment.

【符号の説明】[Explanation of symbols]

11 検索モード選択装置 12 パターン入力装置 13 概略画数入力装置 14 パターン検索装置 15 総画数型辞書 16 部首別型辞書 17 候補漢字出力装置 18 抽出結果判定入力装置 19 判断部 20 パターン再入力装置 21 パターン追加入力装置 30 パターン辞書作成装置 31 漢字の方向コード化装置 32 総画数型パターン抽出装置 33 部首別型パターン抽出装置 34 パターン分類装置 11 search mode selection device 12 pattern input device 13 rough stroke number input device 14 pattern search device 15 total stroke number type dictionary 16 radical type dictionary 17 candidate kanji output device 18 extraction result judgment input device 19 judgment unit 20 pattern re-input device 21 pattern Additional input device 30 Pattern dictionary creation device 31 Kanji direction encoding device 32 Total stroke number type pattern extraction device 33 Radical pattern extraction device 34 Pattern classification device

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 各漢字部首及び部首以外の部分の最初の
N画(Nは所望の自然数)の各画の最初の書き出し線を
「\」,「―」,「|」,「/」の4種類にパターン分
けして記憶する記憶手段と、 検索対象漢字の部首及び部首以外の部分のN画分の各画
の最初の書き出し線を「\」,「―」,「|」,「/」
の4種類にパターン分けしたときの、同部首及び部首以
外の部分のN画分のパターンを取り込む手段と、 同手段により取り込んだ部首及び部首以外の部分のN画
分のパターンと上記記憶手段のデータとをパターン検索
し、検索対象漢字のデータを抽出する手段とを有するこ
とを特徴とする難読漢字検索装置。
1. The first write-out line of each stroke of the first N strokes (N is a desired natural number) of each kanji radical and parts other than the radical is "\", "-", "|", "/". , And the first writing line of each stroke of the N strokes of the radical and the portion other than the radical of the search target kanji is "\", "-", "|". , "/"
When the pattern is divided into four types, the means for capturing the N fraction pattern of the radical and the portion other than the radical, and the N fraction pattern of the radical and the portion other than the radical captured by the means An obfuscated kanji search device, characterized in that it has means for pattern-searching the data in the storage means and extracting data of kanji to be searched.
JP32011994A 1994-12-22 1994-12-22 Hard-to-read kanji search device Expired - Fee Related JP3233803B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32011994A JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32011994A JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Publications (2)

Publication Number Publication Date
JPH08180050A true JPH08180050A (en) 1996-07-12
JP3233803B2 JP3233803B2 (en) 2001-12-04

Family

ID=18117911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32011994A Expired - Fee Related JP3233803B2 (en) 1994-12-22 1994-12-22 Hard-to-read kanji search device

Country Status (1)

Country Link
JP (1) JP3233803B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008106472A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Integrated pinyin and stroke input
WO2008106475A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input
US8316295B2 (en) 2007-03-01 2012-11-20 Microsoft Corporation Shared language model

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008106472A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Integrated pinyin and stroke input
WO2008106475A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input
US8316295B2 (en) 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US8677237B2 (en) 2007-03-01 2014-03-18 Microsoft Corporation Integrated pinyin and stroke input

Also Published As

Publication number Publication date
JP3233803B2 (en) 2001-12-04

Similar Documents

Publication Publication Date Title
JP2726568B2 (en) Character recognition method and device
US6950533B2 (en) Sorting images for improved data entry productivity
JP2713622B2 (en) Tabular document reader
JPH1055371A (en) Document retrieval and retrieval system
JPH08180050A (en) Hardly readable kanji retrieval device
JP2000322417A (en) Device and method for filing image and storage medium
JPH0744656A (en) Handwritten character recognizing device
JPH0896081A (en) Character recognizing device and character recognizing method
JP3763262B2 (en) Handwritten character recognition device
JP3157530B2 (en) Character extraction method
KR20030018519A (en) The Easy Chinese Character Input and Correction Method using Image Retrieval Technologies
JPH0944521A (en) Index generating device and document retrieval device
JPS6059487A (en) Recognizer of handwritten character
JPH053631B2 (en)
JP3481850B2 (en) Character recognition device
JPH117492A (en) Method and device for editing key entry
JPH06333083A (en) Optical character reader
JPH1097528A (en) Input method for hard-torread chinese character
JPH11282965A (en) Character recognizing device and computer readable storage medium recording character recognition program
JPH09134357A (en) Character processor
JP2000057315A (en) Document filing device and its method
JPH05189621A (en) On-line hand-written character recognizing device
JPH056456A (en) Character recognizing device
JPH05324610A (en) Address notation chinese character inputting device
JPH07325887A (en) Data input device and method for preparing character recognition dictionary

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010821

LAPS Cancellation because of no payment of annual fees