JPH03214350A - 'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method - Google Patents

'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method

Info

Publication number
JPH03214350A
JPH03214350A JP909990A JP999090A JPH03214350A JP H03214350 A JPH03214350 A JP H03214350A JP 909990 A JP909990 A JP 909990A JP 999090 A JP999090 A JP 999090A JP H03214350 A JPH03214350 A JP H03214350A
Authority
JP
Japan
Prior art keywords
character
radical
bushu
kanji
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP909990A
Other languages
Japanese (ja)
Inventor
Takayuki Fujikawa
藤川 孝之
Keiko Abe
阿部 惠子
Susumu Takasaki
高崎 進
Katsumasa Sakai
酒井 勝正
Hiromichi Aoki
青木 宏導
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Toppan Inc
Original Assignee
Sony Corp
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp, Toppan Printing Co Ltd filed Critical Sony Corp
Priority to JP909990A priority Critical patent/JPH03214350A/en
Publication of JPH03214350A publication Critical patent/JPH03214350A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To specify a desired 'BUSHU' (a common part which becomes a mark for looking for a character in a Chinese character dictionary, such as a left-hand radical, etc.) even in the case the name of the 'BUSHU' and the number of strokes of the 'BUSHU' are not known exactly by selecting a position of the 'BUSHU' of its KANJI (Chinese character) from in a table of the position of the 'BUSHU' and outputting one group of 'BUSHU' corresponding to its position. CONSTITUTION:A circumscribed frame circumscribed to a KANJI is derived, and a 'BUSHU' of its KANJI is classified by positions 41A - 41K of the 'BUSHU' of its KANJI. Subsequently, when a prescribed position, for instance, the position 41C is selected from in a table of the positions 41A - 41K of the 'BUSHU' to the circumscribed frame, one group of 'BUSHU' corresponding to its prescribed position is outputted. In such a way, even in the case the name of the 'BUSHU' and the number of strokes of the 'BUSHU' are not known, the 'BUSHU' of a desired KANJI is specified.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、例えば文字認識装置の認識結果の修正段階及
びワードプロセッサの入力段階等に使用して好適な漢字
の部首検索方法に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a radical search method for Chinese characters suitable for use, for example, in the correction stage of recognition results of a character recognition device, the input stage of a word processor, and the like.

〔発明の概要〕[Summary of the invention]

本発明は、例えば文字認識装置の認識結果の修正段階及
びワードプロセノサの入力段階等に使用して好適な漢字
の部首検索方法において、漢字に外接する外接枠を求め
、この外接枠に対するその漢字の部首の位置によってそ
の漢字の部首を分類し、外接枠に対する部首の位置の一
覧表の中から所定の位置が選択されたときに、その所定
の位置に対応する一組の部首を出力することにより、部
首の名前及び部首の画数が分からない場合でも所望の部
首を特定できるようにしたものである。
The present invention provides a Kanji radical search method that is suitable for use, for example, in the stage of correcting the recognition results of a character recognition device and the input stage of a word processor. The radicals of a kanji are classified according to the position of the radical, and when a predetermined position is selected from the list of radical positions relative to the circumscribed frame, a set of radicals corresponding to that predetermined position is classified. By outputting the neck, a desired radical can be specified even if the name of the radical and the number of strokes of the radical are unknown.

[従来の技術] 文字認識装置において認識結果の誤りを修正する場合及
びワードプロセソサにおいて原稿の文字を入力する場合
等に所定の漢字を指定することが必要Gこなる。この場
合、その漢字の音又は訓が分かれば比較的容易にその漢
字を検索することができるが、音及び訓が分からないと
きにはその漢字の総画数又は部首によって検索を行なう
[Prior Art] It is necessary to specify a predetermined Chinese character when correcting errors in recognition results in a character recognition device, or when inputting characters from a manuscript in a word processor. In this case, if the sound or precept of the kanji is known, the kanji can be searched relatively easily, but if the pronunciation or precept is unknown, the search is performed using the total number of strokes or the radical of the kanji.

このうち総画数によって検索を行なう方法は、当該漢字
が複雑である場合には総画数を数えるのに時間を要する
と共に、総画数を誤まって指定するおそれがあるため、
部首によって検索を行なう方法が有効である。従来の部
首の入力方法には、にんべん,がんだれ,・・・・等の
部首名を直接入力する方法及び部首画数を入力する方法
が知られている。
Among these, the method of searching by the total number of strokes requires time to count the total number of strokes if the kanji in question is complex, and there is a risk of specifying the total number of strokes incorrectly.
An effective method is to search by radical. Conventional radical input methods include a method of directly inputting a radical name such as ninben, gandarare, etc., and a method of inputting the number of strokes of the radical.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかしながら、部首名を直接入力する方法はその部首名
を知らない場合には使用できないので、200種程度あ
る部首の一覧表を活用せざるを得す所定の部首を探し出
すのに時間を要する不都合がある。また、部首画数を入
力する方法はその画数の数え誤りのために時間を要する
ことがある不都合がある。
However, the method of directly inputting a radical name cannot be used if the radical name is not known, so it is necessary to use a list of about 200 radicals. There is an inconvenience that requires Further, the method of inputting the number of radical strokes has the disadvantage that it takes time due to an error in counting the number of strokes.

本発明は斯かる点に鑑み、部首の名前及び部首の画数が
正確に分からない場合でも所望の部首を特定できる部首
検索方法を提案することを目的おする。
In view of the above, an object of the present invention is to propose a radical search method that can identify a desired radical even if the name of the radical and the number of strokes of the radical are not accurately known.

〔課題を解決するだめの手段〕[Failure to solve the problem]

本発明による部首検索方法は、漢字に外接する外接枠を
求め、この外接枠に対するその漢字の部首の位置(41
A)〜(41K)によってその漢字の部首を分類し、外
接枠に対する部首の位置(41A)〜(41K)の一覧
表の中から所定の位置(例えば位置(41C))が選択
されたときに、その所定の位置に対応する一紐の部首(
例えば第2図)を出力するようにしたものである。
The radical search method according to the present invention obtains a circumscribing frame that circumscribes a kanji, and the position of the radical of the kanji with respect to this circumscribing frame (41
A) The radical of the kanji is classified according to ~(41K), and a predetermined position (for example, position (41C)) is selected from the list of radical positions (41A) ~ (41K) with respect to the circumscribed frame. Sometimes a string of radicals (
For example, the image shown in FIG. 2) is output.

[作用] 斯かる本発明によれば、或る漢字の部首を特定するには
、その部首の位置(414)〜(41M)の一覧表の中
からその漢字の部首の位置を選択することによりその位
置に対応する一組の部首が出力されるので、その一組の
部首の中からその漢字の部首を特定することができる。
[Operation] According to the present invention, in order to specify the radical of a certain kanji, the position of the radical of that kanji is selected from the list of positions (414) to (41M) of that kanji. By doing so, a set of radicals corresponding to that position is output, so it is possible to specify the radical of the Kanji character from among the set of radicals.

従って、部首の名前及び部首の画数が分からない場合で
も所望の漢字の部首を特定することができる。
Therefore, even if the name of the radical and the number of strokes of the radical are not known, the radical of a desired Kanji character can be specified.

〔実施例〕〔Example〕

以下、本発明の一実施例につき図面を参照して説明しよ
う。本例は文字認識装置の認識結果の修正段階に本発明
を適用したものである。
Hereinafter, one embodiment of the present invention will be described with reference to the drawings. In this example, the present invention is applied to the stage of correcting recognition results of a character recognition device.

第9図は本例の文字認識装置のシステム構成を示しこの
第9図において、(13)はドキュメントフィーダとイ
メージリーダとによりなるスキャナー(14)はこのス
キャナーにセントされた原稿であり、スキャナー(l3
)は原稿(l4)の1ページ全体を例えば400X40
0dpi (ドノト/インチ)の読取り密度でドット分
解し、各ドットの濃淡に対応した原文字信号S1を生成
する。
FIG. 9 shows the system configuration of the character recognition device of this example. In FIG. 9, (13) is a scanner (14) consisting of a document feeder and an image reader, and the scanner (14) is a document sent to this scanner. l3
) is the entire page of the manuscript (l4), for example 400X40
The dots are separated at a reading density of 0 dpi (dots per inch) to generate an original character signal S1 corresponding to the shade of each dot.

(15)はイメージデータ入出力ボード、(16)はホ
ストコンピュータ、(21)はプリンターを示し、イメ
ージデータ入出力ボード(15)は原文字信号Slの所
定部分をホストコンピュータ(16)に供給すると共に
、ホストコンピュータ(16)から出力される印字用の
信号をプリンター(I6)に供給する。(17)はホス
トコンピュータ(16)を操作するためのキーボード、
(18)はホストコンピュータ(16)に各種座標を入
力するための座標入力ユニソト、(19)はキャラクタ
識別ボードを示し、ホストコンピュータ(16)が原文
字信号S1から1個の文字の外接枠の内部でハイレベル
“1”となる切出し信号を用いて切出した基本矩形切出
し文字信号S7を順次そのキャラクタ識別ボード(19
)に供給すると、キャラクタ識別ボード(19)はその
切出し文字信号S7に対応する文字の文字コードC(そ
の文字の認識ができない場合にはりジエクトコード)を
ホストコンピュータ(16)に供給する。
(15) is an image data input/output board, (16) is a host computer, (21) is a printer, and the image data input/output board (15) supplies a predetermined portion of the original character signal Sl to the host computer (16). At the same time, a printing signal output from the host computer (16) is supplied to the printer (I6). (17) is a keyboard for operating the host computer (16);
(18) indicates a coordinate input unit for inputting various coordinates to the host computer (16), and (19) indicates a character identification board, in which the host computer (16) extracts the circumscribed frame of one character from the original character signal S1. The basic rectangular cut-out character signal S7 cut out using the cut-out signal that becomes high level "1" internally is sequentially passed to the character identification board (19).
), the character identification board (19) supplies the character code C of the character corresponding to the cutout character signal S7 (or the jump code if the character cannot be recognized) to the host computer (16).

(20)は陰極線管よりなる表示装置を示し、この表示
装置(20)の表示画面の所定領域には原稿(14)の
1ページ分の文字を認識した結果を原稿(14)に対応
した形式で表示する如くなす。また、この表示装置(2
0)の表示画面には必要に応じて原稿(14)の1ペー
ジ分又は所定部分のドノトパターンそのものをも表示で
きる如くなす。
(20) indicates a display device made of a cathode ray tube, and a predetermined area on the display screen of this display device (20) displays the results of recognizing characters for one page of the manuscript (14) in a format corresponding to the manuscript (14). Do as shown in . In addition, this display device (2
The display screen 0) is designed to be able to display the donot pattern itself for one page or a predetermined portion of the original (14) as needed.

第10図は第9図例のプリンター(21)に関する処理
部分を除くより詳細な構成を示し、この第10図のイメ
ージデータ入出力ボード(15)において、(22)は
原稿(14)の1ページ分以上のドソトパターンを記憶
できるメモリを有するイメージデータ入力部、(23)
は同じく原稿(l4)の1ページ分以上のドットパター
ンを記憶できるハックアップメモリであり、スキャナー
(13)より出力された原稿(14)の1ページ分の原
文字信号s1をイメージデータ入力部(22)に記憶す
る。また、このイメージデータ入力部(22)に記憶さ
れている原文字信号s1の所望の部分を随時ハンクアッ
プメモリ(23)に移送すると共に、その所望の部分は
文字がない白紙状態に対応する(例えばゼロレヘル′゛
o”の)原文字信号で置換える如《なし、その所望の部
分が置換えられた原文字信号S1を原文字信号s2と称
し、この原文字信号S2の所定部分を原文字信号S3と
称する。
FIG. 10 shows a more detailed configuration of the printer (21) in the example in FIG. 9 excluding the processing part. In the image data input/output board (15) in FIG. An image data input section (23) having a memory capable of storing dosoto patterns for more than one page;
is also a hack-up memory that can store dot patterns for one or more pages of the original (14), and inputs the original character signal s1 for one page of the original (14) output from the scanner (13) to the image data input section ( 22). Further, a desired portion of the original character signal s1 stored in the image data input section (22) is transferred to the hunkup memory (23) at any time, and the desired portion corresponds to a blank state with no characters ( For example, the original character signal S1 with the desired part replaced is called the original character signal s2, and a predetermined part of this original character signal S2 is replaced with the original character signal s2. It is called S3.

ホストコンピュータ(16)において、(24)は中央
処理ユニノト(以下rcpuJと称す) 、(25)は
メインメモリ、(26)は表示装置(2o)用のビデオ
信号用RAM (以下rVRAM,出称す) 、(27
)は文字コードを入力してこの文字コードに対応する所
定の字体のドットパターン即ちフォントを出力するキャ
ラクタROMよりなるフォントテーブルヲ示し、オペレ
ータがキーボード(17)及び座標入力ユニット(18
)を介してC P U (24)に各種コマンド、デー
タ及び座標データを供給すると、CPU(24)はこれ
に対応して本例の文字認識装置の全体の動作を制御する
In the host computer (16), (24) is a central processing unit (hereinafter referred to as rcpuJ), (25) is a main memory, and (26) is a video signal RAM (hereinafter referred to as rVRAM) for the display device (2o). , (27
) indicates a font table consisting of a character ROM that inputs a character code and outputs a dot pattern, that is, a font, of a predetermined font corresponding to this character code.
) When various commands, data, and coordinate data are supplied to the CPU (24), the CPU (24) controls the overall operation of the character recognition device of this example in response to these.

また、原文字信号S2及びS3を夫々随時メインメモリ
(25)及びVRAM(26)に供給する。この場合、
メインメモリ(25)から読出された1文字の外接枠の
内部に対応する文字信号である基本矩形切出し文字信号
S7を順次キャラクタ識別ボード(19)に供給し、キ
ャラクタ識別ボード(19)より送信されて来る文字コ
ードCをメインメモリ(25)を介してフォントテーブ
ル(27)のアドレスハスに供給し、このフォントテー
ブル(27)のデータハスに現われるフォントデータを
V R A M (26)の所定領域に書込む如くなす
。また、本例のホスl・コンピュータ(l6)、キーボ
ード(17)、座標ユニ,ト(1B)及び表示装置(2
0)よりなるシステムはワートプロセッサとしての機能
をも具え7ている。
Further, the original character signals S2 and S3 are supplied to the main memory (25) and VRAM (26), respectively, as needed. in this case,
The basic rectangular cutout character signal S7, which is a character signal corresponding to the inside of the circumscribed frame of one character read from the main memory (25), is sequentially supplied to the character identification board (19), and the character identification board (19) transmits the character signal S7. The incoming character code C is supplied to the address lot of the font table (27) via the main memory (25), and the font data appearing in the data lot of this font table (27) is sent to a predetermined area of the VRAM (26). Do it as if you were writing it. In addition, the host/computer (16), keyboard (17), coordinate unit (1B), and display device (2) of this example are also included.
The system consisting of 0) also has the function of a word processor.

キャラクタ識別ボード(19)において、(28)は文
字の認識部、(30)は各種字体のフォントデータを文
字コードC本例ではJISコード)に対応させて記憶し
ている認識辞書部を示し、認識部(28)及び認識辞書
部(30)が基本的に文字識別作業を実行する。本例の
認識辞書部(30)は大分類文字用の大分類辞書部と細
分類文字用の細分類辞書部とに分かれている。一般に文
字の大まかな特徴は文字の外接枠の各辺の近傍のドット
パターンによっても表わされるため、各文字の外接枠の
四辺の近傍のドットパターンを四辺データ(又は周辺デ
ータ)として数値化して、この四辺データが所定の範囲
に収まった文字の(大分類文字の)フォントデータを大
分類辞書部に格納する如くなしてもよい。
In the character identification board (19), (28) indicates a character recognition section, (30) indicates a recognition dictionary section that stores font data of various fonts in correspondence with character codes (in this example, JIS codes), The recognition unit (28) and recognition dictionary unit (30) basically perform character identification work. The recognition dictionary section (30) of this example is divided into a large classification dictionary section for large classification characters and a subclassification dictionary section for small classification characters. Generally, the general characteristics of a character are also expressed by the dot patterns near each side of the circumscribing frame of the character, so the dot patterns near the four sides of the circumscribing frame of each character are digitized as four-side data (or peripheral data). The font data of characters (major classification characters) whose four side data fall within a predetermined range may be stored in the major classification dictionary section.

一方、細分類辞書部には大分類辞書部に含まれない他の
全ての文字(細分類文字)の24 X 24 F yト
に正規化されたフォントデータが文字コードに対応して
格納されている。
On the other hand, the subdivision dictionary section stores 24 x 24 F y normalized font data of all other characters (subdivision characters) that are not included in the major dictionary section, corresponding to the character codes. There is.

(29)は辞書作成部を示し、この辞書作成部(29)
はオペレータによって辞書作成モードが設定された場合
には、供給されて来る1文字分の基本矩形切出し文字信
号によって表わされるフォントデータが大分類文字に対
応するか細分類文字に対応するかを判別し、大分類文字
に対応するときにはそのフォントデータを正規化して認
識辞書部(30)の大分類辞書の所定の文字コードの領
域に書込み、細分類文字に対応するときにはそのフォン
トデータを正規化して認識辞書部(30)の細分類辞書
部の所定の文字コードの領域に書込む如くなす。これに
よって、ユーザ側で簡便に種々の字体に対応できる認識
辞書部(30)を作成することができる。
(29) indicates a dictionary creation section, and this dictionary creation section (29)
When the dictionary creation mode is set by the operator, determines whether the font data represented by the supplied basic rectangular cutout character signal for one character corresponds to a major classification character or a subclassification character. When corresponding to major classification characters, the font data is normalized and written into a predetermined character code area of the major classification dictionary of the recognition dictionary section (30), and when corresponding to subclassification characters, the font data is normalized and recognized. It is written in a predetermined character code area of the subdivision dictionary section of the dictionary section (30). This allows the user to easily create a recognition dictionary section (30) that can handle various fonts.

キャラクタ識別ボード(19)の認識部(28)はオペ
レータによって文字認識モードが設定された場合、供給
されて来る基本矩形切出し文字信号S7が大分類文字に
対応するときには認識辞書部(30)の大分類文字部の
フォントデータを順次第1の先入れ先出し(FIFO)
レジスタに書込み、細分類文字に対応するときには細分
類文字部のフォントデータを順次第2のFIFOレジス
タに書込む。また、この動作と並行して認識部(28)
はその基本矩形切出し文字信号S7に対応するドットパ
ターンを正規化して順次第3のFIFOレジスタに書込
む。そして、認識部(28)は第3のFIFOレジスタ
中の認識対象となる文字のドットパターンと第1のFI
FOレジスタ中の一連のフォントデータ及び第2のFI
FOレジスタ中の一連のフォントデータとを順次比較す
ることにより、その認識対象となる文字のドントパター
ンに最も近いフォントデータに対応する文字コードを優
先順位の高い順に10個生成し、この文字コードをホス
トコンピュータ(16)のメインメモリの所定領域に書
込む如くなす。
When the character recognition mode is set by the operator, the recognition section (28) of the character identification board (19) changes the size of the recognition dictionary section (30) when the supplied basic rectangular cutout character signal S7 corresponds to a major classification character. The font data of the classified character section is sequentially processed in first-in, first-out (FIFO) format.
When the font data corresponds to subcategory characters, the font data of the subclass character section is sequentially written to the second FIFO register. In addition, in parallel with this operation, the recognition unit (28)
normalizes the dot pattern corresponding to the basic rectangular cutout character signal S7 and sequentially writes it into the third FIFO register. Then, the recognition unit (28) uses the dot pattern of the character to be recognized in the third FIFO register and the first FIFO register.
A series of font data in the FO register and the second FI
By sequentially comparing a series of font data in the FO register, 10 character codes corresponding to the font data closest to the don't pattern of the character to be recognized are generated in descending order of priority, and these character codes are It is written in a predetermined area of the main memory of the host computer (16).

その優先順位を決定するには、例えば24 X 24ド
ノトの個々のドノトについて認識対象となる文字のドッ
トパターンと認識辞書部(30)より読出したフォント
データとを比較して、両者の値が異なっているドノトの
総和を評価値となし、この評価値が小さい順に優先順位
を高く設定する。また、この最も優先順位の高い文字コ
ードの評価値が所定値以下の場合には、文字認識が行な
われたものとみなしてその最も優先順位の高い文字コー
ドを認識対象となる文字の文字コードCとしてメインメ
モリ(25)の原稿(14)に対応して定められた領域
に書込む。同時に認識部(28)はその文字コードCと
共にその文字の大きさを示すデータ及びその文字の平均
的な外接枠の中での位置を示すデータをメインメモリ(
25)に書込む如くなす。一方、最も優先順位の高い文
字コードの評価値が所定値を超える場合には、認識部(
28)は文字認識ができなかったものとみなしてリジエ
クトコードをそのメインメモリ(25)の原稿(I4)
に対応して定められた領域に書込む如くなす。上述の文
字認識の動作はパイプライン方式で高速に実行される。
To determine the priority, for example, for each dot of 24 x 24 dots, the dot pattern of the character to be recognized is compared with the font data read from the recognition dictionary section (30), and if the values of the two are different, The total sum of the donots that are listed is taken as an evaluation value, and the order of priority is set in descending order of the evaluation value. If the evaluation value of the character code with the highest priority is less than or equal to a predetermined value, it is assumed that character recognition has been performed and the character code with the highest priority is changed to the character code C of the character to be recognized. The data is written in a predetermined area of the main memory (25) corresponding to the original (14). At the same time, the recognition unit (28) stores the character code C, data indicating the size of the character, and data indicating the position of the character in the average circumscribing frame in the main memory (
25). On the other hand, if the evaluation value of the character code with the highest priority exceeds the predetermined value, the recognition unit (
28) assumes that character recognition was not possible, and saves the reject code to the manuscript (I4) in its main memory (25).
The data is written in a predetermined area corresponding to the data. The character recognition operation described above is executed at high speed in a pipeline system.

第1図は本例の表示装置(20)の表示画面(2OA)
を示し、この表示画面(20A)には、原稿(14)の
1ページ分の文字を認識した認識結果を表示する認識結
果表示領域(31)を設ける。本例では原稿(14)は
縦書きであるが、認識結果は横書きで表示している。(
33)は修正対象となる文字を指示するためのカーソル
を示し、このカーソル(33)はキーボード(l7)又
は座標入力ユニット(18)によって認識結果の任意の
文字の上に移動することができる。
Figure 1 shows the display screen (2OA) of the display device (20) of this example.
This display screen (20A) is provided with a recognition result display area (31) for displaying the recognition results of one page of characters of the original (14). In this example, the original (14) is written vertically, but the recognition results are displayed horizontally. (
33) indicates a cursor for indicating a character to be corrected, and this cursor (33) can be moved over any character in the recognition result using the keyboard (17) or the coordinate input unit (18).

第1図例ではカーソル(33)がリジェクトされた文字
を示すブランク(32A)の上に在るので、表示画面(
20A)の認識結果表示領域(31)に近接する領域(
34)及び(35)に夫々「対象文字」の語及びブラン
クが表示される。(36)は機能釦領域を示し、この領
域(36)には「候補」,「コード」,「かな漢字」及
び「部首画数」等の文字が表示されており、これらの機
能釦は座標人カユニッ} (18)によって選択するこ
とができる。例えば「候補」が選択されると、表示画面
(20A)の一部に修正対象となる文字に最も近いと認
識される10個の文字のパターンが優先順位の高い順に
表示され、「コード」が選択されるとその修正対象文字
を文字コードで直接指定できるようになり、「かな漢字
」が選択されるとその修正対象文字をかな/漢字変換で
入力できるようになり、「部首画数」の文字で示される
部首画数釦(36E)が選択されると、機能釦領域(3
6)の下部の選択領域(40)に後述の如く漢字の部首
の位置の一覧表が表示される。
In the example in Figure 1, the cursor (33) is on the blank (32A) indicating the rejected character, so the display screen (
The area (20A) close to the recognition result display area (31)
34) and (35), the word "target character" and a blank are displayed, respectively. (36) indicates the function button area. In this area (36), characters such as "candidate", "code", "kana-kanji", and "number of radical strokes" are displayed. (18). For example, when "Candidate" is selected, 10 character patterns recognized as being closest to the character to be corrected are displayed on a part of the display screen (20A) in descending order of priority, and "Code" is displayed. When selected, the character to be corrected can be specified directly with the character code, and when "Kana-Kanji" is selected, the character to be corrected can be input by Kana/Kanji conversion, and the character with "Radical Stroke Count" is selected. When the radical stroke number button (36E) indicated by is selected, the function button area (36E) is selected.
In the selection area (40) at the bottom of 6), a list of radical positions of Kanji characters is displayed as described later.

また、(37)は再認識釦を示し、この釦(37)を座
標入力ユニット(18)で選択することにより、修正対
象文字の再認識を実行できるようになる。
Further, (37) indicates a re-recognition button, and by selecting this button (37) with the coordinate input unit (18), it becomes possible to execute re-recognition of the character to be corrected.

本例ではその認識結果表示領域(31)の近傍に面積が
WxWの周辺イメージ表示領域(38)を設け、この周
辺イメージ表示領域(38)には修正対象となる文字に
対応する原稿(14)上の文字を中心として幅170ド
ソト×高さ170ドントの領域のドットパターンをその
まま表示する。具体的には第10図において、C P 
U (24)はイメージデータ入力部(22)に記憶さ
れている1ページ分の原文字信号S2(本例では原文字
信号Slそのもの)の内で修正対象となる文字を中心と
して170 X 170ドットの領域の原文字信号S3
を読出して、その原文字信号S3を拡大(補間)又は縮
少(間引き)してVR A M (26)の所定領域に
書込む如くなす。従って、第1図の表示画面(20A)
中の周辺イメージ表示領域(38)には修正対象となる
ブランクに対応する原稿(14)上の文字”fL及びこ
7の文字の周辺の例えば8個の文字のイメージがドット
パターンとしてそのまま表示される。また、切出し文字
パターン表示領域(39)にはその修正対象となる文字
の原稿(14)上でのイメージの24 X 24ドット
に正規化されたパターンが表示される。
In this example, a peripheral image display area (38) with an area of WxW is provided near the recognition result display area (31), and in this peripheral image display area (38) there is a document (14) corresponding to the character to be corrected. A dot pattern in an area of width 170 dots x height 170 dots centered on the upper character is displayed as is. Specifically, in FIG. 10, C P
U (24) is 170 x 170 dots centered around the character to be corrected in the original character signal S2 for one page (original character signal Sl itself in this example) stored in the image data input section (22). Original character signal S3 in the area of
is read out, and the original character signal S3 is enlarged (interpolated) or reduced (thinned out) and written in a predetermined area of VR A M (26). Therefore, the display screen (20A) in Figure 1
In the peripheral image display area (38) inside, images of the character "fL" on the document (14) corresponding to the blank to be corrected and images of, for example, eight characters around these seven characters are displayed as dot patterns. Further, in the cutout character pattern display area (39), a pattern normalized to 24 x 24 dots of the image of the character to be corrected on the original (14) is displayed.

このように修正対象の文字及びその周辺の文字のイメー
ジが表示されると、オペレータは原稿(14)を参照す
ることなく修正対象となる文字を前後の文字等に合わせ
て修正することができるので、修正の効率が改善される
利益がある。
When the image of the character to be corrected and the surrounding characters is displayed in this way, the operator can correct the character to be corrected according to the characters before and after it without referring to the manuscript (14). , there is a benefit of improving the efficiency of correction.

本例の文字認識装置で認識結果の修正を行なう場合の動
作につき説明するに、修正対象となる文字は第1図の認
識結果表示領域(31)のブランク(32A)〜(32
C)即ち認識できず排除された文字の中のブランク(3
2A)に対応する文字であるとする。
To explain the operation when correcting recognition results with the character recognition device of this example, the characters to be corrected are blanks (32A) to (32) in the recognition result display area (31) in FIG.
C) i.e. blanks among characters that are unrecognizable and excluded (3
2A).

この場合、カーソル(33)をそのブランク(32A)
の上に移動して座標人カスイノチを操作することにより
そのブランク(32A)に対応する文字が修正対象に指
定され、周辺イメージ表示領域(38)及び切出し文字
パターン表示領域(39)にはそのブランク(32A)
に対応する原稿(14)上の文字の情報が表示される。
In this case, move the cursor (33) to its blank (32A)
By moving above and operating the coordinate person Kasuinochi, the character corresponding to that blank (32A) is designated as a correction target, and the blank is displayed in the peripheral image display area (38) and cutout character pattern display area (39). (32A)
The information of the characters on the original document (14) corresponding to is displayed.

この第1図例ではその認識できなかった文字は「罹」で
あり、この漢字「罹」の部首はあみかしら「口」である
ため、この部首「口」を先ず特定する必要がある。その
ため、オペレータは機能釦領域(36)の部首画数釦(
36E)を選択することにより選択領域(40)に漢字
の部首の11通りの位置(41A)〜(41K)の一覧
表を表示させる。
In this example in Figure 1, the character that could not be recognized is ``Muki'', and the radical of this kanji ``Muki'' is Amikashira ``口'', so we need to identify this radical ``口'' first. . Therefore, the operator must press the radical stroke number button (
By selecting 36E), a list of 11 positions (41A) to (41K) of radicals of kanji is displayed in the selection area (40).

本例の漢字の部首の位置(41A)〜(41K)は、そ
の漢字に外接する外接枠として四辺形を設定し、この四
辺形の4辺に対してその漢字の部首が何れの辺の近傍に
存在するかによってその部首の位置を分類したものであ
る。具体的には、その外接枠としての四辺形の左辺,右
辺,上辺.下辺,左右の辺及び上辺,左辺及び上辺.左
辺及び下辺,左右の辺及び下辺5上辺及び右辺,上下の
辺及び左辺の近傍に存在する部首を夫々位置(41A)
〜(41J)る属する部首として分類を行ない、そのよ
うな分類が困難であると思われるも2のはその他の位置
(41K)に属する部首として分類を行なう。尚、部首
の位置の紛らわしいものについては2つ以上の位置(例
えば位置(41F)及び(41J)の両方)に重複して
分類してもよい。
For the positions (41A) to (41K) of the radicals of the kanji in this example, set a quadrilateral as a circumscribing frame that circumscribes the kanji, and which side of the radical of the kanji is set relative to the four sides of this quadrilateral. The position of the radical is classified according to whether it exists in the vicinity of the radical. Specifically, the left side, right side, and top side of the quadrilateral as its circumscribing frame. Bottom side, left and right sides, top side, left side and top side. Left side and bottom side, left and right sides and bottom side 5 Position the radicals that exist near the top side and right side, top and bottom sides and left side respectively (41A)
- (41J) are classified as belonging to the radicals, and those for which such classification is difficult are classified as the radicals belonging to the other positions (41K). Note that if the position of a radical is confusing, it may be classified into two or more positions (for example, both positions (41F) and (41J)).

本例の対象とする漢字「罹」の部首「口」は位IF(4
1C)に属するため、オペレータは座標入力ユニット(
18)を操作して十字のカーソル(42)を位置(41
C)を示す図形の上に移動して座標入力スイッチを操作
する。これによってその位置(41G)が選択されて、
選択領域(40)には第2図に示す如く位置(41C)
に属する部首(なべぶたー,わかんむりー,<さかんむ
り一等)が部首画数順に表示される。例えば位置(41
C)の部首画数は2画,3画,・・・・,6画及び7画
以上に分類されている。
In this example, the radical ``mouth'' of the kanji ``过'' is in position IF (4
1C), the operator must use the coordinate input unit (
18) to move the cross cursor (42) to the position (41).
Move onto the figure showing C) and operate the coordinate input switch. This selects that position (41G),
The selection area (40) has a position (41C) as shown in Figure 2.
Radicals belonging to (Nabebuta, Wakanmuri, <Sakanmuri 1st class) are displayed in order of the number of strokes in the radical. For example, position (41
The number of radical strokes in C) is classified into 2 strokes, 3 strokes, ..., 6 strokes, and 7 or more strokes.

更に、部首画数が同し部首については使用頻度の高い順
番に左側から右側へと配列されている。
Furthermore, radicals with the same number of radical strokes are arranged from left to right in order of frequency of use.

例えば3画の所では最も使用頻度の高いくさかんむりー
が最も左側に配されるでいる。
For example, in the third stroke, the most frequently used flower crown is placed on the far left.

そして、本例の求めている[OIIjは第2図の5画の
列の枠(43)内に表示されているので、オペレータが
カーソル(42)をその枠(43)内に移動させて座標
人カスインチを操作することによりその「口」を特定す
る。これに応じて選択領域(40)には第3図に示す如
く、部首「口」に属する12個の漢字が表示され、本例
の対象とする漢字「罹」は枠(44)内に表示されてい
る。そこで、オペレータがカーソル(42)をその枠(
44)内に移動させて座標入力スイッチを操作すること
によりその漢字「罹」が認識できなかった文字として特
定される。具体的には、第1図のブランク(32A)の
代わりに漢字「罹」が表示され、対応するメインメモリ
(25)内のファイルにはその漢字「罹」が記録される
Then, since [OIIj, which is sought in this example, is displayed within the frame (43) of the 5-stroke column in Figure 2, the operator moves the cursor (42) into the frame (43) and sets the Identify the "mouth" by manipulating the human body inch. Accordingly, 12 kanji belonging to the radical ``口'' are displayed in the selection area (40), as shown in Fig. 3, and the kanji character ``ku'', which is the target of this example, is displayed in the frame (44). Displayed. Then, the operator moves the cursor (42) to that frame (
44), and by operating the coordinate input switch, the kanji character ``补'' is specified as an unrecognized character. Specifically, the kanji character ``buk'' is displayed instead of the blank (32A) in FIG. 1, and the kanji ``buk'' is recorded in the corresponding file in the main memory (25).

上述のように本例によれば文字認識後の修正処理を行な
う場合に、入力する漢字の部首の名前及び画数が分から
なくともその部首の位置を指定するだけでその部首を特
定することかできるため、漢字の入力を迅速に行なうこ
とができ修正作業を迅速にできる利益がある。更に、そ
の漢字の部首の名前又は画数が分かっている場合であっ
ても、本例のように部首の位置(41,A)〜(41k
)の一覧表の中から対象とする部首の位置を選択する方
法の方がより速く対象とする部首を特定することができ
る。
As mentioned above, according to this example, when performing correction processing after character recognition, even if the name and stroke count of the radical of the kanji to be input are not known, the radical can be identified simply by specifying the position of the radical. This has the advantage that kanji can be input quickly and correction work can be done quickly. Furthermore, even if the name or number of strokes of the radical of the kanji is known, the positions of the radical (41,A) to (41k) are known, as in this example.
) can identify the target radical more quickly by selecting the position of the target radical from the list.

最後に、第1図の位置(41A)〜(41J)に属する
部首を第4図〜第8図にまとめて示す。即ち、第4図は
位置(41A)に属する部首(にんべん仁にすい冫等)
、第5図は位置(41B)に属する部首(りっとうl 
, さんづ《りち等)、第6図は位置(41C)に属す
る部首、第7図は位置(410)に属する部首(れんが
・・・・,したごころ・=・等)を示す。
Finally, radicals belonging to positions (41A) to (41J) in FIG. 1 are collectively shown in FIGS. 4 to 8. That is, Figure 4 shows the radicals belonging to position (41A)
, Figure 5 shows the radical belonging to position (41B).
, Sanzu (Richi, etc.), Figure 6 shows the radicals belonging to position (41C), and Figure 7 shows the radicals belonging to position (410) (Renga..., Shitagokoro, =..., etc.). .

また、第8図A−Fは夫h位置(41E)〜(41J)
に属する部首を示す。
In addition, Fig. 8 A-F shows husband h positions (41E) to (41J).
Indicates radicals belonging to .

尚、本発明は上述実施例に限定されず、例えば各漢字に
外接する外接枠として四辺形以外の多角形や円周等を用
いて部首を分類するなど、本発明の要旨を逸脱しない範
囲で種々の構成を採り得ることは勿論である。
The present invention is not limited to the above-mentioned embodiments, and may be applied within the scope of the present invention, such as classifying radicals using a polygon other than a quadrilateral, a circumference, etc. as a circumscribing frame circumscribing each kanji. Of course, various configurations can be adopted.

〔発明の効果] 本発明によれば、漢字の部首の名前及び画数が分からな
い場合であっても、その部首を検索できる利益がある。
[Effects of the Invention] According to the present invention, even if the name and number of strokes of a radical of a kanji character are unknown, there is an advantage that the radical can be searched.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の表示画面を示す正面図、第
2図及び第3図は夫々第1図の選択領域の表示内容を示
す正面図、第4図〜第8図は夫々一実施例の11種の位
置に属する部首の例を示す線図、第9図は本発明の一実
施例の文字認識装置のシステム構成を示す一部斜視図を
含む構成図、第10図は第9図例の要部のより詳細な構
成を示す構成図である。 (31)は認識結果表示領域、(33)は修正対象文字
を指示するカーソル、 (36E)は部首画数釦、(4
0)は選択領域、 (41A)〜(41K)は夫々部首
の位置である。
FIG. 1 is a front view showing the display screen of an embodiment of the present invention, FIGS. 2 and 3 are front views showing the display contents of the selection area in FIG. 1, and FIGS. 4 to 8 are respectively A line diagram showing examples of radicals belonging to 11 types of positions according to an embodiment, FIG. 9 is a configuration diagram including a partial perspective view showing the system configuration of a character recognition device according to an embodiment of the present invention, and FIG. 10 9 is a configuration diagram showing a more detailed configuration of the main part of the example in FIG. 9. FIG. (31) is the recognition result display area, (33) is the cursor that indicates the character to be corrected, (36E) is the radical stroke number button, (4
0) is the selection area, and (41A) to (41K) are the positions of the radicals, respectively.

Claims (1)

【特許請求の範囲】 漢字に外接する外接枠を求め、該外接枠に対する上記漢
字の部首の位置によって上記漢字の部首を分類し、 外接枠に対する部首の位置の一覧表の中から所定の位置
が選択されたときに、上記所定の位置に対応する一組の
部首を出力するようにしたことを特徴とする部首検索方
法。
[Claims] Obtain a circumscribing frame that circumscribes a kanji, classify the radical of the kanji according to the position of the radical of the kanji with respect to the circumscribing frame, and select a circumscribed frame from a list of radical positions with respect to the circumscribing frame. A radical search method characterized in that when a position is selected, a set of radicals corresponding to the predetermined position is output.
JP909990A 1990-01-19 1990-01-19 'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method Pending JPH03214350A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP909990A JPH03214350A (en) 1990-01-19 1990-01-19 'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP909990A JPH03214350A (en) 1990-01-19 1990-01-19 'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method

Publications (1)

Publication Number Publication Date
JPH03214350A true JPH03214350A (en) 1991-09-19

Family

ID=11735306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP909990A Pending JPH03214350A (en) 1990-01-19 1990-01-19 'bushu' (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method

Country Status (1)

Country Link
JP (1) JPH03214350A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307645A (en) * 1992-04-16 1993-11-19 Tadayasu Takada Method for inputting hand-written character and storage device for inputting hand-written character
JPH0683872A (en) * 1992-07-16 1994-03-25 Masakazu Togawa System and device for retrieving kanji

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307645A (en) * 1992-04-16 1993-11-19 Tadayasu Takada Method for inputting hand-written character and storage device for inputting hand-written character
JPH0683872A (en) * 1992-07-16 1994-03-25 Masakazu Togawa System and device for retrieving kanji

Similar Documents

Publication Publication Date Title
US7633512B2 (en) Information processing apparatus, information processing method and program
US6282316B1 (en) Image processing method and apparatus that use handwritten gestures for editing
JPH03214378A (en) Character recognizing device
JPH03214350A (en) &#39;bushu&#39; (common part which becomes mark for looking for character in chinese character dictionary, such as left-hand radical or the like) retrieving method
JPH11219409A (en) Document reader
Suchenwirth et al. Optical recognition of Chinese characters
JPH03214281A (en) Character recognizing device
JP2010157078A (en) Information processing apparatus and locus data recognition method
JP2976990B2 (en) Character recognition device
JP2893781B2 (en) Character recognition device
JPS61272882A (en) Information recognizing device
JPH03214379A (en) Character recognizing device
JPH07192081A (en) Handwritten character input device
JPS60217483A (en) Recognizer of character
JP2595399B2 (en) Document processing method
JPH0816571A (en) Kanji input device
JPH08297718A (en) Character segmentation device and character recognition device
JPH06195519A (en) Device and method for character recognition
JPS62190565A (en) Device for making fair copy of hand-written pattern
JPH03214287A (en) Character recognizing device
JPH0634258B2 (en) Handwritten character recognition device with personal dictionary creation function
JPH04270482A (en) Printing character recognition device
JP2953162B2 (en) Character recognition device
JPH0460881A (en) Picture generating device
JPH03214377A (en) Character recognizing device