JP2001216297A - Kana/kanji conversion and single kanji conversion device - Google Patents

Kana/kanji conversion and single kanji conversion device

Info

Publication number
JP2001216297A
JP2001216297A JP2000023486A JP2000023486A JP2001216297A JP 2001216297 A JP2001216297 A JP 2001216297A JP 2000023486 A JP2000023486 A JP 2000023486A JP 2000023486 A JP2000023486 A JP 2000023486A JP 2001216297 A JP2001216297 A JP 2001216297A
Authority
JP
Japan
Prior art keywords
character
kana
kanji
kanji conversion
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000023486A
Other languages
Japanese (ja)
Inventor
Makoto Hattori
誠 服部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CCE KK
Original Assignee
CCE KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CCE KK filed Critical CCE KK
Priority to JP2000023486A priority Critical patent/JP2001216297A/en
Publication of JP2001216297A publication Critical patent/JP2001216297A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a Kana (Japanese syllabary)/Kanji (Chinese character) conversion and single Kanji conversion device provided with a means for replacing Kanji unprintable since the type is not defined in code to a character for which the type is defined in code and displaying it. SOLUTION: When a variant character reference flag is attached in the candidate character string of Kana/Kanji conversion and single Kanji conversion, whether or not a pertinent character is present in a type data storage means is inquired. In the case that the pertinent character is present, the pertinent character is replaced with a variant character present in the type data storage means and displayed. In the case that the pertinent character is not present in the type data storage means, it is replaced with the road of the Kanji to which the variant character reference flag is attached and displayed.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明が属する技術分野】本発明は、日本語ワードプロ
セッサやコンピュータの日本語処理部に使用される仮名
漢字変換および単漢字変換装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion system and a single-kanji conversion system used in a Japanese word processor and a Japanese processing unit of a computer.

【0002】[0002]

【従来の技術】従来、日本語の漢字を扱うシステムにお
いては、漢字の字形ごとに固有のコードを割り当てて、
そのコードを参照することによって、表示、文書作成、
印刷などが行われていた。また、ディジタルコンピュー
タの普及に伴い、異機種間におけるデータ交換が行われ
ていた。さらには、上述のコードとして、JISコード
と通称されるコード体系に基づくJISコード漢字表が
広く用いられていた。このJISコード漢字表は、その
時代時代での社会的通念に基づいて取り決められてお
り、現在までに数度の改正が加えられていた。しかし、
JISコード漢字表に掲載されている字形は漢和辞典の
字と異なっていたり、人名で使われる字形が存在しなか
ったりした。この様な場合、使用者はJISコード表内
のコードを割り振って、いわゆる外字を作成し、必要な
字形を使用していた。
2. Description of the Related Art Conventionally, in a system handling Japanese kanji, a unique code is assigned to each kanji glyph.
By referencing that code, you can view, document,
Printing etc. were performed. Further, with the spread of digital computers, data exchange between different models has been performed. Further, as the above-mentioned code, a JIS code kanji table based on a code system commonly called a JIS code has been widely used. This JIS code kanji table has been negotiated based on social wisdom in the era, and has been revised several times to date. But,
The glyphs in the JIS code kanji table differed from those in the Kanji dictionary, and there were no glyphs used in personal names. In such a case, the user allocates a code in the JIS code table to create a so-called external character and uses a necessary character shape.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上述し
たような従来の日本語の漢字を扱うシステムでは、外字
領域のコードの割り振り方について特に規定が無く、日
本語漢字システムの製造当事者の自由裁量に任されてい
るため、プリンタなどの出力装置においてコードに字形
が定義されていないと印字されないというような障害が
あった。本発明ではこの問題点を解決するために、あら
かじめCRTなどの表示装置に出力装置で印字可能な文
字に置き換えて表示する手段を有する仮名漢字変換およ
び単漢字変換装置を提供することを目的としている。
However, in the conventional system for handling Japanese kanji as described above, there is no particular rule on how to assign codes for the external character area, and the Japanese kanji system manufacturer has no discretion. Therefore, there is a problem that printing is not performed unless a character shape is defined in a code in an output device such as a printer. In order to solve this problem, an object of the present invention is to provide a kana-kanji conversion device and a single-kanji conversion device having means for previously displaying characters on a display device such as a CRT by replacing the characters with printable characters on an output device. .

【0004】[0004]

【課題を解決するための手段】この目的を達成するため
に、本発明の仮名漢字変換および単漢字変換装置は、
(a)入力された仮名文字列と読みが一致する変換候補
群を辞書から検索する検索手段と、(b)漢字の部首ま
たは画数から該当する変換候補群を辞書から検索する検
索手段と、(c)手書き文字から文字パターンが一致す
る変換候補群を辞書から検索する検索手段とを備え、漢
字の字形データを格納する字形データ格納手段と、漢字
の仮名データを格納する仮名データ格納手段と、前記検
索手段の結果に基づき、文字を出力させるための字形デ
ータまたは仮名データを表示する表示手段とを備える仮
名漢字変換および単漢字変換装置において、その文字に
対して異体字が存在するか否かを示すフラグを有する仮
名漢字変換および単漢字変換用辞書と、その仮名漢字変
換および単漢字変換用辞書による仮名漢字変換および単
漢字変換結果に異体字が存在する場合、その字形データ
が字形データ格納手段中に存在するか否かを問い合せる
問い合せ手段と、その問い合せ手段により、(イ)前記
字形データ格納手段中に前記異体字の字形データが存在
することが確認された場合、それを抽出する字形抽出手
段と、前記仮名漢字変換および単漢字変換結果中の異体
字が存在する文字の字形データと前記字形抽出手段によ
り抽出された異体字の字形データとを置き換える異体字
置換手段と、(ロ)前記字形データ格納手段中に前記異
体字の字形データが存在しないことが確認された場合、
前記仮名データ格納手段中より仮名データを抽出する仮
名抽出手段と、前記仮名漢字変換および単漢字変換結果
中の異体字が存在する文字の字形データと前記仮名抽出
手段により抽出された該漢字の仮名データとを置き換え
る異体字置換手段を備えている。
In order to achieve this object, a kana-kanji conversion device and a single-kanji conversion device according to the present invention are provided.
(A) search means for searching a dictionary for a group of conversion candidates whose pronunciation matches the input kana character string; (b) search means for searching the dictionary for a group of conversion candidates corresponding to the radical or stroke count of kanji; (C) character shape data storage means for storing kanji character shape data, and kana data storage means for storing kanji kana data; A kana-kanji conversion / single-kanji conversion device including a display unit for displaying character shape data or kana data for outputting characters based on the result of the search unit. The Kana-Kanji conversion and Kana-Kanji conversion dictionary with a flag indicating whether the Kana-Kanji conversion and Kana-Kanji conversion are different. When there is a character, an inquiry means for inquiring whether or not the character data exists in the character data storage means, and (a) the character data of the variant character is present in the character data storage means by the inquiry means. If it is confirmed, the character shape extracting means for extracting the character, the character shape data of the character having the variant character in the result of the kana-kanji conversion and the single kanji conversion, and the character shape of the variant character extracted by the character shape extracting device (B) when it is confirmed that the character data of the variant does not exist in the character data storage means;
Kana extraction means for extracting kana data from the kana data storage means, character shape data of a character having a variant character in the kana kanji conversion and single kanji conversion results, and the kana of the kanji extracted by the kana extraction means A variant character replacement means for replacing data is provided.

【0005】[0005]

【作用】上記構成を有する本発明の仮名漢字変換および
単漢字変換装置において、検索手段により仮名文字列の
「たかぎ」と読みが一致する変換候補が検索され、図4
に示す文字列を確定しようとするとき、図4に示す文字
列の中の図5に示す文字に異体字有りの情報が付いてい
ると、問い合せ手段により仮名漢字変換とともに用いら
れる字形データ格納手段が図5に示す文字の異体字の字
形データを持っているかどうかを問い合せ、図5に示す
文字の異体字の字形データの存在が確認されると、字形
抽出手段によりそれを抽出し、異体字置換手段により図
4に示す文字列の中の図5に示す文字を置き換えた「高
木」を出力する指示を出す。
In the kana-kanji conversion and single-kanji conversion apparatus of the present invention having the above structure, the search means searches the kana-kanji character string "takagi" for a conversion candidate whose reading matches that of FIG.
When the character string shown in FIG. 4 is to be determined, if the character shown in FIG. 5 in the character string shown in FIG. Is inquired as to whether or not it has the character data of the variant of the character shown in FIG. 5, and if the existence of the character data of the variant of the character shown in FIG. 5 is confirmed, it is extracted by the character shape extracting means, and the variant character is extracted. An instruction to output “Takagi” by replacing the character shown in FIG. 5 in the character string shown in FIG. 4 by the replacing means is issued.

【0006】また、上記構成を有する本発明の仮名漢字
変換および単漢字変換装置において図7に示す文字を表
示するために、検索手段により部首「さんずい」から変
換候補が検索され、その文字を確定しようとするとき、
図7に示す文字に異体字有りの情報が付いていると、問
い合せ手段により単漢字変換とともに用いられる字形デ
ータ格納手段が図7に示す文字の異体字の字形データを
持っているかどうかを問い合せ、図7に示す文字の異体
字の字形データが存在しないことが確認されると、仮名
抽出手段に図7に示す文字の仮名を抽出し、仮名置換手
段により図7に示す文字を「あい」と置き換えて出力す
る指示を出す。
Further, in order to display the characters shown in FIG. 7 in the kana-kanji conversion and single kanji conversion apparatus of the present invention having the above-described configuration, a conversion candidate is searched from the radical "sanzui" by a search means, and the characters are searched. When trying to finalize,
If the character shown in FIG. 7 has information indicating that there is a variant character, the query means inquires whether the character shape data storage means used together with the single kanji conversion has the character shape data of the character variant shown in FIG. When it is confirmed that the character data of the variant of the character shown in FIG. 7 does not exist, the kana of the character shown in FIG. 7 is extracted by the kana extracting means, and the character shown in FIG. Give instructions to replace and output.

【0007】[0007]

【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings.

【0008】図2は本実施例の文書処理装置の構成を示
すブロック図であり、文書処理装置は、入力装置10
と、CRTなどの表示装置20と、作成した文書の保存
などに使用する補助記憶装置40と、制御装置30とか
ら構成されている。制御装置30は、全体的プログラム
を制御するCPU31と、ここでの制御処理プログラム
が記憶されるROM32と、ワーキング用のRAM33
と、入力装置10・表示装置20・補助記憶装置40と
CPU31とのデータ交換のための入出力インターフェ
ース(I/O)34と、バスライン35とを備えてい
る。
FIG. 2 is a block diagram showing the configuration of the document processing apparatus according to the present embodiment.
, A display device 20 such as a CRT, an auxiliary storage device 40 used for storing created documents, and the like, and a control device 30. The control device 30 includes a CPU 31 for controlling the overall program, a ROM 32 for storing the control processing program here, and a working RAM 33.
And an input / output interface (I / O) 34 for data exchange between the input device 10, the display device 20, the auxiliary storage device 40, and the CPU 31, and a bus line 35.

【0009】入力装置10、表示装置20、補助記憶装
置40は(I/O)34で制御装置30と接続してい
る。また、制御装置30内の、ROM32と、RAM3
3と、(I/O)34とはバスライン35により、全体
的プログラムを制御するCPU31と接続している。R
OM32中には異体字参照フラグならびに仮名参照フラ
グが付与された辞書32a、および字形データ32b、
および仮名データ32cが記憶されている。RAM33
中には処理結果保存領域33aが存在する。
The input device 10, the display device 20, and the auxiliary storage device 40 are connected to the control device 30 via (I / O) 34. Also, the ROM 32 and the RAM 3 in the control device 30
3 and (I / O) 34 are connected by a bus line 35 to a CPU 31 that controls the entire program. R
In the OM 32, a dictionary 32a to which a variant character reference flag and a kana reference flag are added, and character shape data 32b,
And pseudonym data 32c are stored. RAM33
Inside there is a processing result storage area 33a.

【0010】図3は辞書32aおよび異体字参照フラグ
の構成例である。その構成としては仮名漢字変換時に入
力文字列と参照させるために使用する《読み》と、部首
による単漢字変換時に該部首名と参照させるために使用
する《部首》と、画数による単漢字変換時に該画数と参
照させるために使用する《画数》と、文字パターンが一
致する漢字に変換する時に入力手書き文字と参照させる
ために使用する《手書》と、これらの変換時の出力候補
である《表記》と、《表記》の各文字について異体字が
存在する可能性があることを示す《異体字参照フラグ》
がある。
FIG. 3 shows a configuration example of the dictionary 32a and the variant character reference flag. The composition is "reading" used to refer to the input character string during kana-kanji conversion, "radical" used to refer to the radical name when converting to single kanji by radical, and The "number of strokes" used to refer to the number of strokes during kanji conversion, the "handwriting" used to refer to input handwritten characters when converting to kanji with a matching character pattern, and output candidates for these conversions <Notation> and <notation> indicate that there is a possibility that a variant character exists for each character.
There is.

【0011】次に本発明を使用した仮名漢字変換および
単漢字変換を図4、図5、図6、図7、図8を参照して
説明する。
Next, kana-kanji conversion and single-kanji conversion using the present invention will be described with reference to FIGS. 4, 5, 6, 7, and 8. FIG.

【0012】まず始めに、「たかぎ」と入力し(S0
1)、図4に示す文字に変換する(S02)。この文字
は異体字参照フラグを持つので(S03;Y)、問い合
せ手段により字形データに図5に示す文字の異体字が存
在するかどうかを問い合せる(S04)。字形データに
異体字が存在すると(S05;Y)、字形抽出手段は図
5に示す文字の異体字「高」を抽出し、図4に示す文字
列の中の図5に示す文字と「高」とを置き換えて(S0
8)、「高木」と表示する(S10)。もし仮名漢字変
換結果に異体字参照フラグをもつ字が存在しなければ
(S03;N)、もとの図4に示す文字列のまま表示す
る。
First, "takagi" is input (S0
1), it is converted into the character shown in FIG. 4 (S02). Since this character has a variant character reference flag (S03; Y), the inquiry means inquires whether the variant data of the character shown in FIG. 5 exists in the character data (S04). If there is a variant character in the character data (S05; Y), the character shape extracting means extracts the variant character "high" of the character shown in FIG. 5 and the character shown in FIG. To (S0
8) "Takagi" is displayed (S10). If there is no character having the variant character reference flag in the kana-kanji conversion result (S03; N), the character string shown in FIG. 4 is displayed as it is.

【0013】また、図6に示す文字列を得るために、図
6に示す文字列の中の図7に示す文字の部首「さんず
い」から検索を行い(S01)、図7に示す文字に変換
する(S02)。この文字は異体字参照フラグを持つの
で(S03;Y)、問い合せ手段により字形データに図
7に示す文字の異体字が存在するかどうかを問い合せる
(S04)。字形データに異体字が存在しないので(S
05;N)、仮名抽出手段は図7に示す文字の仮名「あ
い」を抽出し、図6に示す文字列の中の図7に示す文字
と仮名「あい」とを置き換えて(S09)、文字列「あ
い川」と表示する(S10)。
In addition, in order to obtain the character string shown in FIG. 6, a search is performed from the radical "sanzui" of the character shown in FIG. 7 in the character string shown in FIG. 6 (S01), and the character string shown in FIG. Conversion is performed (S02). Since this character has a variant character reference flag (S03; Y), the inquiry means inquires whether the variant data of the character shown in FIG. 7 exists in the character data (S04). Since there is no variant character in the glyph data (S
05; N), the kana extraction means extracts the kana “ai” of the character shown in FIG. 7 and replaces the character shown in FIG. 7 in the character string shown in FIG. 6 with the kana “ai” (S09), The character string "Aikawa" is displayed (S10).

【0014】[0014]

【発明の効果】本発明では、コードに字形が定義されて
いないため印字不可能な漢字を、コードに字形が定義さ
れている異体字に置き換え、また異体字が無い場合は仮
名に置き換えて表示することが可能である。
According to the present invention, kanji characters that cannot be printed because the character shape is not defined in the code are replaced with variant characters whose character shape is defined in the code, and if there is no variant character, they are replaced with kana and displayed. It is possible to

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の仮名漢字変換および単漢字変換装置を
示すブロック図。
FIG. 1 is a block diagram showing a kana-kanji conversion and single kanji conversion device of the present invention.

【図2】本発明の仮名漢字変換および単漢字変換装置の
構成をを具体化した一実施例を示すブロック図。
FIG. 2 is a block diagram showing an embodiment embodying the configuration of the kana-kanji conversion and single kanji conversion device of the present invention.

【図3】本発明に使用される辞書の構成例を示す図。FIG. 3 is a diagram showing a configuration example of a dictionary used in the present invention.

【図4】使用者が希望する「たかぎ」の字形を示す図。FIG. 4 is a diagram showing a character shape of “takagi” desired by a user.

【図5】「たか(い)」の漢字の字形を示す図。FIG. 5 is a diagram showing a kanji character form of “taka”.

【図6】「あい」の漢字の字形を示す図。FIG. 6 is a diagram showing a kanji character shape of “Ai”.

【図7】使用者が希望する「あいかわ」の字形を示す
図。
FIG. 7 is a view showing a character shape of “Aikawa” desired by a user.

【図8】本実施例における異体字置き換え処理および仮
名置き換え処理を示すフローチャート。
FIG. 8 is a flowchart showing variant character replacement processing and kana replacement processing in the present embodiment.

【符号の説明】[Explanation of symbols]

10 入力装置 20 表示装置 30 制御装置 40 補助記憶装置 Reference Signs List 10 input device 20 display device 30 control device 40 auxiliary storage device

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 所望する漢字を得るための手段として、
(a)入力された仮名文字列と読みが一致する変換候補
群を辞書から検索する検索手段と、(b)漢字の部首ま
たは画数から該当する変換候補群を辞書から検索する検
索手段と、(c)手書き文字から文字パターンが一致す
る変換候補群を辞書から検索する検索手段とを備え、漢
字の字形データを格納する字形データ格納手段と、漢字
の仮名データを格納する仮名データ格納手段と、前記検
索手段の結果に基づき、文字を出力させるための字形デ
ータまたは仮名データを表示する表示手段とを備える仮
名漢字変換および単漢字変換装置において、その文字に
対して異体字が存在するか否かを示すフラグを有する仮
名漢字変換および単漢字変換用辞書と、その仮名漢字変
換および単漢字変換用辞書による仮名漢字変換および単
漢字変換結果に異体字が存在する場合、その字形データ
が字形データ格納手段中に存在するか否かを問い合せる
問い合せ手段と、その問い合せ手段により、(イ)前記
字形データ格納手段中に前記異体字の字形データが存在
することが確認された場合、それを抽出する字形抽出手
段と、前記仮名漢字変換および単漢字変換結果中の異体
字が存在する文字の字形データと前記字形抽出手段によ
り抽出された異体字の字形データとを置き換える異体字
置換手段と、(ロ)前記字形データ格納手段中に前記異
体字の字形データが存在しないことが確認された場合、
前記仮名データ格納手段中より仮名データを抽出する仮
名抽出手段と、前記仮名漢字変換および単漢字変換結果
中の異体字が存在する文字の字形データと前記仮名抽出
手段により抽出された該漢字の仮名データとを置き換え
る異体字置換手段を備えたことを特徴とする仮名漢字変
換および単漢字変換装置。
1. A means for obtaining a desired kanji,
(A) search means for searching a dictionary for a group of conversion candidates whose pronunciation matches the input kana character string; (b) search means for searching the dictionary for a group of conversion candidates corresponding to the radical or stroke count of kanji; (C) character shape data storage means for storing kanji character shape data, and kana data storage means for storing kanji kana data; A kana-kanji conversion / single-kanji conversion device including a display unit for displaying character shape data or kana data for outputting a character based on the result of the search unit. The Kana-Kanji conversion and Kana-Kanji conversion dictionary with a flag indicating whether the Kana-Kanji conversion and Kana-Kanji conversion are different. When there is a character, an inquiry means for inquiring whether or not the character data exists in the character data storage means, and (a) the character data of the variant character is present in the character data storage means by the inquiry means. If it is confirmed that the character shape data is extracted, character shape data of a character having a variant character in the result of the kana-kanji conversion and the single kanji conversion and the character shape of the variant character extracted by the character shape extraction device (B) when it is confirmed that the character data of the variant does not exist in the character data storage means;
Kana extraction means for extracting kana data from the kana data storage means, character shape data of a character having a variant character in the kana kanji conversion and single kanji conversion results, and the kana of the kanji extracted by the kana extraction means A kana-kanji conversion device and a single-kanji conversion device, comprising variant character replacement means for replacing data.
JP2000023486A 2000-02-01 2000-02-01 Kana/kanji conversion and single kanji conversion device Pending JP2001216297A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000023486A JP2001216297A (en) 2000-02-01 2000-02-01 Kana/kanji conversion and single kanji conversion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000023486A JP2001216297A (en) 2000-02-01 2000-02-01 Kana/kanji conversion and single kanji conversion device

Publications (1)

Publication Number Publication Date
JP2001216297A true JP2001216297A (en) 2001-08-10

Family

ID=18549639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000023486A Pending JP2001216297A (en) 2000-02-01 2000-02-01 Kana/kanji conversion and single kanji conversion device

Country Status (1)

Country Link
JP (1) JP2001216297A (en)

Similar Documents

Publication Publication Date Title
US5784071A (en) Context-based code convertor
US5682158A (en) Code converter with truncation processing
KR100330801B1 (en) Language identifiers and language identification methods
KR100661173B1 (en) Print having a direct printing function and printing method thereof
US20060217959A1 (en) Translation processing method, document processing device and storage medium storing program
JP4451908B2 (en) Unicode converter
JP2012190314A (en) Image processing device and program
JP2001216297A (en) Kana/kanji conversion and single kanji conversion device
JP2943791B2 (en) Language identification device, language identification method, and recording medium recording language identification program
JP7180076B2 (en) External character search program and external character search device
JPH07105201A (en) Japanese syllabary to chinese character converting device
JPH07105194A (en) Japanese syllabary-to-chinese character converting method
JPH09288664A (en) Character code conversion device
Liu Chinese information processing
JP2000057132A (en) Character data processor and program recording medium therefor
JPS62202259A (en) Documentation device
JP2000057131A (en) Character string converting device and program recording medium therefor
JPS605470B2 (en) typesetting system
JPH087747B2 (en) Kana-Kanji mutual conversion device
JPH02288948A (en) Document output device with adjunct
JPH07101115A (en) Printer
JPH04199358A (en) Document processor
JPH01318156A (en) Document processor
JPH11191107A (en) Method and device for processing document
JPH06131329A (en) Japanese language character processor