JPH07105194A - Japanese syllabary-to-chinese character converting method - Google Patents

Japanese syllabary-to-chinese character converting method

Info

Publication number
JPH07105194A
JPH07105194A JP5249192A JP24919293A JPH07105194A JP H07105194 A JPH07105194 A JP H07105194A JP 5249192 A JP5249192 A JP 5249192A JP 24919293 A JP24919293 A JP 24919293A JP H07105194 A JPH07105194 A JP H07105194A
Authority
JP
Japan
Prior art keywords
code
character
kana
variant
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5249192A
Other languages
Japanese (ja)
Inventor
Ryohei Komiya
量平 小宮
Kozue Watanabe
こずえ 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP5249192A priority Critical patent/JPH07105194A/en
Publication of JPH07105194A publication Critical patent/JPH07105194A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To provide a KANA(Japanese syllabary)-KANJI(Chinese character) converting method having a method which reduces trouble in data exchange between different kinds of equipment. CONSTITUTION:In a code decision stage, a KANA-KANJI conversion dictionary is referred to for a character string to be converted to decide whether or not there are at least two different types to which the same code is assigned among type codes specifying types extracted as character candidates and, when the presence is cleared up, a desired different type is selected between the at least two different types specified with the type codes in a different type selection stage, and then a different type code specifying the selected different type is generated in a code generation stage.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、かな文字列に対してか
な漢字変換処理を施すかな漢字変換方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion method for performing kana-kanji conversion processing on a kana character string.

【0002】[0002]

【従来の技術】従来、日本語の漢字を取り扱うシステム
においては、ディジタルコンピュータの普及に伴い、漢
字の字体ごとに固有のコードが割り振られ、そのコード
を参照することにより、異機種間におけるデータ交換が
行われていた。また、前記固有のコードとしては、JI
Sコードと通称されるコード体系に基づくJISコード
漢字表が広く用いられている。このJISコード漢字表
は、常用漢字表などと同様に、その時代時代での社会的
通念に基づいて取り決められており、現在までに数度に
及ぶ改正が加えられている。
2. Description of the Related Art Conventionally, in a system for handling Japanese kanji, with the spread of digital computers, a unique code is assigned to each type of kanji, and data can be exchanged between different models by referring to the code. Was being done. Further, as the unique code, JI
A JIS code kanji table based on a code system commonly known as an S code is widely used. This JIS code kanji table, like the common kanji table, is arranged based on the social conventions of the times and has been revised several times to date.

【0003】また、字体は時代とともに変遷を繰り返し
ており、古来中国より伝来した字体の中には、現在では
人名や地名などの固有名称にのみ使用され、それ以外の
通常の文章の場合には変化した字体が使われる、いわゆ
る新、旧字体と呼ばれ区別される字体が数多く存在して
いる。更には、字体の区別をするために、正字、略字、
俗字と呼称される場合もあり、それらは混同して使用さ
れる場合もあるようであるが、用語の定義を明確にしよ
うとすると漢字の文化論的要素が強くなり、本論の主旨
を大きく逸脱するため、ここでは各用語は社会的通念に
基づいて定義されるものに準ずるものとする。
Further, the fonts have been changing with the times, and among the fonts introduced from China since ancient times, they are now used only for proper names such as personal names and place names, and in the case of other ordinary texts. There are many different typefaces, which are so-called new and old typefaces, in which changed fonts are used. Furthermore, in order to distinguish the fonts, regular characters, abbreviations,
It is sometimes called slang, and it seems that they are sometimes confused with each other, but when trying to clarify the definition of terms, the cultural element of kanji becomes stronger, and it deviates largely from the main point of this paper. Therefore, the terms used here are to be defined in accordance with social norms.

【0004】さて、上述のJISコード漢字表である
が、字体の中には旧JISコード漢字表と新JISコー
ド漢字表のいずれか一方にしか含まれないものがある。
これには例えば、図7に示した文字などがあるが、これ
らは各々JIS規格においては同値として取り扱われ、
同一のJISコードが割り振られることになっている。
また人名については、戸籍業務のコンピュータ化によ
り、「平成2年10月20日,法務省民二第5200
号,民事局長通達」により、訂正されない俗字、略字が
示されている。例えば、図8に示したような場合であ
る。これらの字体の多くはJISコード漢字表には含ま
れていない。
In the JIS code Chinese character table described above, some fonts are included in only one of the old JIS code Chinese character table and the new JIS code Chinese character table.
This includes, for example, the characters shown in FIG. 7, but these are treated as equivalent values in the JIS standard.
The same JIS code is to be assigned.
Also, regarding personal names, the computerization of family register work has led to "October 20, 1990, Ministry of Justice, Minji 5200".
No., Citizen Bureau Director's Notice ”shows uncorrected slang and abbreviations. For example, this is the case as shown in FIG. Many of these fonts are not included in the JIS code kanji table.

【0005】ところで、通常の文章においては、文字の
使用は使用者の文化的背景に基づいて使用されるべきで
あり、選択の余地のある場合、それぞれの好みで使用さ
れることとなる。しかしながら、地名や人名において
は、公文書の要素が強くなればなるほど定義された字体
そのものを使用しなくてはならない。従って、従来、図
7に示すような1つの漢字に対して複数の異体字が存在
する場合には、それらを区別するために、一方の字体に
JISコード表内のコードを割り振り、他方の字体に、
いわゆる外字領域のコードを割り振ることが行われてい
た。
By the way, in ordinary sentences, the use of characters should be based on the cultural background of the user, and if there is a choice, it will be used according to each preference. However, in place names and personal names, the stronger the elements of the official document, the more the defined typeface itself must be used. Therefore, conventionally, when there are a plurality of variants for one Chinese character as shown in FIG. 7, in order to distinguish them, one code is assigned a code in the JIS code table and the other To
The code of the so-called external character area was assigned.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上述し
たような従来の日本語の漢字を取り扱うシステムにおい
ては、外字領域のコードの割り振り方について特に規定
がなく、該システムの製造当事者の自由裁量に任されて
いるため、異機種間において同一コードに対して異なる
字体が割り振られたり、あるいは字体が定義されていな
かったりすることがあり、データ交換において障害とな
っていた。
However, in the conventional system for handling Japanese Kanji characters as described above, there is no particular regulation on how to allocate codes in the external character area, and the manufacturer of the system is left to the discretion. Therefore, different fonts may be assigned to the same code between different models, or the font may not be defined, which is an obstacle to data exchange.

【0007】本発明は、上述した問題点を鑑みてなされ
たものであり、異機種間のデータ交換における障害を軽
減させる方法を有するデータ変換方法を提供することを
目的としている。
The present invention has been made in view of the above-mentioned problems, and an object of the present invention is to provide a data conversion method having a method for reducing obstacles in data exchange between different models.

【0008】[0008]

【課題を解決するための手段】この目的を達成するため
に本発明のかな漢字変換方法は、変換対象となるかな文
字列に対してかな漢字変換辞書を参照し、字候補として
抽出した字体を指定する字体コードの中に、少なくとも
二つ以上の異体字に対して同じコードを割り当てたもの
が存在するか否かを判定するコード判定段階と、そのコ
ード判定段階により該存在が判明した字体コードにより
指定される少なくとも二つ以上の異体字の中から所望と
する異体字を選択する異体字選択段階と、その異体字選
択段階により選択された異体字を指定する異体字コード
を発生するコード発生段階とを有している。
In order to achieve this object, a kana-kanji conversion method of the present invention refers to a kana-kanji conversion dictionary for a kana character string to be converted, and specifies a character style extracted as a character candidate. Designated by a code determination step that determines whether or not there is a character code assigned the same code to at least two variant characters, and a font code whose existence is determined by the code determination step A variant character selecting step of selecting a desired variant character from at least two or more variant characters, and a code generating step of generating a variant character code designating the variant character selected by the variant character selecting step. have.

【0009】[0009]

【作用】上記の構成を有する本発明のかな漢字変換方法
は、コード判定段階において変換対象となるかな文字列
に対してかな漢字変換辞書を参照し、字候補として抽出
した字体を指定する字体コードの中に、少なくとも二つ
以上の異体字に対して同じコードを割り当てたものが存
在するか否かを判定し、存在が判明した場合、異体字選
択段階において該字体コードにより指定される少なくと
も二つ以上の異体字の中から所望とする異体字を選択
し、その後、コード発生段階において、選択された異体
字を指定する異体字コードを発生する。
According to the kana-kanji conversion method of the present invention having the above-mentioned structure, the kana-kanji conversion dictionary is referred to for the kana-character string to be converted in the code determination step, and the kana-kanji character code specified as a character candidate , It is determined whether or not there is at least two variant characters to which the same code is assigned, and if it is found, at least two or more specified by the variant code in the variant character selection stage. A desired variant character is selected from among the variant characters, and then a variant character code designating the selected variant character is generated at the code generation stage.

【0010】[0010]

【実施例】以下、本発明を具体化した実施例を図面を参
照して説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0011】スタンドアローン型、あるいは接続型を問
わず、一般的なコンピュータシステムは図2に示すよう
に、基本構成としてCPU1、ROM2、RAM3、キ
ーボード4、CRT5といった要素を備えており、前記
ROM2には、以降詳述する一連のかな漢字変換処理を
実行するための各種プログラム等が格納されている。
As shown in FIG. 2, a general computer system, regardless of whether it is a stand-alone type or a connection type, has elements such as a CPU 1, a ROM 2, a RAM 3, a keyboard 4 and a CRT 5 as a basic configuration. Stores various programs for executing a series of kana-kanji conversion processing described in detail below.

【0012】そして、CPU1がROM2に格納される
各種プログラムに従って、所定の処理動作を実行するこ
とにより、キーボード4から入力されたデータをCRT
5に表示し得るようになっている。
Then, the CPU 1 executes a predetermined processing operation in accordance with various programs stored in the ROM 2 so that the data input from the keyboard 4 is CRT.
5 can be displayed.

【0013】尚、オペレーティングシステムによって
は、例えば図示していない外部記憶装置に記憶されるプ
ログラムの全て、あるいは一部をRAM3上にロードし
て、CPU1に所定の動作をさせるものもあるが、本実
施例ではプログラムの動作に重点をおいて説明するた
め、その存在は問わないこととする。
Depending on the operating system, some or all of the programs stored in an external storage device (not shown) may be loaded on the RAM 3 to cause the CPU 1 to perform a predetermined operation. In the embodiments, the operation of the program will be mainly described, so that the existence thereof does not matter.

【0014】次に、本発明の第一の実施例におけるかな
漢字変換処理の流れを図1を参照して説明する。まず始
めに図3に示すかな文字列がキーボード4から入力さ
れ、かな区切り、形態素解析等の処理を繰り返した後、
「たか」の候補字を選択しようとする場合、S11にお
いて「たか」の読みを持つ候補字が、CRT5の画面上
において図4に示すようにユーザーに提示され、ユーザ
ーのキーの押し下げにより特定の漢字が選択される。
Next, the flow of kana-kanji conversion processing in the first embodiment of the present invention will be described with reference to FIG. First, the kana character string shown in FIG. 3 is input from the keyboard 4, and after processes such as kana division and morphological analysis are repeated,
When trying to select the candidate character of "taka", the candidate character having the reading of "taka" is presented to the user on the screen of the CRT 5 as shown in FIG. Kanji is selected.

【0015】次に、S12において選択された漢字の字
体コードに対応づけられた異体字存在フラグのON/O
FFの判定がなされる。尚、ここにおいて、異体字存在
フラグを設ける代わりにかな漢字変換辞書を再検索し
て、字体コード中に異体字が含まれるか否かの判定がな
されるようにしてもよい。そして、異体字存在フラグが
OFF、すなわち異体字が存在しないと判定された場
合、S16においてその字体を指定する字体コードの発
行を行って処理を終了する。
Next, ON / O of the variant character presence flag associated with the character code of the Chinese character selected in S12.
The FF is judged. Here, instead of providing the variant character existence flag, the kana-kanji conversion dictionary may be re-searched to determine whether or not the variant character is included in the character code. Then, if the variant character existence flag is OFF, that is, if it is determined that there is no variant character, a character type code designating the character type is issued in S16, and the process ends.

【0016】次に、異体字存在フラグがON、すなわち
異体字が存在すると判定された場合の動作について説明
すると、これは例えば図4に示す候補字のうち、1.の
番号が付された漢字が選択された場合に相当する。
Next, the operation when the variant character presence flag is ON, that is, when it is determined that a variant character is present, will be described. Among the candidate characters shown in FIG. This corresponds to the case where the Kanji with the number of is selected.

【0017】上記1.の候補字の選択により、S13に
おいて図5に示すように異体字の候補字の表示が行われ
る。そして、S14においてユーザーはキーの押し下げ
によって特定の漢字を選択し、その後S15において、
その漢字の字体を指定する字体コードおよび異体字コー
ドの発行を行い、処理を終了する。
The above 1. By selecting the candidate character of, the candidate character of the variant character is displayed in S13 as shown in FIG. Then, in S14, the user selects a particular Kanji by pressing the key, and then in S15,
A glyph code and a glyph code designating the glyph of the kanji is issued, and the process ends.

【0018】尚、以上の処理において例えばS11のと
ころで、図6に示すような異体字を含む候補字をユーザ
ーに提示して、その選択動作を促すようにしてもよい。
その動作の流れを本発明の第二の実施例として図9に示
す。ここでは図1に示すS13及びS14の処理が省か
れ、S15及びS16の処理は図1に示すものと同様で
ある。
In the above process, for example, at S11, a candidate character including a variant character as shown in FIG. 6 may be presented to the user to prompt the selection operation.
The flow of the operation is shown in FIG. 9 as the second embodiment of the present invention. Here, the processes of S13 and S14 shown in FIG. 1 are omitted, and the processes of S15 and S16 are the same as those shown in FIG.

【0019】次に、図10を用いて、本発明の第三の実
施例を説明する。この場合、S11の処理は図1に示す
第一の実施例における処理と同様であるが、その処理の
後、S17において、選択された字体の字体コードの発
行が行われる。そして、S12において、選択された漢
字の字体コードに対応づけられた異体字存在フラグのO
N/OFFの判定がなされる。ここで、例えば異体字存
在フラグを設ける代わりに、かな漢字変換辞書を再検索
して、字体コード中に異体字が含まれるかどうかの判定
がなされるようにしてもよい。その後、異体字が存在し
ないと判定された場合には、それをもって処理を終了す
る。
Next, a third embodiment of the present invention will be described with reference to FIG. In this case, the processing of S11 is the same as the processing in the first embodiment shown in FIG. 1, but after that processing, the font code of the selected font is issued in S17. Then, in S12, the O of the variant character presence flag associated with the character code of the selected Chinese character is set to O.
N / OFF judgment is made. Here, for example, instead of providing the variant character presence flag, the kana-kanji conversion dictionary may be searched again to determine whether or not the variant character is included in the character code. After that, when it is determined that there is no variant character, the processing ends with that.

【0020】また、異体字が存在すると判定された場合
には、S13およびS14の処理は第一の実施例と同様
の処理がなされ、その後S18において、選択された字
体を指定する異体字コードの発行をもって処理を終了す
る。
If it is determined that a variant character exists, the processes in S13 and S14 are the same as those in the first embodiment, and thereafter, in S18, the variant character code designating the selected character is designated. The process ends with the issue.

【0021】更には、例えば本発明の第4の実施例とし
て、異体字の種別コードを発行するか否かを設定し得る
ように構成し、その設定状態を異体字設定フラグのON
/OFFでもたせて、その判定を図11のS101に示
すように、S11とS12の間で行い、その判定結果に
基づいて異体字コードを発行するか否かを決定するよう
にしてもよい。
Further, for example, as a fourth embodiment of the present invention, it is configured so that it can be set whether or not to issue a variant code, and the setting state is set to ON for the variant character setting flag.
Alternatively, the determination may be made between S11 and S12 as shown in S101 of FIG. 11, and whether or not to issue the variant character code may be determined based on the determination result.

【0022】[0022]

【発明の効果】以上詳述したことから明らかなように、
本発明のかな漢字変換方法によれば、異機種間のデータ
交換における障害が軽減されることにより、多機種との
互換性に優れた装置を作ることが可能となり、また表
示、あるいは印字可能な字体の種類を増やすことができ
るため、文書等の作成がより容易になる。
As is clear from the above description,
According to the kana-kanji conversion method of the present invention, it is possible to make a device excellent in compatibility with multiple models by reducing obstacles in data exchange between different models, and to display or print fonts. Since it is possible to increase the number of types, it becomes easier to create documents and the like.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のかな漢字変換方法の第一の実施例を示
すフローチャートである。
FIG. 1 is a flowchart showing a first embodiment of a kana-kanji conversion method of the present invention.

【図2】一般的なコンピュータシステムの構成を示すブ
ロック図である。
FIG. 2 is a block diagram showing a configuration of a general computer system.

【図3】かな漢字変換がなされるかな文字列の例を示す
図である。
FIG. 3 is a diagram showing an example of a kana character string on which kana-kanji conversion is performed.

【図4】「たか」の読みを持つ候補字の表示例を示す図
である。
FIG. 4 is a diagram showing a display example of candidate characters having a pronunciation of “taka”.

【図5】「たか」の異体字の候補字の表示例を示す図で
ある。
FIG. 5 is a diagram showing a display example of candidate characters for variant characters of “Taka”.

【図6】「たか」の読みを持つ異体字を含んだ候補字の
表示例を示す図である。
FIG. 6 is a diagram showing a display example of candidate characters including variant characters having the pronunciation “taka”.

【図7】異体字の字体例を示す図である。FIG. 7 is a diagram showing an example of fonts of variant characters.

【図8】異体字の字体例を示す図である。FIG. 8 is a diagram showing an example of fonts of variant characters.

【図9】本発明の第二の実施例の動作を示すフローチャ
ートである。
FIG. 9 is a flowchart showing the operation of the second embodiment of the present invention.

【図10】本発明の第三の実施例の動作を示すフローチ
ャートである。
FIG. 10 is a flowchart showing the operation of the third embodiment of the present invention.

【図11】本発明の第四の実施例の動作を示すフローチ
ャートである。
FIG. 11 is a flowchart showing the operation of the fourth embodiment of the present invention.

【符号の説明】 1 CPU 2 ROM 3 RAM 4 キーボード 5 CRT[Explanation of reference numerals] 1 CPU 2 ROM 3 RAM 4 keyboard 5 CRT

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 かな文字列に対してかな漢字変換処理を
施すかな漢字変換方法において、 変換対象となるかな文字列に対してかな漢字変換辞書を
参照し、字候補として抽出した字体を指定する字体コー
ドの中に、少なくとも二つ以上の異体字に対して同じコ
ードを割り当てたものが存在するか否かを判定するコー
ド判定段階と、 そのコード判定段階により該存在が判明した字体コード
により指定される少なくとも二つ以上の異体字の中から
所望とする異体字を選択する異体字選択段階と、 その異体字選択段階により選択された異体字を指定する
異体字コードを発生するコード発生段階とを有すること
を特徴とするかな漢字変換方法。
1. A kana-kanji conversion method for performing kana-kanji conversion processing on a kana-character string, by referring to a kana-kanji conversion dictionary for the kana-character string to be converted and designating a character style code that specifies a character style extracted as a character candidate. There is a code determination step for determining whether or not there is at least two variant characters to which the same code is assigned, and at least a font code whose existence is determined by the code determination step is designated by at least It has a variant selecting step of selecting a desired variant from two or more variants, and a code generating step of generating a variant code designating the variant selected by the variant selecting step. A kana-kanji conversion method characterized by.
JP5249192A 1993-10-05 1993-10-05 Japanese syllabary-to-chinese character converting method Pending JPH07105194A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5249192A JPH07105194A (en) 1993-10-05 1993-10-05 Japanese syllabary-to-chinese character converting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5249192A JPH07105194A (en) 1993-10-05 1993-10-05 Japanese syllabary-to-chinese character converting method

Publications (1)

Publication Number Publication Date
JPH07105194A true JPH07105194A (en) 1995-04-21

Family

ID=17189274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5249192A Pending JPH07105194A (en) 1993-10-05 1993-10-05 Japanese syllabary-to-chinese character converting method

Country Status (1)

Country Link
JP (1) JPH07105194A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method
CN113103769A (en) * 2020-01-09 2021-07-13 精工爱普生株式会社 Printing apparatus and control method of printing apparatus

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method
CN113103769A (en) * 2020-01-09 2021-07-13 精工爱普生株式会社 Printing apparatus and control method of printing apparatus
US11232334B2 (en) 2020-01-09 2022-01-25 Seiko Epson Corporation Printing device and control method for printing device
CN113103769B (en) * 2020-01-09 2022-08-30 精工爱普生株式会社 Printing apparatus and control method of printing apparatus

Similar Documents

Publication Publication Date Title
KR100330801B1 (en) Language identifiers and language identification methods
US5873111A (en) Method and system for collation in a processing system of a variety of distinct sets of information
US5187480A (en) Symbol definition apparatus
US5835924A (en) Language processing apparatus and method
US6771267B1 (en) Merging digital fonts
KR100757372B1 (en) Database system and its handling method for ideogram
JPH07105194A (en) Japanese syllabary-to-chinese character converting method
JPH10301922A (en) Command input method, command input method in the case of inputting character by using software for kana/kanji conversion, and computer readable recording medium recorded with program for executing the method by computer
JP3071703B2 (en) Table creation apparatus and method
JP3398729B2 (en) Automatic keyword extraction device and automatic keyword extraction method
JPH10320399A (en) Language identification device and method therefor and recording medium for recording program of language identification
JPH08263482A (en) Font managing device
JPH07105205A (en) Data converting device
JPH06203018A (en) Document processor
JPH0115105B2 (en)
JP3713747B2 (en) Single kanji conversion device
JPH11203279A (en) Kana-kanji conversion device and method and storage medium
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPS62202259A (en) Documentation device
Engström Internationalisation and Localisation Problems in the Chinese and Arabic Scripts
JPS63128424A (en) Data processing system
JPH06231123A (en) External character processor
JPH04199358A (en) Document processor
JPH0778133A (en) Document preparing device and method for outputting character pattern
JPH01318156A (en) Document processor