JPH03282961A - Mutual conversion dictionary system - Google Patents

Mutual conversion dictionary system

Info

Publication number
JPH03282961A
JPH03282961A JP2084409A JP8440990A JPH03282961A JP H03282961 A JPH03282961 A JP H03282961A JP 2084409 A JP2084409 A JP 2084409A JP 8440990 A JP8440990 A JP 8440990A JP H03282961 A JPH03282961 A JP H03282961A
Authority
JP
Japan
Prior art keywords
kanji
conversion
kana
character string
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2084409A
Other languages
Japanese (ja)
Inventor
Koichi Hayasaka
公一 早坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Home Electronics Ltd
NEC Corp
Original Assignee
NEC Home Electronics Ltd
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Home Electronics Ltd, Nippon Electric Co Ltd filed Critical NEC Home Electronics Ltd
Priority to JP2084409A priority Critical patent/JPH03282961A/en
Publication of JPH03282961A publication Critical patent/JPH03282961A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To save a memory resource necessary for conversion by providing the mutual conversion dictionary system with double structure capable of retrieving the 'KANA' (Japanese syllabary) reading of a 'KANJI' (Chinese character) character string simultaneously with the conversion of the 'KANJI' character string from a 'KANA' character string. CONSTITUTION:A 'KANA' character string is inputted or a 'KANJI' character string to be reconverted is specified through a Japanese editor. Whether a character string type set up in a conversion buffer is a 'KANA' character type or a 'KANJI' character type is discriminated, and in the case of 'KANA' character type, 'KANJI' retrieval is executed by 'KANJI' processing and converted candidates are obtained. In the case of 'KANJI' character type, the 'KANA' reading is retrieved to obtain converted candidates. Respective converted candidates are outputted to a 'KANJI' character string or a 'KANA' character string by the Japanese editor. Since 'KANJI' conversion or 'KANA' reading conversion can be selected at the time of conversion, the using efficiency of a memory can be improved.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な相互変換辞書方式に関する。
[Detailed Description of the Invention] Industrial Field of Application The present invention relates to a mutual conversion dictionary system that is capable of searching for Kanji character strings from Kana character strings and conversely searching for readings from Kanji character strings. .

また、相互の検索が可能なことから、英訳、和訳など語
学辞書としての機能を有する相互変換辞書方式に厨する
In addition, since mutual searches are possible, a mutual conversion dictionary system that functions as a language dictionary such as English translation and Japanese translation will be developed.

従来の技術 従来のかな漢字変換辞書方式においては、かな文字列か
ら漢字文字列を検索することのみに利用される辞書構造
となっている。
BACKGROUND OF THE INVENTION Conventional kana-kanji conversion dictionary systems have a dictionary structure that is used only to search for kanji character strings from kana character strings.

また、漢字文字列の再変換機能においては、はじめに漢
字文字列に変換した後も、元のかな文字列情報がメモリ
に残っていて、再びかな文字列から漢字文字列に変換す
るというような構造になっている。
In addition, the reconversion function for kanji strings has a structure in which the original kana string information remains in memory even after it is first converted to a kanji string, and the kana string is converted back to a kanji string. It has become.

発明が解決しようとする課題 上述した変換辞書方式において、一方向の検索辞書とし
てしか使用されず、再変換機能においても、かな文字列
情報が残っていることがら、メモリ効率が非常に悪い。
Problems to be Solved by the Invention In the conversion dictionary system described above, it is used only as a one-way search dictionary, and even in the re-conversion function, kana character string information remains, resulting in very poor memory efficiency.

従って、漢字文字列とがな文字列の相互の検索を可能に
することが望ましいが、このためには、それぞれ別々の
辞書を使用しなければならず、辞書メモリサイズが約2
倍に膨れるという問題点がある。
Therefore, it is desirable to be able to search between Kanji strings and Gana strings, but this requires the use of separate dictionaries for each, and the dictionary memory size is approximately 2.
The problem is that it doubles.

本発明は、かかる点に鑑みてなされたもので、その目的
とするところは、かな漢字変換辞書における仕様拡張と
ともに、メモリ効率の向上を実現する相互変換辞書方式
を提供することにある。
The present invention has been made in view of these points, and its purpose is to provide a mutual conversion dictionary system that realizes expansion of specifications in a kana-kanji conversion dictionary and improvement of memory efficiency.

課題を解決するための手段 本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な二重構造を有し、ほぼ一つ分のメモリサイズで上記
二種類の構造をもつ変換辞書を有した構成としている。
Means for Solving the Problems The present invention has a dual structure in which it is possible to search for Kanji character strings from Kana character strings and conversely to search readings from Kanji character strings. The configuration has a conversion dictionary having the above two types of structures with a memory size of 10 minutes.

実施例 以下、本発明を一実施例に従って説明する。Example Hereinafter, the present invention will be explained according to one embodiment.

まず、本発明と従来の技術とをフローチャート図を使っ
て比較する。
First, the present invention and the conventional technology will be compared using flowcharts.

第5図は、従来のかな漢字変換方式のフローチャート図
で、先ずステップ(11)において、日本語エディタで
様々なキー人力を行なう。
FIG. 5 is a flowchart of the conventional kana-kanji conversion method. First, in step (11), various key operations are performed using a Japanese editor.

次に、かな文字を入力しくステップ(12)) 、変換
用バッファにかな文字コードをセットする(ステップ(
13))。さらに再変換用バッファにかな文字コードを
セット(ステップ(14)) L、次いでステップ(1
5)の日本語変換処理を経て、漢字辞書検索を行ない、
変換候補を得た(ステップ(16))後に、日本語エデ
ィタにより、その候補の漢字コードから漢字文字列を出
力する(ステップ(17))。
Next, input kana characters (step (12)) and set the kana character code in the conversion buffer (step (12)).
13)). Furthermore, set the kana character code in the reconversion buffer (step (14)) L, then step (1
After the Japanese conversion process in 5), a kanji dictionary search is performed,
After obtaining a conversion candidate (step (16)), the Japanese editor outputs a kanji character string from the kanji code of the candidate (step (17)).

第6図は従来の漢字文字列再変換方式のフローチャート
図で、第5図に示す処理により漢字に変換した文字列が
、ステップ(21)の日本語エディタ上に表示されてい
る。ここで、ステップ(22)で再変換すべき漢字文字
列を指定して、ステップ(24)で指定した漢字文字列
に対するかな文字コードがバッファに存在するかをチエ
ツクし、なければ、ステップ(23)でエラー表示をし
、始めに戻る。
FIG. 6 is a flowchart of a conventional kanji character string reconversion method, in which a character string converted into kanji by the process shown in FIG. 5 is displayed on the Japanese editor in step (21). Here, in step (22), specify the kanji string to be reconverted, and in step (24), check whether the kana character code for the specified kanji string exists in the buffer. If not, in step (23) ) to display an error message and return to the beginning.

一方、対応するかな文字コードがあれば、ステップ(2
5)で変換用バッファにかな文字コードをセットする。
On the other hand, if there is a corresponding kana character code, step (2)
Step 5) Set the kana character code in the conversion buffer.

次の処理リステップ(26)、(27)、(28)につ
いては、通常の変換と全く同処理を行う。
Regarding the next processing steps (26), (27), and (28), exactly the same processing as the normal conversion is performed.

このように、従来の技術では再変換しようとする際に、
再変換用のかな文字バッファが必要となり、またこの文
字バッファに対応するかな文字コードがなければ再変換
不可能となる。
In this way, when trying to reconvert with conventional technology,
A kana character buffer is required for reconversion, and if there is no kana character code corresponding to this character buffer, reconversion will not be possible.

従って、全ての漢字文字列に対して再変換可能状態にす
るためには、極めて多くのメモリを必要とし、限られメ
モリ資源の有効活用という観点からすると、非常に非効
率的な方法となるという問題点がある。
Therefore, in order to make it possible to reconvert all kanji character strings, an extremely large amount of memory is required, and from the perspective of effective use of limited memory resources, this method is extremely inefficient. There is a problem.

そこで本発明では、第3図にフローチャート図で示すよ
うな相互変換辞書方式を用いて日本語変換を行うもので
ある。
Therefore, in the present invention, Japanese language conversion is performed using a mutual conversion dictionary system as shown in the flowchart of FIG.

まず、ステップ(31)の日本語エディタ上で、かな文
字列を入力するか、もしくは再変換すべき漢字を指定す
る(ステップ(32))。ここで、変換バッファにセッ
トされた(ステップ(33))文字列タイプが、かな文
字なのか漢字文字なのかを判断しくステップ(34))
 、かな文字であればステップ(35)の漢字変換処理
により、漢字検索を行ない、変換候補を得る(ステップ
(36))。
First, on the Japanese editor in step (31), a kana character string is input or a kanji character to be reconverted is specified (step (32)). Here, determine whether the character string type set in the conversion buffer (step (33)) is a kana character or a kanji character (step (34)).
, if it is a kana character, a kanji search is performed by the kanji conversion process in step (35) to obtain conversion candidates (step (36)).

一方、漢字文字であれば、ステップ(41)の読みがな
変換処理により、読みがな検索を行ない、変換候補を得
る(ステップ(42))。
On the other hand, if it is a kanji character, the reading is searched through the reading conversion process in step (41) to obtain conversion candidates (step (42)).

それぞれの変換候補は、日本語エディタにより、ステッ
プ(37)の漢字文字列、もしくはステップ(43)の
かな文字列に出力される。
Each conversion candidate is output by the Japanese editor as a kanji character string in step (37) or a kana character string in step (43).

このように、本発明においては変換時に漢字変換するの
か、読みがな変換するのかを選択することができ、相互
兼用辞書を使用することにより、メモリの使用効率に優
れた日本語変換方式が実現可能となる。
In this way, in the present invention, it is possible to select whether to convert kanji or readings at the time of conversion, and by using a mutually compatible dictionary, a Japanese conversion method with excellent memory usage efficiency is realized. It becomes possible.

第2図は、本発明の相互兼用辞書の一実施例構造を示し
ている。
FIG. 2 shows the structure of an embodiment of the mutually compatible dictionary of the present invention.

この辞書は、辞書インデックス部(101)との辞書デ
ータ部(102)の2つに分類される。辞書インデック
ス部(101)においては、まず漢字変換ディレクトリ
の先頭アドレス(103)を持ち、読みがなディレクト
リの先頭アドレス(104)と並ぶ。
This dictionary is classified into two parts: a dictionary index part (101) and a dictionary data part (102). The dictionary index section (101) first has the start address (103) of the kanji conversion directory, which is aligned with the start address (104) of the reading directory.

また(105)は、辞書データ部(102)の先頭アド
レスを示し、(109)は辞書ブロック1の開始アドレ
スを表す。
Further, (105) indicates the start address of the dictionary data section (102), and (109) indicates the start address of dictionary block 1.

ここで(106)には、漢字表記などの情報が入ってい
る。また、(107)には漢字変換の各ブ白ツクの先頭
アドレスと、かな見出しが入っている。そして(108
)には、読みがな変換の各ブロックの先頭アドレスと、
漢字見出しが入っている。
Here, (106) contains information such as kanji notation. Also, (107) contains the start address of each blank for kanji conversion and a kana heading. And (108
) is the start address of each block of reading conversion, and
Contains kanji headings.

実際には読みがなブロックの各データは、各々の漢字ブ
ロックに不規則に位置しているが、各データに読みがな
変換のための属性とシリアル番号がついて、ブロック分
けを可能にしている。(109)は、それぞれの漢字変
換のためのグループ分けをブロック化している。このブ
ロック化は漢字変換のためのみ構成しているもので、読
みがな変換のためのブロック化は表面上、不規則である
In reality, each data in the reading block is irregularly located in each kanji block, but each data has an attribute and a serial number for reading and writing conversion, making it possible to divide the data into blocks. . (109) blocks the grouping for each Kanji conversion. This blocking is configured only for Kanji conversion, and the blocking for reading Kana conversion is irregular on the surface.

第3図は、相互兼用辞書のデータ構造を示している。FIG. 3 shows the data structure of the mutual dictionary.

すなわち、品詞情報(201)が先頭にあり、(202
)の漢字文字数と、(203)のかな文字数が並んでい
る。次に、カナ見出しく204)が入っていて、1バイ
1〜カナコードで表現されている。(205)には漢字
文字列データがセットされていて、2バイト漢字コード
で表している。(206)は、次候補の読みがな候補が
ある漢字ブロック番号がセットされ(207)はそのブ
ロックの先頭から何バイト目にあるかを表している。(
208)は、次候補があるかどうかの情報が入っている
。(209)と(210)には、読みがな辞書としての
属性は入っていて、読みがなブロック番号や漢字分類番
号を表す。
That is, part of speech information (201) is at the beginning, and (202
) and the number of kana characters (203) are lined up. Next, there is a kana header 204), which is expressed in 1 by 1 ~ kana code. Kanji character string data is set in (205) and is represented by a 2-byte Kanji code. (206) is set to the kanji block number in which the next candidate reading is located, and (207) represents the number of bytes from the beginning of the block. (
208) contains information as to whether there is a next candidate. (209) and (210) contain attributes as a reading dictionary, and represent reading block numbers and kanji classification numbers.

第4図は、読みがな辞書検索のフローチャート図である
FIG. 4 is a flowchart of reading dictionary search.

まず、ステップ(61)でディレクトリの先頭アドレス
を第2図に示す(104)から得て、ステップ(62)
で読みがな変換処理する漢字が、どの読みがなブロック
に属するかを第2図に示す(108)から調べる。
First, in step (61), the first address of the directory is obtained from (104) shown in Figure 2, and in step (62)
In step (108) shown in FIG. 2, it is determined to which reading block the kanji to be subjected to reading conversion processing belongs.

次に、そのブロックの先頭のアドレスを求め、ステップ
(64)で候補があるかどうかを調べる。
Next, the start address of the block is found, and in step (64) it is checked whether there is a candidate.

ここで候補があれば、第1図に示すステップ(31)の
日本語エディタ上で指定(ステップ(32)) した変
換文字列の長さを求め(ステップ(65)) 、候補見
出しと漢字文字列の長さを比較する(ステップ(66)
)。
If there is a candidate here, find the length of the converted character string specified (step (32)) on the Japanese editor in step (31) shown in Figure 1 (step (65)), and add the candidate heading and kanji character. Compare column lengths (step (66)
).

次いで、ステップ(67)で長さが等しいか否かを判断
し、長さが等しければ、漢字コードを比較して(ステッ
プ(68)) 、一致したならば(ステップ(69))
 、辞書の漢字文字数と、日本語エディタで指定した漢
字文字数とが一致したかを調べる(ステップ(70))
Next, in step (67) it is determined whether the lengths are equal, and if the lengths are equal, the kanji codes are compared (step (68)), and if they match (step (69)).
, check whether the number of kanji characters in the dictionary matches the number of kanji characters specified in the Japanese editor (step (70))
.

このとき一致したならば、読みがな検索成功である。そ
こで、検索したかな文字コードを出力バッファにセット
しくステップ(74)) 、日本語エディタに戻り、読
みがな文字列を出力する。
If there is a match at this time, the pronunciation search is successful. Therefore, step (74)) sets the searched kana character code in the output buffer, returns to the Japanese editor, and outputs the reading kana character string.

発明の詳細 な説明したように本発明の相互兼用辞書方式によれば、
かな漢字変換のみならず、読みがな変換も一つの辞書で
使用可能になり、変換時にどちらの変換をするかを選択
的に実行可能となる。
As described in detail, according to the mutual dictionary system of the present invention,
Not only Kana-Kanji conversion but also Yomi-Kana conversion can be used in one dictionary, making it possible to selectively perform either conversion at the time of conversion.

また、変換のために必要なメモリ資源も、大幅に節約で
き、その使用効率は大きく向上する。
Furthermore, memory resources required for conversion can be saved significantly, and their usage efficiency is greatly improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例相互変換辞書方式を用いた日
本語変換処理のフローチャート図、第2図は本発明の一
実施例相互変換辞書の構造図、第3図は相互変換辞書の
データ構造図、第4図は読みがな辞書検索処理のフロー
チャート図、第5図は従来のかな漢字変換処理のフロー
チャート図、第6図は従来の漢字文字列再変換処理のフ
ローチャート図である。
FIG. 1 is a flowchart of a Japanese language conversion process using a mutual conversion dictionary method according to an embodiment of the present invention, FIG. 2 is a structural diagram of a mutual conversion dictionary according to an embodiment of the present invention, and FIG. FIG. 4 is a flowchart of the reading/kana dictionary search process, FIG. 5 is a flowchart of the conventional kana-kanji conversion process, and FIG. 6 is a flowchart of the conventional kanji character string reconversion process.

Claims (1)

【特許請求の範囲】[Claims] かな文字列から漢字文字列を検索すると同時に、逆に漢
字文字列から読みがなをも検索することが可能な二重構
造を有し、ほぼ一つ分のメモリサイズで上記二種類の構
造をもつ変換辞書を備えた相互変換辞書方式。
It has a dual structure that allows you to search for kanji strings from kana strings and conversely search for readings from kanji strings. A mutual conversion dictionary method with a conversion dictionary.
JP2084409A 1990-03-30 1990-03-30 Mutual conversion dictionary system Pending JPH03282961A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2084409A JPH03282961A (en) 1990-03-30 1990-03-30 Mutual conversion dictionary system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2084409A JPH03282961A (en) 1990-03-30 1990-03-30 Mutual conversion dictionary system

Publications (1)

Publication Number Publication Date
JPH03282961A true JPH03282961A (en) 1991-12-13

Family

ID=13829793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2084409A Pending JPH03282961A (en) 1990-03-30 1990-03-30 Mutual conversion dictionary system

Country Status (1)

Country Link
JP (1) JPH03282961A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0488550A (en) * 1990-07-31 1992-03-23 Canon Inc Character processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0488550A (en) * 1990-07-31 1992-03-23 Canon Inc Character processor

Similar Documents

Publication Publication Date Title
JP3152868B2 (en) Search device and dictionary / text search method
US6877003B2 (en) Efficient collation element structure for handling large numbers of characters
US5383121A (en) Method of providing computer generated dictionary and for retrieving natural language phrases therefrom
KR100288144B1 (en) Foreign language coding method in Korean and search method using the same
JPH03282961A (en) Mutual conversion dictionary system
JP3253657B2 (en) Document search method
JPH056398A (en) Document register and document retrieving device
JP2785168B2 (en) Electronic dictionary compression method and apparatus for word search
JPH0227423A (en) Method for rearranging japanese character data
JPH0140372B2 (en)
JPS6057421A (en) Documentation device
JPH0140370B2 (en)
JPH0612550B2 (en) Data retrieval method
KR100289332B1 (en) Automatic Word Construction System for Electronic Documents and Method
JP2773657B2 (en) String search device
JP4061283B2 (en) Apparatus, method and program for converting lexical data to data
JPS61285573A (en) Kana-to-kanji converting device
JPH03127254A (en) Word retrieving device
JPH0721212A (en) Word processor
JPS62214468A (en) Kana-kanji converter
JPH0746353B2 (en) Japanese text input device
JPS63229523A (en) Information processor
JPH02500693A (en) Device for data compression
JPH0338772A (en) Compression system for character code data
JPS63263529A (en) Keyword extracting system