JPH03282961A - Mutual conversion dictionary system - Google Patents
Mutual conversion dictionary systemInfo
- Publication number
- JPH03282961A JPH03282961A JP2084409A JP8440990A JPH03282961A JP H03282961 A JPH03282961 A JP H03282961A JP 2084409 A JP2084409 A JP 2084409A JP 8440990 A JP8440990 A JP 8440990A JP H03282961 A JPH03282961 A JP H03282961A
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- conversion
- kana
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims abstract description 51
- 240000000220 Panda oleosa Species 0.000 claims abstract description 35
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims description 14
- 230000009977 dual effect Effects 0.000 claims description 2
- 230000015654 memory Effects 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000006993 memory improvement Effects 0.000 description 1
- 230000004793 poor memory Effects 0.000 description 1
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な相互変換辞書方式に関する。[Detailed Description of the Invention] Industrial Field of Application The present invention relates to a mutual conversion dictionary system that is capable of searching for Kanji character strings from Kana character strings and conversely searching for readings from Kanji character strings. .
また、相互の検索が可能なことから、英訳、和訳など語
学辞書としての機能を有する相互変換辞書方式に厨する
。In addition, since mutual searches are possible, a mutual conversion dictionary system that functions as a language dictionary such as English translation and Japanese translation will be developed.
従来の技術
従来のかな漢字変換辞書方式においては、かな文字列か
ら漢字文字列を検索することのみに利用される辞書構造
となっている。BACKGROUND OF THE INVENTION Conventional kana-kanji conversion dictionary systems have a dictionary structure that is used only to search for kanji character strings from kana character strings.
また、漢字文字列の再変換機能においては、はじめに漢
字文字列に変換した後も、元のかな文字列情報がメモリ
に残っていて、再びかな文字列から漢字文字列に変換す
るというような構造になっている。In addition, the reconversion function for kanji strings has a structure in which the original kana string information remains in memory even after it is first converted to a kanji string, and the kana string is converted back to a kanji string. It has become.
発明が解決しようとする課題
上述した変換辞書方式において、一方向の検索辞書とし
てしか使用されず、再変換機能においても、かな文字列
情報が残っていることがら、メモリ効率が非常に悪い。Problems to be Solved by the Invention In the conversion dictionary system described above, it is used only as a one-way search dictionary, and even in the re-conversion function, kana character string information remains, resulting in very poor memory efficiency.
従って、漢字文字列とがな文字列の相互の検索を可能に
することが望ましいが、このためには、それぞれ別々の
辞書を使用しなければならず、辞書メモリサイズが約2
倍に膨れるという問題点がある。Therefore, it is desirable to be able to search between Kanji strings and Gana strings, but this requires the use of separate dictionaries for each, and the dictionary memory size is approximately 2.
The problem is that it doubles.
本発明は、かかる点に鑑みてなされたもので、その目的
とするところは、かな漢字変換辞書における仕様拡張と
ともに、メモリ効率の向上を実現する相互変換辞書方式
を提供することにある。The present invention has been made in view of these points, and its purpose is to provide a mutual conversion dictionary system that realizes expansion of specifications in a kana-kanji conversion dictionary and improvement of memory efficiency.
課題を解決するための手段
本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な二重構造を有し、ほぼ一つ分のメモリサイズで上記
二種類の構造をもつ変換辞書を有した構成としている。Means for Solving the Problems The present invention has a dual structure in which it is possible to search for Kanji character strings from Kana character strings and conversely to search readings from Kanji character strings. The configuration has a conversion dictionary having the above two types of structures with a memory size of 10 minutes.
実施例 以下、本発明を一実施例に従って説明する。Example Hereinafter, the present invention will be explained according to one embodiment.
まず、本発明と従来の技術とをフローチャート図を使っ
て比較する。First, the present invention and the conventional technology will be compared using flowcharts.
第5図は、従来のかな漢字変換方式のフローチャート図
で、先ずステップ(11)において、日本語エディタで
様々なキー人力を行なう。FIG. 5 is a flowchart of the conventional kana-kanji conversion method. First, in step (11), various key operations are performed using a Japanese editor.
次に、かな文字を入力しくステップ(12)) 、変換
用バッファにかな文字コードをセットする(ステップ(
13))。さらに再変換用バッファにかな文字コードを
セット(ステップ(14)) L、次いでステップ(1
5)の日本語変換処理を経て、漢字辞書検索を行ない、
変換候補を得た(ステップ(16))後に、日本語エデ
ィタにより、その候補の漢字コードから漢字文字列を出
力する(ステップ(17))。Next, input kana characters (step (12)) and set the kana character code in the conversion buffer (step (12)).
13)). Furthermore, set the kana character code in the reconversion buffer (step (14)) L, then step (1
After the Japanese conversion process in 5), a kanji dictionary search is performed,
After obtaining a conversion candidate (step (16)), the Japanese editor outputs a kanji character string from the kanji code of the candidate (step (17)).
第6図は従来の漢字文字列再変換方式のフローチャート
図で、第5図に示す処理により漢字に変換した文字列が
、ステップ(21)の日本語エディタ上に表示されてい
る。ここで、ステップ(22)で再変換すべき漢字文字
列を指定して、ステップ(24)で指定した漢字文字列
に対するかな文字コードがバッファに存在するかをチエ
ツクし、なければ、ステップ(23)でエラー表示をし
、始めに戻る。FIG. 6 is a flowchart of a conventional kanji character string reconversion method, in which a character string converted into kanji by the process shown in FIG. 5 is displayed on the Japanese editor in step (21). Here, in step (22), specify the kanji string to be reconverted, and in step (24), check whether the kana character code for the specified kanji string exists in the buffer. If not, in step (23) ) to display an error message and return to the beginning.
一方、対応するかな文字コードがあれば、ステップ(2
5)で変換用バッファにかな文字コードをセットする。On the other hand, if there is a corresponding kana character code, step (2)
Step 5) Set the kana character code in the conversion buffer.
次の処理リステップ(26)、(27)、(28)につ
いては、通常の変換と全く同処理を行う。Regarding the next processing steps (26), (27), and (28), exactly the same processing as the normal conversion is performed.
このように、従来の技術では再変換しようとする際に、
再変換用のかな文字バッファが必要となり、またこの文
字バッファに対応するかな文字コードがなければ再変換
不可能となる。In this way, when trying to reconvert with conventional technology,
A kana character buffer is required for reconversion, and if there is no kana character code corresponding to this character buffer, reconversion will not be possible.
従って、全ての漢字文字列に対して再変換可能状態にす
るためには、極めて多くのメモリを必要とし、限られメ
モリ資源の有効活用という観点からすると、非常に非効
率的な方法となるという問題点がある。Therefore, in order to make it possible to reconvert all kanji character strings, an extremely large amount of memory is required, and from the perspective of effective use of limited memory resources, this method is extremely inefficient. There is a problem.
そこで本発明では、第3図にフローチャート図で示すよ
うな相互変換辞書方式を用いて日本語変換を行うもので
ある。Therefore, in the present invention, Japanese language conversion is performed using a mutual conversion dictionary system as shown in the flowchart of FIG.
まず、ステップ(31)の日本語エディタ上で、かな文
字列を入力するか、もしくは再変換すべき漢字を指定す
る(ステップ(32))。ここで、変換バッファにセッ
トされた(ステップ(33))文字列タイプが、かな文
字なのか漢字文字なのかを判断しくステップ(34))
、かな文字であればステップ(35)の漢字変換処理
により、漢字検索を行ない、変換候補を得る(ステップ
(36))。First, on the Japanese editor in step (31), a kana character string is input or a kanji character to be reconverted is specified (step (32)). Here, determine whether the character string type set in the conversion buffer (step (33)) is a kana character or a kanji character (step (34)).
, if it is a kana character, a kanji search is performed by the kanji conversion process in step (35) to obtain conversion candidates (step (36)).
一方、漢字文字であれば、ステップ(41)の読みがな
変換処理により、読みがな検索を行ない、変換候補を得
る(ステップ(42))。On the other hand, if it is a kanji character, the reading is searched through the reading conversion process in step (41) to obtain conversion candidates (step (42)).
それぞれの変換候補は、日本語エディタにより、ステッ
プ(37)の漢字文字列、もしくはステップ(43)の
かな文字列に出力される。Each conversion candidate is output by the Japanese editor as a kanji character string in step (37) or a kana character string in step (43).
このように、本発明においては変換時に漢字変換するの
か、読みがな変換するのかを選択することができ、相互
兼用辞書を使用することにより、メモリの使用効率に優
れた日本語変換方式が実現可能となる。In this way, in the present invention, it is possible to select whether to convert kanji or readings at the time of conversion, and by using a mutually compatible dictionary, a Japanese conversion method with excellent memory usage efficiency is realized. It becomes possible.
第2図は、本発明の相互兼用辞書の一実施例構造を示し
ている。FIG. 2 shows the structure of an embodiment of the mutually compatible dictionary of the present invention.
この辞書は、辞書インデックス部(101)との辞書デ
ータ部(102)の2つに分類される。辞書インデック
ス部(101)においては、まず漢字変換ディレクトリ
の先頭アドレス(103)を持ち、読みがなディレクト
リの先頭アドレス(104)と並ぶ。This dictionary is classified into two parts: a dictionary index part (101) and a dictionary data part (102). The dictionary index section (101) first has the start address (103) of the kanji conversion directory, which is aligned with the start address (104) of the reading directory.
また(105)は、辞書データ部(102)の先頭アド
レスを示し、(109)は辞書ブロック1の開始アドレ
スを表す。Further, (105) indicates the start address of the dictionary data section (102), and (109) indicates the start address of dictionary block 1.
ここで(106)には、漢字表記などの情報が入ってい
る。また、(107)には漢字変換の各ブ白ツクの先頭
アドレスと、かな見出しが入っている。そして(108
)には、読みがな変換の各ブロックの先頭アドレスと、
漢字見出しが入っている。Here, (106) contains information such as kanji notation. Also, (107) contains the start address of each blank for kanji conversion and a kana heading. And (108
) is the start address of each block of reading conversion, and
Contains kanji headings.
実際には読みがなブロックの各データは、各々の漢字ブ
ロックに不規則に位置しているが、各データに読みがな
変換のための属性とシリアル番号がついて、ブロック分
けを可能にしている。(109)は、それぞれの漢字変
換のためのグループ分けをブロック化している。このブ
ロック化は漢字変換のためのみ構成しているもので、読
みがな変換のためのブロック化は表面上、不規則である
。In reality, each data in the reading block is irregularly located in each kanji block, but each data has an attribute and a serial number for reading and writing conversion, making it possible to divide the data into blocks. . (109) blocks the grouping for each Kanji conversion. This blocking is configured only for Kanji conversion, and the blocking for reading Kana conversion is irregular on the surface.
第3図は、相互兼用辞書のデータ構造を示している。FIG. 3 shows the data structure of the mutual dictionary.
すなわち、品詞情報(201)が先頭にあり、(202
)の漢字文字数と、(203)のかな文字数が並んでい
る。次に、カナ見出しく204)が入っていて、1バイ
1〜カナコードで表現されている。(205)には漢字
文字列データがセットされていて、2バイト漢字コード
で表している。(206)は、次候補の読みがな候補が
ある漢字ブロック番号がセットされ(207)はそのブ
ロックの先頭から何バイト目にあるかを表している。(
208)は、次候補があるかどうかの情報が入っている
。(209)と(210)には、読みがな辞書としての
属性は入っていて、読みがなブロック番号や漢字分類番
号を表す。That is, part of speech information (201) is at the beginning, and (202
) and the number of kana characters (203) are lined up. Next, there is a kana header 204), which is expressed in 1 by 1 ~ kana code. Kanji character string data is set in (205) and is represented by a 2-byte Kanji code. (206) is set to the kanji block number in which the next candidate reading is located, and (207) represents the number of bytes from the beginning of the block. (
208) contains information as to whether there is a next candidate. (209) and (210) contain attributes as a reading dictionary, and represent reading block numbers and kanji classification numbers.
第4図は、読みがな辞書検索のフローチャート図である
。FIG. 4 is a flowchart of reading dictionary search.
まず、ステップ(61)でディレクトリの先頭アドレス
を第2図に示す(104)から得て、ステップ(62)
で読みがな変換処理する漢字が、どの読みがなブロック
に属するかを第2図に示す(108)から調べる。First, in step (61), the first address of the directory is obtained from (104) shown in Figure 2, and in step (62)
In step (108) shown in FIG. 2, it is determined to which reading block the kanji to be subjected to reading conversion processing belongs.
次に、そのブロックの先頭のアドレスを求め、ステップ
(64)で候補があるかどうかを調べる。Next, the start address of the block is found, and in step (64) it is checked whether there is a candidate.
ここで候補があれば、第1図に示すステップ(31)の
日本語エディタ上で指定(ステップ(32)) した変
換文字列の長さを求め(ステップ(65)) 、候補見
出しと漢字文字列の長さを比較する(ステップ(66)
)。If there is a candidate here, find the length of the converted character string specified (step (32)) on the Japanese editor in step (31) shown in Figure 1 (step (65)), and add the candidate heading and kanji character. Compare column lengths (step (66)
).
次いで、ステップ(67)で長さが等しいか否かを判断
し、長さが等しければ、漢字コードを比較して(ステッ
プ(68)) 、一致したならば(ステップ(69))
、辞書の漢字文字数と、日本語エディタで指定した漢
字文字数とが一致したかを調べる(ステップ(70))
。Next, in step (67) it is determined whether the lengths are equal, and if the lengths are equal, the kanji codes are compared (step (68)), and if they match (step (69)).
, check whether the number of kanji characters in the dictionary matches the number of kanji characters specified in the Japanese editor (step (70))
.
このとき一致したならば、読みがな検索成功である。そ
こで、検索したかな文字コードを出力バッファにセット
しくステップ(74)) 、日本語エディタに戻り、読
みがな文字列を出力する。If there is a match at this time, the pronunciation search is successful. Therefore, step (74)) sets the searched kana character code in the output buffer, returns to the Japanese editor, and outputs the reading kana character string.
発明の詳細
な説明したように本発明の相互兼用辞書方式によれば、
かな漢字変換のみならず、読みがな変換も一つの辞書で
使用可能になり、変換時にどちらの変換をするかを選択
的に実行可能となる。As described in detail, according to the mutual dictionary system of the present invention,
Not only Kana-Kanji conversion but also Yomi-Kana conversion can be used in one dictionary, making it possible to selectively perform either conversion at the time of conversion.
また、変換のために必要なメモリ資源も、大幅に節約で
き、その使用効率は大きく向上する。Furthermore, memory resources required for conversion can be saved significantly, and their usage efficiency is greatly improved.
第1図は本発明の一実施例相互変換辞書方式を用いた日
本語変換処理のフローチャート図、第2図は本発明の一
実施例相互変換辞書の構造図、第3図は相互変換辞書の
データ構造図、第4図は読みがな辞書検索処理のフロー
チャート図、第5図は従来のかな漢字変換処理のフロー
チャート図、第6図は従来の漢字文字列再変換処理のフ
ローチャート図である。FIG. 1 is a flowchart of a Japanese language conversion process using a mutual conversion dictionary method according to an embodiment of the present invention, FIG. 2 is a structural diagram of a mutual conversion dictionary according to an embodiment of the present invention, and FIG. FIG. 4 is a flowchart of the reading/kana dictionary search process, FIG. 5 is a flowchart of the conventional kana-kanji conversion process, and FIG. 6 is a flowchart of the conventional kanji character string reconversion process.
Claims (1)
字文字列から読みがなをも検索することが可能な二重構
造を有し、ほぼ一つ分のメモリサイズで上記二種類の構
造をもつ変換辞書を備えた相互変換辞書方式。It has a dual structure that allows you to search for kanji strings from kana strings and conversely search for readings from kanji strings. A mutual conversion dictionary method with a conversion dictionary.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2084409A JPH03282961A (en) | 1990-03-30 | 1990-03-30 | Mutual conversion dictionary system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2084409A JPH03282961A (en) | 1990-03-30 | 1990-03-30 | Mutual conversion dictionary system |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03282961A true JPH03282961A (en) | 1991-12-13 |
Family
ID=13829793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2084409A Pending JPH03282961A (en) | 1990-03-30 | 1990-03-30 | Mutual conversion dictionary system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03282961A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0488550A (en) * | 1990-07-31 | 1992-03-23 | Canon Inc | Character processor |
-
1990
- 1990-03-30 JP JP2084409A patent/JPH03282961A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0488550A (en) * | 1990-07-31 | 1992-03-23 | Canon Inc | Character processor |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3152868B2 (en) | Search device and dictionary / text search method | |
US6877003B2 (en) | Efficient collation element structure for handling large numbers of characters | |
US5383121A (en) | Method of providing computer generated dictionary and for retrieving natural language phrases therefrom | |
KR100288144B1 (en) | Foreign language coding method in Korean and search method using the same | |
JPH03282961A (en) | Mutual conversion dictionary system | |
JP3253657B2 (en) | Document search method | |
JPH056398A (en) | Document register and document retrieving device | |
JP2785168B2 (en) | Electronic dictionary compression method and apparatus for word search | |
JPH0227423A (en) | Method for rearranging japanese character data | |
JPH0140372B2 (en) | ||
JPS6057421A (en) | Documentation device | |
JPH0140370B2 (en) | ||
JPH0612550B2 (en) | Data retrieval method | |
KR100289332B1 (en) | Automatic Word Construction System for Electronic Documents and Method | |
JP2773657B2 (en) | String search device | |
JP4061283B2 (en) | Apparatus, method and program for converting lexical data to data | |
JPS61285573A (en) | Kana-to-kanji converting device | |
JPH03127254A (en) | Word retrieving device | |
JPH0721212A (en) | Word processor | |
JPS62214468A (en) | Kana-kanji converter | |
JPH0746353B2 (en) | Japanese text input device | |
JPS63229523A (en) | Information processor | |
JPH02500693A (en) | Device for data compression | |
JPH0338772A (en) | Compression system for character code data | |
JPS63263529A (en) | Keyword extracting system |