JPS62214468A - Kana-kanji converter - Google Patents
Kana-kanji converterInfo
- Publication number
- JPS62214468A JPS62214468A JP61058666A JP5866686A JPS62214468A JP S62214468 A JPS62214468 A JP S62214468A JP 61058666 A JP61058666 A JP 61058666A JP 5866686 A JP5866686 A JP 5866686A JP S62214468 A JPS62214468 A JP S62214468A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- kanji
- clause
- dictionary
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 27
- 240000000220 Panda oleosa Species 0.000 claims abstract description 14
- 235000016496 Panda oleosa Nutrition 0.000 claims abstract description 14
- 238000000926 separation method Methods 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims 1
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、日本語文章を入力する為に、入力されたかな
文字列を、かな漢字混じり文章に変換するかな漢字変換
装置における単語辞書検索に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a word dictionary search in a kana-kanji conversion device that converts an input kana character string into a kana-kanji mixed sentence in order to input a Japanese sentence.
従来のかな漢字変換における単語辞書検索の高速化の方
式としては、大きく分けて以下の様な方法がとられてい
た。Conventional methods for speeding up word dictionary searches in kana-kanji conversion have been roughly divided into the following methods.
(1)単語辞書を高速検索媒体(ROM)上に構築する
。(1) Build a word dictionary on a high-speed retrieval medium (ROM).
(2) 単語辞書検索用の検索テーブル(インデック
ス)をできるだけ多く、主記憶装置に常駐する。(2) As many search tables (indexes) for word dictionary searches as possible reside in the main memory.
(6) 単語辞書を木構造化し、アクセス回数を減少す
る。(6) Create a tree structure for the word dictionary to reduce the number of accesses.
しかし、(1)の方法では、読み専用記憶装置の為、使
用頻度に基づく完全な単語学習が不可能であり、(2)
、 (a)の方法は、を節分カミち書を処理より凰語
辞i!fe直接検索している為低速な記憶媒体を使用す
る場合、検索時間が多く掛かるという欠点があった。However, with method (1), complete word learning based on frequency of use is impossible due to the read-only storage device, and (2)
, Method (a) is more effective than processing Setsubun Kamichisho! Since fe is directly searched, there is a drawback that it takes a long time to search when a slow storage medium is used.
以上述べた様に、文節分かち書き処理より単語辞書を直
接検索していると低速な記憶媒体を使用する場合、検索
時間が多く掛かり、かな漢字変換処理時間を増大してし
まう。特に、「二文節最長一致法」「文節数最小法」等
辞書検索回数の多い変換方式の場合、検索時間の低減が
必要である。As described above, if a word dictionary is directly searched rather than a bunsetsu segmentation process, if a slow storage medium is used, the search time will be longer and the kana-kanji conversion process time will be increased. In particular, in the case of conversion methods that require a large number of dictionary searches, such as the "two-clause longest match method" and the "minimum clause count method," it is necessary to reduce the search time.
これらの問題点を解決する為、本発明は、かな漢字変換
装置において、外部記憶装置の単語辞書(以下単語辞書
と略す)より、これとは別に文節分かち書きの為のみの
単語辞書(以下文法処理用辞書と略す)を主記憶装置上
に構築する。In order to solve these problems, the present invention provides a kana-kanji conversion device that uses a word dictionary (hereinafter referred to as "word dictionary") in an external storage device that is only used for segment separation (hereinafter referred to as "grammar processing"). (abbreviated as "dictionary") is constructed on the main memory.
この為、かな見出しと品詞のみで構成される文法処理用
辞書を作成する手段(文法処理用辞書作成手段〉と、こ
の文法処理用辞書を用いた文節分かち書き手段と、文節
分かち書きされた単位で、かな文字列を漢字文字列に変
換する漢字候補作成手段と、単語が選択された段階で、
その使用頻度を単語辞書と文法処理用辞書の両者に学習
する手段(使用頻度学習手段)とを持つ。For this reason, there is a means for creating a grammar processing dictionary consisting only of kana headings and parts of speech (grammar processing dictionary creation means), a clause dividing means using this grammar processing dictionary, and a unit in which the clauses are divided. A kanji candidate creation method that converts kana character strings into kanji character strings, and once a word is selected,
It has means (usage frequency learning means) for learning the usage frequency in both the word dictionary and the grammar processing dictionary.
本来、文節分かち書きに必要な情報とは、単語のかな見
出しと文法情報である品詞のみであり、かな文字列を漢
字文字列に変換するもの・は文節分かち書き用に検索さ
れた単語の内、文法的に適肖と思われる一部のもののみ
であり、文節分かち書きを主記憶上で高速に行ない、か
な文字列を漢字文字列に換えるする時のみ、外部記憶装
置上の単語辞書を使用する事により、大幅に、かな漢字
変換処理全体を高速化できる。Originally, the information required for bunsetsu separation is only the kana heading of the word and the part of speech, which is grammatical information.The information needed to convert a kana string into a kanji string is the grammatical information of the words searched for bunsetsu separation. The word dictionary on the external storage device is used only when it is considered suitable for the purpose of writing, and only when segmentation is performed at high speed in the main memory and when converting kana character strings to kanji character strings. This greatly speeds up the entire Kana-Kanji conversion process.
従って、これら文法処理用辞書作成手段、文節分かち書
き手段、漢字候補作成手段、使用頻度学習手段により、
かな漢字変換処理全体を高速化する。Therefore, with these grammar processing dictionary creation means, clause separation means, kanji candidate creation means, and usage frequency learning means,
Speed up the entire Kana-Kanji conversion process.
ここで、以下に本発明の詳細を図示した実施例に基づい
て説明する。Hereinafter, details of the present invention will be explained based on illustrated embodiments.
第1図は本発明のかな漢字変換装置を示す図である。図
中符号1は入力部2より入力されたデータに基づきシス
テム全体の制御を行なう中央処理装置(以下0’PUと
略す)である。まずかな漢字変換装置7の起動時点で文
法処理用辞書作成部8により、単語辞111・2より文
法処理用辞書11を作成し、以降かな漢字変換処理に入
る。FIG. 1 is a diagram showing a kana-kanji conversion device of the present invention. Reference numeral 1 in the figure is a central processing unit (hereinafter abbreviated as 0'PU) that controls the entire system based on data input from the input section 2. When the kana-kanji conversion device 7 is started up, the grammar processing dictionary creating section 8 creates a grammar processing dictionary 11 from the word dictionaries 111 and 2, and then begins the kana-kanji conversion process.
入力部2により読み込まれた文字列はかな漢字変換装置
7に送られ、かな漢字変換が行なわれる。かな漢字変換
装置7内では、文節分かち書き部10が文法処理用辞書
11を検索し、文節分かち書きを行なう。この文節分か
ち書きデータの候補は、漢字候補作成部13に送られ、
単語辞書12を検索しながら文節候補が作成され、文節
候補出力部14により順次文節単位に候補が出力される
かな漢字変換が行なわれた文節候補群は、文節候補表示
部4により表示され、文節候補洗濯部3L−トh−3!
″h寸仲婦加清τ女倖順鮪凛中如【酬1−1− )1確
定される。全文節が確定すると、そのデータは文章格納
部6に格納されると共に、かな漢字変換装置7内の確定
文節受取部15に送られ、これをもとに使用頻度学習部
16は、漢字候補作成部13に蓄積された解析データに
基づき、文法処理用辞書11と単語辞1112に単語の
使用頻度学習を行なう。The character string read by the input unit 2 is sent to the kana-kanji conversion device 7, where it is converted into kana-kanji. In the kana-kanji conversion device 7, a phrase separation section 10 searches the grammar processing dictionary 11 and performs phrase separation. This clause separation data candidate is sent to the kanji candidate creation unit 13,
Phrase candidates are created while searching the word dictionary 12, and the phrase candidate output unit 14 sequentially outputs candidates for each phrase.The phrase candidate group that has been subjected to kana-kanji conversion is displayed by the phrase candidate display unit 4, and the phrase candidates are output as phrase candidates. Laundry department 3L-h-3!
``h sunchufukasei τ女倖jun骪凛中郎 [对1-1-) 1 is determined. When all the phrases are determined, the data is stored in the sentence storage section 6, and the kana-kanji conversion device 7 Based on this, the usage frequency learning unit 16 determines the usage of the word in the grammar processing dictionary 11 and word dictionary 1112 based on the analysis data accumulated in the kanji candidate creation unit 13. Perform frequency learning.
この一連の動作により、かな漢字変換において最大の処
理時間を要する文節分かち書き処理の単語検索処理時間
を削減でき、高速なかな漢字変換を可能とする。This series of operations can reduce the word search processing time of the bunsetsu segmentation process, which requires the maximum processing time in kana-kanji conversion, and enables high-speed kana-kanji conversion.
第2図は、本発明の詳細な説明するフ四−チヤードであ
る。FIG. 2 is a detailed illustration of the present invention.
ここで、200において、かな漢字変換の始まる前に文
法処理用辞書が作成される。Here, at 200, a grammar processing dictionary is created before the kana-kanji conversion begins.
201において、かな文字列が入力され、これが終了符
号であった場合202により終了処理となる。終了でな
い場合は203により文法処理用辞書11を検索/参照
しながら文節分かち書きが成され、このデータをもとに
204により、単語辞書12が検索/参照されて、文節
分かち書きされた漢字候補データが出力され、205で
文節単位にユーザにより、候補の選択、確定がなされ取
消の符号が入力されれば、201の処理にもどり、そう
でないなら207により単語辞書の使用頻度学習が成さ
れ、208により単語辞書の使用頻度学習が成され、フ
な人力201と戻り一連の動作が繰り返される。At step 201, a kana character string is input, and if this is an end code, end processing is performed at step 202. If it is not completed, the phrase separation is performed in step 203 while searching/referring to the grammar processing dictionary 11, and based on this data, the word dictionary 12 is searched/referenced in step 204, and the kanji candidate data for the phrase separation is created. If the candidate is selected and confirmed by the user for each phrase in 205 and a cancellation code is input, the process returns to 201. If not, the usage frequency learning of the word dictionary is performed in 207, and in 208 The frequency of use of the word dictionary is learned, and the series of operations is repeated by returning to the manual input 201.
第3図は、本発明の文法処理用辞書11と単語辞書の構
造を示す図である。単語辞書は、図の様にブロック化さ
れた12Aは、複数のブロックより成る。漢字部12b
と、そのブロックを示すインデクス部12αより成れ、
インデクス部12αはブロックの最大見出し12C′f
t羅列している。FIG. 3 is a diagram showing the structure of the grammar processing dictionary 11 and word dictionary of the present invention. The word dictionary is divided into blocks 12A as shown in the figure, and consists of a plurality of blocks. Kanji section 12b
and an index section 12α indicating the block,
The index part 12α is the maximum heading 12C′f of the block.
T is listed.
また漢字部12bは、かな見出し12d2品詞126、
漢字12/をルーコードとして持つている。In addition, the kanji section 12b has a kana heading 12d2 a part of speech 126,
It has Kanji 12/ as a roux code.
文法処理用辞書は、文節分かち書きに必要な情報を持つ
だけでよい為、図の様にブロック化されたデータ部11
b(1jAは、複数のブロックより成る。)と、そのブ
ロックを示すインデクス部116より成り、インデクス
部11αはブロックの最大見出し11Ce羅列している
。またデータ部11Aは、かな見出し11d、品詞11
gをルーコードとして持ち、漢字情報を持たない。The grammar processing dictionary only needs to have the information necessary for segmentation, so the data section 11 is divided into blocks as shown in the figure.
b (1jA consists of a plurality of blocks) and an index section 116 indicating the block, and the index section 11α lists the maximum headings 11Ce of the blocks. In addition, the data section 11A includes a kana heading 11d, a part of speech 11
It has g as a roux code and has no kanji information.
本発明は次の様な効果がある。 The present invention has the following effects.
(リ かな漢字変換において、最も処理時開の掛かる文
節分かち書き処理の処理時間を短縮し、かな漢字変換処
理速度を向上する。(In Kana-Kanji conversion, this shortens the processing time of the clause separation process, which takes the most processing time, and improves the processing speed of Kana-Kanji conversion.
(2) 文法処理用辞書に漢字データがない為比較的
少容量で、主記憶上に構築できる。(2) Since the grammar processing dictionary does not contain kanji data, it has a relatively small capacity and can be constructed in main memory.
(3) この考え方を応用して、ホスト・コンピュー
タに単語辞書を置き、ターミナルコンピュータに文法処
理用辞書を置き、必要な分の漢字データのみをホスト・
コンピュータより転送利用するなどの応用が図れる。(3) Applying this idea, a word dictionary is placed on the host computer, a grammar processing dictionary is placed on the terminal computer, and only the required amount of kanji data is transferred to the host computer.
Applications such as transfer and use from a computer can be achieved.
第1図は本発明のかな漢字変換装置’!2示すブロック
図である。
第2図は本発明のかな漢字変換装置の動作を示すフロー
チャート図である。
第5図は本発明のかな漢字変換装置の文法処理用辞書と
単語辞書の構造を示す図である。
以上
出願人 セイコーエプソン株式会社
第2図
1a
12c
第3図Figure 1 shows the Kana-Kanji conversion device of the present invention! FIG. 2 is a block diagram showing FIG. FIG. 2 is a flowchart showing the operation of the kana-kanji conversion device of the present invention. FIG. 5 is a diagram showing the structure of the grammar processing dictionary and word dictionary of the kana-kanji conversion device of the present invention. Applicant Seiko Epson Corporation Figure 2 1a 12c Figure 3
Claims (1)
な混じり文を変換する、かな漢字変換装置において、か
な見出し、漢字文字列、品詞より構成され、外部記憶装
置に記憶されている単語辞書より、かな見出しと品詞の
みを抽出した文法解析用辞書を内部記憶装置上に構築し
文節分かち書き処理には、文法解析用辞書を使用し、文
節分かち書き処理以降のかな文字列を漢字文字列に変換
する時のみ外部記憶装置記憶されている単語辞書を参照
使用する事を特徴とするかな漢字変換装置。A kana-kanji conversion device that converts an input kana character string by selecting homophones and converting sentences containing kanji and kana. , a grammar analysis dictionary that extracts only kana headings and parts of speech is built on the internal storage device, and the grammar analysis dictionary is used for the clause separation process, and the kana character string after the clause separation process is converted into a kanji character string. A kana-kanji conversion device characterized in that it refers to and uses a word dictionary stored in an external storage device only at times.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61058666A JPH0766380B2 (en) | 1986-03-17 | 1986-03-17 | Kana-Kanji converter |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61058666A JPH0766380B2 (en) | 1986-03-17 | 1986-03-17 | Kana-Kanji converter |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62214468A true JPS62214468A (en) | 1987-09-21 |
JPH0766380B2 JPH0766380B2 (en) | 1995-07-19 |
Family
ID=13090907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61058666A Expired - Lifetime JPH0766380B2 (en) | 1986-03-17 | 1986-03-17 | Kana-Kanji converter |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0766380B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02105254A (en) * | 1988-10-14 | 1990-04-17 | Nippon I B M Kk | Device and method for kana-kanji conversion |
JPH0469766A (en) * | 1990-07-10 | 1992-03-04 | Pfu Ltd | Kana to kanji converter |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59112328A (en) * | 1982-12-20 | 1984-06-28 | Fujitsu Ltd | Processing method of "kana"-"kanji" conversion |
-
1986
- 1986-03-17 JP JP61058666A patent/JPH0766380B2/en not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59112328A (en) * | 1982-12-20 | 1984-06-28 | Fujitsu Ltd | Processing method of "kana"-"kanji" conversion |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02105254A (en) * | 1988-10-14 | 1990-04-17 | Nippon I B M Kk | Device and method for kana-kanji conversion |
JPH0469766A (en) * | 1990-07-10 | 1992-03-04 | Pfu Ltd | Kana to kanji converter |
Also Published As
Publication number | Publication date |
---|---|
JPH0766380B2 (en) | 1995-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3196868B2 (en) | Relevant word form restricted state transducer for indexing and searching text | |
US5560037A (en) | Compact hyphenation point data | |
KR100288144B1 (en) | Foreign language coding method in Korean and search method using the same | |
JP7247460B2 (en) | Correspondence Generating Program, Correspondence Generating Device, Correspondence Generating Method, and Translation Program | |
JPS62214468A (en) | Kana-kanji converter | |
JPH056398A (en) | Document register and document retrieving device | |
JPH0140372B2 (en) | ||
JPS6057421A (en) | Documentation device | |
JP3628565B2 (en) | Dictionary search method, device, and recording medium recording dictionary search program | |
JPH0140370B2 (en) | ||
JPH0227423A (en) | Method for rearranging japanese character data | |
JPS62144269A (en) | Information retrieving device | |
JP2976682B2 (en) | Language playback device | |
JPS59100939A (en) | Japanese word input device | |
JPS60251461A (en) | "kana"/"kanji" converter | |
JPS63308665A (en) | Kana/kanji converting device | |
JPS59116835A (en) | Japanese input device with input abbreviating function | |
JPS61282966A (en) | Kana/kanji conversion system | |
JPS63157266A (en) | Forming system for word dictionary | |
JPS6243769A (en) | Kana-to-kanji converting device | |
JPS61282964A (en) | Kana/kanji conversion system | |
JPS58166435A (en) | Japanese syllabary to chinese character conversion system using probability matrix | |
JPH08339365A (en) | Method and device for documentation | |
JPS61128364A (en) | Retrieving device of dictionary | |
JPS6118065A (en) | Kana-to-kanji conversion processor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |