JPS62271173A - Kana/kanji conversion system - Google Patents

Kana/kanji conversion system

Info

Publication number
JPS62271173A
JPS62271173A JP61115325A JP11532586A JPS62271173A JP S62271173 A JPS62271173 A JP S62271173A JP 61115325 A JP61115325 A JP 61115325A JP 11532586 A JP11532586 A JP 11532586A JP S62271173 A JPS62271173 A JP S62271173A
Authority
JP
Japan
Prior art keywords
dictionary
word
reading
search
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61115325A
Other languages
Japanese (ja)
Inventor
Masaru Nakajima
勝 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61115325A priority Critical patent/JPS62271173A/en
Publication of JPS62271173A publication Critical patent/JPS62271173A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To improve the processing speed without changing the size of a dictionary by registering a word having a long reading at first in the dictionary if reverse sequential retrieval is more difficult than the forward retrieval or impossible in the word data retrieval in the dictionary. CONSTITUTION:In registering the representation of a word, the words are registered in the order of Japanese syllabary of the read of the head of each word and a word having a longer reading is registered earlier in the words having the same head reading. That is, when the lengths of the reading of optional words, A,B in the dictionary are a,b, respectively in case of the relation of a< and the reading of the head character of the word B is coincident with the reading of the word A, the word B is registered earlier without fail in the forward retrieval. It is assumed that the sentence KANA(Japanese syllabary)/KANJI(Chinese character) conversion is processed while being regarded as (reading to be converted)=(reading registered in dictionary)+(declension word end, reading of adjunct), where the relations of (reading registered in dictionary)>= 1 and (reading of declension word end and adjunct) >=0 exist.

Description

【発明の詳細な説明】 3、発明の詳細な説明 技術分野 本発明は、仮名漢字変換方式に関し、特にワードプロセ
ッサ等において、読み長の長い単語も短い単語も、同じ
ように変換速度を向上させることが可能な仮名漢字変換
方式に関するものである。
[Detailed Description of the Invention] 3. Detailed Description of the Invention Technical Field The present invention relates to a kana-kanji conversion method, and in particular, to improve the conversion speed of both long and short words in a word processor, etc. This paper relates to a kana-kanji conversion method that allows for

従来技術 従来の辞書は、一般に読みコード順に単語が登録されて
いる。すなわち、アイウェオ順の辞書では、読み長さの
短い単語が先に登録されている。
Prior Art In conventional dictionaries, words are generally registered in order of reading code. In other words, in a dictionary arranged in iweo order, words with short reading lengths are registered first.

従って、例えば、″芯″″と゛′信徒″を比較すると、
パ芯″が先に登録されている。そして、仮名の′″しん
とパを漢字に変換する場合、辞書検索は、シんと′″、
シん″、および゛シ″の3通りを行う必要がある。表記
゛′信徒′″と芯と″では、前者の方が辞書に登録され
ている単語の読みの長さが長いので、正解である確率が
高く、先に出力される八きである。しかし、読み長さの
長い順に辞書検索を行うと、逆方向検索となるため、処
理速度が低下する。
Therefore, for example, if we compare "core" and "follower",
``Pashin'' is registered first.If you want to convert the kana ``Shintopa'' into kanji, the dictionary search will be ``Shinto'',
It is necessary to do three things: ``shin'' and ``shi''. Between the expressions ``believer'' and ``core,'' the former has a longer pronunciation of the word registered in the dictionary, so it has a higher probability of being correct, and is the first to be output. However, if the dictionary is searched in the order of the longest reading length, the processing speed will decrease because the search will be in the backward direction.

また、短い順に検索を行うと、辞書検索が完全に終了す
るまで表記を出力できす、必要とする候補蓄積領域も大
きくなるため、好ましくない。また。
Furthermore, if the search is performed in order of shortest length, notations cannot be output until the dictionary search is completely completed, and the required candidate storage area becomes larger, which is not preferable. Also.

辞書に対して、順・逆双方向の順次検索を可能にすると
、辞書サイズが大きくなるという問題がある。
If a dictionary is allowed to be sequentially searched in both forward and reverse directions, there is a problem in that the dictionary size increases.

第1図(a)は、従来の辞書登録順を示す図である。辞
書内の任意の単語A、Hの読み長さをa。
FIG. 1(a) is a diagram showing the conventional dictionary registration order. The reading length of arbitrary words A and H in the dictionary is a.

bとした時、a < bでかつBの先頭の文字の読みが
Aの読みと一致している場合に、順方向検索の時の登録
順が必ずBの方が後になっている。すなわち、第1図(
a)に示すように、読み長さの長い゛表日本″、゛′手
荷物″、″′日本″、″本″等の単語が後に登録される
ことになり、読み長の短い゛御”、″尾″、“手″、゛
′二″゛、″干″等の単語が先に登録される。
When b, if a < b and the pronunciation of the first character of B matches the pronunciation of A, then B is always registered later in the forward search. In other words, Figure 1 (
As shown in a), words with long reading lengths such as ``table Japan'', ``baggage'', ``'Japan'', and ``hon'' will be registered later, and words with short reading lengths such as ``go'' and ``book'' will be registered later. Words such as ``tail'', ``hand'', ``2'', and ``hang'' are registered first.

目     的 本発明の目的は、このような従来の問題を改善し、辞書
の大きさを変更しないで、処理速度を向上でき、かつ辞
書検索アルゴリズムおよび候補単語蓄積アルゴリズムを
単純化できる仮名漢字変換方式を提供することにある。
Purpose The purpose of the present invention is to provide a kana-kanji conversion method that can improve the above conventional problems, improve processing speed without changing the size of the dictionary, and simplify the dictionary search algorithm and candidate word accumulation algorithm. Our goal is to provide the following.

構   成 上記目的を達成するため、本発明の仮名漢字変換方式は
、主記憶装置あるいは補助記憶装置に格納され、かつ単
語データを探索する際に、順方向に比べて逆方向の探索
が困難ないし不可能な辞書、および該辞書を用いて仮名
漢字変換処理を行う制御手段を有する仮名漢字変換シス
テムにおいて、該辞書内の先頭文字の読みが一致する単
語相互間では、読み長さの長い単語を先に登録し、かつ
辞書の単語の読み長さの長い単語から順次検索すること
に特徴がある。
Configuration In order to achieve the above object, the kana-kanji conversion method of the present invention is stored in the main memory or auxiliary memory, and when searching for word data, searching in the backward direction is more difficult or difficult than in the forward direction. In a kana-kanji conversion system that has an impossible dictionary and a control means that performs kana-kanji conversion processing using the dictionary, between words whose first letters in the dictionary have the same reading, words with a long reading length are The feature is that the words are registered first and the words in the dictionary are searched sequentially starting with the words with the longest pronunciation length.

以下、本発明の構成を、実施例により詳細に説明する。Hereinafter, the configuration of the present invention will be explained in detail using examples.

第1図(b)および(c)は、本発明の実施例1および
実施例2による辞書登録順を示す図である。実施例1で
は、単語の表記を登録する場合、単語の先頭の読みのア
イウェオ順に登録するとともに、先頭の読みが同じもの
の中では、読みの長さが長いものほど先に登録する。な
お、()内の表記は、活用語尾のため、辞書には登録さ
れていない。実施例2では、単語の表記を登録する場合
、単語の先頭の読みのアイウェオの逆の順、っまり″ン
″、″ワ″、゛′口″、″し″、゛ル″・ ・ ・の順
に登録する。そして、先頭の読みが同じものの中では、
読みの長さが長いものほど先に登録する点では、実施例
1と同じである。すなわち、本発明では、辞書内の任意
の単語A、Bの読みの長さをa、bとした時、a (b
で、かつBの先頭の文字の読みがAの読みと一致してい
るときには、順方向検索の時の登録順が必ずBの方が先
になっている。
FIGS. 1(b) and 1(c) are diagrams showing the dictionary registration order according to the first and second embodiments of the present invention. In the first embodiment, when registering the notation of a word, it is registered in the order of the first pronunciation of the word, and among words with the same first pronunciation, the one with the longer pronunciation is registered first. Note that the notation in parentheses is a conjugated ending and is not registered in the dictionary. In Embodiment 2, when registering the spelling of a word, the first pronunciation of the word is in the reverse order of the pronunciation of the word, ``n'', ``wa'', ``mouth'', ``shi'', ゛ru'', etc. Register in this order. And among those with the same initial pronunciation,
This is the same as the first embodiment in that the longer reading length is registered first. That is, in the present invention, when the pronunciation lengths of arbitrary words A and B in the dictionary are a and b, a (b
And if the reading of the first character of B matches the reading of A, then B is always registered first in the forward search.

この例では、簡単のために文節仮名漢字変換は、(変換
すべき読み)=(辞書登録読み)+(活用語尾、付属語
の読み) とみなして処理するものと仮定する。ここで、(辞書登
録読み)≧1.(活用語尾、付属語の読み)≧0 である。
In this example, for simplicity, it is assumed that bunsetsu kana-kanji conversion is processed as follows: (reading to be converted) = (reading registered in dictionary) + (reading of conjugated endings and attached words). Here, (dictionary reading) ≧1. (Inflection endings, pronunciations of attached words) ≧0.

第2図は、本発明の一実施例を示す仮名漢字変換装置の
ブロック図である。第1図において、1は変換すべき゛
′仮名″を入力するためのキーボード等の操作部、2は
変換された゛′漢字″を表示出力するだめのCRTディ
スプレイ等の表示部、3は辞書の検索や語尾作成や入出
力等を制御する制御部、4は索引を参照して辞書を検索
するための辞書検索部、5は辞書から直接単語データを
読み取る順次検索部、6は語尾、付属語を作成する作成
部。
FIG. 2 is a block diagram of a kana-kanji conversion device showing an embodiment of the present invention. In Figure 1, 1 is an operating section such as a keyboard for inputting the ``kana'' to be converted, 2 is a display section such as a CRT display for displaying and outputting the converted ``kanji'', and 3 is a dictionary search unit. 4 is a dictionary search unit that searches the dictionary by referring to the index; 5 is a sequential search unit that reads word data directly from the dictionary; and 6 is a control unit that controls word endings and adjuncts. Creation section to create.

7は索引を検索するための索引検索部、8は辞書、9は
索引である。
7 is an index search unit for searching an index, 8 is a dictionary, and 9 is an index.

先ず、操作部lから変換すべきデータが入力されると、
制御部3は、変換すべき読みを辞書読みと、活用語尾、
付属語の読みに分け、辞書検索部4から辞書読みに対す
る単語の表記と、活用語尾、付属語の読みに対する表記
−を得る。辞書検索部4は、索引検索部7を利用して辞
書ポインタを得た後、順次検索部5に指示を与えて辞書
の検索を行う。順次検索部5は、辞書8を単語の登録順
に検索し、辞書読みに対する単語のデータを得る。索引
検索部7は、辞書索引を検索し、求める単語データが含
まれるブロックの位置(辞書ポインタ)を得る。また、
語尾、付属語作成部6は、辞書検索により得られた単語
に対する活用語尾、付属語を作成する。
First, when data to be converted is input from the operation section l,
The control unit 3 converts the readings to be converted into dictionary readings, conjugated endings,
It is divided into the pronunciations of the attached words, and the dictionary search unit 4 obtains the notation of the word corresponding to the dictionary pronunciation, the inflected ending, and the notation of the pronunciation of the attached word. The dictionary search unit 4 uses the index search unit 7 to obtain a dictionary pointer, and then sequentially instructs the search unit 5 to search the dictionary. The sequential search unit 5 searches the dictionary 8 in the order in which words are registered, and obtains word data for dictionary readings. The index search unit 7 searches the dictionary index and obtains the position (dictionary pointer) of the block containing the desired word data. Also,
The ending/adjunct word creation unit 6 creates inflected endings and adjunct words for the word obtained by dictionary search.

先ず、本発明を文節仮名漢字変換に適用した場合につい
て、説明する。
First, a case where the present invention is applied to phrase kana-kanji conversion will be explained.

いま、第2図の辞書8として、第1図(b)に示す内容
が登録されていると仮定する。仮名漢字変換時の動作に
ついて、変換すべき読みとして、パおもてにほん″を例
にとって説明する。
Assume now that the contents shown in FIG. 1(b) are registered as the dictionary 8 in FIG. 2. The operation when converting kana to kanji will be explained using ``Paomotenihon'' as an example of the reading to be converted.

(1)制御部3は、辞書読みを″おもてにほん″、語尾
、付属語の読みを無しとして、候補を探す。
(1) The control unit 3 searches for candidates with the dictionary pronunciation as "Omote nihon" and the pronunciations of endings and adjuncts as absent.

(2)次に、辞書検索部4が″おもてにほん″に対する
単語データを検索する。この場合、先ず、索引検索によ
り、″おもてにほん″の辞書ポインタを得た後、順次検
索により、″表日本″の単語データを得る。この時、辞
書ポインタは1次の単語表″′を指している。
(2) Next, the dictionary search unit 4 searches for word data for "Omote Nihon". In this case, first, a dictionary pointer for "Omote Nihon" is obtained through an index search, and then word data for "Omote Nihon" is obtained through sequential searches. At this time, the dictionary pointer points to the first-order word table ``''.

(3)この″おもてにほん′″に対する候補の表記″表
日本″を得る。
(3) Obtain the candidate notation ``Omote Nippon'' for this ``Omote ni Hon''.

(4〕次に、制御部3は、辞書読みをパおもてには″、
語尾、付属語の読みを″ん″として候補を探す。
(4) Next, the control unit 3 reads the dictionary on the front page.
Search for candidates using the reading of the ending and attached word as ``n''.

(5)辞書検索部4が″おもてには″に対する単語デー
タを検索する。その場合、読みが″おもてには″である
単語の登録順は、本発明の登録順に従うと、″おもてに
ほん″の読みの単語の後になければならないので、索引
検索は不要である。順次検索により、′″おもてには″
に対する単語データが無いことを検出する。そのとき、
辞書ポインタは変化しない。
(5) The dictionary search unit 4 searches for word data for "Omoteha". In that case, according to the registration order of the present invention, words with the reading ``Omote wa'' must be registered after words with the reading ``Omote nihon,'' so no index search is necessary. be. By sequential search, ``On the front''
Detects that there is no word data for. then,
The dictionary pointer does not change.

(6)前記(4)と同じようにして、辞書読みを゛おも
てに″、語尾、付EX語の読みを′″はん″として候補
を探すが、これも単語データが無い。
(6) In the same way as in (4) above, candidates are searched for using the dictionary reading as ``main'' and the readings of the endings and EX words as ``han'', but there is no word data for this either.

(7)次に、辞書読みを″おもて″、語尾、付属語の読
みを′にほん′として、候補を探す。
(7) Next, search for candidates using the dictionary reading as ``Omote'' and the readings of the endings and adjuncts as ``Nihon.''

(8)辞書検索部4は、″おもて′″に対して、゛′表
″の単語データを得る。辞書ポインタは1次の単語′″
思・・を指している。
(8) The dictionary search unit 4 obtains the word data of the ``table'' for the ``front''.The dictionary pointer is the primary word ''
It refers to thoughts.

(9)付属語の表記として、パにほんパを得る。(9) As a notation for attached words, get pa ni honpa.

(10)“おもてにほん″に対する候補の表記1表にほ
ん″を得る。
(10) Candidate notation for “Omote Nihon” Obtain “Table 1”.

以下、同じようにして、″おも11 + #してにほん
′°、′お、、 + 11もてにほんパに対して候補を
検索する。
Hereafter, in the same way, candidates are searched for ``Omo 11 + #ShiNihon'°, 'O... + 11MoTeNiHonpa.

第8図は、″おもてにほん″を変換する際の辞書検索に
ついて、従来の辞書と本発明の辞書の検索手順を示す比
較図である。
FIG. 8 is a comparison diagram showing the search procedure of the conventional dictionary and the dictionary of the present invention regarding dictionary search when converting "Omote Nihon".

本発明においては、先頭の文字の読みが同じのとき、単
語の読み長さの長い方を先に登録しであるため、変換す
べき読みの辞書読みを順次短くし、語尾、付た語の読み
を順次長くして、辞書検索を行うので、辞書の単語の登
録順が前に探した位置より後を探せばよく、従って索引
検索が不要となる。その場合、辞書ポインタは、前に探
した位置を指しており、変化しないので、次の検索はそ
の位置から再開すればよい。
In the present invention, when the first characters have the same pronunciation, the longer pronunciation of the word is registered first, so the dictionary pronunciation of the pronunciation to be converted is sequentially shortened, and Since the dictionary search is performed by sequentially lengthening the pronunciations, it is only necessary to search for words in the dictionary after the position where the word was previously searched, thus eliminating the need for an index search. In that case, the dictionary pointer points to the previously searched position and does not change, so the next search can be restarted from that position.

すなわち、第8図に示すように、最初のパおもてにほん
″の検索時では、従来と本発明とは同じ手順で、索引検
索→順次検索→″表日本″を得るが。
That is, as shown in FIG. 8, in the first search for ``Paradise Japan'', the conventional method and the present invention use the same procedure to obtain index search -> sequential search -> ``Table Japan''.

次の1おもてには″の検索以降は、前述のように、本発
明では、辞書検索の際に近接している単語の検索におい
て索引検索の省略が可能であるため、順次検索→単語デ
ータを得ることができ、高速化が実現できる。
After the next search for ``,'' as mentioned above, in the present invention, it is possible to omit the index search when searching for nearby words during dictionary search, so sequential search → word Data can be obtained and speeding up can be achieved.

次に、本発明を、複文節変換に適用した場合について、
説明する。
Next, regarding the case where the present invention is applied to complex clause conversion,
explain.

複文節変換では、複数単語を組み合せて候補を作成する
ため、辞書検索により得られた単語データを蓄積する必
要がある。
In compound clause conversion, candidates are created by combining multiple words, so it is necessary to accumulate word data obtained through dictionary searches.

一般に、複文節変換では、第1単語の読み長さの長い候
補の表記を優先して出力するようになっている。そのた
め、辞書検索も、読み長さの長いものから検索した方が
、蓄積エリアが一杯になってしまった場合の処理が簡単
である。
In general, in compound clause conversion, candidate notations with a long reading length of the first word are output with priority. Therefore, when searching the dictionary, it is easier to search in the order of long reading length when the storage area is full.

従って、文節変換の場合と同じように、読み長さの長い
ものから探す辞書検索アルゴリズムとなり、索引検索省
略による高速化が実現できる。
Therefore, as in the case of bunsetsu conversion, the dictionary search algorithm searches for items with the longest reading length, and speeding up can be achieved by omitting index search.

次に、辞8読み込み用バッファを設けた場合について、
説明する。
Next, regarding the case where a buffer for reading 8 is provided,
explain.

辞書が補助記憶装置に存在する場合、辞書読み込みはバ
ッファを介して行われることになる。従って、近接した
単語を連続して検索する時の処理速度は、本発明の方が
従来の方法に比べて格段に向上する。
If the dictionary exists in auxiliary storage, reading the dictionary will be done through a buffer. Therefore, the processing speed of successive searches for adjacent words is significantly improved by the present invention compared to the conventional method.

第3図は、第2図における制御部の動作シーケンスチャ
ートである。第3図において、入力データ11は操作部
1から入力されたデータで、モードと読みからなる。出
力データ12は、制御部3から表示部2に出力する変換
結果を示すデータで、これはモードと表記からなる。1
3は候補表記であり、語尾、付属語作成部6から送られ
てくる。
FIG. 3 is an operation sequence chart of the control section in FIG. 2. In FIG. 3, input data 11 is data input from the operation unit 1 and consists of a mode and reading. The output data 12 is data indicating a conversion result output from the control section 3 to the display section 2, and consists of a mode and a description. 1
3 is a candidate notation, which is sent from the ending/adjunct word creation unit 6.

14は検索情報であり、辞書検索読み、辞書ポインタ5
および検索結果よりなる。15は単語データであり、辞
書検索部4から送られてくる。
14 is search information, dictionary search reading, dictionary pointer 5
and search results. 15 is word data, which is sent from the dictionary search section 4.

制御部3が仮名漢字変換の制御を行う場合、先ず入力デ
ータ11のモードを調べて、変換モードのときには、入
力データ11より辞書検索読みをセットし、辞書ポイン
タをクリアする。次候補モードのときには、待機する。
When the control unit 3 controls kana-kanji conversion, it first checks the mode of the input data 11, and when it is in the conversion mode, sets the dictionary search reading from the input data 11 and clears the dictionary pointer. When in the next candidate mode, it waits.

また、出力データ12に対して、出力モードをセットし
く確定モード)、語尾、付属語作成部6から候補表記1
3が送られると、出力データ12の表記をセットする。
In addition, for the output data 12, set the output mode (determined mode), word ending, and candidate notation 1 from the adjunct word creation unit 6.
When 3 is sent, the notation of output data 12 is set.

そして、検索情報により辞書を検索した結果、単語有り
の場合、単語、付m語を作成し、候補表記出力モードを
セットするとともに、表記をセットする。
Then, as a result of searching the dictionary using the search information, if the word is found, the word and m-word are created, the candidate notation output mode is set, and the notation is set.

また、単語無しの場合には、辞書検索読み長さを調べ、
1以上のときには読みを縮める。また、読み長さが0の
ときには、候補無し表示モードをセットする。
In addition, if there is no word, check the dictionary search reading length,
When it is 1 or more, the reading is shortened. Further, when the reading length is 0, a no-candidate display mode is set.

第4図は、第2図における辞書検索部の動作シーケンス
チャートである。辞書検索部4では、制御部3との間で
検索情報21のやりとりを行うとともに、検索結果であ
る単語データ22を制御部3に送出する。先ず、辞書を
検索する場合には、辞書ポインタを初期化する(すなわ
ち、ポインタがクリアされているか否かを調べる)。ク
リアされているときには、辞#索引を検索する。索引検
索部7から辞書ポインタが送られると、順次検索部5に
対して順次検索を指示する。順次検索の結果を単語デー
タ22に乗せるとともに、検索結果を検索情報21内に
セットする。
FIG. 4 is an operation sequence chart of the dictionary search section in FIG. 2. The dictionary search section 4 exchanges search information 21 with the control section 3 and sends word data 22 that is the search result to the control section 3. First, when searching a dictionary, initialize the dictionary pointer (that is, check whether the pointer has been cleared). When cleared, search the # index. When the dictionary pointer is sent from the index search unit 7, it instructs the sequential search unit 5 to perform a sequential search. The results of the sequential search are placed on the word data 22, and the search results are set in the search information 21.

第5図は、第2図における索引検索部の動作シーケンス
チャートである。索引検索部7では、辞書検索部4との
間で、辞書検索読み23を受は取す、辞書ポインタ24
を返送する。そして、索引9との間では、索引読みおよ
び辞書ポインタからなる索引25を照合することにより
取り出す。先ず、辞書索引を検索した後、辞書検索読み
23と索引25の索引読みとを比較する。一致すれば、
同一索引25内の辞書ポインタをセットして辞書検索部
4に送出する。
FIG. 5 is an operation sequence chart of the index search section in FIG. 2. The index search unit 7 uses a dictionary pointer 24 to receive and receive dictionary search readings 23 from the dictionary search unit 4.
to be sent back. Then, the index 9 is retrieved by comparing the index 25 consisting of an index reading and a dictionary pointer. First, after searching the dictionary index, the dictionary search reading 23 and the index reading of the index 25 are compared. If they match,
A dictionary pointer within the same index 25 is set and sent to the dictionary search section 4.

第6図は、第2図における順次検索部の動作シーケンス
チャートである。順次検索部5は、辞書検索部4との間
で、辞書検索読み26を受は取り、辞書ポインタ27を
やり取りして、単語データ28を送出する。辞書検索部
4から辞書の順次検索が指示されると、受は取った辞書
検索読み26と辞書8の内容29である辞書登録読みを
比較する。
FIG. 6 is an operation sequence chart of the sequential search section in FIG. 2. The sequential search unit 5 receives and receives dictionary search pronunciations 26 from the dictionary search unit 4, exchanges dictionary pointers 27, and sends word data 28. When the dictionary search unit 4 instructs the dictionary to be searched sequentially, the receiver compares the dictionary search reading 26 and the dictionary registered reading which is the content 29 of the dictionary 8.

そして、一致したならば、内容29に対応する単語デー
タをセットして辞書検索部4に送出する。
If there is a match, word data corresponding to the content 29 is set and sent to the dictionary search unit 4.

第7図は、第2図における語尾、付属語作成部の動作シ
ーケンスチャートである。語尾、付属語作成部6では、
制御部3との間で、単語データ30と辞書検索読み31
と読み32とを受は取り、語尾表を検索してセントした
語尾長さ34を参照して候補表記を作成し、この候補表
?233を返送する。すなわち、語尾・付属語作成部6
には、語尾表が備えられており、制御部3から辞書検索
により得られた単語データ30が送られてくると、作成
部6はこれを基にして語尾および付属語を作成する。先
ず、単語データ30の品詞情報および辞書検索読み31
、読み32を参照して1語尾表を検索し、それにより活
用語尾長さを得る(用言の場合)。また、用言でない場
合には、語尾長さをOにする。そして、単語データ30
の単語表記と品詞情報および読み32により、付属語を
セントする。セットされた付R語と語尾長さ34と単語
表記から候補表記33を作成し、制御部3に送出する。
FIG. 7 is an operation sequence chart of the ending and adjunct word creation section in FIG. 2. In the ending and adjunct word creation section 6,
Between the control unit 3 and the word data 30 and the dictionary search reading 31
``Uke'' takes the reading ``32'', searches the word ending list, refers to the cent ending length 34, creates a candidate notation, and then creates a candidate notation. 233 is returned. In other words, the ending/adjunct word creation unit 6
is equipped with a table of word endings, and when word data 30 obtained by dictionary search is sent from the control section 3, the creation section 6 creates word endings and adjuncts based on this. First, part of speech information of word data 30 and dictionary search reading 31
, the 1-word ending table is searched with reference to reading 32, and the length of the conjugated ending is thereby obtained (in the case of a predicate). Furthermore, if the word is not a predicate, the ending length is set to O. And word data 30
Based on the word notation, part of speech information, and pronunciation 32, the attached word is cented. A candidate notation 33 is created from the set R-word, ending length 34, and word notation, and sent to the control unit 3.

このようにして、第1図に示す各部の動作が実行される
。仮名漢字変換では、読み長の長い単語を優先して出力
する必要があるが、本実施例では、辞書に、読み長さの
長い単語が先に登録されているため、処理アルゴリズム
の単純化と変換速度の向上が可能となる。
In this way, the operations of each section shown in FIG. 1 are executed. In kana-kanji conversion, it is necessary to give priority to outputting words with long reading lengths, but in this example, words with long reading lengths are registered first in the dictionary, which simplifies the processing algorithm. It is possible to improve the conversion speed.

効   果 以上説明したように、本発明によれば、辞書の単語デー
タ探索が、順方向に比べて逆方向の順次検索が困難、あ
るいは不可能である場合に、辞書に読みの長さの長い単
語を先に登録しておくので、辞書の大きさを変更せずに
処理速度の向上が可能となる。また、本発明は、最長−
教法による変換アルゴリズムに適しており、辞書検索ア
ルゴリズムおよび候補単語蓄積アルゴリズムを単純化す
ることができる。
Effects As explained above, according to the present invention, when it is difficult or impossible to search for word data in a dictionary in the backward direction compared to the forward direction, the word data search in the dictionary is difficult or impossible. Since words are registered first, processing speed can be improved without changing the size of the dictionary. Further, the present invention provides the longest -
It is suitable for conversion algorithms based on teaching methods, and can simplify dictionary search algorithms and candidate word accumulation algorithms.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の第1の実施例および第2の実施例を示
す辞書登録順の比較図、第2図は本発明の一実施例を示
す文節仮名漢字変換システムのブロック図、第3図は第
2図における制御部の動作シーケンスチャート、第4図
は第2図における辞書検索部の動作シーケンスチャート
、第5図は第2図における索引検索部の動作シーケンス
チャート、第6図は第2図における順次検索部の動作シ
ーケンスチャート、第7図は第2図における語尾・付属
語作成部の動作シーケンスチャート、第8図は本発明に
よる′おもてにほん″の辞書検索動作の比較図である。 1:操作部、2:表示部、3;制御部、4:辞書検索部
、5:順次検索部、6:語尾・付属語作成部、7:索引
検索部、8:辞書、9:索引。
FIG. 1 is a comparison diagram of dictionary registration order showing a first embodiment and a second embodiment of the present invention, FIG. 2 is a block diagram of a bunsetsu kana-kanji conversion system showing an embodiment of the present invention, and FIG. Figure 4 is an operation sequence chart of the control unit in Figure 2, Figure 4 is an operation sequence chart of the dictionary search unit in Figure 2, Figure 5 is an operation sequence chart of the index search unit in Figure 2, and Figure 6 is the operation sequence chart of the index search unit in Figure 2. 2 is an operation sequence chart of the sequential search section, FIG. 7 is an operation sequence chart of the ending/adjunct word creation section in FIG. 2, and FIG. 8 is a comparison diagram of the dictionary search operation of 'Omote Nihon' according to the present invention. 1: Operation section, 2: Display section, 3: Control section, 4: Dictionary search section, 5: Sequential search section, 6: Ending/adjunct word creation section, 7: Index search section, 8: Dictionary, 9 :index.

Claims (1)

【特許請求の範囲】 1、主記憶装置あるいは補助記憶装置に格納され、かつ
単語データを探索する際に、順方向に比べて逆方向の探
索が困難ないし不可能な辞書、および該辞書を用いて仮
名漢字変換処理を行う制御手段を有する仮名漢字変換シ
ステムにおいて、該辞書内の先頭文字の読みが一致する
単語相互間では、読み長さの長い単語を先に登録し、か
つ辞書の単語の読み長さの長い単語から順次検索するこ
とを特徴とする仮名漢字変換方式。 2、上記辞書は、先頭文字の読みがアイウエオ順あるい
はその逆方向のンワロレルリラの順に単語を格納し、か
つ先頭文字の読みが同一の単語間では、読み長さの長い
単語から先に登録することを特徴とする特許請求の範囲
第1項記載の仮名漢字変換方式。
[Claims] 1. A dictionary that is stored in a main memory or an auxiliary memory and in which searching in the backward direction is more difficult or impossible than in the forward direction when searching for word data, and the dictionary is used. In a kana-kanji conversion system that has a control means that performs kana-kanji conversion processing using A Kana-Kanji conversion method that searches words sequentially starting from the longest reading length. 2. The dictionary stores words in the order of the first letter reading Aiueo or vice versa, and among words with the same first letter reading, the word with the longest reading length is registered first. A kana-kanji conversion method according to claim 1, characterized in that:
JP61115325A 1986-05-20 1986-05-20 Kana/kanji conversion system Pending JPS62271173A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61115325A JPS62271173A (en) 1986-05-20 1986-05-20 Kana/kanji conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61115325A JPS62271173A (en) 1986-05-20 1986-05-20 Kana/kanji conversion system

Publications (1)

Publication Number Publication Date
JPS62271173A true JPS62271173A (en) 1987-11-25

Family

ID=14659776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61115325A Pending JPS62271173A (en) 1986-05-20 1986-05-20 Kana/kanji conversion system

Country Status (1)

Country Link
JP (1) JPS62271173A (en)

Similar Documents

Publication Publication Date Title
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPS592125A (en) &#34;kana&#34; (japanese syllabary) &#34;kanji&#34; (chinese character) converting system
JP2595934B2 (en) Kana-Kanji conversion processor
JPS62271173A (en) Kana/kanji conversion system
JP2668205B2 (en) Text search device
JP2745484B2 (en) Handwritten character recognition method and device
JP2628775B2 (en) Dictionary creation device
JP3888701B2 (en) Character converter
JP2638777B2 (en) Kana-Kanji conversion device
JPH0350669A (en) Information processor
JPS62212877A (en) Kanji/kana converter
JPS60112175A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JP3344793B2 (en) Kana-Kanji conversion device
JPS603017A (en) Kana-kanji conversion processing system
JPS62237567A (en) Kana/kanji converter
JPH06290183A (en) Kanji conversion device
JPS59116835A (en) Japanese input device with input abbreviating function
JPS62140165A (en) Kana-kanji conversion system
JPS58144251A (en) Input device for chinese compound word
JPS60140460A (en) Abbreviated converting system in kana (japanese syllabary) kanji (chinese character) converter
JPS61210473A (en) Text preparing device
JPH10334085A (en) Character input device
JPH0573535A (en) Kana/kanji conversion device
JPS6210764A (en) Kana to kanji conversion system
JPS6243769A (en) Kana-to-kanji converting device