JPH09134351A - Kana/kanji converting method of document processor - Google Patents
Kana/kanji converting method of document processorInfo
- Publication number
- JPH09134351A JPH09134351A JP7273206A JP27320695A JPH09134351A JP H09134351 A JPH09134351 A JP H09134351A JP 7273206 A JP7273206 A JP 7273206A JP 27320695 A JP27320695 A JP 27320695A JP H09134351 A JPH09134351 A JP H09134351A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- kanji conversion
- kanji
- grammatical
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、文書処理装置の仮
名漢字変換方法に関する。特に、日本語ワードプロセッ
サ(以下ワープロと略する)の仮名漢字変換方法に関す
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion method for a document processing device. In particular, it relates to a kana-kanji conversion method for a Japanese word processor (hereinafter abbreviated as word processor).
【0002】[0002]
【従来の技術】ワープロで、仮名キー入力モード又は、
ローマ字キー入力モードで、図1の如く、キーボード
(1)より、仮名文字を入力すると表示部(3)に表示され
る。この後、「漢字変換キー」を打鍵すると、図2の如
く、漢字(漢字混じり文字列)に変換される。2. Description of the Related Art In a word processor, a kana key input mode or
Romaji key input mode, keyboard as shown in Figure 1
From (1), when kana characters are entered, they are displayed on the display unit (3). After that, when the "Kanji conversion key" is pressed, it is converted into Kanji (character string mixed with Kanji) as shown in FIG.
【0003】更に、「漢字変換キー」を打鍵すると、図
3の如く、次の候補漢字が表示される。この表示順は、
変換候補として、得点の高い順に表示される。つまり、
変換候補として、図4の如く、文節の区切り位置(/)
により、様々な候補の文字がある。尚、付属語及び活用
語尾は、単語に付属するものである。この組み合わせの
中から、高得点のものを選ぶ。Further, when the "Kanji conversion key" is pressed, the next candidate Kanji is displayed as shown in FIG. This display order is
The conversion candidates are displayed in descending order of score. That is,
As a conversion candidate, as shown in Fig. 4, the segment delimiter position (/)
There are various candidate characters. The adjunct word and the inflectional word end are attached to the word. From this combination, choose the one with the highest score.
【0004】得点付けの処理としての一般的なルールを
以下に示す。 1.文節数が少ない(区切り位置数が少ない)のが、高
得点。 2.かな漢字辞書に予め格納されている使用頻度得点の
高い単語が、高得点。 3.実際に利用された漢字を学習し、この学習した単語
が高得点。 4.文法的な接続の可否を判定し、正しいのが高得点。The general rules for the scoring process are shown below. 1. The score is high because the number of clauses is small (the number of break positions is small). 2. Words that are stored in the Kana-Kanji dictionary in advance and have a high frequency of use have a high score. 3. Learning the kanji actually used, this learned word has a high score. 4. The grammatical connection is judged and the correct score is high.
【0005】5.共起辞書に格納されている単語が、高
得点。 これらの、得点付けの結果、得点の高い候補を変換候補
として優先して表示している。ところで、この得点付け
の処理は、非常に負担である。入力された仮名文字を数
文字入力してから「漢字変換キー」を操作する使用方法
であれば問題ない。5. The word stored in the co-occurrence dictionary has a high score. As a result of these scoring, candidates with high scores are preferentially displayed as conversion candidates. By the way, this scoring process is very burdensome. There is no problem if it is used to operate the "Kanji conversion key" after inputting several Kana characters that have been input.
【0006】しかし、多くの文節を構成するような多数
の仮名文字を入力してから「漢字変換キー」を操作する
と、得点付けのための処理解析時間は、等比級数的に増
大し、処理までに非常に時間がかかる。そこで、前述の
ルール「1.文節数が少ない(区切り位置数が少ない)
のが、高得点。」により、文節数の少ない候補について
のみ、前述のルール2〜5による得点付けを行ってい
る。However, if the "Kanji conversion key" is operated after inputting a large number of kana characters that constitute many clauses, the processing analysis time for scoring increases in a geometric progression, It takes a very long time. Therefore, the above rule “1. The number of clauses is small (the number of division positions is small).
Has a high score. ”, The points are scored according to the above-mentioned rules 2 to 5 only for the candidates having a small number of clauses.
【0007】つまり、ルール1で足切りを行っている。
このような足切りを以下に説明する。 6.文節数が多いのは、候補として表示しない。 7.文法的な接続の可否を判定し、不可は候補として表
示しない。 8.低得点のものは、候補として表示しない。In other words, the rule 1 is used to cut off.
Such a truncation will be described below. 6. Those with many phrases are not displayed as candidates. 7. Whether or not the grammatical connection is possible is determined, and the non-acceptance is not displayed as a candidate. 8. Those with low scores are not displayed as candidates.
【0008】ところで、文節数が多い文においては、区
切り位置が使用者の思惑と異なる場合が、多々発生す
る。この場合に、区切り位置を使用者が変更できる。
尚、このような区切り位置の修正変更の技術について
は、特公平7-7403号公報(G06F17/22),特開平4-116764号
公報(G06F15/20),特開平5-89086号公報(G06F15/20),特
開平6-4519号公報(G06F15/20)等にも紹介されているよ
うに、当業者においては、良く知られている。By the way, in a sentence having a large number of clauses, there are many cases where the delimiter position is different from the user's intention. In this case, the user can change the delimiter position.
Incidentally, regarding such a technique of correcting and changing the division position, Japanese Patent Publication No. 7-7403 (G06F17 / 22), JP-A-4-116764 (G06F15 / 20), JP-A-5-89086 (G06F15) / 20), Japanese Patent Laid-Open No. 6-4519 (G06F15 / 20), etc., and is well known to those skilled in the art.
【0009】[0009]
【発明が解決しようとする課題】本発明は、区切り位置
の修正変更時に、使用者の感覚に合った動作を行う文書
処理装置を提案するものである。仮名漢字変換時におい
ては、その精度を上げるために、前述の如く、文法的に
正しい文字列を表示するようにしている。DISCLOSURE OF THE INVENTION The present invention proposes a document processing apparatus which performs an operation suitable for the user's sense when the break position is corrected and changed. At the time of kana-kanji conversion, in order to improve the accuracy, a grammatically correct character string is displayed as described above.
【0010】そして、文法的に誤った文字列は、優先度
を低くしたり、表示しないようにしている。しかし、実
際に人が使用する言語には、文法に沿っていない例もあ
る。例えば、「彼女来ない」は現実には有り得る言葉で
ある。しかし、文法的には「彼女は来ない」である。A grammatically incorrect character string has a lower priority or is not displayed. However, there are cases where the language actually used does not follow the grammar. For example, "she doesn't come" is a possible word in reality. However, grammatically, she doesn't come.
【0011】そして、通常は「かのじょこない」と仮名
入力して「仮名漢字変換キー」を操作すると「彼女庫
内」となり、「彼女来ない」は表示されない。このよう
な場合は、再変換モード時で修正すれば良い。そこで、
本発明は、再編化モードでこのような修正が容易となる
のを目的とする。[0011] Normally, when "Kanajokonai" is entered and the "Kana-Kanji conversion key" is operated, "She's inside" is displayed and "She does not come" is not displayed. In such a case, it may be corrected in the reconversion mode. Therefore,
The present invention aims to facilitate such modification in a reorganization mode.
【0012】[0012]
【課題を解決するための手段】本発明では、仮名入力を
複数の文節に区切り、少なくても複数文節間の文法的な
接続関係で得点を付け、高得点の仮名漢字変換候補を優
先的に表示する仮名漢字変換モードと共に、前記区切り
位置を操作者の指示により変更可能な再変換モードを備
える文書処理装置の仮名漢字変換方法において、前記再
変換モード時における文法的得点付けの重みを軽くする
ことを特徴とする。According to the present invention, kana input is divided into a plurality of phrases, scores are given by at least grammatical connection relations between the plurality of phrases, and a kana-kanji conversion candidate with a high score is given priority. In a kana-kanji conversion method of a document processing apparatus having a kana-kanji conversion mode to be displayed and a re-conversion mode in which the delimiter position can be changed by an operator's instruction, the weight of grammatical scoring in the re-conversion mode is reduced. It is characterized by
【0013】また、本発明では、仮名入力を複数の文節
に区切り、少なくても複数文節間の文法的な接続関係で
得点を付け、高得点の仮名漢字変換候補を優先的に表示
する仮名漢字変換モードと共に、前記区切り位置を操作
者の指示により変更可能な再変換モードを備える文書処
理装置の仮名漢字変換方法において、前記再変換モード
時において、前記区切り位置を操作者の指示により変更
され、その部分の漢字変換候補の部分確定操作が為され
た場合に、この確定部分が未確定部分に及ぼす文法的得
点付けの重みを軽くすることを特徴とする。Further, according to the present invention, the kana kanji character is divided into a plurality of clauses, the score is given at least by the grammatical connection relation between the plurality of clauses, and the kana-kanji conversion candidate having a high score is preferentially displayed. In the kana-kanji conversion method of the document processing device having a conversion mode and a reconversion mode in which the delimiter position can be changed by an operator's instruction, in the reconversion mode, the delimiter position is changed by an operator's instruction, It is characterized by reducing the weight of the grammatical score given to the undetermined portion by the confirmed portion when the partial confirmation operation of the kanji conversion candidate of the portion is performed.
【0014】[0014]
【実施の形態】本発明の第1実施例を図5を参照しつつ
説明する。図5に、このワープロの動作を示した。つま
り、ステップS2の如く、「漢字変換モード」と「再変
換モード」を判定する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A first embodiment of the present invention will be described with reference to FIG. FIG. 5 shows the operation of this word processor. That is, as in step S2, the "kanji conversion mode" and the "reconversion mode" are determined.
【0015】また、ステップS5の如く、単なる「再変
換モード」と部分確定を行った「再変換モード」とに別
れる。このようにモード判別される。そして、ステップ
S3,S6,S7に示すように、そのモードに応じて、
文法的な得点付けによる制約が外される。Further, as in step S5, it is divided into a simple "reconversion mode" and a partially confirmed "reconversion mode". The mode is discriminated in this way. Then, as shown in steps S3, S6, and S7, depending on the mode,
The restrictions due to grammatical scoring are removed.
【0016】つまり、漢字変換モード時には、「かのじ
ょこない」は、「彼女庫内」であり、「彼女来ない」は
表示されない。また、再変換モード時には、「かのじょ
こない」は、「彼女庫内」であり、「仮名漢字変換キ
ー」の複数の操作により、「彼女来ない」が表示され
る。また、再変換モード時に、「かのじょこない」の
「かのじょ」を「彼女」として部分確定すると、残りの
「こない」は「来ない」となる。In other words, in the Kanji conversion mode, "Kanojokonai" is "inside the girlfriend" and "She does not come" is not displayed. Further, in the re-conversion mode, “Kanojokonai” is “inside the she”, and “she does not come” is displayed by a plurality of operations of the “Kana-Kanji conversion key”. Further, in the re-conversion mode, if "Kanojo" of "Kanojokonai" is partially confirmed as "she", the remaining "Konajokonai" becomes "Never come".
【0017】図6〜図18を参照しつつ、本発明の第2
実施例を説明する。図6は、この実施例のワープロのブ
ロック図である。(11)は、キーボード、マウスから
なる入力部である。この入力部(11)は、かな入力あ
るいはローマ字入力によるかな文字列の入力を行う文字
キー、かな漢字変換の指示を行うかな漢字変換キー、カ
ーソル移動キー、仮確定キー、文節切れ目変更キーなど
の各種指示キーを備える。The second aspect of the present invention will be described with reference to FIGS. 6 to 18.
An embodiment will be described. FIG. 6 is a block diagram of the word processor of this embodiment. (11) is an input unit including a keyboard and a mouse. The input unit (11) is a character key for inputting a kana character string by kana input or roman character input, a kana-kanji conversion key for instructing kana-kanji conversion, a cursor movement key, a temporary confirmation key, a phrase break changing key, and the like. With a key.
【0018】(12)は、読み出し専用のメモリ(RO
M)である。このROM(12)は、かな漢字変換を行
う際に必要な単語辞書データ、活用語尾/付属語デー
タ、接続テーブル、等を格納する。(13)は、読み出
し/書き込み可能なメモリ(RAM)である。RAM
(13)は、かな漢字変換する際に必要なかな入力バッ
ファ、候補テーブル、文節候補テーブル、出力候補テー
ブル、仮確定テーブル等を格納する。(12) is a read-only memory (RO
M). The ROM (12) stores word dictionary data, inflectional / adjunct word data, a connection table, etc., which are necessary when performing kana-kanji conversion. (13) is a readable / writable memory (RAM). RAM
(13) stores a kana input buffer, a candidate table, a phrase candidate table, an output candidate table, a tentative confirmation table, and the like, which are necessary for kana-kanji conversion.
【0019】(14)は、制御部である。この制御部
(14)には、入力部(11)から入力されたかな文字
列、および指示が与えられる。制御部(14)は、与え
られたものに応じて、装置各部のデータ授受を制御する
とともに、入力された文字列をLCDディスプレイなど
からなる出力部(15)に出力する。(16)は、かな
漢字変換を司るかな漢制御部である。(14) is a control unit. The kana character string and the instruction input from the input unit (11) are given to the control unit (14). The control unit (14) controls the data exchange of each unit of the device according to the given one, and outputs the input character string to the output unit (15) including an LCD display or the like. (16) is a kana-kanji control unit that controls kana-kanji conversion.
【0020】このワープロの動作を説明する。説明は図
7、図14のフローチャート、図8〜図13および図1
5〜図18の説明図を用いて行う。入力部(11)から
かな文字列「かのじょこない」が順次入力されると、そ
の入力に対応して、制御部(14)は、かな漢制御部
(16)を起動して、ステップ100を実行する。The operation of this word processor will be described. The description will be given with reference to the flowcharts of FIGS. 7 and 14, FIGS.
This is performed using the explanatory views of FIGS. When the kana character string "Kanojokonai" is sequentially input from the input unit (11), the control unit (14) activates the Kana-han control unit (16) in response to the input, Run 100.
【0021】ステップ100では、入力されたキーの判
定を行う。入力キーが文字の場合、ステップ110を実
行する。入力キーが漢字変換の場合、ステップ130を
実行する。入力キーが次候補の場合は、ステップ190
を実行する。入力キーが仮確定の場合は、ステップ21
0を実行する。At step 100, the input key is judged. If the input key is a character, step 110 is executed. If the input key is Kanji conversion, step 130 is executed. If the input key is the next candidate, step 190.
Execute If the input key is tentatively confirmed, step 21
Execute 0.
【0022】ステップ110では、かな入力バッファに
かな文字に対応した読みコードを書き込み位置をインク
リメントしながら図8のように格納していく。ステップ
120では、仮確定テーブルの初期化を行う。仮確定テ
ーブルの全項目に0を格納する。仮確定テーブルは、第
1文節から第8文節までのそれぞれの仮確定された漢字
文字列コード、品詞、漢字文字列に対応する入力かな文
字列数で構成される。In step 110, the reading code corresponding to the kana character is stored in the kana input buffer while incrementing the writing position as shown in FIG. In step 120, the temporary confirmation table is initialized. 0 is stored in all the items of the temporary confirmation table. The provisional confirmation table includes the provisionally determined kanji character string codes, the parts of speech, and the number of input kana character strings corresponding to the kanji character strings of the first to eighth phrases.
【0023】格納が終われば、制御を制御部(4)の戻
し、キー入力待ちとなる。ステップ130では、図8の
ようにエンドマーク0を入力バッファに格納しする。ス
テップ140では、仮確定テーブルより、次処理以降の
かな漢字変換を行う対象文字列の変換開始位置を決定す
る。仮確定テーブルを第1文節より検索して、対応する
入力かな文字列数が0でないところまでの、この対応す
る入力かな文字列数の合算位置を求める。仮確定されて
いない場合、0となる。When the storage is completed, the control is returned to the control unit (4) and the key input is waited. In step 130, the end mark 0 is stored in the input buffer as shown in FIG. In step 140, the conversion start position of the target character string to be subjected to the kana-kanji conversion for the subsequent process is determined from the temporary confirmation table. The provisional fixed table is searched from the first clause to find the total position of the corresponding number of input kana character strings up to a place where the number of corresponding input kana character strings is not zero. If it is not tentatively determined, it becomes 0.
【0024】ステップ150では、出力開始文節を決定
する。仮確定テーブルを第1文節より検索して、対応す
る入力かな文字列数が0となった位置が、次処理以降の
かな漢字変換の出力候補テーブルへの出力開始文節であ
る。ステップ160では、前接続品詞を決定する。仮確
定テーブルの第1文節の入力かな文字列数が0のとき
は、前接続品詞には文頭を意味する品詞「ALL」がセ
ットされる。In step 150, the output start clause is determined. The position where the number of corresponding input kana character strings becomes 0 when the temporary fixed table is searched from the first phrase is the output start phrase to the output candidate table for kana-kanji conversion after the next process. In step 160, the pre-connection part-of-speech is determined. When the number of input kana character strings in the first clause of the provisional confirmation table is 0, the part of speech "ALL" that means the beginning of the sentence is set in the pre-connection part of speech.
【0025】それ以外のときは、仮確定テーブルで上記
入力かな文字列数が0となる文節の前文節に格納されて
いる品詞データが前接続品詞に格納する。ステップ17
0では、上記入力バッファ、変換開始位置、出力開始位
置、前接続品詞に基づき、図9のような単語辞書データ
を用いて、複文節かな漢字変換処理を行う。In other cases, the part-of-speech data stored in the preceding phrase of the phrase in which the number of input kana character strings is 0 in the provisional confirmation table is stored in the pre-connection part-of-speech. Step 17
In 0, the compound phrase kana-kanji conversion process is performed using the word dictionary data as shown in FIG. 9 based on the input buffer, the conversion start position, the output start position, and the pre-connection part-of-speech.
【0026】処理の出力は、出力候補テーブルに格納さ
れる。この処理の内容は後述する。たとえば、前記入力
バッファの状態で、仮確定のない場合は、図10のよう
な出力データが格納される。ステップ180では、出力
開始文節が0でないとき、出力候補テーブルの出力開始
文節までに格納すべきデータを、仮確定テーブルの第1
文節より複写する。The output of the process is stored in the output candidate table. The contents of this processing will be described later. For example, if there is no provisional confirmation in the state of the input buffer, output data as shown in FIG. 10 is stored. In step 180, when the output start clause is not 0, the data to be stored up to the output start clause in the output candidate table is set as the first data in the temporary confirmation table.
Copy from the clause.
【0027】その後、表示候補順位に1を格納し、出力
候補テーブルの第1位の候補を表示するよう出力部(1
5)に指示し、制御を制御部(14)に戻す。ステップ
240では、仮確定テーブルのセットを行う。いま、
「かのじょこない」が入力されて、漢字変換指示、直後
に仮確定指示された場合で説明する。After that, 1 is stored in the display candidate rank and the output unit (1
5) and returns control to the control unit (14). In step 240, the temporary confirmation table is set. Now
An explanation will be given in the case where "Kanajokonai" is input, a Kanji conversion instruction is given, and a temporary confirmation instruction is given immediately after.
【0028】仮確定指示一回について、仮確定されてい
ない文節が1つだけ前方から仮仮定されるとする。かな
漢字変換直後の出力候補テーブルのないようは、図10
となっている。表示は、図10の出力順第一位の「彼女
庫内」である。仮確定指示があると、仮確定テーブルの
チェックを行う。仮確定テーブルを第1文節より検索し
て、対応するかな文字列が0の位置を調べる。It is assumed that for each temporary confirmation instruction, only one clause that is not temporarily confirmed is provisionally assumed from the front. There is no output candidate table immediately after Kana-Kanji conversion.
It has become. The display is "she warehouse" which is first in the output order of FIG. When there is a temporary confirmation instruction, the temporary confirmation table is checked. The provisional confirmation table is searched from the first clause to find the position where the corresponding kana character string is 0.
【0029】調べた結果の位置に出力候補テーブルの対
応する文節のデータを出力候補テーブルの表示候補順位
のデータより複写する。上記例の場合は、表示候補順位
は1であるので、出力順第1位の第1文節のデータを仮
確定テーブル第1文節に複写する。複写の結果、仮確定
テーブルは、図13のようになる。The data of the corresponding clause of the output candidate table is copied from the data of the display candidate rank of the output candidate table at the position of the checked result. In the case of the above example, since the display candidate rank is 1, the data of the first phrase having the first rank in the output order is copied to the first phrase of the temporary confirmation table. As a result of copying, the temporary confirmation table is as shown in FIG.
【0030】ステップ190では、次候補の場合の仮確
定直後かどうかを判定する。判定の結果、仮確定直後で
なければステップ230を実行する。仮確定直後であれ
ば、ステップ200以降を実行する。いま、「かのじょ
こない」が入力されて、漢字変換指示、直後に仮確定指
示、次候補指示の場合について説明する。In step 190, it is determined whether or not it is immediately after the temporary confirmation in the case of the next candidate. If the result of determination is that it is not immediately after provisional confirmation, step 230 is executed. Immediately after the provisional confirmation, step 200 and subsequent steps are executed. Now, a case will be described in which "Kanajokonai" is input, a Kanji conversion instruction is given, and immediately after that, a temporary confirmation instruction and a next candidate instruction are given.
【0031】この場合はステップ200を実行する。ス
テップ200では、仮確定テーブルより、次処理以降の
かな漢字変換を行う対象文字列の変換開始位置を決定す
る。仮確定テーブルを第1文節より検索して、対応する
入力かな文字列数が0でないところまでの、この対応す
る入力かな文字列数の合算位置を求める。上記例の場
合、図13の仮確定テーブルより、変換開始位置は4と
なる。In this case, step 200 is executed. In step 200, the conversion start position of the target character string for the subsequent kana-kanji conversion is determined from the temporary confirmation table. The provisional fixed table is searched from the first clause to find the total position of the corresponding number of input kana character strings up to a place where the number of corresponding input kana character strings is not zero. In the case of the above example, the conversion start position is 4 from the temporary confirmation table of FIG.
【0032】ステップ210では、出力開始文節を決定
する。仮確定テーブルを第1文節より検索して、対応す
る入力かな文字列数が0となった位置が、次処理以降か
な漢字変換の出力候補テーブルへの出力開始文節であ
る。上記例の場合、図13の仮確定テーブルより、出力
開始位置は1となる。ステップ220では、前接続品詞
を決定する。仮確定テーブルの第1文節の入力かな文字
列数が0のときは、前接続品詞には文頭を意味する品詞
「ALL」がセットされる。In step 210, the output start clause is determined. The position where the corresponding input kana character string number becomes 0 after searching the temporary fixed table from the first phrase is the output start phrase to the output candidate table for kana-kanji conversion after the next process. In the case of the above example, the output start position is 1 from the temporary confirmation table of FIG. In step 220, the pre-connection part-of-speech is determined. When the number of input kana character strings in the first clause of the provisional confirmation table is 0, the part of speech "ALL" that means the beginning of the sentence is set in the pre-connection part of speech.
【0033】それ以外のときは、仮確定テーブルで上記
入力かな文字列数が0となる文節の前文節に格納されて
いる品詞データが前接続品詞に格納する。上記例の場
合、図13の仮確定テーブルより、前接続品詞は「名
詞」となる。ステップ170では、上記入力バッファ、
変換開始位置、出力開始位置、前接続品詞に基づき、図
9のような単語辞書データを用いて、複文節かな漢字変
換処理を行う。In other cases, the part-of-speech data stored in the preceding phrase of the phrase in which the number of input kana character strings is 0 in the provisionally determined table is stored in the pre-connection part-of-speech. In the case of the above example, the pre-connection part-of-speech is “noun” from the provisional confirmation table of FIG. In step 170, the input buffer,
Based on the conversion start position, the output start position, and the pre-connection part-of-speech, the compound phrase kana-kanji conversion process is performed using the word dictionary data as shown in FIG.
【0034】処理の出力は、出力候補テーブルに格納さ
れる。この処理の内容は後述する。上記例の場合、図1
1のような出力データが格納される。ステップ180で
は、出力開始文節が0でないとき、出力候補テーブルの
出力開始文節までに格納すべきデータを、仮確定テーブ
ルの第1文節より複写する。上記例の場合、図13の仮
確定テーブルの第1文節を出力候補テーブル第1文節に
複写し、図14のようなデータが格納される。The output of the process is stored in the output candidate table. The contents of this processing will be described later. In the case of the above example, FIG.
Output data such as 1 is stored. In step 180, when the output start clause is not 0, the data to be stored up to the output start clause in the output candidate table is copied from the first clause in the temporary confirmation table. In the case of the above example, the first clause of the temporary confirmation table of FIG. 13 is copied to the first clause of the output candidate table, and the data as shown in FIG. 14 is stored.
【0035】その後、表示候補順位に1を格納し、出力
候補テーブルの第1位の候補を表示するよう出力部(1
5)に指示し、制御を制御部(14)に戻す。ステップ
230では、出力候補テーブルにもとづいて、次候補を
出力する。即ち、表示候補順位の値に1を加えて、その
表示候補順位の出力候補テーブルの内容を表示するよう
出力部(15)に指示し、制御を制御部(14)に戻
す。After that, 1 is stored in the display candidate rank and the output unit (1
5) and returns control to the control unit (14). In step 230, the next candidate is output based on the output candidate table. That is, 1 is added to the value of the display candidate rank, the output unit (15) is instructed to display the contents of the output candidate table of the display candidate rank, and the control is returned to the control unit (14).
【0036】以降、図7のステップ170の処理につい
て説明する。説明は、図14のフローチャートと図15
〜図18の説明図を用いて行う。説明は、「かのじょこ
ない」の入力、漢字変換指示の際の処理を例に行う。ス
テップ300では、初期化を行う。文節番号Nに出力開
始文節を、第1文節の候補番号M(N)に1を格納す
る。M(N)は、第N文節の候補番号を表す。組み合わ
せ可能な候補の数KOHOに0を格納する。The processing of step 170 in FIG. 7 will be described below. The explanation is given by the flowchart of FIG. 14 and FIG.
~ This is performed using the explanatory diagram of Fig. 18. The explanation will be made by using an example of the process of inputting “Kanajokonai” and instructing conversion of Kanji. In step 300, initialization is performed. The output start phrase is stored in the phrase number N, and 1 is stored in the candidate number M (N) of the first phrase. M (N) represents the candidate number of the Nth clause. Store 0 in the number of candidates KOHO that can be combined.
【0037】ステップ305では、図8の入力かな文字
列に基づいて、図9の単語辞書データから単語の検索を
行う。検索の結果は、図17の候補テーブルに格納され
る。付属語処理が必要なものは、図15の活用語尾/付
属語辞書データを用いて、単語に連続する入力バッファ
の対応するかな文字列と活用語尾/付属語辞書データの
内容が合致するかどうか、単語が活用語尾/付属語辞書
データの品詞と合致するかどうかを検定し、合致した場
合は、活用語尾/付属語付きで候補テーブルに格納す
る。In step 305, the word is searched from the word dictionary data of FIG. 9 based on the input kana character string of FIG. The search result is stored in the candidate table of FIG. What requires the adjunct word processing is whether or not the corresponding kana character string in the input buffer consecutive to the word matches the contents of the inflected word / adjunct word dictionary data using the inflection word / adjunct word dictionary data in FIG. , It is verified whether or not the word matches the part of speech of the inflectional / adjunct word dictionary data, and if matched, it is stored in the candidate table with the inflectional / adjunct word.
【0038】上記例の場合、図17のようになる。候補
テーブルは、次の項目からなる。配列番号は1、2、3
とテーブルの先頭からつけた通し番号である。始点は、
単語の先頭を対応するかな入力バッファの位置で表して
いる。終点は、単語の最後の位置の次の位置を対応する
かな入力バッファの位置で表している。In the case of the above example, the result is as shown in FIG. The candidate table consists of the following items. SEQ ID NOs: 1, 2, 3
And the serial number added from the beginning of the table. The starting point is
The beginning of a word is represented by the position of the corresponding kana input buffer. The end point represents the position next to the last position of the word by the position of the corresponding kana input buffer.
【0039】上記例の場合に単語辞書より検索できる
「彼女」の場合は、始点は0となり、終点は4となる。
付属語長さは、上記の活用語尾/付属語辞書 データに
よる処理で付加された活用語尾/付属語の文字数であ
る。「来ない」の場合は、2となる。自立語品詞には、
単語辞書データに格納されている品詞が格納される。付
属語品詞には、活用語尾または付属語が付加されている
場合の後方への文法的接続特性を表す品詞が格納され
る。In the case of "she" which can be searched from the word dictionary in the above example, the starting point is 0 and the ending point is 4.
The adjunct word length is the number of characters of the inflected word / adjunct word added by the above processing by the inflection word / adjunct word dictionary data. If "not come", it will be 2. Independent word parts of speech,
The part of speech stored in the word dictionary data is stored. The adjunct part-of-speech stores a part-of-speech that represents a backward grammatical connection characteristic when an inflectional ending or an adjunct word is added.
【0040】付加されていない場合は、0を格納する。
頻度には、単語辞書データの頻度を格納する。単語の使
用頻度を表す。ステップ315では、文節番号Nが1の
とき、前接続品詞と第N文節第M候補の品詞接続を検定
する。検定には、図16のような接続テーブルを使用す
る。縦方向に前接続品詞の品詞、横方向には、第N文節
第M候補品詞を用いる。このテーブルで接続強さを検定
する。接続強さが0である組み合わせの場合は、NGと
なり、ステップ370を実行する。それ以外の場合は、
ステップ320を実行する。If not added, 0 is stored.
The frequency stores the frequency of the word dictionary data. Shows the frequency of word usage. In step 315, when the phrase number N is 1, the pre-connection part-of-speech and the part-of-speech connection of the Nth clause Mth candidate are tested. A connection table as shown in FIG. 16 is used for the verification. The part-of-speech of the pre-connection part-of-speech is used in the vertical direction, and the N-th clause M-th candidate part-of-speech is used in the horizontal direction. Use this table to test the connection strength. If the combination has a connection strength of 0, the result is NG and step 370 is executed. Otherwise,
Step 320 is executed.
【0041】ステップ310は、第N文節の第M(N)
候補のチェックを行う。このチェックでは、Nが出力開
始文節より大きい場合は、第N−1文節の第M(N−
1)候補の終点と第N文節の第M(N)候補の始点を比
べ一致していなかったら、NGであり、ステップ350
を実行する。Nが出力開始文節のときは第N文節の第M
(N)候補の始点が変換開始位置でなくなったら、NG
であり、ステップ350を実行する。Step 310 is the M-th (N) th section of the N-th clause.
Check candidates. In this check, if N is larger than the output start phrase, the M-th (N-
1) If the end point of the candidate and the start point of the Mth (N) th candidate of the Nth clause are not coincident with each other, the result is NG, and step 350 is performed.
Execute When N is the output start clause, the Mth clause of the Nth clause
(N) If the start point of the candidate is not the conversion start position, NG
Then, step 350 is executed.
【0042】それ以外の場合はOKとなり、ステップ3
20を実行する。ステップ350では、文節番号Nが出
力開始文節より大きい場合はステップ360を、文節番
号Nが出力開始文節のときは、ステップ410を実行す
る。ステップ360では、文節番号Nに1引いた数を格
納する。また、第N文節の候補番号M(N)に1足した
数を格納する。その後、ステップ310を実行する。In other cases, the result is OK and step 3
Execute 20. In step 350, if the clause number N is larger than the output start clause, step 360 is executed, and if the clause number N is the output start clause, step 410 is executed. In step 360, the phrase number N minus 1 is stored. In addition, a number obtained by adding 1 to the candidate number M (N) of the Nth clause is stored. Then, step 310 is executed.
【0043】ステップ320では、第N+1文節の候補
番号M(N+1)を0クリアする。ステップ330で
は、第N+1文節の第M(N+1)候補のチェックを行
う。内容はステップ310と同様である。NGの場合
は、ステップ370を実行する。OKの場合は、ステッ
プ330を実行する。In step 320, the candidate number M (N + 1) of the (N + 1) th clause is cleared to 0. In step 330, the Mth (N + 1) th candidate of the (N + 1) th clause is checked. The contents are the same as in step 310. If NG, execute step 370. If it is OK, step 330 is executed.
【0044】ステップ370では、第N文節の候補番号
M(N)に1足した数を格納する。続いてステップ31
0を実行する。ステップ335では、第N文節の第M
(N)候補と第N+1文節の第M(N+1)候補の品詞
接続を検定する。検定には、図16のような接続テーブ
ルを使用する。In step 370, the number obtained by adding 1 to the candidate number M (N) of the Nth clause is stored. Then step 31
Execute 0. In step 335, the M-th sentence of the N-th clause
(N) The part-of-speech connection of the (N) candidate and the M (N + 1) th candidate of the (N + 1) th clause is tested. A connection table as shown in FIG. 16 is used for the verification.
【0045】接続テーブルは縦方向に前文節の品詞、付
属語が付いている場合は付属語を、ない場合は自立語の
品詞を用いる。横方向には、後文節の品詞、自立語の品
詞を用いる。このテーブルで接続強さを検定する。接続
強さが0である組み合わせの場合は、NGとなり、ステ
ップ340を実行する。それ以外の場合は、ステップ3
80を実行する。The connection table uses the part-of-speech of the preceding clause in the vertical direction, the part-of-speech of an independent word when an adjunct is attached, and the part-of-speech of an independent word when there is no adjunct. In the horizontal direction, the part-of-speech of the after clause and the part-of-speech of the independent word are used. Use this table to test the connection strength. If the combination has a connection strength of 0, the result is NG and step 340 is executed. Otherwise, step 3
Execute 80.
【0046】ステップ380では、第N+1文節の第M
候補の終点がかな入力バッファのEND位置になってい
るかどうかを判定する。ENDのときは、ステップ39
0を実行する。そうでないときは、ステップ340を実
行する。ステップ390では、組み合わせた候補の評価
を行う。評価は、 1:文節数が少ないのが高得点、 2:使用頻度の高いものが高得点 3:文法的な接続は、図16の接続テーブルで接続デー
タの値が高いものが高得点となるようにする。例えば、
文節数が1のとき100点、2のときは50点などとテ
ーブルで持てばよい。In step 380, the M-th M + 1th clause
It is determined whether the end point of the candidate is the END position of the kana input buffer. If it is END, step 39
Execute 0. Otherwise, execute step 340. In step 390, the combined candidates are evaluated. The evaluation is as follows: 1: The score is high when the number of clauses is small, 2: The score is high when the usage frequency is high, 3: The grammatical connection is high when the connection data in the connection table of FIG. 16 is high. To do so. For example,
If the number of clauses is 1, 100 points, if it is 2, 50 points, etc., may be held in the table.
【0047】これらの合算値が評価となる。ステップ4
00では、組み合わせ可能な候補を文節候補テーブルに
ステップ390の評価と合わせて格納する。候補数KO
HOに1足した値を格納する。但し、文節候補テーブル
に格納可能な組み合わせは、8組が限度となっている。The sum of these values becomes the evaluation. Step 4
In 00, the candidates that can be combined are stored in the phrase candidate table together with the evaluation in step 390. Number of candidates KO
The value obtained by adding 1 to HO is stored. However, the number of combinations that can be stored in the phrase candidate table is limited to eight.
【0048】候補数KOHOがすでに8のとき、文節候
補テーブルのうちもっとも評価の低い組と、格納しよう
としている候補の評価を比較して、格納しようとしてい
る組のほうが高い場合のみ、その組をもっとも評価の低
い組の位置に格納する。この場合の候補数KOHOは8
のままとする。上記例の図18のようになる。ステップ
410では、文節候補テーブルに基づいて、出力候補を
出力候補テーブルの出力開始文節より格納する。出力順
は、 1:文節候補テーブルの評価の高い順 2:同音異義語がある場合、単語辞書データの頻度順な
どのルールで決まる。 上記例の場合、図10となる。なお、KOHOが0の場
合は、かな入力バッファに格納されているかなコード出
力候補テーブルの出力開始文節に格納する。When the number of candidates KOHO is already 8, the set having the lowest evaluation in the clause candidate table is compared with the evaluation of the candidate to be stored, and the set is stored only when the set to be stored is higher. Store in the position of the group with the lowest evaluation. The number of candidates KOHO in this case is 8
Leave as is. FIG. 18 of the above example is obtained. In step 410, the output candidates are stored from the output start clause of the output candidate table based on the clause candidate table. The output order is determined by a rule such as 1) the order in which the phrase candidate table is highly evaluated, 2: the case where there are homonyms, and the frequency order of the word dictionary data. In the case of the above example, FIG. When KOHO is 0, it is stored in the output start clause of the kana code output candidate table stored in the kana input buffer.
【0049】ステップ410を終えると、制御を戻す。Upon completion of step 410, control returns.
【0050】[0050]
【発明の効果】本発明により、モードに応じて、最適な
文法ルールによる得点付けが為される。According to the present invention, scoring is performed according to the optimum grammar rule according to the mode.
【図1】従来からのワープロを示す図である。FIG. 1 is a diagram showing a conventional word processor.
【図2】従来からのワープロの仮名漢字変換処理を説明
するための図である。FIG. 2 is a diagram for explaining a conventional kana-kanji conversion process of a word processor.
【図3】従来からのワープロの仮名漢字変換処理を説明
するための図である。FIG. 3 is a diagram for explaining a conventional kana-kanji conversion process of a word processor.
【図4】文節区切りと変換候補を説明するための図であ
る。FIG. 4 is a diagram for explaining segment breaks and conversion candidates.
【図5】本発明の第1実施例のフローを説明するための
図である。FIG. 5 is a diagram for explaining the flow of the first embodiment of the present invention.
【図6】本発明の第1実施例のブロック図である。FIG. 6 is a block diagram of a first embodiment of the present invention.
【図7】この第2実施例のフローを説明するための図で
ある。FIG. 7 is a diagram for explaining the flow of the second embodiment.
【図8】この第2実施例を説明するための図である。FIG. 8 is a diagram for explaining the second embodiment.
【図9】この第2実施例を説明するための図である。FIG. 9 is a diagram for explaining the second embodiment.
【図10】この第2実施例を説明するための図である。FIG. 10 is a diagram for explaining the second embodiment.
【図11】この第2実施例を説明するための図である。FIG. 11 is a diagram for explaining the second embodiment.
【図12】この第2実施例を説明するための図である。FIG. 12 is a diagram for explaining the second embodiment.
【図13】この第2実施例を説明するための図である。FIG. 13 is a diagram for explaining the second embodiment.
【図14】この第2実施例のフローを説明するための図
である。FIG. 14 is a diagram for explaining the flow of the second embodiment.
【図15】この第2実施例を説明するための図である。FIG. 15 is a diagram for explaining the second embodiment.
【図16】この第2実施例を説明するための図である。FIG. 16 is a diagram for explaining the second embodiment.
【図17】この第2実施例を説明するための図である。FIG. 17 is a diagram for explaining the second embodiment.
【図18】この第2実施例を説明するための図である。FIG. 18 is a diagram for explaining the second embodiment.
(1)・・・・・入力部、 (2)・・・・・本体(仮名漢字変換部)、 (3)・・・・・表示部。 (1) ・ ・ ・ ・ ・ Input section, (2) ・ ・ ・ ・ ・ Main body (Kana-Kanji conversion section), (3) ・ ・ ・ ・ ・ Display section.
Claims (3)
ても複数文節間の文法的な接続関係で得点を付け、高得
点の仮名漢字変換候補を優先的に表示する仮名漢字変換
モードと共に、前記区切り位置を操作者の指示により変
更可能な再変換モードを備える文書処理装置の仮名漢字
変換方法において、 前記再変換モード時における文法的得点付けの重みを、
前記仮名漢字変換モード時における文法的得点付けの重
みに比べて、軽くすることを特徴とする仮名漢字変換方
法。1. A kana-kanji conversion mode in which kana input is divided into a plurality of clauses, a score is given at least by a grammatical connection relation between the plurality of clauses, and a kana-kanji conversion candidate with a high score is preferentially displayed. In a kana-kanji conversion method of a document processing apparatus having a reconversion mode in which the delimiter position can be changed by an operator's instruction, a weight for grammatical scoring in the reconversion mode,
A kana-kanji conversion method, which is lighter than the weight of grammatical scoring in the kana-kanji conversion mode.
ても複数文節間の文法的な接続関係で得点を付け、高得
点の仮名漢字変換候補を優先的に表示する仮名漢字変換
モードを備える文書処理装置の仮名漢字変換方法におい
て、 前記再変換モード時において、漢字変換候補の部分確定
操作が為された場合に、この確定部分が未確定部分に及
ぼす文法的得点付けの重みを軽くすることを特徴とする
仮名漢字変換方法。2. A kana-kanji conversion mode that divides kana input into a plurality of clauses, scores at least the grammatical connection between the clauses, and preferentially displays kana-kanji conversion candidates with high scores. In the kana-kanji conversion method of a document processing device, when a partial confirmation operation of a kanji conversion candidate is performed in the re-conversion mode, the weight of grammatical scoring exerted by this confirmed portion on an undetermined portion is lightened. Kana-Kanji conversion method characterized by.
ても複数文節間の文法的な接続関係で得点を付け、高得
点の仮名漢字変換候補を優先的に表示する仮名漢字変換
モードと共に、前記区切り位置を操作者の指示により変
更可能な再変換モードを備える文書処理装置の仮名漢字
変換方法において、 前記再変換モード時において、前記区切り位置を操作者
の指示により変更され、その部分の漢字変換候補の部分
確定操作が為された場合に、この確定部分が未確定部分
に及ぼす文法的得点付けの重みを軽くすることを特徴と
する仮名漢字変換方法。3. A kana-kanji conversion mode in which kana input is divided into a plurality of clauses, a score is given at least by a grammatical connection relationship between the clauses, and a kana-kanji conversion candidate with a high score is preferentially displayed. In a kana-kanji conversion method of a document processing apparatus having a re-conversion mode in which the delimiter position can be changed by an operator's instruction, in the re-conversion mode, the delimiter position is changed by the operator's instruction, and the kanji of that part is changed. A kana-kanji conversion method characterized by lightening the weight of grammatical scoring exerted by the fixed part on the unfixed part when the partial fixing operation of the conversion candidate is performed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7273206A JPH09134351A (en) | 1995-09-08 | 1995-10-20 | Kana/kanji converting method of document processor |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7-231409 | 1995-09-08 | ||
JP23140995 | 1995-09-08 | ||
JP7273206A JPH09134351A (en) | 1995-09-08 | 1995-10-20 | Kana/kanji converting method of document processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09134351A true JPH09134351A (en) | 1997-05-20 |
Family
ID=26529848
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP7273206A Pending JPH09134351A (en) | 1995-09-08 | 1995-10-20 | Kana/kanji converting method of document processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09134351A (en) |
-
1995
- 1995-10-20 JP JP7273206A patent/JPH09134351A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7302640B2 (en) | Language input architecture for converting one text form to another text form with tolerance to spelling, typographical, and conversion errors | |
WO2001035249A2 (en) | Language input architecture for converting one text form to another text form with modeless entry | |
JPH10326275A (en) | Method and device for morpheme analysis and method and device for japanese morpheme analysis | |
JP2633824B2 (en) | Kana-Kanji conversion device | |
JP2595934B2 (en) | Kana-Kanji conversion processor | |
JPH11238051A (en) | Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program | |
JPH09134351A (en) | Kana/kanji converting method of document processor | |
JPH11338498A (en) | Voice synthesizer | |
US6327560B1 (en) | Chinese character conversion apparatus with no need to input tone symbols | |
JPH07105217A (en) | Automatic correcting device for input character | |
JPH09134353A (en) | Kana/kanji converting method of document processor | |
JPH07104861B2 (en) | Kana-Kanji conversion device and method | |
JPH08272780A (en) | Processor and method for chinese input processing, and processor and method for language processing | |
JP3490811B2 (en) | Kana-Kanji conversion method for document processing device | |
JPH09134350A (en) | Kana/kanji converting method of document processor | |
JP2738386B2 (en) | Kana-Kanji conversion device | |
JPH0773174A (en) | Processing system of japanese language | |
JPH0675943A (en) | Kana-kanji conversion device | |
JPH0628338A (en) | Word processor | |
JPH06149791A (en) | Chinese character document input device | |
JPH09231217A (en) | System and method for language analysis | |
JPH0798702A (en) | Document preparing device | |
JPH032960A (en) | Kana/kanji converting device | |
JPH06274492A (en) | Language inputting device | |
JPH08241315A (en) | Word registering mechanism for document processor |