JPH1021231A - Japanese syllabary-chinese character conversion device - Google Patents

Japanese syllabary-chinese character conversion device

Info

Publication number
JPH1021231A
JPH1021231A JP8177726A JP17772696A JPH1021231A JP H1021231 A JPH1021231 A JP H1021231A JP 8177726 A JP8177726 A JP 8177726A JP 17772696 A JP17772696 A JP 17772696A JP H1021231 A JPH1021231 A JP H1021231A
Authority
JP
Japan
Prior art keywords
rule
kana
conversion
reading
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8177726A
Other languages
Japanese (ja)
Inventor
Takao Kato
隆夫 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP8177726A priority Critical patent/JPH1021231A/en
Publication of JPH1021231A publication Critical patent/JPH1021231A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide the KANA (Japanese syllabary)-KANJI (Chinese character) conversion device which can generate a rule dictionary of smaller size with less trouble and can perform accurate KANA-KANJI conversion. SOLUTION: When an item has reading partial matching information (S46: YES) during a rule rewriting process, a KANA-KANJI converting process is performed first (S52) so that the matching part is rewritten with a described word (S50) and the reading of the remaining part is connected gramatically to the rewritten word. Here, when the conversion into the word which is connected grammatically can be done (S54: YES), the remaining part is rewritten with the word (S56). When not (S54: NO), on the other hand, a copied conversion result is put back in a conversion result storage area 22 (S58) and the process is ended.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、日本語ワードプロ
セッサ等のかな漢字変換装置に関するものである。
The present invention relates to a kana-kanji conversion device such as a Japanese word processor.

【0002】[0002]

【従来の技術】従来、この種のかな漢字変換装置は、特
開平3−142658号公報に開示されているように、
単語の読みに対する漢字等の表記を記憶した基本辞書に
基づいてかな漢字変換を行い、変換結果記憶部にかな漢
字変換結果を記憶し、そして、複数の単語列のパターン
とその書換え情報とを一組の規則として格納したものを
規則辞書とし、その規則辞書中の規則と一致した規則が
検索されたとき、前記かな漢字変換結果の内容を書換
え、表示装置により表示するようにしたものであった。
このような一連の作用は、規則変換と称していた。
2. Description of the Related Art Conventionally, a kana-kanji conversion apparatus of this kind has been disclosed in Japanese Patent Application Laid-Open No. 3-142658.
Performs Kana-Kanji conversion based on a basic dictionary that stores notations such as Kanji for reading words, stores the Kana-Kanji conversion results in a conversion result storage unit, and stores a pattern of a plurality of word strings and its rewriting information as a set. The rules stored as rules are used as a rule dictionary, and when a rule that matches a rule in the rule dictionary is searched, the contents of the kana-kanji conversion result are rewritten and displayed on a display device.
Such a series of actions was called rule conversion.

【0003】例えば、「てがみをかく」と入力した場合
に、通常のかな漢字変換では、変換結果として「手紙を
各」が出力される場合がある。これが、規則変換を利用
すると、規則辞書中に<U−手紙:N><U−を:N>
<D−か:書><U−Pカ行5段:N>というパターン
が記憶されていた場合には、この規則が働くことによ
り、「手紙を各」の「各」の部分を「書く」に書換え
て、「手紙を書く」という正しい変換結果を得ることが
できるものであった。
[0003] For example, when "tegami kakaku" is input, in the normal kana-kanji conversion, "each letter" may be output as a conversion result. If this uses rule conversion, then <U-letter: N><U-:N> in the rule dictionary
If a pattern of <D- or: letter><UP-line 5th row: N> is stored, this rule works to write the "each" part of "each letter". To obtain a correct conversion result of "writing a letter".

【0004】[0004]

【発明が解決しようとする課題】しかしながら、例えば
上述の規則中の<U−Pカ行5段:N>という規則項目
は、カ行5段動詞のすべての活用語尾を表しており、こ
れにより「書こう」「書いた」などの語尾変化にも対応
して正しい変換結果を得ることができるようになってい
るが、実際には、内部的にそれぞれの活用語尾をすべて
データとして保有しているわけであり、他の単語だけの
組み合わせによる規則に比べて、規則作成時の手間が多
くかかり、また規則辞書のサイズも大きくなるという問
題点があった。
However, for example, the rule item <UP-K5th-row: N> in the above rule represents all the inflected endings of the 5-row-verb verb. Although correct conversion results can be obtained in response to inflections such as "let's write" and "written", in practice, each of the inflected endings is stored internally as data. Therefore, there is a problem that it takes more time and effort to create a rule and a rule dictionary becomes larger in size than a rule based on a combination of other words alone.

【0005】本発明は、上述した問題点を解決するため
になされたものであり、よりサイズの小さい規則辞書を
より少ない手間で作成でき、且つ正確にかな漢字変換を
行えるかな漢字変換装置を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problems, and an object of the present invention is to provide a kana-kanji conversion apparatus which can create a rule dictionary having a smaller size with less labor and can perform kana-kanji conversion accurately. With the goal.

【0006】[0006]

【課題を解決するための手段】この目的を達成するため
に本発明の請求項1に記載のかな漢字変換装置は、かな
読み文字列を入力するための入力手段と、少なくとも単
語の読みに対する表記を記憶した基本辞書と、前記基本
辞書に基づいて、前記入力手段より入力されたかな読み
文字列のかな漢字変換を行うかな漢字変換手段と、その
かな漢字変換手段による変換結果を記憶する変換結果記
憶手段と、前記基本辞書に記憶された単語の読みや表記
等の情報の複数の単語についての組み合わせからなるパ
ターンと、そのパターン内の単語の表記を書換えるため
の書換え情報とを有する規則を記憶した規則辞書と、前
記変換結果記憶手段に記憶された前記変換結果と一致す
るパターンを持つ規則を、前記規則辞書から検索する規
則検索手段と、その規則検索手段により一致したパター
ンを持つ規則が検索されたとき、その規則の書換え情報
に従って前記変換結果を書換える規則書換え手段と、を
備えたものを対象として、前記規則辞書は、単語の読み
の一部分が一致することを示す読み部分一致情報を記憶
し、前記規則書換え手段は、前記読み部分一致情報に基
づいて、前記変換結果記憶手段が記憶する前記変換結果
の書換えを行い、且つその書換えた文字列以降のかな読
み文字列を、前記書換えた文字列の末尾に文法的に正し
く接続するように再変換処理を行う。
In order to achieve this object, a kana-kanji conversion device according to claim 1 of the present invention comprises input means for inputting a kana reading character string and at least a notation for reading a word. Based on the stored basic dictionary, based on the basic dictionary, kana-kanji conversion means for performing kana-kanji conversion of the kana reading character string input from the input means, and conversion result storage means for storing a conversion result by the kana-kanji conversion means, A rule dictionary storing a rule having a pattern composed of a combination of a plurality of words of information such as word reading and notation stored in the basic dictionary and rewriting information for rewriting word notation in the pattern Rule search means for searching the rule dictionary for a rule having a pattern that matches the conversion result stored in the conversion result storage means; A rule rewriting means for rewriting the conversion result in accordance with rewriting information of the rule when a rule having a pattern matched by the rule retrieving means is searched. The rule rewriting means rewrites the conversion result stored in the conversion result storage means based on the reading partial match information, and reads and rewrites the conversion result. Re-conversion processing is performed so that the kana-reading character string after the character string is grammatically connected to the end of the rewritten character string.

【0007】従って、単語の読みの一部分だけを規則辞
書中に記述し、読み部分一致情報を備えることによっ
て、用言の活用語尾すべてについての規則変換が可能な
ので、規則辞書作成の手間を少なくし、サイズを小さく
することが可能になる。
Therefore, by describing only a part of the reading of a word in the rule dictionary and providing the partial reading matching information, rule conversion can be performed for all of the endings of the verbs, so that the time and effort for creating a rule dictionary can be reduced. , It is possible to reduce the size.

【0008】また、請求項2に記載のかな漢字変換装置
は、前記読み部分一致情報が、用言の語幹部分が一致す
ることを示す。従って、用言の活用語尾すべてについて
の規則変換が可能となり、規則辞書作成の手間を少なく
し、サイズを小さくすることが可能になる。
Further, in the kana-kanji conversion device according to the second aspect, the reading part matching information indicates that the stem part of the declinable word matches. Therefore, it is possible to perform rule conversion for all of the endings of the idiom, thereby reducing the time and effort for creating a rule dictionary and reducing the size.

【0009】また、請求項3に記載のかな漢字変換装置
は、前記規則書換え手段が、前記再変換処理によって、
前記書換えた文字列以降のかな読み文字列を前記書換え
た文字列の末尾に文法的に正しく接続するように変換す
ることができないときは、前記書換えを取り止める。従
って、規則書換え手段による無意味な文字列の書換えが
起こりにくくなり、より正確にかな漢字変換を行うこと
が可能になる。
According to a third aspect of the present invention, in the kana-kanji conversion device, the rule rewriting means performs the re-conversion processing by:
If the kana reading character string after the rewritten character string cannot be converted so as to be grammatically connected to the end of the rewritten character string, the rewriting is stopped. Therefore, the meaningless character string is less likely to be rewritten by the rule rewriting means, and more accurate Kana-Kanji conversion can be performed.

【0010】[0010]

【発明の実施の形態】以下、本発明のかな漢字変換装置
を具体化した実施形態について図面を参照して説明す
る。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of a kana-kanji conversion device according to the present invention will be described below with reference to the drawings.

【0011】かな漢字変換装置の概略的構成を示すブロ
ック図を図1に示す。
FIG. 1 is a block diagram showing a schematic configuration of a kana-kanji conversion device.

【0012】図1に示すように、本実施例のかな漢字変
換装置は、かな漢字変換をする文字列を入力したり、変
換、確定等の各種指示を行うためのキーボード等によっ
て構成される入力装置10、及びその入力装置10から
入力される文字列等が表示される出力装置70が、装置
全体を制御するための中央処理装置(CPU)12に接
続されている。
As shown in FIG. 1, a kana-kanji conversion apparatus according to the present embodiment has an input device 10 including a keyboard for inputting a character string for kana-kanji conversion and for performing various instructions such as conversion and confirmation. And an output device 70 for displaying a character string or the like input from the input device 10 is connected to a central processing unit (CPU) 12 for controlling the entire device.

【0013】RAM20は、前記CPU12に接続さ
れ、かな漢字変換された結果を記憶するための変換結果
記憶領域22、入力されたかな読み文字列を記憶するた
めの読み入力バッファ領域24、前記変換結果記憶領域
22の内容をかな漢字文字列として記憶するための出力
バッファ領域26、及びポインタ情報やフラグ情報等を
記憶するワークエリア28とを備えている。そして、前
記入力装置10が、本発明の入力手段を構成し、変換結
果記憶領域22が、本発明の変換結果記憶手段を構成し
ている。
The RAM 20 is connected to the CPU 12, and stores a conversion result storage area 22 for storing a result of the Kana-Kanji conversion, a reading input buffer area 24 for storing an input Kana reading character string, and a storage for the conversion result. An output buffer area 26 for storing the contents of the area 22 as a Kana-Kanji character string, and a work area 28 for storing pointer information, flag information, and the like. The input device 10 constitutes the input means of the present invention, and the conversion result storage area 22 constitutes the conversion result storage means of the present invention.

【0014】変換結果記憶領域22には、入力されたか
な読み文字列を後述する基本辞書62と接続テーブル6
4を用いてかな漢字変換した結果が単語単位で情報を付
して記憶されており、この内容がさらに、規則変換時に
参照更新される。
The conversion result storage area 22 stores an input kana reading character string in a basic dictionary 62 and a connection table 6 described later.
The result of the Kana-Kanji conversion using No. 4 is stored with information attached in word units, and this content is further referred to and updated at the time of rule conversion.

【0015】ROM40は、前記CPU12に接続さ
れ、各種プログラムを格納しているプログラム部42と
複数の辞書を格納した辞書部60とを備えている。プロ
グラム部42は、かな漢字変換プログラム44、規則検
索プログラム46、規則書換えプログラム48とを格納
している。
The ROM 40 is connected to the CPU 12 and includes a program section 42 for storing various programs and a dictionary section 60 for storing a plurality of dictionaries. The program section 42 stores a kana-kanji conversion program 44, a rule search program 46, and a rule rewriting program 48.

【0016】尚、前記規則検索プログラム46、及び規
則書換えプログラム48により行われる処理を規則変換
処理と呼ぶ。
The processing performed by the rule search program 46 and the rule rewriting program 48 is called rule conversion processing.

【0017】そして、前記かな漢字変換プログラム44
が、本発明のかな漢字変換手段を構成し、前記規則検索
プログラム46が規則検索手段を構成している。また、
前記規則書換えプログラム48が、本発明の規則書換え
手段を構成している。
The kana-kanji conversion program 44
Constitute the kana-kanji conversion means of the present invention, and the rule search program 46 constitutes the rule search means. Also,
The rule rewriting program 48 constitutes a rule rewriting means of the present invention.

【0018】辞書部60は、基本辞書62、接続テーブ
ル64及び規則辞書66を格納している。
The dictionary section 60 stores a basic dictionary 62, a connection table 64, and a rule dictionary 66.

【0019】基本辞書62には、それぞれの単語の読み
と、その単語の漢字表記と、品詞情報と、その単語が属
するカテゴリーを表す意味コード情報が記憶されてい
る。
The basic dictionary 62 stores reading of each word, kanji notation of the word, part of speech information, and meaning code information indicating a category to which the word belongs.

【0020】接続テーブル64は、単語同士の接続関係
の可否を品詞情報により判断するためのデータを記憶し
ている。例えば、名詞と格助詞の接続は可能であるとい
う情報や動詞と格助詞の接続はできないという情報をテ
ーブルデータとして記憶している。
The connection table 64 stores data for determining whether or not there is a connection relationship between words based on part of speech information. For example, information that nouns and case particles can be connected and information that verbs and case particles cannot be connected are stored as table data.

【0021】規則辞書66は、図2に示すように、規則
項目66a〜66cを一組として一つの規則として記憶
している。一般に規則の項目は、<検索因子−単語パタ
ーン:書換え情報>という形で書かれており、この項目
の組み合わせで一つの規則パターンがつくられる仕組み
になっている。
As shown in FIG. 2, the rule dictionary 66 stores a set of rule items 66a to 66c as one rule. Generally, rule items are written in the form of <search factor-word pattern: rewrite information>, and a structure is such that one rule pattern is created by combining these items.

【0022】検索因子とは、変換結果と規則とが一致す
る方法の種類を示すもので、U因子、D因子、M因子、
及びY因子等があり、U因子は、変換結果記憶領域22
に記憶されている単語についての読み及び表記との完全
一致を意味し、D因子は変換結果記憶領域22に記憶さ
れている単語についての読み、つまりその単語と同音で
一致することを意味している。また、M因子は、変換結
果記憶領域22に記憶されている単語の意味コードで一
致することを意味する。さらに、本実施例の特徴である
Y因子は、変換結果記憶領域22に記憶されている単語
についての読みの一部分と一致することを意味し、同時
に書換え処理中において、残った読みの部分をかな漢字
変換することによって再構成したものに書換えることを
意味している。このY因子が、本発明の読み部分一致情
報を構成している。
The search factors indicate the types of methods in which the conversion result matches the rule, and include the U factor, D factor, M factor,
And the Y factor. The U factor is stored in the conversion result storage area 22.
Means a perfect match with the reading and notation of the word stored in the word, and the D factor means a reading of the word stored in the conversion result storage area 22, that is, matching the word with the same sound. I have. Further, the M factor means that the words match in the meaning code of the word stored in the conversion result storage area 22. Further, the Y factor, which is a feature of the present embodiment, means that it matches a part of the reading of the word stored in the conversion result storage area 22, and at the same time, replaces the remaining part of the reading with the Kana-Kanji character during the rewriting process. This means that the data is rewritten by conversion. This Y factor constitutes the read partial match information of the present invention.

【0023】単語パターンとは、その規則を変換結果記
憶領域22中の単語に一致させる単語のことを示し、こ
こには単語の読み、表記、意味コードの内のいずれか1
つが入る。
A word pattern indicates a word whose rule is to be matched with a word in the conversion result storage area 22. Here, any one of word reading, notation, and meaning code is used.
One enters.

【0024】書換え情報は、無変化マーカーN、削除マ
ーカーD、単語列又は意味コードのいずれかであり、無
変化マーカーNが格納されている時は、規則辞書66の
項目に一致した変換結果記憶領域22中の単語をそのま
まにし、書換えないことを表す。また、削除マーカーD
が格納されている時は、その項目を削除することを表
す。さらに、書換え情報として、単語列がある時は、規
則辞書66の項目と一致した変換結果記憶領域22中の
単語をその単語列に書換えることを表し、意味コードの
時は、基本辞書62中に記憶されている単語中の同音語
でその意味コードを持つ単語に書換えることを表してい
る。尚、ここでいう単語列とは、複数の単語(一つの単
語だけでもよい)が規則辞書66に記憶されたものであ
り、実際には基本辞書62中の単語を指し示すためのア
ドレス情報等が設定されており、このアドレス情報に基
づいて基本辞書62を参照することによって利用され
る。尚、図2においては、規則辞書66の内部構成を理
解しやすいように単語を読み、又は表記で表している。
The rewriting information is one of a non-change marker N, a deletion marker D, a word string, and a meaning code. When the non-change marker N is stored, the conversion result storage corresponding to the item of the rule dictionary 66 is stored. This indicates that the word in the area 22 is left as it is and is not rewritten. Also, delete marker D
Indicates that the item is to be deleted. Further, when there is a word string as the rewriting information, it indicates that the word in the conversion result storage area 22 that matches the item of the rule dictionary 66 is to be rewritten to the word string. In the word stored in the word "H" means that the word has the meaning code. Note that the word string referred to here is a plurality of words (only one word may be stored) stored in the rule dictionary 66. Actually, address information or the like for indicating a word in the basic dictionary 62 is stored. It is set and used by referring to the basic dictionary 62 based on this address information. In FIG. 2, words are read or represented by notation so that the internal structure of the rule dictionary 66 can be easily understood.

【0025】次に、このように構成されたかな漢字変換
装置によるかな漢字変換書処理について、図3に示すフ
ローチャートに基づいて説明する。尚、規則辞書66の
記憶状況は、図2に示すような状態であるとする。
Next, the Kana-Kanji conversion processing by the Kana-Kanji conversion apparatus configured as described above will be described with reference to the flowchart shown in FIG. It is assumed that the storage status of the rule dictionary 66 is as shown in FIG.

【0026】入力装置10からのキー入力を受け取り
(S10)、その入力が読み文字列であるか否かが判断
され(S12)、読み文字列であった場合には(S1
2:YES)、そのかな文字コードがRAM20内の読
み入力バッファ領域24に記憶される(S14)。例え
ば、読み文字列「かれはえをかきました」が入力される
と、そのかな文字コードが読み入力バッファ領域24に
記憶される。また、入力が読み文字列でない場合は(S
12:NO)、変換を指示する変換キーであるか否かが
判断され(S16)、変換キーでもない場合には(S1
6:NO)、その他の処理が行われる(S18)。
A key input from the input device 10 is received (S10), and it is determined whether or not the input is a reading character string (S12).
2: YES), the kana character code is stored in the reading input buffer area 24 in the RAM 20 (S14). For example, when the reading character string “Karihae Kakiha” has been input, the kana character code is stored in the reading input buffer area 24. If the input is not a reading character string (S
12: NO), it is determined whether the key is a conversion key for instructing conversion (S16), and if it is not a conversion key (S1).
6: NO), other processing is performed (S18).

【0027】そして、入力キーが変換キーの場合(S1
6:YES)、かな漢字変換が行われ、ROM40内の
かな漢字変換プログラム44により基本辞書62と接続
テーブル64に基づいて、読み入力バッファ領域24に
記憶されているかな文字コードが漢字かな混じり文に変
換され、変換結果記憶領域22にそれぞれの単語が記憶
される(S20)。
If the input key is a conversion key (S1)
6: YES), the kana-kanji conversion is performed, and the kana-character code stored in the reading input buffer area 24 is converted into a kanji-kana mixed sentence by the kana-kanji conversion program 44 in the ROM 40 based on the basic dictionary 62 and the connection table 64. Then, each word is stored in the conversion result storage area 22 (S20).

【0028】例えば、基本辞書62に基づいて通常のか
な漢字変換を行うと、前述の読み文字列は、漢字かな混
じり文「彼は絵を下記真下」と変換されることがある。
そして、それぞれの単語「彼」「は」「絵」「を」「下
記」「真下」が変換結果記憶領域22に記憶される。
For example, when ordinary kana-kanji conversion is performed based on the basic dictionary 62, the above-mentioned read character string may be converted into a sentence "kana kana-kane" below, which is a mixture of kanji and kana.
Then, the words “he”, “ha”, “picture”, “wo”, “below”, and “below” are stored in the conversion result storage area 22.

【0029】次に、ROM40の規則検索プログラム4
6により、変換結果記憶領域22中の単語の組み合わせ
と一致する単語パターンの組み合わせを持つ規則が、規
則辞書66中に存在するか否かの検索処理が行われる
(S22)。尚、規則中の読み部分一致情報を持つ規則
項目については、変換結果記憶領域22中の単語の読み
の一部分と一致すれば単語の一致が成り立ったとして処
理される。
Next, the rule search program 4 in the ROM 40
According to 6, a search process is performed to determine whether or not a rule having a combination of word patterns matching the combination of words in the conversion result storage area 22 exists in the rule dictionary 66 (S22). It should be noted that if a rule item having partial reading matching information in a rule matches a part of the reading of a word in the conversion result storage area 22, it is determined that a word match has been established.

【0030】例えば、前述の変換結果記憶領域22中の
単語「下記」は、読み部分一致情報を持つ規則項目66
cの<Y−か:描>と一致が成立し、すなわち、規則6
6a〜66cが変換結果記憶領域22中の単語の組み合
わせと一致していることになる。
For example, the word “below” in the above-mentioned conversion result storage area 22 is a rule item 66 having partial reading matching information.
A match is established with <Y-?: draw> of c, that is, rule 6
6a to 66c match the combination of words in the conversion result storage area 22.

【0031】変換結果記憶領域22中の単語の組み合わ
せと一致する規則がなかった場合には(S24:N
O)、規則変換処理を終了し、変換結果記憶領域22の
内容は、そのまま出力バッファ領域26に格納され、出
力装置70に表示される(S28)。
If there is no rule that matches the combination of words in the conversion result storage area 22 (S24: N
O), the rule conversion processing ends, and the contents of the conversion result storage area 22 are stored in the output buffer area 26 as they are and displayed on the output device 70 (S28).

【0032】一致する規則が規則辞書66中に存在する
場合には(S24:YES)、ROM40の規則書換え
プログラム48により、変換結果記憶領域22中の単語
の内、規則の単語パターンの組み合わせと一致した単語
の組み合わせの部分を、その規則の書換え情報に従って
書換えるという処理が行われる(S26)。
If a matching rule exists in the rule dictionary 66 (S24: YES), the rule rewriting program 48 of the ROM 40 matches the combination of the rule word pattern in the words in the conversion result storage area 22 with the rule. A process of rewriting the combined word portion according to the rewriting information of the rule is performed (S26).

【0033】ここで、図4のフローチャートに基づい
て、規則書換え処理の詳細を説明する。
Here, the details of the rule rewriting process will be described with reference to the flowchart of FIG.

【0034】規則書換え処理では、まず変換結果記憶領
域22中の変換結果のコピーを取っておく(S40)。
その後、規則検索処理で検索された規則辞書66中の規
則の中に、書換え単語項目が存在するか否かを順に探し
ていく(S42)。対象規則末尾まで見て、書換え単語
項目がない場合は(S44:NO、S60:YES)、
処理を終了する。また、対象規則中に書換え単語項目が
存在した場合には(S44:YES)、さらにその項目
が読み部分一致情報を持つものか否かを判定する(S4
6)。その項目が読み部分一致情報を持つものでなかっ
た場合には(S46:NO)、その単語位置に対応する
変換結果記憶領域22中の単語を書換え指定された単語
によって書換えるという、従来の書換え処理を行う(S
48)。その項目が読み部分一致情報を持つものであっ
た場合には(S46:YES)、まず、一致部分を記述
されている単語によって書換え(S50)、残りの部分
の読みについて、書換えられた単語に文法的に接続する
ようにかな漢字変換処理を行う(S52)。ここで、文
法的に接続するような単語列に変換できた場合には(S
54:YES)、残りの部分をその単語によって書換え
る(S56)。文法的に接続するような単語列に変換で
きなかった場合には(S54:NO)、書換え処理を取
りやめて終了する。すなわち、コピーしておいた変換結
果を変換結果記憶領域22に戻し(S58)、処理を終
了する。以上の規則書換え処理が、本発明の規則書換え
手段として機能している。
In the rule rewriting process, a copy of the conversion result in the conversion result storage area 22 is first made (S40).
Thereafter, it is sequentially searched whether or not the rewritten word item exists in the rules in the rule dictionary 66 searched by the rule search process (S42). If there is no rewritten word item up to the end of the target rule (S44: NO, S60: YES),
The process ends. If a rewrite word item exists in the target rule (S44: YES), it is further determined whether or not the item has reading partial match information (S4).
6). If the item does not have the reading partial match information (S46: NO), the conventional rewriting is performed in which the word in the conversion result storage area 22 corresponding to the word position is rewritten by the specified word. Perform processing (S
48). If the item has the reading partial matching information (S46: YES), first, the matching part is rewritten with the written word (S50), and the reading of the remaining part is changed to the rewritten word. A kana-kanji conversion process is performed so as to connect grammatically (S52). Here, if it can be converted into a word string that grammatically connects (S
54: YES), the remaining part is rewritten with the word (S56). If the word string cannot be converted into a grammatically connected word string (S54: NO), the rewriting process is canceled and the process ends. That is, the copied conversion result is returned to the conversion result storage area 22 (S58), and the process ends. The above rule rewriting process functions as the rule rewriting means of the present invention.

【0035】例えば、すでに述べたように、変換結果記
憶領域22中の「彼」「は」「絵」「を」「下記」「真
下」は、規則検索処理によって、規則辞書66中の66
a〜66cの規則の単語パターンの組み合わせと一致す
る。そこで、規則書換え処理により、順に規則項目が確
認されていき、規則項目66cが読み部分一致情報を持
つことがわかる。ここで、規則項目66cから、まず、
「下記」が「描」に書換えられ、残りの読み「きまし
た」が、「描」に文法的に接続するようにかな漢字変換
される。すると、「き(カ行五段活用語尾)」「まし
(助動詞)」「た(助詞)」という単語の組み合わせに
変換することができるので、「真下」の部分が、これら
の単語によって書換えられる。
For example, as described above, "he", "ha", "picture", "wo", "below", and "immediately below" in the conversion result storage area 22 are stored in the rule dictionary 66 by the rule search processing.
This matches the combination of the word patterns of the rules a to 66c. Then, the rule items are sequentially confirmed by the rule rewriting process, and it is found that the rule item 66c has the reading partial matching information. Here, from the rule item 66c, first,
The word "below" is rewritten to "drawing", and the remaining reading "is" is converted to kana-kanji so that it is grammatically connected to "drawing". Then, it can be converted into a combination of the words "ki" (five-step endings), "masashi (auxiliary verb)", and "ta (particle)", so the "underneath" part is rewritten by these words. .

【0036】これによって、変換結果記憶領域22中の
単語は「彼」「は」「絵」「を」「描」「き」「まし」
「た」という適切な変換結果となる。
As a result, the words in the conversion result storage area 22 are "he", "ha", "picture", "wo", "draw", "ki" and "masashi".
An appropriate conversion result of "ta" is obtained.

【0037】このように、規則辞書中の規則パターン
に、用言の語幹部分だけを規則項目として記述し、幅広
い語尾活用に対応した規則変換を行うことができるの
で、少ない手間で、サイズの小さい規則辞書を作成する
ことが可能となる。
As described above, in the rule pattern in the rule dictionary, only the stem portion of the declinable word is described as a rule item, and rule conversion corresponding to a wide range of inflections can be performed. A rule dictionary can be created.

【0038】さらに、例えば、「かれのえをかいてんい
わいにおくる」と読みが入力され、かな漢字変換される
と、「彼の絵を開店祝いに贈る」と漢字かな混じり文に
変換されることがある。これは、前述の例と同様に、規
則検索処理によって、規則辞書66中の66a〜66c
の規則の単語パターンの組み合わせと一致する。そこ
で、規則書換え処理によって書換えが行われるわけであ
るが、読み部分一致情報を持つ規則項目66cによっ
て、「開店」が「描」に書換えられ、残りの読み文字列
「いてんいわいにおくる」が「描」に文法的に接続する
ようにかな漢字変換される。しかし、結局残りの読み文
字列「いてんいわいにおくる」を「描」に文法的に接続
するようにかな漢字変換することは不可能であるので、
規則書換え処理は取りやめとなる。
Further, for example, when a reading "Karenoe Kaitei Niwa ni Koiwai" is input and converted to Kana-Kanji, it is converted to a sentence "Kanji Kana-Kana-Kana" to "Send his picture for opening celebration." There is. This is because, as in the example described above, 66a to 66c in the rule dictionary 66 by the rule search process.
Matches the word pattern combination of the rule. Therefore, the rewriting is performed by the rule rewriting process. According to the rule item 66c having the reading partial matching information, the “opening store” is rewritten to “drawing”, and the remaining reading character string “teiwanai ni kuru” is written. Kana-Kanji conversion is performed so that it is grammatically connected to "Draw". However, after all, it is impossible to convert Kana-Kanji characters so that the rest of the reading character string "Issue Ito Nikkoru" is grammatically connected to "Draw".
The rule rewriting process is canceled.

【0039】このように、規則書換え処理中の再変換
で、文法的に接続する変換結果が得られない場合に、規
則書換え処理を取りやめるので、規則変換による無意味
な文字列の書換えが起こりにくくなる。
As described above, when the conversion result during grammatical connection cannot be obtained by the reconversion during the rule rewriting process, the rule rewriting process is canceled, so that the meaningless character string rewriting due to the rule conversion does not easily occur. Become.

【0040】以上の処理によって規則書換え処理(S2
6)は終了し、図3中のS28に戻り、変換結果記憶領
域22の内容は、出力バッファ領域26に格納され、出
力装置70に表示される(S28)。
By the above processing, the rule rewriting processing (S2
6) is completed, the process returns to S28 in FIG. 3, and the contents of the conversion result storage area 22 are stored in the output buffer area 26 and displayed on the output device 70 (S28).

【0041】その後、ユーザーからのキー入力による指
示を受け取り(S30)、入力キーが確定の指示であっ
た場合は(S32:YES)、確定処理が行われ(S3
4)、かな漢字変換処理を終了する。また、入力キーが
確定の指示でない場合には(S32:NO)、次候補変
換等のその他の処理が行われる(S36)。
Thereafter, an instruction by a key input from the user is received (S30), and if the input key is an instruction for confirmation (S32: YES), confirmation processing is performed (S3).
4) The kana-kanji conversion process ends. If the input key is not an instruction to confirm (S32: NO), other processing such as next candidate conversion is performed (S36).

【0042】尚、本発明は以上詳述した実施の形態に限
定されるものではなく、その要旨を逸脱しない範囲にお
いて、種々の変更を加えることができる。
The present invention is not limited to the embodiment described in detail above, and various changes can be made without departing from the gist of the present invention.

【0043】例えば、前記実施の形態においては、読み
部分一致情報として用言の語幹部分を記憶する例を示し
たが、姓名等の名詞の一部分を記憶しても構わない。こ
の場合、例えば、姓名に対しては、「君」、「さん」等
の敬称が文法的に接続する語句となる。
For example, in the above-described embodiment, an example has been described in which the stem portion of a declinable word is stored as the reading part matching information. However, a part of a noun such as a family name may be stored. In this case, for example, with respect to the first and last names, titles such as "kun" and "san" are grammatically connected words.

【0044】[0044]

【発明の効果】以上説明したことから明らかなように、
本発明の請求項1に記載のかな漢字変換装置は、かな読
み文字列を入力するための入力手段と、少なくとも単語
の読みに対する表記を記憶した基本辞書と、前記基本辞
書に基づいて、前記入力手段より入力されたかな読み文
字列のかな漢字変換を行うかな漢字変換手段と、そのか
な漢字変換手段による変換結果を記憶する変換結果記憶
手段と、前記基本辞書に記憶された単語の読みや表記等
の情報の複数の単語についての組み合わせからなるパタ
ーンと、そのパターン内の単語の表記を書換えるための
書換え情報とを有する規則を記憶した規則辞書と、前記
変換結果記憶手段に記憶された前記変換結果と一致する
パターンを持つ規則を、前記規則辞書から検索する規則
検索手段と、その規則検索手段により一致したパターン
を持つ規則が検索されたとき、その規則の書換え情報に
従って前記変換結果を書換える規則書換え手段と、を備
えたものを対象として、前記規則辞書は、単語の読みの
一部分が一致することを示す読み部分一致情報を記憶
し、前記規則書換え手段は、前記読み部分一致情報に基
づいて、前記変換結果記憶手段が記憶する前記変換結果
の書換えを行い、且つその書換えた文字列以降のかな読
み文字列を、前記書換えた文字列の末尾に文法的に正し
く接続するように再変換処理を行う。
As is apparent from the above description,
A kana-kanji conversion device according to claim 1 of the present invention, comprising: an input unit for inputting a kana reading character string; a basic dictionary storing at least a notation for reading a word; and the input unit based on the basic dictionary. A kana-kanji conversion means for performing kana-kanji conversion of the input kana-reading character string, a conversion result storage means for storing a conversion result by the kana-kanji conversion means, and information of information such as word reading and notation stored in the basic dictionary. A rule dictionary storing a rule having a pattern composed of a combination of a plurality of words and rewriting information for rewriting the notation of a word in the pattern, and matching with the conversion result stored in the conversion result storage means Rule searching means for searching a rule having a pattern to be searched from the rule dictionary, and a rule having a pattern matched by the rule searching means. Rule rewriting means for rewriting the conversion result in accordance with the rewriting information of the rule, the rule dictionary reads the partial reading matching information indicating that a part of the reading of the word matches. The rule rewriting means rewrites the conversion result stored by the conversion result storage means based on the read partial match information, and converts the kana reading character string after the rewritten character string into the rewritten character string. Performs re-conversion processing so that it is grammatically connected to the end of the string.

【0045】従って、単語の読みの一部分だけを規則辞
書中に記述し、読み部分一致情報を備えることによっ
て、用言の活用語尾すべてについての規則変換が可能な
ので、規則辞書作成の手間を少なくし、サイズを小さく
することが可能になる。
Therefore, by describing only a part of the word reading in the rule dictionary and providing the reading part matching information, the rule conversion can be performed for all the endings of the lexical words. , It is possible to reduce the size.

【0046】また、請求項2に記載のかな漢字変換装置
は、前記読み部分一致情報が、用言の語幹部分が一致す
ることを示す。従って、用言の活用語尾すべてについて
の規則変換が可能となり、規則辞書作成の手間を少なく
し、サイズを小さくすることが可能になる。
Further, in the kana-kanji conversion device according to the second aspect, the reading part matching information indicates that the stem portion of the declinable word matches. Therefore, it is possible to perform rule conversion for all of the endings of the idiom, thereby reducing the time and effort for creating a rule dictionary and reducing the size.

【0047】また、請求項3に記載のかな漢字変換装置
は、前記規則書換え手段が、前記再変換処理によって、
前記書換えた文字列以降のかな読み文字列を前記書換え
た文字列の末尾に文法的に正しく接続するように変換す
ることができないときは、前記書換えを取り止める。従
って、規則書換え手段による無意味な文字列の書換えが
起こりにくくなり、より正確にかな漢字変換を行うこと
が可能になる。
According to a third aspect of the present invention, in the kana-kanji conversion apparatus, the rule rewriting means performs the re-conversion processing by:
If the kana reading character string after the rewritten character string cannot be converted so as to be grammatically connected to the end of the rewritten character string, the rewriting is stopped. Therefore, the meaningless character string is less likely to be rewritten by the rule rewriting means, and more accurate Kana-Kanji conversion can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態のかな漢字変換装置の概略的構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a schematic configuration of a kana-kanji conversion device according to an embodiment.

【図2】規則辞書の記憶内容を示す模式図である。FIG. 2 is a schematic diagram showing stored contents of a rule dictionary.

【図3】本実施形態のかな漢字変換装置の動作を示すフ
ローチャートである。
FIG. 3 is a flowchart showing an operation of the kana-kanji conversion device of the embodiment.

【図4】本実施形態の規則書き換え処理を示すフローチ
ャートである。
FIG. 4 is a flowchart illustrating a rule rewriting process according to the embodiment.

【符号の説明】[Explanation of symbols]

10 入力装置 12 CPU 20 RAM 22 変換結果記憶領域 24 読み入力バッファ領域 26 出力バッファ領域 28 ワークエリア 40 ROM 42 プログラム部 44 かな漢字変換プログラム 46 規則検索プログラム 48 規則書換えプログラム 60 辞書部 62 基本辞書 64 接続テーブル 66 規則辞書 70 出力装置 DESCRIPTION OF SYMBOLS 10 Input device 12 CPU 20 RAM 22 Conversion result storage area 24 Reading input buffer area 26 Output buffer area 28 Work area 40 ROM 42 Program part 44 Kana-Kanji conversion program 46 Rule search program 48 Rule rewriting program 60 Dictionary part 62 Basic dictionary 64 Connection table 66 rule dictionary 70 output device

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 かな読み文字列を入力するための入力手
段と、 少なくとも単語の読みに対する表記を記憶した基本辞書
と、 前記基本辞書に基づいて、前記入力手段より入力された
かな読み文字列のかな漢字変換を行うかな漢字変換手段
と、 そのかな漢字変換手段による変換結果を記憶する変換結
果記憶手段と、 前記基本辞書に記憶された単語の読みや表記等の情報の
複数の単語についての組み合わせからなるパターンと、
そのパターン内の単語の表記を書換えるための書換え情
報とを有する規則を記憶した規則辞書と、 前記変換結果記憶手段に記憶された前記変換結果と一致
するパターンを持つ規則を、前記規則辞書から検索する
規則検索手段と、 その規則検索手段により一致したパターンを持つ規則が
検索されたとき、その規則の書換え情報に従って前記変
換結果を書換える規則書換え手段と、 を備えたかな漢字変換装置において、 前記規則辞書は、単語の読みの一部分が一致することを
示す読み部分一致情報を記憶し、 前記規則書換え手段は、前記読み部分一致情報に基づい
て、前記変換結果記憶手段が記憶する前記変換結果の書
換えを行い、且つその書換えた文字列以降のかな読み文
字列を、前記書換えた文字列の末尾に文法的に正しく接
続するように再変換処理を行うことを特徴とするかな漢
字変換装置。
An input unit for inputting a kana reading character string; a basic dictionary storing at least a notation for reading a word; and a kana reading character string input from the input unit based on the basic dictionary. Kana-Kanji conversion means for performing Kana-Kanji conversion, conversion result storage means for storing the conversion result of the Kana-Kanji conversion means, and a pattern comprising a combination of a plurality of words of information such as word reading and notation stored in the basic dictionary When,
A rule dictionary storing rules having rewriting information for rewriting the word notation in the pattern, and a rule having a pattern matching the conversion result stored in the conversion result storage means, A kana-kanji conversion device comprising: a rule search means to be searched; and a rule rewriting means for rewriting the conversion result according to rewriting information of the rule when the rule having the matched pattern is searched by the rule search means. The rule dictionary stores reading partial match information indicating that a part of the word reading matches, and the rule rewriting means stores the conversion result stored by the conversion result storage means based on the reading partial match information. Perform rewriting, and grammatically correctly connect the kana reading character string after the rewritten character string to the end of the rewritten character string. Kana-kanji conversion apparatus characterized by performing a re-conversion process.
【請求項2】 前記読み部分一致情報は、用言の語幹部
分が一致することを示すことを特徴とする請求項1に記
載のかな漢字変換装置。
2. The kana-kanji conversion device according to claim 1, wherein the reading partial matching information indicates that the stem portion of the declinable word matches.
【請求項3】 前記規則書換え手段は、前記再変換処理
によって、前記書換えた文字列以降のかな読み文字列を
前記書換えた文字列の末尾に文法的に正しく接続するよ
うに変換することができないときは、前記書換えを取り
止めることを特徴とする請求項1若しくは2に記載のか
な漢字変換装置。
3. The rule rewriting means cannot perform conversion by the re-conversion processing so that a kana reading character string subsequent to the rewritten character string is grammatically connected to the end of the rewritten character string. The kana-kanji conversion device according to claim 1, wherein the rewriting is stopped when the kana-kanji conversion is performed.
JP8177726A 1996-07-08 1996-07-08 Japanese syllabary-chinese character conversion device Pending JPH1021231A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8177726A JPH1021231A (en) 1996-07-08 1996-07-08 Japanese syllabary-chinese character conversion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8177726A JPH1021231A (en) 1996-07-08 1996-07-08 Japanese syllabary-chinese character conversion device

Publications (1)

Publication Number Publication Date
JPH1021231A true JPH1021231A (en) 1998-01-23

Family

ID=16036047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8177726A Pending JPH1021231A (en) 1996-07-08 1996-07-08 Japanese syllabary-chinese character conversion device

Country Status (1)

Country Link
JP (1) JPH1021231A (en)

Similar Documents

Publication Publication Date Title
JPS619753A (en) Automatic registering method of frequent phrase for document processor
JPH1021231A (en) Japanese syllabary-chinese character conversion device
JP2003178087A (en) Retrieval device and method for electronic foreign language dictionary
JP3285149B2 (en) Foreign language electronic dictionary search method and apparatus
JP3329476B2 (en) Kana-Kanji conversion device
JP2688651B2 (en) String converter
JPS6246029B2 (en)
JPS62145463A (en) Kana/kanji (japanese syllabary/chinese character) conversion system
JPH0716192Y2 (en) Text processor
JPH10254869A (en) Kana (japanese syllabary) and kanji (chinese character) converter
JPS60129875A (en) Season word conversion system for kana/kanji converter
JP2744241B2 (en) Character processor
JPS63184864A (en) Documentation device
JPH0749870A (en) Japanese syllabary-chinese character conversion processing method
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JPH1091623A (en) Character conversion device
JPH08292954A (en) Japanese syllabary-chinese character converting device
JPH0785048A (en) Method and device for correcting document
JPH10124500A (en) Kana/kanji conversion device
JPS62119665A (en) Word processor
JPH0816569A (en) Document processor
JPH10177573A (en) Method and device for processing document
JPH02144661A (en) Kana/kanji converter
JPH0610804B2 (en) Kana-Kanji converter
JPH10154141A (en) Kana-to-kanji (japanese syllabary-to-chinese character) conversion device