JP2580060B2 - Kana-Kanji conversion method and device - Google Patents

Kana-Kanji conversion method and device

Info

Publication number
JP2580060B2
JP2580060B2 JP2098626A JP9862690A JP2580060B2 JP 2580060 B2 JP2580060 B2 JP 2580060B2 JP 2098626 A JP2098626 A JP 2098626A JP 9862690 A JP9862690 A JP 9862690A JP 2580060 B2 JP2580060 B2 JP 2580060B2
Authority
JP
Japan
Prior art keywords
user
dictionary
kana
conversion
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2098626A
Other languages
Japanese (ja)
Other versions
JPH03296163A (en
Inventor
佳三 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2098626A priority Critical patent/JP2580060B2/en
Publication of JPH03296163A publication Critical patent/JPH03296163A/en
Application granted granted Critical
Publication of JP2580060B2 publication Critical patent/JP2580060B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は、入力されたかな文字列を漢字かな交じり
文に変換するかな漢字変換方法及び装置に関する。
The present invention relates to a kana-kanji conversion method and apparatus for converting an input kana character string into a kanji-kana mixed sentence.

(ロ)従来の技術 従来、この種のかな漢字変換機能を備えた文書処理装
置においては、かな漢字変換のための辞書が設けられて
いる。
(B) Conventional technology Conventionally, in a document processing apparatus having a kana-kanji conversion function of this type, a dictionary for kana-kanji conversion is provided.

この辞書に登録してある単語は、通常は一般的な単語
であり、専門的な単語については、ユーザーが新規に単
語を登録できるようにユーザー辞書が設けられている。
このユーザー辞書に登録した単語は、ユーザーが使用す
る単語ということで、一般辞書に登録してある単語より
出力の優先順位が高いのが普通である。
The words registered in this dictionary are usually general words, and a specialized dictionary is provided with a user dictionary so that a user can newly register words.
Since the words registered in the user dictionary are words used by the user, they usually have a higher output priority than the words registered in the general dictionary.

(ハ)発明が解決しようとする課題 しかしながら、単語は欲しいが必ずしも第1番目に出
してほしくない単語がある。また、ユーザー辞書に単語
を登録した為、今まで正確に出力していた文字列が出な
くなる場合がある、 すなわち、前者の場合は、例えば辞書には「こうて
い」として「工程,公定,公邸,行程,肯定,皇帝,校
訂,高低」が登録されており、ここに新たに「考訂」を
登録すれば、以後「考訂」は他の「こうてい」という単
語よりも強めに出力される。
(C) Problems to be Solved by the Invention However, there are words that the user wants a word but does not necessarily want to appear first. In addition, since words have been registered in the user dictionary, a character string that has been output correctly up to now may not be output. , Process, affirmation, emperor, school revision, high and low "are registered, and if" revision "is newly registered here," revision "will be output more strongly than the other words" kouta ".

また、後者においては、ユーザー辞書に「うじこ=氏
子」を登録することにより、今まで「こうくうじこ」の
文字列を変換すると「航空事故」と出力されていたもの
が、「うじこ」の出力が強いので「校区氏子」と出力さ
れる可能性が生じる。
In the latter case, by registering "Ujiko = Ujiko" in the user dictionary, if the character string of "Kuko Ujiko" was converted to "Aircraft accident" until now, "Ujiko" Is strong, there is a possibility that the output will be "School District Fellow".

この発明は、このような事情を考慮してなされたもの
で、ユーザー辞書に単語を登録する際に、その単語に、
単文節変換時以外、つまり複文節変換や連文節変換と呼
ばれる複数文節一括変換時には、変換の対象としないと
いう認識フラッグをつけることにより、変換時の悪影響
を防止して、変換効率の向上を図ったかな漢字変換方法
及び装置を提供するものである。
The present invention has been made in consideration of such circumstances, and when registering a word in a user dictionary,
At the time other than single-segment conversion, that is, at the time of multiple-segment conversion or multiple-segment conversion at the same time, by adding a recognition flag indicating that conversion is not to be performed, adverse effects during conversion were prevented, and conversion efficiency was improved. A kana-kanji conversion method and apparatus are provided.

(ニ)課題を解決するための手段 この発明は、多数の単語をその読み情報と共に記憶し
た一般辞書と、使用者によって指定された単語と読み情
報及び識別情報とを関連付けて登録するユーザー辞書と
を用いて、入力されるかな文字列をかな漢字変換するに
あたり、かな文字列を入力し、入力されたかな文字列を
記憶し、記憶されたかな文字列を文節単位に分割し、分
割された文節を単位にして一般辞書およびユーザー辞書
より変換候補を検索し、検索された変換候補中に識別情
報が付されたユーザー辞書変換候補が含まれているかど
うかを判断し、分割結果が複数文節であるとき、識別情
報が付されたユーザー辞書変換候補以外の変換候補のみ
出力することを特徴とするかな漢字変換方法である。
(D) Means for Solving the Problems The present invention relates to a general dictionary that stores a large number of words together with their reading information, and a user dictionary that registers a word specified by a user in association with reading information and identification information. Is used to convert the input Kana character string to Kana-Kanji conversion, input the Kana character string, store the input Kana character string, divide the stored Kana character string into phrase units, The conversion candidate is searched from the general dictionary and the user dictionary in units of, and it is determined whether the searched conversion candidate includes the user dictionary conversion candidate with identification information, and the division result is a plurality of phrases. At this time, there is provided a kana-kanji conversion method characterized by outputting only conversion candidates other than the user dictionary conversion candidates with identification information.

また、この発明は、第1図に示すように、多数の単語
のその読み情報と共に記憶した一般辞書101と、使用者
によって指定された単語と読み情報及び識別情報とを関
連付けて登録するユーザー辞書102と、かな文字列を入
力する入力手段103と、入力されたかな文字列を記憶す
る記憶手段104と、記憶されたかな文字列を文節単位に
分割する分割手段105と、分割された文節を単位にして
一般辞書101およびユーザー辞書102より変換候補を検索
する検索手段106と、検索された変換候補中に識別情報
が付されたユーザー辞書変換候補が含まれているかどう
かを判断する判断手段107と、分割結果が複数文節であ
るとき、識別情報が付されたユーザー辞書変換候補以外
の変換候補のみ出力する出力手段108を備えたことを特
徴とするかな漢字変換装置である この発明における一般辞書部101及びユーザー辞書部1
02は、漢字を含む単語の読み情報、表記、意味上の分類
及び用例を単語毎に多数記憶できるものであればよく、
大容量のROM、フロッピーディスクやハードディスクな
どの磁気記憶媒体とその駆動装置などで構成される。
In addition, as shown in FIG. 1, the present invention provides a general dictionary 101 that stores a large number of words together with their reading information, and a user dictionary that registers a word specified by a user in association with reading information and identification information. 102, an input means 103 for inputting a kana character string, a storage means 104 for storing the input kana character string, a dividing means 105 for dividing the stored kana character string in units of phrases, Search means 106 for searching for conversion candidates from the general dictionary 101 and the user dictionary 102 in units, and judging means 107 for judging whether the searched conversion candidates include a user dictionary conversion candidate with identification information. And a kana-kanji conversion device characterized by comprising output means 108 for outputting only conversion candidates other than the user dictionary conversion candidates with identification information when the division result is a plurality of phrases. General dictionary section 101 and user dictionary section 1 in Ming
02 may be anything that can store a large number of reading information, notation, semantic classification and examples of words including kanji for each word,
It is composed of a large-capacity ROM, a magnetic storage medium such as a floppy disk or a hard disk, and a drive unit for the medium.

入力手段103、記憶手段104及び出力手段108は、当該
分野で公知のものが使用できる。例えば入力手段103と
してはかな文字列を入力できるものであればよく、キー
ボード装置、タブレット装置等、記憶手段104としてはR
AM、出力手段108としてはCRT,LCDなどの表示装置がそれ
ぞれ用いられる。
As the input unit 103, the storage unit 104, and the output unit 108, those known in the art can be used. For example, the input means 103 may be any device capable of inputting a kana character string.
A display device such as a CRT and an LCD is used as the AM and the output means 108, respectively.

分割手段105、検索手段106及び便判断手段107として
は、CPU,ROM,RAM,I/Oポート等を備えたマイクロコンピ
ュータを用いるのが便利である。
It is convenient to use a microcomputer having a CPU, a ROM, a RAM, an I / O port, and the like as the dividing unit 105, the searching unit 106, and the service determining unit 107.

(ホ)作用 この発明によれば、入力されたかな文字列が複数文節
であるときには、識別情報が付されたユーザー辞書変換
候補以外の変換候補のみが出力されるので、これにより
かな漢字変換時の悪影響を防止して、かな漢字変換の変
換効率を向上させることができる。
(E) Function According to the present invention, when the input kana character string is a plurality of phrases, only conversion candidates other than the user dictionary conversion candidate with identification information are output, thereby providing kana-kanji conversion. The conversion efficiency of kana-kanji conversion can be improved by preventing the adverse effects.

(ヘ)実施例 以下、図面に示す実施例に基づいてこの発明を詳述す
る。なお、これによってこの発明が限定されるものでは
ない。
(F) Embodiment Hereinafter, the present invention will be described in detail based on an embodiment shown in the drawings. Note that the present invention is not limited to this.

第2図はこの発明を日本語ワードプロセッサに適用し
た一実施例の構成を示すブロック図である。
FIG. 2 is a block diagram showing a configuration of an embodiment in which the present invention is applied to a Japanese word processor.

この図において、1はかなキーやファンクションキー
等を備えたキーボードであり、かな文字列を制御部2に
入力する。
In FIG. 1, reference numeral 1 denotes a keyboard provided with kana keys, function keys, and the like, and inputs a kana character string to the control unit 2.

制御部2は、マイクロコンピュータから構成され、RO
Mからなるプログラムメモリ3に書き込まれている制御
プログラムに従い、各種のデータ処理を行う。
The control unit 2 is composed of a microcomputer and has a RO
Various data processing is performed according to the control program written in the program memory 3 composed of M.

4はキーボード1から入力されたかな文字列を漢字か
な交じり文に変換するためのフロッピーディスク装置か
らなるかな漢字変換辞書である。かな漢字変換辞書4
は、多数の単語をその読み情報と共に記憶した一般辞書
部5と、使用者によって指定された単語と読み情報とを
関連付けて登録するユーザー辞書部6から構成されてい
る。
Reference numeral 4 denotes a kana-kanji conversion dictionary comprising a floppy disk device for converting a kana character string input from the keyboard 1 into a kanji-kana mixed sentence. Kana-Kanji conversion dictionary 4
Is composed of a general dictionary unit 5 that stores a large number of words together with their reading information, and a user dictionary unit 6 that registers a word specified by the user in association with the reading information.

7はCRTディスプレイ装置からなる表示装置である。 Reference numeral 7 denotes a display device including a CRT display device.

8はかな漢字変換された文書データを記憶するRAMか
らなる文章メモリである。
Reference numeral 8 denotes a sentence memory composed of a RAM for storing document data converted into kana-kanji characters.

第3図はユーザー辞書部6に単語を登録する場合の登
録画面の一例を示す説明図であり、図に示すように、ユ
ーザー辞書部6に単語を登録する場合には、例えば「う
じこ」という単語の登録であれば、 見出し→「うじこ」 登録語→「氏子」 品詞→「名詞」 のように登録し、複数の文節を一括して変換する一括変
換(複文節変換や、連文節変換ともいう)の対象文字に
したくない場合には「品詞」の後に例えば“×”印を入
力する。これにより、ユーザー辞書部6に登録する単語
に識別符号としての認識フラッグを付加する。
FIG. 3 is an explanatory diagram showing an example of a registration screen in the case of registering a word in the user dictionary unit 6. As shown in FIG. 3, when a word is registered in the user dictionary unit 6, for example, "Ujiko" If you register the word, headline → “Ujiko” Registered word → “Ujiko” Part of speech → “Noun” Register and convert multiple phrases at once (multi-phrase conversion, continuous phrase conversion, etc.) For example, if the user does not want to use the target character, a "x" mark is input after the "part of speech". Thereby, a recognition flag as an identification code is added to a word registered in the user dictionary unit 6.

第4図はユーザー辞書部6の登録例を示す説明図であ
り、図に示すように、ユーザー辞書部6には、一括変換
の対象とする単語には認識フラッグ“1"が、対象とした
くない単語には認識フラッグ“0"がそれぞれ付加されて
いる。
FIG. 4 is an explanatory diagram showing an example of registration in the user dictionary unit 6. As shown in FIG. 4, in the user dictionary unit 6, the recognition flag “1” is assigned to a word to be subjected to batch conversion, and Words that do not have a recognition flag “0” are added to each word.

例えば、第5図に示すような「こうくうじこ」という
かな文字列が入力されて、この文字列に対してかな漢字
変換が行われる場合について説明する。
For example, a case will be described in which a kana character string such as “Kokuujiji” as shown in FIG. 5 is input and Kana-Kanji conversion is performed on this character string.

「こうくうじこ」のかな文字列が入力された場合、制
御部2により、先行文節と後続文節の抽出が行われ、複
数の候補が選出される。通常の処理では、漢字2字どう
しの結びつきが強いので「氏子」がユーザー辞書部6に
登録されていなければ、「航空、高空+事故、自己」の
候補にしぼられ、頻度情報が考慮されて「航空+事故」
が結びつけられて出力される。
When a kana character string of “Koji Ujiko” is input, the control unit 2 extracts a preceding phrase and a following phrase, and selects a plurality of candidates. In the normal processing, since the connection between two kanji characters is strong, if "Ushiko" is not registered in the user dictionary unit 6, it is squeezed as a candidate for "aviation, high sky + accident, self" and frequency information is considered. "Aircraft + accident"
Are output in association with each other.

しかしながら、「氏子」がユーザー辞書部6に登録さ
れれば「校区、工区+氏子」の候補も選出される。この
場合、「こうくうじこ」という文字例が入力されたとき
には、「航空+事故」を出力するという約束ごと(複合
用例)があれば「氏子」が登録されていても問題はない
が、この約束ごとがなければユーザー辞書部6に登録さ
れた単語の方が強く出力されるので、「氏子」を出力す
るために「校区+氏子」と変換される可能性が高い。
However, if "Fuji" is registered in the user dictionary unit 6, a candidate for "School zone, construction zone + Fiji" is also selected. In this case, if the character example "Koku Ujiko" is input, if there is a promise (composite example) to output "Airline + Accident", there is no problem even if "Mr. Ushiko" is registered. If there is no promise, the words registered in the user dictionary unit 6 are output more strongly, so that there is a high possibility that the words are converted to “school zone + shiko” in order to output “shiko”.

この為、あらかじめ「氏子」が悪影響を及ぼすとわか
っていれば、又はわかった時点でユーザー辞書部6の認
識フラッグをOFF(0)にする。そうすれば「氏子」が
複数文節一括変換の対称とならないので「航空+事故」
と出力されるようにすることができる。
For this reason, if it is known that “Mr.” has an adverse effect, or at the time when it is known, the recognition flag of the user dictionary unit 6 is set to OFF (0). In that case, "Ushiko" will not be the symmetry of multiple phrase batch conversion, so "Airline + accident"
Can be output.

次に、このような制御部2の処理動作の内容を、第6
図に示すフローチャートに従い説明する。
Next, the contents of the processing operation of the control unit 2 are described in the sixth.
The description will be made according to the flowchart shown in FIG.

かな漢字変換字には、まず、入力されるかな文字列を
取り込んで(ステップ201)、先行文節を抽出し(ステ
ップ202)、後続文節を抽出して(ステップ203)、一般
辞書部5とユーザー辞書6を参照して二文節処理を行う
(ステップ204)。そして、文章の終わりまでこれを繰
り返して(ステップ206)、同音語の選択を行って(ス
テップ207)、文章が終われば(ステップ208)、かな漢
字変換を終了する、 このようにして、ユーザー辞書部6に登録した単語
に、複数文節一括変換字には変換の対象としないという
認識フラッグをつけることにより、ユーザー辞書部6に
単語を登録することによって生ずる、かな漢字変換字の
変換効率の低下を防止することができる。
For the kana-kanji conversion character, first, an input kana character string is taken in (step 201), a preceding phrase is extracted (step 202), a subsequent phrase is extracted (step 203), and the general dictionary unit 5 and the user dictionary are extracted. Then, a two-segment process is performed with reference to step 6 (step 204). This is repeated until the end of the sentence (step 206), and the same phoneme is selected (step 207). When the sentence ends (step 208), the kana-kanji conversion is completed. By attaching a recognition flag to the words registered in 6 that the multiple-phrase batch conversion characters are not subject to conversion, it is possible to prevent a reduction in conversion efficiency of kana-kanji conversion characters caused by registering words in the user dictionary unit 6. can do.

(ト)発明の効果 この発明によれば、入力されたかな文字列が複数文節
であるときには、識別情報が付されたユーザー辞書変換
候補以外の変換候補のみを出力するようにしたので、か
な漢字変換時の悪影響を防止して、かな漢字変換の変換
効率を向上させることができる。
(G) Effects of the Invention According to the present invention, when an input kana character string is a plurality of phrases, only conversion candidates other than the user dictionary conversion candidates to which identification information is added are output. The conversion efficiency of kana-kanji conversion can be improved by preventing adverse effects of time.

【図面の簡単な説明】[Brief description of the drawings]

第1図はこの発明の構成を示すブロック図、第2図はこ
の発明の一実施例の構成を示すブロック図、第3図はユ
ーザー辞書部に単語を登録する場合の登録画面の一例を
示す説明図、第4図はユーザー辞書部の登録例を示す説
明図、第5図はかな漢字変換の一例を示す説明図、第6
図は実施例の動作を示すフローチャートである。 1……キーボード、2……制御部、 3……プログラムメモリ、 4……かな漢字変換辞書、 5……一般辞書部、6……ユーザー辞書部、 7……表示装置、8……文章メモリ。
FIG. 1 is a block diagram showing a configuration of the present invention, FIG. 2 is a block diagram showing a configuration of an embodiment of the present invention, and FIG. 3 shows an example of a registration screen when a word is registered in a user dictionary unit. FIG. 4 is an explanatory diagram showing an example of registration in a user dictionary unit. FIG. 5 is an explanatory diagram showing an example of kana-kanji conversion.
FIG. 5 is a flowchart showing the operation of the embodiment. 1 ... keyboard, 2 ... control unit, 3 ... program memory, 4 ... kana-kanji conversion dictionary, 5 ... general dictionary unit, 6 ... user dictionary unit, 7 ... display device, 8 ... sentence memory.

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】多数の単語をその読み情報と共に記憶した
一般辞書と、使用者によって指定された単語と読み情報
及び識別情報とを関連付けて登録するユーザー辞書とを
用いて、入力されるかな文字列をかな漢字変換するにあ
たり、 かな文字列を入力し、 入力されたかな文字列を記憶し、 記憶されたかな文字列を文節単位に分割し、 分割された文節を単位にして一般辞書およびユーザー辞
書より変換候補を検索し、 検索された変換候補中に識別情報が付されたユーザー辞
書変換候補が含まれているかどうかを判断し、 分割結果が複数文節であるとき、識別情報が付されたユ
ーザー辞書変換候補以外の変換候補のみ出力することを
特徴とするかな漢字変換方法。
1. A kana character to be input using a general dictionary storing a large number of words together with its reading information, and a user dictionary for registering a word specified by a user in association with reading information and identification information. To convert a column to Kana-Kanji characters, enter a Kana character string, store the entered Kana character string, divide the stored Kana character string into clause units, and use the divided clauses as a unit for general dictionaries and user dictionaries. The conversion candidates are searched for, and it is determined whether or not the searched conversion candidates include the user dictionary conversion candidates with identification information. When the division result is a plurality of phrases, the user with the identification information is determined. A kana-kanji conversion method characterized by outputting only conversion candidates other than dictionary conversion candidates.
【請求項2】多数の単語のその読み情報と共に記憶した
一般辞書と、 使用者によって指定された単語と読み情報及び識別情報
とを関連付けて登録するユーザー辞書と、 かな文字列を入力する入力手段と、 入力されたかな文字列を記憶する記憶手段と、 記憶されたかな文字列を文節単位に分割する分割手段
と、 分割された文節を単位にして一般辞書およびユーザー辞
書より変換候補を検索する検索手段と、 検索された変換候補中に識別情報が付されたユーザー辞
書変換候補が含まれているかどうかを判断する判断手段
と、 分割結果が複数文節であるとき、識別情報が付されたユ
ーザー辞書変換候補以外の変換候補のみ出力する出力手
段を備えたことを特徴とするかな漢字変換装置。
2. A general dictionary that stores a large number of words together with their reading information, a user dictionary that registers words specified by a user in association with reading information and identification information, and an input unit that inputs a kana character string. And storage means for storing the input kana character string; dividing means for dividing the stored kana character string into phrases; and searching for conversion candidates from the general dictionary and the user dictionary in units of the divided phrases. Search means; determination means for determining whether or not a searched conversion candidate includes a user dictionary conversion candidate with identification information; and, when the division result is a plurality of phrases, a user with identification information. A kana-kanji conversion device comprising output means for outputting only conversion candidates other than dictionary conversion candidates.
JP2098626A 1990-04-13 1990-04-13 Kana-Kanji conversion method and device Expired - Lifetime JP2580060B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2098626A JP2580060B2 (en) 1990-04-13 1990-04-13 Kana-Kanji conversion method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2098626A JP2580060B2 (en) 1990-04-13 1990-04-13 Kana-Kanji conversion method and device

Publications (2)

Publication Number Publication Date
JPH03296163A JPH03296163A (en) 1991-12-26
JP2580060B2 true JP2580060B2 (en) 1997-02-12

Family

ID=14224738

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2098626A Expired - Lifetime JP2580060B2 (en) 1990-04-13 1990-04-13 Kana-Kanji conversion method and device

Country Status (1)

Country Link
JP (1) JP2580060B2 (en)

Also Published As

Publication number Publication date
JPH03296163A (en) 1991-12-26

Similar Documents

Publication Publication Date Title
JP2580060B2 (en) Kana-Kanji conversion method and device
JPH05233600A (en) Word processor
JPS58123129A (en) Converting device of japanese syllabary to chinese character
JPH07271774A (en) Document input device
JPH08339376A (en) Foreign language retrieving device and information retrieving system
JP2621999B2 (en) Document processing device
JPH0452500B2 (en)
JPH0154744B2 (en)
JP2866437B2 (en) Example dictionary registration method and device
JP3454895B2 (en) Kana-Kanji conversion method
JPH0421901B2 (en)
JP3118880B2 (en) Japanese sentence processor
JP3084864B2 (en) Text input device
JPS60112175A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JPS59194233A (en) Kana to kanji conversion system
JPS63116269A (en) Kana-kanji conversion device for Japanese processing
JPH01114973A (en) Device for supporting document formation/calibration
JPH0727526B2 (en) Kana-Kanji converter
JPH01316865A (en) Device for attaching reading input function in kana/kanji conversion
JPH06274478A (en) Document processor
JPS59220828A (en) Kana to kanji conversion system
JPH07129571A (en) Device and method for document preparation
JPH08263472A (en) Method and device for retrieving sentence
JPH0512251A (en) Document processor
JPS6299866A (en) Japanese text input method