JPH03164859A - Kana/kanji converting device - Google Patents
Kana/kanji converting deviceInfo
- Publication number
- JPH03164859A JPH03164859A JP1304159A JP30415989A JPH03164859A JP H03164859 A JPH03164859 A JP H03164859A JP 1304159 A JP1304159 A JP 1304159A JP 30415989 A JP30415989 A JP 30415989A JP H03164859 A JPH03164859 A JP H03164859A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- data
- word
- kanji
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000016496 Panda oleosa Nutrition 0.000 title claims abstract description 29
- 240000000220 Panda oleosa Species 0.000 title claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 34
- 150000001875 compounds Chemical class 0.000 claims description 25
- 238000005192 partition Methods 0.000 abstract 5
- 239000002131 composite material Substances 0.000 abstract 4
- 238000000638 solvent extraction Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000000470 constituent Substances 0.000 description 2
- 235000010678 Paulownia tomentosa Nutrition 0.000 description 1
- 240000002834 Paulownia tomentosa Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、かなの状態で入力された文字列をかな漢字混
じ9列に変換するかな漢字変換装置に関するものである
。DETAILED DESCRIPTION OF THE INVENTION Field of the Invention The present invention relates to a kana-kanji conversion device that converts a character string input in kana to nine strings including kana and kanji.
従来の技術
近年かな漢字変換装置は日本語を入力するために用いら
れる装置として、日本語ワード・プロセッサを初めとし
て各種の日本語処理装置に広く用いられている。かな漢
字変換装置は、入力されたかな列をかな漢字混じり列に
変換するために用いられる。例えば、次のかな列
きようのてんきははれてず。2. Description of the Related Art In recent years, kana-kanji conversion devices have been widely used in various Japanese language processing devices, including Japanese word processors, as devices for inputting Japanese characters. The kana-kanji conversion device is used to convert an input kana string into a kana-kanji mixed string. For example, the temperature in the next kana row should be swollen.
を入力すると、 今日の天気は晴れです。If you enter The weather is sunny today.
と変換を行うことができる。また、最近のかな漢字変換
装置には、頻繁に使用される複合語も自立語辞書に登録
することにより、変換の効率を上げることができるもの
も出てきた。例えば、次のかな列
しょうききかんのはったつにより、
を入力し、変換を行なうとする。自立語辞書には「しよ
うききかん」という読みで、「蒸気機関」という語が登
録されているので、
蒸気機関の発達により、
と変換を行うことができる。You can perform the conversion with In addition, some recent kana-kanji conversion devices are capable of increasing conversion efficiency by registering frequently used compound words in an independent word dictionary. For example, suppose we input and perform conversion according to the following kana column format. In the independent word dictionary, the word ``steam engine'' is registered as ``shokikikan'', so with the development of steam engines, it can be converted to .
発明の解決しようとする課題
しかしながら、以上説明した従来のかな漢字変換装置は
、複合語であっても、一つの自立語として扱うため、
しょうききかんにちんしやくにんからもうじでかあった
ばあい、
を入力すると、
蒸気機関に賃借人から申し出があった場合。Problems to be Solved by the Invention However, the conventional kana-kanji conversion device described above treats even a compound word as a single independent word, so it is a step away from the conventional kana-kanji conversion device. In this case, if you enter , the lessee makes an offer to use the steam engine.
となってしまい、誤った変換結果を得ることになる。こ
のように、2つの語の連続(以下、連語と呼ぶ)が複1
合語と同じ読みになってしまう(以下読みの衝突と呼ぶ
)場合、ユーザはまず、「蒸気機関に」という文節にカ
ーソルを当てて、文節縮小キー等で文節を「蒸気」、「
機関に」のように切り直し、さらに、「蒸気」、「機関
に」のそれぞれの文節に対して、再変換を行なって、「
上記」「期間に」という候補を得なければならなかった
。This will result in incorrect conversion results. In this way, a series of two words (hereinafter referred to as a collocation) is a compound word.
If the pronunciation is the same as the password (hereinafter referred to as a conflict of pronunciations), the user should first place the cursor on the phrase "steam engine" and use the clause reduction key etc. to change the phrase to "steam", "
``to the engine'', and then reconvert the phrases ``steam'' and ``to the engine'' to get ``to the engine''.
I had to get candidates for ``above'' and ``in the period.''
また、辞書に「上記期間」を登録するといった方法も考
えられるが、複合語との読みの衝突が考えられる単語の
組合せは膨大な数になり、全てを登録するのは辞書のサ
イズの増大による検索スピードの劣化を招き実用的では
ない。Another option is to register "the above period" in a dictionary, but the number of combinations of words that may conflict with compound words is enormous, and registering all of them would be difficult due to the increase in the size of the dictionary. This is not practical as it causes a decrease in search speed.
課題を解決するための手段
この課題を解決するために本発明は一つの自立語或いは
複数の自立語が結合した複合語の読みデータとその漢字
データと複合語の区切れを示すデータとで構成される単
語データを複数個記憶した辞書を設け、辞書から読み出
した漢字データが複合語の場合、辞書に記憶された区切
れを示すデータに従って読み出された漢字データを区切
り、該区切れ毎の自立語に対応する漢字データを辞書か
ら読み出す手段で構成される。Means for Solving the Problem In order to solve this problem, the present invention consists of reading data of one independent word or a compound word that is a combination of multiple independent words, its Kanji data, and data indicating the division of the compound word. If the kanji data read from the dictionary is a compound word, the read kanji data is divided according to the data indicating the divisions stored in the dictionary, and the data for each division is It consists of means for reading kanji data corresponding to independent words from a dictionary.
作 用
複合語を変換結果として読み出した場合、辞書に記憶さ
れたその複合語の区切れを示すデータに従って区切れ毎
での辞書検索が可能になる。When an action compound word is read out as a conversion result, it becomes possible to search the dictionary for each break according to the data stored in the dictionary indicating the breaks of the compound word.
実施例
以下、本発明の一実施例におけるかな漢字変換装置につ
いて説明する。Embodiment A kana-kanji conversion device according to an embodiment of the present invention will be described below.
第1図は本実施例のかな漢字変換装置の機能ブロック図
である。ここで1はかなデータを入力するためのかなキ
ーや、入力したかなデータの漢字データへの変換指示キ
ー及び再変換キーを備えたキーボードで構成された入力
手段である。2は入力手段1よシ入力されたかなデータ
を記憶する入力かな列記境部である。3は単語の読みデ
ータと漢字データと品詞情報と、さらに該単語が複合語
の場合には読みと漢字表記のそれぞれに対する文節の区
切シ位置とを一組の単語データとして記憶している単語
辞書である。7は単語辞書3を検索して入力されたかな
列記境部2に記憶されたかな列を漢字かな混じ9列に変
換し、変換結果が複数の自立語を含むような複合語であ
った場合には。FIG. 1 is a functional block diagram of the kana-kanji conversion device of this embodiment. Here, 1 is an input means consisting of a keyboard having a kana key for inputting kana data, a key for instructing conversion of the input kana data to kanji data, and a reconversion key. Reference numeral 2 denotes an input kana list boundary section for storing kana data inputted through the input means 1. 3 is a word dictionary that stores word reading data, kanji data, part-of-speech information, and, if the word is a compound word, clause break positions for each of the reading and kanji notation as a set of word data. It is. 7 searches the word dictionary 3 and converts the input kana string stored in the kana list boundary section 2 into 9 strings of kanji and kana, and the conversion result is a compound word containing multiple independent words. for.
複合語を構成語で分離し、複数の文節とし、それらの文
節に対する候補の全ての表記を出力するかな漢字変換制
御部である。8はかな漢字変換制御部7から出力された
漢字かな混じり列を記憶する出力文字列記憶部である。This is a kana-kanji conversion control unit that separates compound words into constituent words, converts them into multiple clauses, and outputs all candidate spellings for those clauses. 8 is an output character string storage unit that stores the kanji-kana mixed string output from the kana-kanji conversion control unit 7.
9は出力文字列記憶部8に記憶された漢字かな混じり列
及び入力かな列記境部2に格納されたかなテ°−夕を表
示する表示手段である。Reference numeral 9 denotes display means for displaying the kanji/kana mixed strings stored in the output character string storage section 8 and the kana text stored in the input kana string entry section 2.
第2図は本実施例のかな漢字変換装置の回路ブロック図
であり、1oはキーボード、11は中央処理装置(以下
、CPUと略称する)、12は陰極線管ディヌプレイ、
(−以下、CRTデイスプレィと略称する。)、13は
す〒ドオンリーメモリ(以下、ROMと略称する。)、
14はランダムアクセスメモリ(以下、RAMと略称す
る。)である。FIG. 2 is a circuit block diagram of the kana-kanji conversion device of this embodiment, in which 1o is a keyboard, 11 is a central processing unit (hereinafter abbreviated as CPU), 12 is a cathode ray tube,
(-hereinafter abbreviated as CRT display), 13 Hard-only memory (hereinafter abbreviated as ROM),
14 is a random access memory (hereinafter abbreviated as RAM).
第1図に示した入力手段1はキーボード1oにより、入
力かな列記境部2、出力文字列記憶部8はRAM14に
より、単語辞書3はROM1sにより、かな漢字変換制
御部7はCPU11がROM13およびRAM14とデ
ータのやりと9を行いながらROM13に記憶されたプ
ログツムを実行することにより、表示手段9はCRTデ
イスプレィ12によシ実現されている。The input means 1 shown in FIG. 1 is connected to the keyboard 1o, the input kana list boundary section 2, the output character string storage section 8 is connected to the RAM 14, the word dictionary 3 is connected to the ROM 1s, and the kana-kanji conversion control section 7 is controlled by the CPU 11 to the ROM 13 and RAM 14. The display means 9 is realized by a CRT display 12 by executing a program stored in the ROM 13 while transferring data.
上記のように構成された本実施例のかな漢字変換装置に
ついて、以下この動作を第3図のフローチャートにもと
づき説明する。The operation of the kana-kanji conversion apparatus of this embodiment configured as described above will be explained below based on the flowchart shown in FIG.
まず、ステップ(イ)で入力手段1からかな列が入力さ
れると、その内容は入力かな列゛記憶部2に格納される
。たとえば、次のかな烈
しょうききかんにちんしゃくにんのもうじでかあったば
あい、
を入力手段1より入力すると、入力かな列記憶部2に格
納される。さらに入力手段1よシ変換キーが入力される
と、ステップ(切に進み、かな漢字変換制御部7は単語
辞書3を検索しながら次の文節区切シを決定する。First, in step (a), when a kana string is input from the input means 1, its contents are stored in the input kana string storage section 2. For example, if the following kana reshokikikan nichinshakunin occurs, inputted from the input means 1 is stored in the input kana string storage section 2. Further, when the conversion key is input through the input means 1, the process proceeds to step (kiri), where the kana-kanji conversion control unit 7 searches the word dictionary 3 and determines the next phrase delimiter.
第4図は一実施例の単語辞書の内容を示す図である。区
切シ位置に書かれている数字は先頭から数えて何文字目
から後ろの構成語が始まるかを示している。ただし、0
が書かれている単語は複合語ではなく区切りが存在しな
いことを示している。FIG. 4 is a diagram showing the contents of a word dictionary in one embodiment. The number written at the delimiter position indicates from which character, counting from the beginning, the following constituent word begins. However, 0
A word with is written is not a compound word, but indicates that there is no delimiter.
例文の場合では、かな漢字変換制御部7によって、まず
「しょうききかんに」が文節として切り出される。次に
ステップ(ハ)でいま決定した文節の中に複合語が含ま
れるかどうかを調べる。上の例では「しょうき・きかん
」という複合語が含まれるので、ステップに)に進む。In the case of the example sentence, the kana-kanji conversion control unit 7 first extracts "shokikikanni" as a clause. Next, in step (c), it is checked whether the phrase just determined contains a compound word. In the example above, the compound word ``shoki・kikan'' is included, so proceed to step ).
ステップに)では文節に含まれる複合語を構成語の単位
で分割し、ステップ(へ)に進む。以下、通常の文節を
大文節、複合語の区切υによって分割されたできた文節
を小文節と呼ぶ。In step (to), the compound word included in the clause is divided into component words, and the process proceeds to step (to). Hereinafter, normal phrases will be referred to as large phrases, and phrases divided by the compound word separation υ will be referred to as small phrases.
また、ステップ(ハ)で複合語がないと判断された場合
には、ステップ(ホ)に進み、ステップ(ホ)では、大
文節を小文節とみなしてステップ(へ)に進む。If it is determined in step (c) that there is no compound word, the process proceeds to step (e), and in step (e), the large clause is regarded as a small clause and the process proceeds to step (v).
ステップ(へ)では、かな漢字変換制御部7は単語辞書
3を検索し、小文節に対する表記の候補を出力記憶部に
格納する。上の例では「しょうききかんに」という大文
節が「しょうき」と「きかんに」という2つの小文節に
分割され、その候補とじて「蒸気」、「上記」、「上気
」、「常軌」、「条規」および「機関」、「期間」、「
基幹」、[帰還]が出力記憶部に格納される。そして、
再変換キ、−の操作によって、これらが表示される。次
にステップ(ト)では、全ての入力文について変換が終
ったかを調べ、終っていればステップ(イ)に進む。終
っていなければステップ(に)からの動作を行なう。変
換結果は出力文字列記憶部8に記憶される。つぎにステ
ップ(イ)に進み、表示手段9に第9図のように変換結
果が得られる。In step (v), the kana-kanji conversion control unit 7 searches the word dictionary 3 and stores spelling candidates for the small clauses in the output storage unit. In the example above, the large clause ``shokikikanni'' is divided into two small clauses ``shoki'' and ``kikanni'', and the candidates are ``steam'', ``above'', ``joki'', ``regularity'', ``regulations'' and ``institutions'', ``period'', ``
"Basic" and "Feedback" are stored in the output storage section. and,
These are displayed by operating the reconversion key, -. Next, in step (g), it is checked whether the conversion of all input sentences has been completed, and if it has been completed, the process advances to step (b). If it is not finished, perform the operation from step (to). The conversion result is stored in the output character string storage section 8. Next, the process proceeds to step (a), and the conversion result is obtained on the display means 9 as shown in FIG.
発明の効果
以上のように本発明は、複数の自立語からなる複合語も
記憶した辞書の複合語を構成する自立語毎の区切れを示
すデータも記憶させ、変換結果として読み出されたデー
タが複合語の場合、その区切れを示すデータに従って区
切り、その区切り毎の自立語に対応する漢字データを読
み出すようにしたので、複合語の一部である自立語に対
して再変換を行いたい場合に、文節の縮小を行うような
指示操作を行う必要がなくなる。Effects of the Invention As described above, the present invention also stores data indicating the division of each independent word constituting a compound word in a dictionary that also stores compound words consisting of a plurality of independent words, and the data read out as a conversion result. If is a compound word, it is divided according to the data that indicates the division, and the kanji data corresponding to the independent word for each division is read out, so I would like to reconvert the independent word that is part of the compound word. In this case, there is no need to perform an instruction operation such as reducing a clause.
第1図は本発明の一実施例におけるかな漢字変換装置の
機能ブロック図、第2図は同装置回路ブロック図、第3
図は同処理フローチャート、第4図は単語辞書の内容を
示す図である。FIG. 1 is a functional block diagram of a kana-kanji conversion device according to an embodiment of the present invention, FIG. 2 is a circuit block diagram of the device, and FIG.
The figure is a flowchart of the process, and FIG. 4 is a diagram showing the contents of the word dictionary.
Claims (1)
力されたかなデータを記憶する記憶手段と、 一つの自立語或いは複数の自立語が結合した複合語の読
みデータとその漢字データと複合語の区切れを示すデー
タとで構成される単語データを複数個記憶した辞書と、 前記辞書を参照して前記記憶手段に記憶されたかなデー
タを読みとする漢字データを読み出す辞書検索手段と、 前記辞書検索手段によって読み出された漢字データが複
合語である場合指示に応答して前記辞書に記憶された区
切れを示すデータに従って前記記憶手段に記憶されたか
なデータを区切り、該区切れ毎の自立語に対応する漢字
データを読み出す制御手段と、 を有することを特徴とするかな漢字変換装置。[Claims] An input means for inputting kana data, a storage means for storing the kana data input from the input means, reading data of one independent word or a compound word formed by combining a plurality of independent words, and the reading data thereof. A dictionary that stores a plurality of word data consisting of kanji data and data indicating divisions of compound words, and a dictionary that refers to the dictionary and reads out kanji data whose reading is the kana data stored in the storage means. retrieval means; when the kanji data read by the dictionary retrieval means is a compound word, dividing the kana data stored in the storage means according to data indicating delimitation stored in the dictionary in response to an instruction; A kana-kanji conversion device comprising: a control means for reading out kanji data corresponding to an independent word for each segment.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1304159A JPH03164859A (en) | 1989-11-22 | 1989-11-22 | Kana/kanji converting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1304159A JPH03164859A (en) | 1989-11-22 | 1989-11-22 | Kana/kanji converting device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03164859A true JPH03164859A (en) | 1991-07-16 |
Family
ID=17929769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1304159A Pending JPH03164859A (en) | 1989-11-22 | 1989-11-22 | Kana/kanji converting device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03164859A (en) |
-
1989
- 1989-11-22 JP JP1304159A patent/JPH03164859A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5337232A (en) | Morpheme analysis device | |
JPH0412866B2 (en) | ||
JPH03164859A (en) | Kana/kanji converting device | |
JPH0578058B2 (en) | ||
JPS6210763A (en) | Kana to kanji conversion system | |
JPS62197864A (en) | Language information offering device | |
JP2621999B2 (en) | Document processing device | |
KR20010067827A (en) | multi-languages Chinese characters database structure | |
JP2862236B2 (en) | Character processor | |
JPS613267A (en) | Kana to kanji conversion processor | |
JP3847801B2 (en) | Character processing apparatus and processing method thereof | |
JPH0350668A (en) | Character processor | |
JPS63316162A (en) | Document preparing device | |
JPS6162970A (en) | Dictionary for word processor of kana-kanji conversion | |
JPH027159A (en) | Japanese processor | |
JPH0785040A (en) | Inscription nonuniformity detecting method and kana/ kanji converting method | |
JPH0468466A (en) | Kana / kanji converting device | |
JPH10198676A (en) | Device and method for japanese morpheme analysis | |
JPH0695330B2 (en) | Document creation device | |
JP2002117025A (en) | Device and method for japanese syllabary-to-chinese character conversion | |
JPH0727526B2 (en) | Kana-Kanji converter | |
JPH03208162A (en) | Input device | |
JPS63116269A (en) | Kana/kanji converter for japanese processing | |
JPS63174165A (en) | Word processor | |
JPS62226270A (en) | Sentence preparing device |