JPH0350669A - Information processor - Google Patents

Information processor

Info

Publication number
JPH0350669A
JPH0350669A JP1184451A JP18445189A JPH0350669A JP H0350669 A JPH0350669 A JP H0350669A JP 1184451 A JP1184451 A JP 1184451A JP 18445189 A JP18445189 A JP 18445189A JP H0350669 A JPH0350669 A JP H0350669A
Authority
JP
Japan
Prior art keywords
word
information
dictionary
reading
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1184451A
Other languages
Japanese (ja)
Inventor
Koji Igawa
幸治 井川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1184451A priority Critical patent/JPH0350669A/en
Publication of JPH0350669A publication Critical patent/JPH0350669A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To realize the KANA (Japanese syllabary)/KANJI (Chinese character) conversion of a compound word of good operability through the use of the dictionary of small capacity by adding compound word information in which information capable of succeeding to every word is made succeeding word information to a word dictionary, and retrieving a corresponding succeeding word. CONSTITUTION:KANA input data is given from an input device 1 to a reading input control circuit 4 through a next process determination circuit 2, and is stored in a reading character string storage area 5. It is assumed that a reading character string stored in the area 5 is 'JOUHOSHIYORIGATSUKAINIOITE'. A reading candidate corresponding to this character string does not exist in the word dictionary 7. Then, re-retrieval is repeated as cutting off successively every one character from a rear part. Then, when 'JOHO' is found in the dictionary 7 as the reading candidate corresponding to the reading character string of 'JOUHOU', a grammar analysis circuit 9 takes out the information of the word preceding by one word from a converted result storage area 11, and executes grammatical connection check between the preceding word and the information of this time. These operations are repeated, and the final result of 'JOHO SHORI GAKKAI NI OITE (in an information processing society)' can be obtained.

Description

【発明の詳細な説明】 童粟上勿■里公互 この発明は、ワードプロセッサ、パーソナルコンピュー
タ、DPS等の情報処理装置の改良に係り、特に、かな
漢字変換によって日本語の処理機能を備えた情報処理装
置において、小容量で検索時間の短い辞書を付加するこ
とにより、操作性が高<、シかも低コストの情報処理装
置に関する。
[Detailed Description of the Invention] This invention relates to the improvement of information processing devices such as word processors, personal computers, DPS, etc., and particularly to information processing devices equipped with Japanese processing functions through kana-kanji conversion. The present invention relates to an information processing device that has high operability and low cost by adding a dictionary of small capacity and short search time to the device.

具体的にいえば、単語辞書に、各単語毎に後続可能な情
報を後続単語情報として複合語情報を付加しておき、こ
の複合語情報によって後続単語の変換を行うことによっ
て、小容量のメモリで検索時間の短い辞書を実現した情
報処理装置に関する。
Specifically, compound word information is added to the word dictionary as information that can be followed for each word as subsequent word information, and subsequent words are converted using this compound word information, thereby saving a small amount of memory. The present invention relates to an information processing device that realizes a dictionary with a short search time.

従米夏致先 近年、ワードプロセッサやパーソナルコンピュータ等の
情報処理装置では、日本語の処理機能が不可欠であり、
特に、日本語に特有の漢字入力のために必要なかな漢字
変換処理においては、辞書の小容量化、低コスト化が強
く望まれている。
In recent years, Japanese language processing functionality has become essential for information processing devices such as word processors and personal computers.
In particular, in the kana-kanji conversion process necessary for inputting kanji peculiar to the Japanese language, there is a strong desire to reduce the capacity and cost of dictionaries.

数年前までは、辞書には単語の情報を保持させておき、
アルゴリズムによって単語間の文法的な接続チエツクを
行うことにより、複合語の入力に対処していた。
Until a few years ago, dictionaries held word information;
The algorithm handles compound word input by checking grammatical connections between words.

ところが、この複合語入力方式では、ユーザに満足な変
換率が得られないばかりでなく、文法的には正しいが、
実用上はおかしな複合語(意味のない造語)が続出し、
複合語辞書の必要性が高まる傾向にある。
However, with this compound word input method, not only is it not possible to obtain a conversion rate that is satisfactory to the user, but even though it is grammatically correct,
In practical terms, strange compound words (coined words with no meaning) keep appearing,
The need for compound word dictionaries is on the rise.

複合語は、複数の単語から構成される語で、よみ、表記
等の文字列情報も多く、これらを記憶するためには、辞
書容量が著しく増大する。
A compound word is a word made up of multiple words and includes a lot of character string information such as pronunciation and notation, and storing this requires a significant increase in dictionary capacity.

第6図は、従来の単語辞書の一例を示す図である。FIG. 6 is a diagram showing an example of a conventional word dictionary.

この第6図に示すように、複合語の「よみ」と「表記」
の全てを予め単語辞書内に記憶させておく。例えば、複
合語の「よみ」である「じょうほうしより」に対して、
「情報処理」の表示を対応させておく。
As shown in Figure 6, the ``reading'' and ``notation'' of compound words
All of these are stored in the word dictionary in advance. For example, for the compound word ``johoshiyori'', which is the word ``read'',
Make the "Information Processing" display compatible.

このように、必要な複合語について、その「よみ」と「
表記」の全てを予め単語辞書内に記憶させておけば、複
合語の漢字変換処理を極めて簡単。
In this way, for the necessary compound words, their "reading" and "
If you memorize all the notations in the word dictionary in advance, it will be extremely easy to convert compound words into kanji.

かつ迅速に実行することができる。and can be executed quickly.

しかしながら、この複合語入力方式では、辞書の記憶容
量も必然的に大きくなるので、コストアンプは免かれな
い。
However, in this compound word input method, the storage capacity of the dictionary inevitably increases, so cost amplification is inevitable.

このような問題を解決するために、従来から、単語辞書
と複合語辞書とを組合せて使用したり、単語辞書と前単
語情報とを組合せて使用する複合語入力方式が用いられ
ている。
To solve such problems, conventionally, compound word input methods have been used in which a word dictionary and a compound word dictionary are used in combination, or a word dictionary and previous word information are used in combination.

第7図(1)と(2)は、従来の単語辞書と複合語辞書
とを組合せて使用する複合語入力方式の一例を示す図で
、(1)は単語辞書、(2)は複合語辞書である。図面
において、工、と工2はペア情報を示す。
Figures 7 (1) and (2) are diagrams showing an example of a compound word input method that uses a combination of a conventional word dictionary and a compound word dictionary, where (1) is a word dictionary and (2) is a compound word input method. It is a dictionary. In the drawing, . and . 2 indicate pair information.

この第7図(1)に示す単語辞書には、必要最少限の単
独の単語毎の情報を記憶させておき、これとは別に、第
7図(2)に示すように、複合語辞書を設けておく。
This word dictionary shown in Figure 7 (1) stores the minimum necessary information for each individual word, and separately, as shown in Figure 7 (2), a compound word dictionary is stored. Set it up.

そして、この複合語辞書には、複合語の「よみ」と、複
合される単語のペア情報、すなわちアドレス情報とを格
納しておき、この複合語辞書を検索することによって、
複合語の変換処理に対処する。
Then, in this compound word dictionary, the compound word "yomi" and the pair information of compound words, that is, address information are stored, and by searching this compound word dictionary,
Deal with the conversion process of compound words.

例えば、「じようほうしより」の場合には、複合語辞書
に、ペア情報として、「情報」の表記に対応する工2と
、「処理」の表記に対応する工、とを与えておく。
For example, in the case of "Jiyou Hoshiyori", give the compound word dictionary as pair information, 2, which corresponds to the notation of "information", and 2, which corresponds to the notation of "process". .

この入力方式によれば、先の第6図の方式に比べて、単
語辞書の容量は可成り削減できるが、2つの辞書を検索
する必要があるので、検索時間がかかり、処理能率が低
下する。
According to this input method, the capacity of the word dictionary can be reduced considerably compared to the method shown in Figure 6 above, but since it is necessary to search two dictionaries, the search takes time and processing efficiency decreases. .

次の第8図(1)と(2)は、従来の単語辞書と前単語
情報とを組合せて使用する複合語入力方式の一例を示す
図で、(1)は単語辞書、(2)は前単語情報である。
The following Figures 8 (1) and (2) are diagrams showing an example of a compound word input method that uses a combination of a conventional word dictionary and previous word information, where (1) is a word dictionary and (2) is This is the previous word information.

この第8図(1)と(2)に示す複合語入力方式では、
単語辞書内に各単語に対して、「よみ」と「表記」の他
に、前単語となり得る単語の情報を示すアドレス情報を
記憶させておき、そのアドレスに、前単語の「よみ」と
その「よみ」に対する同音異義語の中の候補番号を格納
することによって対処している。
In the compound word input method shown in Fig. 8 (1) and (2),
For each word in the word dictionary, in addition to the "reading" and "notation", address information indicating information on the word that can be the previous word is stored, and the "reading" of the previous word and its name are stored in that address. This is handled by storing candidate numbers among homophones for ``read''.

この入力方式では、後続単語がベースとなり、その単語
に対する前単語を検索するものである。
In this input method, the following word is used as a base, and the previous word for that word is searched.

したがって、後続単語が正しく検出されないと意味がな
い。
Therefore, it is meaningless unless the subsequent word is detected correctly.

しかしながら、逆にいえば、後続の単語が正しく検出さ
れるということt″!、、可成りの高確率で前の単語も
検出されることを意味するので、わざわざ前単語情報を
検索することは、単に意味のない造語への変換を防止す
るために過ぎない。
However, conversely, if the subsequent word is detected correctly, it means that the previous word will also be detected with a fairly high probability, so it is not necessary to go to the trouble of searching for the previous word information. , simply to prevent conversion into meaningless neologisms.

要するに、この第8図(1)と(2)に示した入力方式
は、複合語の対処という面からは実効性の薄い方式であ
る。
In short, the input methods shown in FIGS. 8(1) and (2) are less effective in dealing with compound words.

しかも、先の第7図の方式と同様に、2つの辞書を検索
する必要があるので、検索時間がかかって処理能率が低
下する。
Moreover, like the method shown in FIG. 7, it is necessary to search two dictionaries, which takes time and reduces processing efficiency.

以上のように、従来の複合語入力方式では、第6図のよ
うに、全ての複合語を単語辞書に記憶させると、辞書容
量が増大し、また、第7図や第8図のように、2つの辞
書を用意して検索すると、検索時間がかかつて処理能率
が低下する上に、辞書容量も余り節減できない、という
不都合があった。
As described above, in the conventional compound word input method, if all compound words are stored in the word dictionary as shown in Figure 6, the dictionary capacity will increase, and as shown in Figures 7 and 8. However, if two dictionaries are prepared and searched, the search time is long, the processing efficiency is reduced, and the dictionary capacity cannot be saved much.

が  しよ゛とする この発明では、従来の日本語ワードプロセッサ等の情報
処理装置における不都合、特に、第7図や第8図のよう
に、2つの辞書を用意して検索する複合語入力方式の不
都合を解決し、検索時間の短縮を可能にして高能率の変
換処理により操作性を高めると共に、単語辞書の容量を
減少させることによって、低コストの辞書を内蔵した情
報処理装置を提供することを目的とする。
This invention aims to solve the disadvantages of conventional information processing devices such as Japanese word processors, especially the compound word input method that uses two dictionaries for searching, as shown in Figures 7 and 8. It is an object of the present invention to provide an information processing device with a built-in dictionary at low cost by solving the inconveniences, making it possible to shorten search time, improving operability through highly efficient conversion processing, and reducing the capacity of the word dictionary. purpose.

課 を  するための この発明では、 少なくとも、入力手段と、表示手段と、単語辞書と、か
なとかなに対応する漢字混じり文字列から構成される単
語の情報を記憶する単語情報記憶手段と、該単語情報記
憶手段に対してかなをキーとして検索するかな検索手段
とを備え、前記入力手段から入力されたかなを漢字に変
換するかな漢字変換機能を有する情報処理装置において
、前記単語辞書に、各単語毎に後続可能な情報を後続単
語情報として複合語情報を付加すると共に、前記かな検
索手段によって検出された単語情報に後続する複合語情
報があったとき、該当する後続単語を検索する後続単語
検索手段、 ζを備え、 後続単語の漢字変換に際して、前記後続単語検索手段に
より前記複合語情報を検索して複合語の漢字変換を行う
ようにしている。
This invention for teaching the lesson includes at least an input means, a display means, a word dictionary, a word information storage means for storing information on words consisting of character strings containing kanji corresponding to kana and kana, and the corresponding word information storage means. and a kana search means for searching the word information storage means using kana as a key, and an information processing device having a kana-kanji conversion function for converting kana input from the input means into kanji, wherein each word is stored in the word dictionary. A subsequent word search that adds compound word information to each possible successor as subsequent word information, and searches for a corresponding subsequent word when there is compound word information that follows the word information detected by the kana search means. means, ζ, when converting a subsequent word into Kanji, the compound word information is searched by the subsequent word search means to convert the compound word into Kanji.

失−五一史 次に、この発明の情報処理装置について、図面を参照し
ながら、その実施例を詳細に説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the information processing apparatus of the present invention will be described in detail with reference to the drawings.

第1図は、この発明の情報処理装置について。FIG. 1 shows an information processing apparatus according to the present invention.

その要部構成の一実施例を示す機能ブロック図である。FIG. 2 is a functional block diagram showing an example of the configuration of the main parts thereof.

図面において、1は入力装置、2は次工程決定回路、3
は編集回路、4はよみ入力制御回路。
In the drawings, 1 is an input device, 2 is a next process determining circuit, and 3 is an input device.
4 is the editing circuit, and 4 is the reading input control circuit.

5はよみ文字列格納エリア、6は変換処理制御回路、7
は単語辞書、8は辞書検索回路、9は文法解析回路、1
0は複合語情報検索回路、11は変換結果格納エリア、
12は文字列表示用データ作成回路、13は表示装置を
示す。
5 is a reading character string storage area, 6 is a conversion processing control circuit, and 7 is a reading character string storage area.
is a word dictionary, 8 is a dictionary search circuit, 9 is a grammar analysis circuit, 1
0 is a compound word information search circuit, 11 is a conversion result storage area,
12 is a character string display data creation circuit, and 13 is a display device.

第1図のブロック図の各部の機能は、概路次のとおりで
ある。
The functions of each part in the block diagram of FIG. 1 are outlined as follows.

入力装置1は、キーボード等からなり、文字や罫線、制
御情報、その他のデータを入力する機能を有している。
The input device 1 includes a keyboard and the like, and has the function of inputting characters, ruled lines, control information, and other data.

次工程決定回路2は、入力装置1からのデータを判定し
て次に行うべき処理を決定し、後段の該当する回路へ入
力データを送出する。
The next process determining circuit 2 determines the data from the input device 1, determines the next process to be performed, and sends the input data to the corresponding circuit at the subsequent stage.

編集回路3は、入力された文字や罫線などの編集作業を
行う機能を有する。
The editing circuit 3 has a function of editing input characters, ruled lines, and the like.

よみ入力制御回路4は、次工程決定回路2からの文字情
報に基いて、よみ文字列の入力を制御する機能を有して
いる。
The reading input control circuit 4 has a function of controlling the input of reading character strings based on the character information from the next process determining circuit 2.

よみ文字列格納エリア5は、よみ入力制御回路4からの
文字夕ら情報を保持する。
The reading character string storage area 5 holds character information from the reading input control circuit 4.

変換処理制御回路6は、よみを変換する処理全体の制御
を司る。
The conversion processing control circuit 6 controls the entire reading conversion process.

単語辞書7は、単語のよみ1品詞、頻度、後続単語情報
を格納するエリアである。
The word dictionary 7 is an area for storing word pronunciation, part of speech, frequency, and subsequent word information.

第2図は、単語辞書7内のデータの数例を示す図である
。図面において、A1〜A6はアドレスを示し、0は該
当アドレスがないことを示す。
FIG. 2 is a diagram showing several examples of data in the word dictionary 7. In the drawings, A1 to A6 indicate addresses, and 0 indicates that there is no corresponding address.

この第2図に示すように、単語辞書7には。As shown in FIG. 2, the word dictionary 7 includes:

「よみ」と「表記」の他に、「品詞」、「頻度」、およ
び「後続情報」が格納されている。
In addition to "reading" and "notation", "part of speech", "frequency", and "subsequent information" are stored.

例えば、「よみ」が「かつかい」の品詞情報は[名詞」
であり、その頻度情報は「1」で、後続情報は「O」で
ある。
For example, the part of speech information for "read" is "katsukai" is [noun]
The frequency information is "1" and the subsequent information is "O".

また、「けんさく」の品詞情報は「す変名側」であり、
その頻度情報は「1」、後続情報はアドレスrA3.A
6.0」である。
In addition, the part of speech information for "kensaku" is "suhenname side",
Its frequency information is "1", and its subsequent information is address rA3. A
6.0".

同様に、rしより」は、品詞情報が「す変名側」で、そ
の頻度情報は「2」、後続情報はアドレスrA1.OJ
である。
Similarly, for "r side", the part of speech information is "su pseudonym side", the frequency information is "2", and the subsequent information is address rA1. O.J.
It is.

なお、「じようほう」の後続情報は、アドレスrA3.
A2.OJである。この後続単語情報の数は制限がなく
、「0」が最終を示す情報、すなわち「マーク」である
In addition, the subsequent information of "Jyouhou" is at address rA3.
A2. This is O.J. There is no limit to the number of subsequent word information, and "0" is information indicating the final word, that is, a "mark."

このように、「じようほう」、すなわち「情報」の場合
の後続単語情報は、rA3.A2.oJとなっており、
後続は「処理」 (アドレスA3)と、「検索」 (ア
ドレスA2)の2つが接続し得る単語として登録されて
いる。
In this way, the subsequent word information in the case of "Jiyouhou", that is, "information" is rA3. A2. It is oJ,
The following two words, ``process'' (address A3) and ``search'' (address A2), are registered as words that can be connected.

したがって、第2図の実施例では、複合語「情報処理」
とr情報検索」の2つが登録されていることになる。
Therefore, in the example of FIG. 2, the compound word "information processing"
and r information search" are registered.

これらの「品詞」、「頻度」、および「後続情報」によ
る複合語の変換処理については後述する。
The conversion process of compound words using these "parts of speech,""frequency," and "successive information" will be described later.

辞書検索回路8は、よみ文字列をキーとして、単語辞書
7を検索する。
The dictionary search circuit 8 searches the word dictionary 7 using the read character string as a key.

文法解析回路9は、単語間の文法的な接続チエツクを行
う機能を有する。
The grammar analysis circuit 9 has a function of checking grammatical connections between words.

複合語情報検索回路10は、単語辞書7の後続単語情報
について検索する機能を有している。
The compound word information search circuit 10 has a function of searching the word dictionary 7 for subsequent word information.

変換結果格納エリア11は、変換処理の結果を格納する
エリアである。
The conversion result storage area 11 is an area for storing the results of conversion processing.

文字列表示用データ作成回路12は、文字を表示するた
めのパターンデータを作成する。
The character string display data creation circuit 12 creates pattern data for displaying characters.

表示装置13は、CRTやLCD等からなる表示手段で
あり、入力された文字や罫線等を可視化する機能を有す
る。
The display device 13 is a display device such as a CRT or LCD, and has a function of visualizing input characters, ruled lines, and the like.

以上が、第1図のブロック図の各部の機能である。The above are the functions of each part in the block diagram of FIG.

次に、第1図に示したこの発明の情報処理装置について
、その動作を説明する。
Next, the operation of the information processing apparatus of the present invention shown in FIG. 1 will be explained.

入力装置1からキー人力されると、次工程決定回路2に
おいてその入力内容に応じて次工程が決定され、該当す
る回路へ必要なデータが出力される。
When a key is input from the input device 1, the next process is determined in the next process determining circuit 2 according to the input contents, and necessary data is output to the corresponding circuit.

第3図は、この発明の情報処理装置について、よみ入力
時における主要な処理の流れを示すフローチャートであ
る。図面において、#1〜#4はステップを示し、また
、■は接続を示す。
FIG. 3 is a flowchart showing the flow of main processing at the time of reading input in the information processing apparatus of the present invention. In the drawings, #1 to #4 indicate steps, and ■ indicates a connection.

まず、第1図の入力表W1において、キー人力がある(
ステップ#1)と、次工程決定回路2によってキー人力
の種別が判定される(ステップ#2)。
First, in the input table W1 in Figure 1, there is a key human power (
Step #1), and the next process determining circuit 2 determines the type of key human power (Step #2).

このステップ#2の判断で、入力データであれば、ステ
ップ#3へ進み、よみ入力の入力であるか否か判断され
る。
If it is determined in step #2 that the input data is input data, the process advances to step #3, where it is determined whether the input is a reading input.

よみ入力の入力であれば、よみ入力の処理へ進み、入力
装置1からのかな入力データが、よみ入力制御回路4へ
与えられてよみ編集が行われる。
If the input is a reading input, the process advances to reading input processing, where the kana input data from the input device 1 is given to the reading input control circuit 4 and reading editing is performed.

入力されたよみ文字列は、逐次、よみ文字列格納エリア
5に格納される。これらの処理は、従来の処理と同様で
ある。
The input read character strings are sequentially stored in the read character string storage area 5. These processes are similar to conventional processes.

もし、ステップ#3の判断で、よみ入力の入力でなけれ
ば、ステップ#4へ進み、変換要求の入力であるか否か
判断される。
If it is determined in step #3 that the input is not a reading input, the process proceeds to step #4, where it is determined whether the input is a conversion request.

一般に、かな漢字変換処理では、何文字かよみ入力され
た時点で、変換要求の入力が行われる。
Generally, in the kana-kanji conversion process, a conversion request is input after some characters have been read and input.

ステップ#4の判断で、この変換要求の入力であること
が判断されると、変換処理へ進む。
If it is determined in step #4 that this conversion request has been input, the process proceeds to conversion processing.

第1図では1次工程決定回路2から変換処理制御回路6
へ変換命令が発生される(詳細なフローは後出の第5図
、参照)。
In FIG. 1, from the primary process determination circuit 2 to the conversion processing control circuit 6.
A conversion command is generated (see FIG. 5 below for detailed flow).

もし、ステップ#4の判断で、変換要求の入力でなけれ
ば、その他の編集処理へ進む。次工程決定回路2から編
集回路3へ編集命令が与えられる。
If it is determined in step #4 that a conversion request is not input, the process proceeds to other editing processes. An editing command is given from the next process determining circuit 2 to the editing circuit 3.

なお、接続■は、後出の第5図のフローからの入力を示
す。
Incidentally, the connection ■ indicates an input from the flow shown in FIG. 5, which will be described later.

このように、第1図の情報処理装置では、よみ入力、変
換要求、編集処理の各キー人力に対応して、次工程決定
回路2から入力内容に応じた該当回路へ必要なデータが
送られる。
In this way, in the information processing apparatus shown in FIG. 1, necessary data is sent from the next process determining circuit 2 to the corresponding circuit according to the input content in response to each key input for reading input, conversion request, and editing processing. .

この発明の情報処理装置では、この辞書検索に特徴を有
しているので、具体的な実施例を示して、詳しく説明す
る。
Since the information processing apparatus of the present invention has a feature in this dictionary search, it will be described in detail by showing a specific embodiment.

第4図は、この発明の情報処理装置による複合語の変換
処理の手順について、その具体例を説明する図である。
FIG. 4 is a diagram illustrating a specific example of the procedure of compound word conversion processing performed by the information processing apparatus of the present invention.

この第4図では、よみ文字列が[じょうほうしよりがっ
かいにおいて」の場合の変換例を示している。
FIG. 4 shows an example of conversion when the reading character string is ``Jōhoshi yori gakkai ni''.

第4図で、左側はよみ文字列格納エリア5、中央は変換
結果格納エリア11、右側は単語辞書7の後続単語情報
を示している。
In FIG. 4, the left side shows the reading character string storage area 5, the center shows the conversion result storage area 11, and the right side shows the subsequent word information of the word dictionary 7.

まず、最初の状態1においては、左側の「よみ文字列格
納エリア5」のよみ文字列「じようほうしよりがっかい
において」に対応するよみ候補は、単語辞書7内に存在
していない。
First, in the first state 1, there is no reading candidate in the word dictionary 7 that corresponds to the reading character string ``Jiyouhoushi yori gakkai ni'' in the ``reading character string storage area 5'' on the left. .

そこで、「じようほうしよりがつかいにおいて」後部の
方から1文字ずつ順次切り捨てて、「じようほう・・・
・・・がっかいにおい」、「じようほう・・・・・・が
っかいにお」、「じようほう・・・・・・がつかいに」
、・・・・・・、「じようほう」というように再検索を
繰返えす。
So, I cut off one letter from the end of ``Jiyouhoushiyori ga kai ni'' and wrote ``Jiyouhou...''
``...gakkai ni'', ``johohou...gakkaini'', ``johohou...gakkaini'', ``johohou...gakkaini''
, . . . , repeat the search for “Jyouhou”.

そして、「じようほう」というよみ文字列に該当するよ
み候補として「情報」を、単語辞書7内で発見すると1
文法解析回路9は、変換結果格納エリア11から一つ前
の単語の情報を取出し、その前単語と今回の「情報」と
の文法的接続チエツクを行う。
Then, when "information" is found in the word dictionary 7 as a reading candidate that corresponds to the reading character string "Jiyouhou", 1
The grammar analysis circuit 9 takes out the information of the previous word from the conversion result storage area 11 and checks the grammatical connection between the previous word and the current "information".

なお、この実施例では、「情報」は先頭の入力文字であ
るから、前単語に相当する語は存在しない。
In this embodiment, since "information" is the first input character, there is no word corresponding to the previous word.

文法的接続チエツクで、「接続可(OK)Jと判定され
ると、この「情報」という単語に関する全ての情報が変
換結果格納エリア11へ格納される。
If the grammatical connection check determines that "connection is possible (OK) J," all information related to the word "information" is stored in the conversion result storage area 11.

同時に、「よみ文字列格納エリア5」のよみ文字列「じ
ようほうしよりかっかいにおいて」から文頭のrじょう
ほう」が削除される。また、右側の単語辞書7の後続単
語情報は、rA3.A2Jとなっている(前出の第2図
の単語辞書7の「じょうほう」、参照)。
At the same time, the beginning of the sentence ``r joho'' is deleted from the reading character string ``johoushi yori kakkai te'' in the ``reading character string storage area 5''. Further, the subsequent word information in the word dictionary 7 on the right side is rA3. A2J (see "Jouho" in word dictionary 7 in Figure 2 above).

このような処理によって、第4図の状態2が得られる。Through such processing, state 2 in FIG. 4 is obtained.

次に、複合語情報検索回路10により、変換された「情
報」の後続単語情報が調査される。
Next, the compound word information search circuit 10 searches for word information subsequent to the converted "information".

この「情報」の後続単語情報は、rA3.A2゜0」と
なっており、「処理」と「検索」の2つの接続単語があ
る。
The subsequent word information of this "information" is rA3. A2゜0'', and there are two connected words: ``process'' and ``search.''

この第4図の状態2では、左側のよみ文字列に。In state 2 of this figure 4, the reading character string on the left side.

「しよりかっかいにおいて」が残存しているので。``Shiyori Kakkai te'' still remains.

この文字列の後続単語が調査される。Subsequent words in this string are examined.

複合語情報検索回路1oは、単語辞書7の後続単語情報
rA3.A2Jにより、後続単語として「処理」と「検
索」の単語情報を取込み、残りのよみ文字列と比較する
と、この場合には、「しより」が一致する。
The compound word information search circuit 1o searches for subsequent word information rA3. By A2J, the word information of "process" and "search" is taken in as subsequent words and compared with the remaining read character strings. In this case, "shiyori" matches.

そこで、この「処理」の単語情報を、変換結果格納エリ
ア11へ格納すると共に、よみ文字列から「しより」を
削除する。したがって、第4図の状態3となる。
Therefore, this word information of "process" is stored in the conversion result storage area 11, and "shiyori" is deleted from the reading character string. Therefore, state 3 in FIG. 4 is reached.

すなわち、左側のよみ文字列には、「かっかいにおいて
」が残存しており、この文字列の後続単語情報は「A1
」である。
In other words, "Kakakai de" remains in the reading character string on the left, and the subsequent word information of this character string is "A1".
”.

そこで、この後続単語情報「A1」によって、単語辞書
7を調査すると、「学会」が発見される。
Therefore, when the word dictionary 7 is searched using this subsequent word information "A1", "academic society" is discovered.

以上の処理が終ると、第4図の状態4のように。When the above processing is completed, the state will be as shown in state 4 in FIG.

左側のよみ文字列には[において」が残存する。[te] remains in the reading character string on the left.

そして、中央の変換結果格納エリア11には。And in the central conversion result storage area 11.

「じょうほう」、「しより」、「かつかい」の全ての情
報が格納される。
All information of ``johou'', ``shiyori'', and ``katsukai'' is stored.

なお、「がっかい」の後続単語情報は0(後続なし)で
あるから、後続解析は終了する。
Note that the subsequent word information for "gakkai" is 0 (no successor), so the subsequent analysis ends.

第5図(1)と(2)は、よみ文字列の変換時における
処理の流れを示すフローチャートである。図面において
、#11〜#29はステップを示し、また、■〜■は接
続を示す。
FIGS. 5(1) and 5(2) are flowcharts showing the flow of processing when converting a reading character string. In the drawings, #11 to #29 indicate steps, and ■ to ■ indicate connections.

先の第1図の入力装置1において、変換要求があると(
第3図のステップ#4の判断)、この第5図(1)のフ
ローがスタートする。
In the input device 1 shown in FIG. 1, when there is a conversion request (
(Judgment at step #4 in FIG. 3), the flow shown in FIG. 5 (1) starts.

次工程決定回路2から変換命令を受けた変換処理制御回
路6は、ステップ#11で、よみ文字列格納エリア5か
らよみ文字列のデータを取込む。
The conversion processing control circuit 6 that has received the conversion command from the next process determination circuit 2 reads data of the read character string from the read character string storage area 5 in step #11.

例えば、先の第4図の例では、状態1のように、「じょ
うほうしよりかっかいにおいて」のよみ文字列のデータ
が取込まれる。
For example, in the example shown in FIG. 4 above, as in state 1, the data of the reading character string ``Johoshi yori Kakkai ni'' is imported.

ステップ#12で、よみ文字列のデータがあるか否か判
断する。
In step #12, it is determined whether there is data for a read character string.

もし、このステップ#12の判断で、よみ文字列のデー
タがなければ、この第5図(1)の接続のから先の第3
図の接続のへ戻り、入力待ちの状態になる。
If it is determined in this step #12 that there is no reading character string data, then the third
Return to the connection shown in the diagram and wait for input.

これに対して、このステップ#12の判断で、よみ文字
列のデータがあれば、次のステップ#13で、文法解析
回路9に対して解析を依頼する。
On the other hand, if it is determined in step #12 that there is data of a read character string, the grammar analysis circuit 9 is requested to analyze it in the next step #13.

解析を依頼された文法解析回路9は、辞書検索回路8に
対して、現在のよみに対応する辞書検索を依頼する。
The grammar analysis circuit 9 that has been requested to perform the analysis requests the dictionary search circuit 8 to search the dictionary corresponding to the current pronunciation.

辞書検索回路8では、よみ文字列格納エリア5から現在
のよみ文字列を取込み、辞書検索を行う。
The dictionary search circuit 8 takes in the current read string from the read string storage area 5 and performs a dictionary search.

第5図(1)のフローでは、ステップ#14で、該当す
る候補の漢字があるか否か判断する。
In the flow shown in FIG. 5(1), in step #14, it is determined whether or not there is a corresponding candidate kanji.

このステップ#14の判断で、よみ文字列と同一のよみ
をもつ候補が見つからないときは、ステップ#15へ進
み、よみ文字列の最後の1文字を削除し、再びステップ
#12八戻り、残りのよみ文字列について、再度辞書検
索を行う。
If it is determined in step #14 that no candidate with the same pronunciation as the read string is found, proceed to step #15, delete the last character of the read string, return to step #128 again, and proceed to step #15 to delete the last character of the read string. Perform another dictionary search for the reading string.

もし、ステップ#14の判断で、よみ文字列と同一のよ
みに該当する候補の漢字があれば、ステップ#16へ進
み、第4図の状態2のように、前の単語の単語情報を取
出す。
If the judgment in step #14 is that there is a candidate kanji that corresponds to the same reading as the reading character string, proceed to step #16 and retrieve the word information of the previous word as in state 2 in Figure 4. .

次のステップ#17で1文法解析回路9において、今回
発見した候補と前の単語との文法的接続チエツクを行う
In the next step #17, the first grammar analysis circuit 9 checks the grammatical connection between the currently discovered candidate and the previous word.

ステップ#18の判断で、文法的接続が不可であれば、
先のステップ#15へ進み、よみ文字列の最後の1文字
を削除し、再びステップ#12へ戻り、以下同様の処理
を繰返えす。
If the judgment in step #18 is that grammatical connection is not possible,
Proceed to step #15, delete the last character of the read character string, return to step #12, and repeat the same process.

もし、ステップ#18の判断で、文法的接続が可能であ
れば、次のステップ#19へ進んで、候補の情報を、変
換結果格納エリア11へ格納する。
If it is determined in step #18 that grammatical connection is possible, the process advances to the next step #19, and candidate information is stored in the conversion result storage area 11.

ステップ#2oで、よみ文字列から候補のよみを削除す
る(第4図の状態2、参照)。
In step #2o, the candidate reading is deleted from the reading character string (see state 2 in FIG. 4).

ステップ#21へ進み、残りのよみ文字列があるか否か
判断する。
Proceeding to step #21, it is determined whether there are any remaining reading character strings.

もし、残りのよみ文字列がなければ、第5図(1)の接
続■から第5図(2)のステップ#27へ進み。
If there is no remaining reading character string, proceed from connection ① in Fig. 5 (1) to step #27 in Fig. 5 (2).

文字列表示用データ作成回路12によって、変換結果格
納エリア11から変換結果のデータを取出して表示用デ
ータを作成し1表示装置13へ表示する。
The character string display data creation circuit 12 takes out the conversion result data from the conversion result storage area 11, creates display data, and displays it on the display device 13.

フローは、第5図(2)の接続■から先の第3図の接続
■へ戻り、入力待ちの状態になる。
The flow returns from connection (2) in FIG. 5(2) to connection (2) in FIG. 3, and enters a state of waiting for input.

これに対して、第5図(1)のステップ#21の判断で
、残りのよみ文字列があれば、次のステップ#22で、
後続単語情報を検索する。
On the other hand, if there are any remaining reading character strings as determined in step #21 of FIG. 5 (1), in the next step #22,
Search for subsequent word information.

ステップ#23で、後続単語情報があるか否か判断する
In step #23, it is determined whether there is any subsequent word information.

もし、後続単語情報がなければ、同様に、第5図(1)
の接続■から第5図(2)のステップ#27へ進むが、
後続単語情報があれば、第5図(1)の接続■から第5
図(2)のステップ#24へ進み、後続単語の実際の単
語情報を取込む。
If there is no subsequent word information, similarly, Fig. 5 (1)
Proceed to step #27 in Figure 5 (2) from connection ■, but
If there is subsequent word information, the connection ■ to 5 in Figure 5 (1)
Proceeding to step #24 in Figure (2), the actual word information of the subsequent word is fetched.

ステップ#25で、後続単語のよみと残りのよみ文字列
とを比較し、次のステップ#26で、後続単語のよみが
残りのよみ文字列の先頭に含まれているか否か判断する
In step #25, the pronunciation of the subsequent word is compared with the remaining read character string, and in the next step #26, it is determined whether the pronunciation of the subsequent word is included at the beginning of the remaining read character string.

もし、後続単語のよみが残りのよみ文字列の先頭に含ま
れていれば、ステップ#28へ進み、後続単語の単語情
報を変換結果格納エリア11へ格納する。
If the pronunciation of the subsequent word is included at the beginning of the remaining pronunciation character string, the process advances to step #28, and the word information of the subsequent word is stored in the conversion result storage area 11.

ステップ#29で、残りのよみ文字列から後続単語のよ
みを削除し、接続■から再びステップ#21へ戻り、以
下、残りのよみ文字列がなくなるまで、同様の処理を繰
返えす。
In step #29, the reading of the subsequent word is deleted from the remaining reading character strings, and the process returns to step #21 again from the connection 2, and the same process is repeated until there are no remaining reading character strings.

このステップ#21〜#29(ステップ#27を除く)
の処理は、先の第4図の状態2〜4の処理である。
These steps #21 to #29 (excluding step #27)
The processing is the processing of states 2 to 4 in FIG. 4 above.

以上の第5図(1)と(2)のステップ#11〜#29
の処理によって、最小の単語辞書によって、必要な複合
語へ迅速に変換することができる。
Steps #11 to #29 in Figure 5 (1) and (2) above
Through this process, the required compound words can be quickly converted using the smallest word dictionary.

見疵見蓋来 この発明の情報処理装置によれば、多数の複合語情報を
有し、しかも、小容量のメモリで検索時間の短い辞書が
実現されるので、操作性が良好な複合語のかな漢字変換
が可能となる。
According to the information processing device of the present invention, it is possible to realize a dictionary that has a large amount of compound word information, has a small memory capacity, and has a short search time. Kana-kanji conversion becomes possible.

具体的にいえば、全ての複合語を記憶する方式の辞書を
内蔵した従来の情報処理装置に比較して。
Specifically, compared to conventional information processing devices that have a built-in dictionary that stores all compound words.

辞書の小容量化の効果が著顕である。The effect of reducing the capacity of the dictionary is remarkable.

また、単語辞書と複合語辞書とを組合せて使用したり、
単語辞書と前単語情報とを組合せて使用する複合語入力
方式の従来の情報処理装置に比較して、2種類の辞書を
検索する必要がないので、検索時間が短かくなる上に、
よみ文字列の情報を2つの辞書が併せもつ必要もないの
で、その分だけ辞書の小容量化も達成される、等の多く
の優れた効果が奏せられる。
You can also use a combination of word dictionary and compound word dictionary,
Compared to conventional information processing devices that use a compound word input method that uses a combination of a word dictionary and previous word information, there is no need to search two types of dictionaries, so the search time is shortened.
Since there is no need for two dictionaries to contain the information on read character strings, many excellent effects can be achieved, such as reducing the capacity of the dictionaries accordingly.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は、この発明の情報処理装置について、その要部
構成の一実施例を示す機能ブロック図。 第2図は、単語辞書7内のデータの数例を示す図。 第3図は、この発明の情報処理装置について、よみ入力
時における主要な処理の流れを示すフローチャート、 第4図は、この発明の情報処理装置による複合語の変換
処理の手順について、その具体例を説明する図、 第5図(1)と(2)は、よみ文字列の変換時における
処理の流れを示すフローチャート、 第6図は、従来の単語辞書の一例を示す図、第7図(1
)と(2)は、従来の単語辞書と複合語辞書とを組合せ
て使用する複合語入力方式の一例を示す図で、(1)は
単語辞書、(2)は複合語辞書、第8図(1)と(2)
は、従来の単語辞書と前単語情報とを組合せて使用する
複合語入力方式の一例を示す図で、(1)は単語辞書、
(2)は前単語情報。 図面において、1は入力装置、2は次工程決定回路、3
は編集回路、4はよみ入力制御回路、5はよみ文字列格
納エリア、6は変換処理制御回路、7は単語辞書、8は
辞書検索回路、9は文法解析回路、10は複合語情報検
索回路、11は変換結果格納エリア、12は文字列表示
用データ作成回路、13は表示装置。 単 語 辞 書 神 図 ・磯臭%]、1 神 図 搾 (2) (1) 叶 (2) (2)
FIG. 1 is a functional block diagram showing an embodiment of the main configuration of an information processing apparatus of the present invention. FIG. 2 is a diagram showing several examples of data in the word dictionary 7. FIG. 3 is a flowchart showing the flow of the main processing at the time of reading input for the information processing device of the present invention. FIG. 4 is a specific example of the procedure of compound word conversion processing by the information processing device of the present invention. Figure 5 (1) and (2) are flowcharts showing the flow of processing when converting reading character strings; Figure 6 is a diagram showing an example of a conventional word dictionary; Figure 7 ( 1
) and (2) are diagrams showing an example of a compound word input method that uses a combination of a conventional word dictionary and a compound word dictionary, where (1) is a word dictionary, (2) is a compound word dictionary, and FIG. (1) and (2)
is a diagram showing an example of a compound word input method that uses a combination of a conventional word dictionary and previous word information; (1) is a word dictionary;
(2) is previous word information. In the drawings, 1 is an input device, 2 is a next process determining circuit, and 3 is an input device.
4 is an editing circuit, 4 is a reading input control circuit, 5 is a reading character string storage area, 6 is a conversion processing control circuit, 7 is a word dictionary, 8 is a dictionary search circuit, 9 is a grammar analysis circuit, and 10 is a compound word information search circuit. , 11 is a conversion result storage area, 12 is a character string display data creation circuit, and 13 is a display device. Word Dictionary Kamizu/Isobori%], 1 Kamizushi (2) (1) Kano (2) (2)

Claims (1)

【特許請求の範囲】 少なくとも、入力手段と、表示手段と、単語辞書と、か
なとかなに対応する漢字混じり文字列から構成される単
語の情報を記憶する単語情報記憶手段と、該単語情報記
憶手段に対してかなをキーとして検索するかな検索手段
とを備え、前記入力手段から入力されたかなを漢字に変
換するかな漢字変換機能を有する情報処理装置において
、 前記単語辞書に、各単語毎に後続可能な情報を後続単語
情報として複合語情報を付加すると共に、 前記かな検索手段によつて検出された単語情報に後続す
る複合語情報があつたとき、該当する後続単語を検索す
る後続単語検索手段、 を備え、 後続単語の漢字変換に際して、前記後続単語検索手段に
より前記複合語情報を検索して複合語の漢字変換を行う
ことを特徴とする情報処理装置。
[Scope of Claims] At least an input means, a display means, a word dictionary, a word information storage means for storing word information consisting of character strings including kanji and kanji corresponding to kana and kana, and the word information storage. an information processing device comprising a kana search means for searching the means using kana as a key, and having a kana-kanji conversion function for converting kana input from the input means into kanji; a subsequent word search means that adds compound word information to possible information as subsequent word information, and searches for a corresponding subsequent word when there is compound word information that follows the word information detected by the kana search means; An information processing device comprising: When converting a subsequent word into Kanji, the subsequent word search means searches for the compound word information and converts the compound word into Kanji.
JP1184451A 1989-07-19 1989-07-19 Information processor Pending JPH0350669A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1184451A JPH0350669A (en) 1989-07-19 1989-07-19 Information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1184451A JPH0350669A (en) 1989-07-19 1989-07-19 Information processor

Publications (1)

Publication Number Publication Date
JPH0350669A true JPH0350669A (en) 1991-03-05

Family

ID=16153381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1184451A Pending JPH0350669A (en) 1989-07-19 1989-07-19 Information processor

Country Status (1)

Country Link
JP (1) JPH0350669A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002002656A (en) * 2000-06-20 2002-01-09 Tokan Kogyo Co Ltd Structure of container
JP5161891B2 (en) * 2007-12-26 2013-03-13 有限会社ティ辞書企画 Dictionary system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002002656A (en) * 2000-06-20 2002-01-09 Tokan Kogyo Co Ltd Structure of container
JP5161891B2 (en) * 2007-12-26 2013-03-13 有限会社ティ辞書企画 Dictionary system

Similar Documents

Publication Publication Date Title
US20060036438A1 (en) Efficient multimodal method to provide input to a computing device
JP2000298667A (en) Kanji converting device by syntax information
JPH0350669A (en) Information processor
JPS58123129A (en) Converting device of japanese syllabary to chinese character
JP3084864B2 (en) Text input device
JPH0380363A (en) Document processor
JP2668205B2 (en) Text search device
JP3914590B2 (en) Kanji conversion device
JPH0352059A (en) Information processor
JP3273778B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JPS59116835A (en) Japanese input device with input abbreviating function
JP2695772B2 (en) Kana-Kanji conversion device
JPS62282364A (en) Character string retrieval system
JPH04372047A (en) Kana/kanji converter
JPH10334085A (en) Character input device
JPH04223550A (en) Japanese word processor
JPH07104863B2 (en) Kana-Kanji converter
JPS60207948A (en) "kana"/"kanji" conversion processor
JPS6210762A (en) Kana to kanji conversion system
JPH0695330B2 (en) Document creation device
JPS59103132A (en) Japanese word input device
JPS62140165A (en) Kana-kanji conversion system
JPS60140460A (en) Abbreviated converting system in kana (japanese syllabary) kanji (chinese character) converter
JPS588379A (en) Kana (japanese syllabary)-kanji (chinese character) converting system
JPH06290182A (en) Double word converting device and kanji conversion device