JP2756252B2 - Character processor - Google Patents

Character processor

Info

Publication number
JP2756252B2
JP2756252B2 JP63056546A JP5654688A JP2756252B2 JP 2756252 B2 JP2756252 B2 JP 2756252B2 JP 63056546 A JP63056546 A JP 63056546A JP 5654688 A JP5654688 A JP 5654688A JP 2756252 B2 JP2756252 B2 JP 2756252B2
Authority
JP
Japan
Prior art keywords
word
information
candidate
phrase
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63056546A
Other languages
Japanese (ja)
Other versions
JPH01229368A (en
Inventor
雄二 小林
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63056546A priority Critical patent/JP2756252B2/en
Publication of JPH01229368A publication Critical patent/JPH01229368A/en
Application granted granted Critical
Publication of JP2756252B2 publication Critical patent/JP2756252B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、読みを表す仮名文字列を表記に変換して出
力する際に、用例を参照して第1候補を決定する文字処
理装置及びその方法に関するものである。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Field] The present invention relates to a character processing device that determines a first candidate by referring to an example when converting a kana character string representing a reading into a notation and outputting the notation. It is about the method.

〔従来の技術〕[Conventional technology]

従来、文字列の変換を行なう文字処理装置として、例
えば日本語ワードプロセッサにおけるカナ漢字変換装置
が広く普及している。カナ漢字変換の結果、多数表われ
る同音語候補に対して、個々の単語の品詞の持つ文法的
特性などから同音語の多義解消が行なわれてきたが、単
語と単語が意味的に共起する同音語対の判定に対しては
考慮がなされていないため、誤変換となる場合が多かっ
た。ここで単語と単語との組、すなわち用例を格納した
単語対辞書にある組み合わせを第一候補決定に利用する
ことなどが行なわれてきた。
2. Description of the Related Art Conventionally, as a character processing device for converting a character string, for example, a kana-kanji conversion device in a Japanese word processor has been widely used. As a result of kana-to-kanji conversion, polysemy disambiguation has been performed for a large number of homonym candidates due to the grammatical characteristics of the part of speech of each word, but words and words co-occur semantically. Since no consideration was given to the determination of the homophone pair, erroneous conversion was often performed. Here, a combination of a word and a word, that is, a combination in a word pair dictionary storing an example has been used for determining a first candidate.

〔発明が解決しようとしている問題点〕[Problems to be solved by the invention]

しかしながら、すべての個々の単語について、単語ど
うしの組み合わせを網羅することはその数が膨大である
ことから効率的ではなく、現実的とは言えない。
However, for all individual words, covering combinations of words is not efficient because of the large number of words, and is not realistic.

たまたま登録されている単語対に対しては、適正な変
換第1候補が得られても、登録外の単語対に対しては、
当然適用することができないため、同じ効果を得ること
はできない。
Even if a proper first conversion candidate is obtained for a registered word pair, for a non-registered word pair,
Naturally, it cannot be applied, so the same effect cannot be obtained.

〔問題点を解決するための手段〕[Means for solving the problem]

上記従来技術の問題点を解決するために、本発明の文
字処理装置は、仮名文字列を入力する入力手段と、単語
の読みと、表記と、意味属性とを対応付けて記憶した単
語辞書と、ある意味属性を有する単語群と共起関係を有
する単語と当該意味属性との組と、該組を当該共起関係
において結合可能な付属語または付属語列を表わす結合
情報とを用例として記憶した用例辞書と、1つの結合情
報に複数の付属語または付属語列を対応づけ可能に、結
合情報と付属語または付属語列とを対応づけた付属語テ
ーブルと、前記単語辞書を参照して、前記入力手段より
入力された仮名文字列を読みとする文節列の各文節の候
補を作成する文節候補作成手段と、前記各文節の候補に
つき、前記用例辞書及び前記付属語テーブルを参照し
て、各文節の自立語候補の1つと他の文節の自立語候補
の意味属性とが前記用例辞書に記憶された用例の組に該
当し、当該自立語候補同士を結合させる付属語または付
属語列と前記付属語テーブルにおいて対応づけられた結
合情報が当該用例の結合情報と一致する文節候補の組を
抽出する抽出手段と、該抽出手段により抽出された文節
候補の組があれば、該組をなす文節候補を優先させて、
前記各文節の第1候補を決定し、該第1候補の表記を出
力する出力手段とを具える。
In order to solve the above-mentioned problems of the related art, a character processing device of the present invention includes an input unit that inputs a kana character string, a word dictionary that stores word reading, notation, and a semantic attribute in association with each other. A set of a word having a co-occurrence relationship with a word group having a certain semantic attribute and the corresponding semantic attribute, and combination information indicating an adjunct or an adjunct string that can be connected to the set in the co-occurrence relationship as an example The example dictionary, the attached word table in which the combined information is associated with the attached word or the attached word string so that a plurality of attached words or attached word strings can be associated with one combined information, and the word dictionary is referred to. A phrase candidate creating means for creating a candidate for each phrase in the phrase string reading the kana character string input from the input means, and referring to the example dictionary and the attached word table for each candidate for the phrase. , Independent phrases of each clause And the semantic attributes of the independent word candidates of the other phrases correspond to the set of examples stored in the example dictionary, and correspond to the attached word or the attached word string that joins the independent word candidates in the attached word table. Extracting means for extracting a set of clause candidates whose attached information matches the combined information of the example, and, if there is a set of clause candidates extracted by the extracting means, giving priority to the clause candidates forming the set. ,
Output means for determining a first candidate of each of the phrases and outputting a notation of the first candidate.

また、本発明の他の態様によれば、文字処理方法に、
仮名文字列を入力する入力工程と、単語の読みと、表記
と、意味属性とを対応付けて記憶した単語辞書を参照し
て、前記入力手段より入力された仮名文字列を読みとす
る文節列の各文節の候補を作成する文節候補作成工程
と、ある意味属性を有する単語群と共起関係を有する単
語と当該意味属性との組と、該組を当該共起関係におい
て結合可能な付属語または付属語列を表わす結合情報と
を用例として記憶した用例辞書、及び1つの結合情報に
複数の付属語または付属語列を対応づけ可能に、結合情
報と付属語または付属語列とを対応づけた付属語テーブ
ルを参照して、前記各文節の候補から、ある文節の自立
語候補の1つと他の自立語候補の意味属性とが前記用例
辞書に記憶された用例の組に該当し、当該自立語候補同
士を結合させる付属語または付属語列と前記付属語テー
ブルにおいて対応づけられた結合情報が当該用例の結合
情報と一致する文節候補の組を抽出する抽出工程と、該
抽出工程により抽出された文節候補の組があれば、該組
をなす文節候補を優先させて、前記各文節の第1候補を
決定し、該第1候補の表記を出力する出力工程とを具え
る。
According to another aspect of the present invention, a character processing method includes:
An input step of inputting a kana character string, a word reading, a notation, and a phrase string in which a kana character string input from the input means is read by referring to a word dictionary stored in association with a semantic attribute. Candidate candidate creating step of creating a candidate for each phrase, a set of a word having a co-occurrence relationship with a word group having a certain semantic attribute, and an adjunct that can combine the set in the co-occurrence relationship Or, an example dictionary storing, as an example, combined information representing an attached word sequence, and associating combined information with an attached word or an attached word sequence so that a plurality of attached words or attached word sequences can be associated with one combined information item. With reference to the attached word table, one of the independent word candidates of a certain phrase and the semantic attribute of another independent word candidate correspond to a set of examples stored in the example dictionary, and Attachment to join independent word candidates Alternatively, if there is an extraction step of extracting a set of phrase candidates in which the combination information associated with the attachment word string and the attachment word table matches the combination information of the example, and if there is a set of clause candidates extracted by the extraction step, An output step of determining a first candidate of each of the phrases by giving priority to the phrase candidates forming the set, and outputting a notation of the first candidate.

これによって、例えば『“動物”を放す』という用例
が登録されていて、“動物”の意味属性が与えられてい
るすべての単語について上記用例を適用した変換をする
ことができる。
As a result, for example, an example of “release an animal” is registered, and conversion can be performed by applying the above example to all words to which a semantic attribute of “animal” is given.

〔実施例〕〔Example〕

以下、図面を参照して本発明を詳細に説明する。 Hereinafter, the present invention will be described in detail with reference to the drawings.

第1図は本発明の全体構成の一例である。 FIG. 1 shows an example of the overall configuration of the present invention.

図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスDBを介
して、それらのバスに接続された各構成要素を制御す
る。
In the configuration shown in the figure, a CPU is a microprocessor, performs calculations for character processing, performs logical judgment, and the like, and is connected to those components via an address bus AB, a control bus CB, and a data bus DB. Control elements.

アドレスバスABはマイクロプロセッサCPUの制御の対
象とする構成要素を指示するアドレス信号を転送する。
コントロールバスCBはマイクロプロセッサCPUの制御の
対象とする各構成要素のコントロール信号を転送して印
加する。データバスDBは各構成機器相互間のデータの転
送を行なう。
The address bus AB transfers an address signal indicating a component to be controlled by the microprocessor CPU.
The control bus CB transfers and applies a control signal of each component to be controlled by the microprocessor CPU. The data bus DB transfers data between the components.

次にROMは、読出し専用の固定メモリである。PAは、
後述するマイクロプロセッサCPUによる第6図〜第14図
に示す制御手順等を記憶させたプログラムエリアであ
る。
Next, the ROM is a fixed read-only memory. PA
This is a program area in which a control procedure and the like shown in FIGS. 6 to 14 by the microprocessor CPU described later are stored.

また、RAMは、1ワード16ビットの構成の書込み可能
のランダムアクセスメモリであって、各構成要素からの
各種データの一時記憶に用いる。
The RAM is a writable random access memory having a structure of one word and 16 bits, and is used for temporarily storing various data from each component.

TBUFは文書バッファであり、キーボードKBより入力さ
れた文書情報を蓄えるためのメモリである。
TBUF is a document buffer, and is a memory for storing document information input from the keyboard KB.

YBUFはキーボードKBより入力された読みを格納する入
力読みバッファ・メモリである。
YBUF is an input reading buffer memory for storing readings input from the keyboard KB.

DICはカナ漢字変換を行なうための単語辞書である。 DIC is a word dictionary for performing kana-kanji conversion.

DBPOOLはYBUFの読みを文節に解析・変換した情報を格
納する同音語候補格納メモリである。
DBPOOL is a homophone candidate storage memory that stores information obtained by analyzing and converting YBUF readings into phrases.

YJPOOLはDBPOOLと連動して、同音語の候補に適用され
ている用例の情報を格納するメモリである。
YJPOOL is a memory that stores information on examples applied to homophone candidates in cooperation with DBPOOL.

LRNDATは個々の単語および用例の学習状態を格納した
学習データ格納メモリである。
LRNDAT is a learning data storage memory that stores learning states of individual words and examples.

FZTBLは付属語をDICに格納されている結合情報に反応
させるための付属語列変換テーブルである。
FZTBL is an attached word string conversion table for causing attached words to react to binding information stored in DIC.

KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号入力キー、及び、
変換を指示する変換キーなどの各種のファンクションキ
ーを備えている。
KB is a keyboard, and character symbol input keys such as alphabet keys, hiragana keys, katakana keys, and
Various function keys such as a conversion key for instructing conversion are provided.

図において、YOMIは読みを入力するためのキー、CON
は入力した読みを変換するための変換指示キー、NXTは
変換候補を変更して次候補に変換するための次候補変換
指示キー、SELは現在の同音語表示候補に確定し同時に
その候補表記を学習することを指示するための選択キー
である。
In the figure, YOMI is a key for inputting readings, CON
Is a conversion instruction key for converting the input reading, NXT is a next candidate conversion instruction key for changing the conversion candidate and converting it to the next candidate, and SEL is determined as the current homophone display candidate and simultaneously displays the candidate notation. This is a selection key for instructing learning.

DISKは定型文書を記憶するためのメモリで作成された
文書の保管を行ない、保管された文書はキーボードの指
示により、必要な時呼び出される。
DISK stores documents created in a memory for storing fixed-form documents, and the stored documents are called up when necessary by keyboard instructions.

CRはカーソルレジスタである。CPUにより、カーソル
レジスタの内容を読み書きできる。後述するCRTコント
ローラCRTCは、ここに蓄えられたアドレスに対する表示
装置CRT上の位置にカーソルを表示する。
CR is a cursor register. The CPU can read and write the contents of the cursor register. A CRT controller CRTC described later displays a cursor at a position on the display device CRT corresponding to the address stored here.

DBUFは表示用バッファメモリで、TBUFに蓄えられた文
書情報等のパターンを蓄える。
DBUF is a display buffer memory for storing patterns such as document information stored in TBUF.

CRTCはカーソルレジスタCR及びバッファDBUFに蓄えら
れた内容を表示器CRTに表示する役割を担う。
The CRTC plays a role of displaying the contents stored in the cursor register CR and the buffer DBUF on the display CRT.

また、CRTは陰極線管等を用いた表示装置であり、そ
の表示装置CRTにおけるドット構成のパターンおよびカ
ーソルの表示をCRTコントローラで制御する。さらに、C
Gはキャラクタジェネレータであって、表示装置CRTに表
示する文字、記号のパターンを記憶するものである。
The CRT is a display device using a cathode ray tube or the like, and the display of the dot configuration pattern and the cursor on the display device CRT is controlled by a CRT controller. Furthermore, C
G is a character generator that stores character and symbol patterns to be displayed on the display device CRT.

かかる各構成要素からなる本発明文字処理装置におい
ては、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラプト信号がマイクロプロセッサCPU
に送られ、そのマイクロプロセッサCPUがROM内に記憶し
てある各種の制御信号を読出し、それらの制御信号に従
って、各種の制御が行なわれる。
In the character processing apparatus of the present invention comprising such components, the apparatus operates in response to various inputs from the keyboard KB. When an input from the keyboard KB is supplied, first, an interrupt signal is generated by the microprocessor CPU.
The microprocessor CPU reads various control signals stored in the ROM, and performs various controls according to the control signals.

第2図は、カナ漢字変換に用いる単語辞書DICの構成
を示した図である。
FIG. 2 is a diagram showing a configuration of a word dictionary DIC used for kana-kanji conversion.

辞書は表記変換に用いる単語情報と表記変換の際の第
1候補を決定するための用例情報とで構成されている。
単語情報はその見出し単語固有の単語IDと、単語の読み
を格納する読み、単語の表記を格納する表記、単語の品
詞を格納する品詞、単語の意味属性を格納する意味から
構成されている。単語IDは先頭の単語を1とする連続番
号である。用例情報はその見出し単語の持つ用例情報の
個数、用例固有の用例ID、その用例が個別用例であるか
意味用例であるかの用例タイプを記述したタイプ、用例
タイプが個別用例であれば用例の相手の単語の単語IDを
格納し意味用例であれば用例の相手となる意味属性を格
納する用例、用例の相手の単語に付く付属語のうち用例
が成立する条件を満たす代表的な付属語を格納した結合
情報、用例を逆転させても使用可能であるかどうかの情
報を格納する逆転から構成される。用例を一つも持たな
い単語は、用例情報の個数に0が格納されている。用例
IDは単語IDと同じく先頭の用例を1とする連続番号であ
る。
The dictionary is composed of word information used for notation conversion and example information for determining a first candidate at the time of notation conversion.
The word information is composed of a word ID unique to the heading word, a reading that stores the reading of the word, a notation that stores the notation of the word, a part of speech that stores the part of speech of the word, and a meaning that stores the semantic attribute of the word. The word ID is a serial number with the first word being 1. The example information is the number of example information that the headword has, the example ID unique to the example, the type that describes the example type whether the example is an individual example or a semantic example, and the example type if the example type is an individual example. If the word ID of the partner's word is stored and if it is a semantic example, an example that stores the semantic attribute that is the partner of the example. It consists of the stored coupling information and the reversal storing information on whether or not the example can be used even if the example is reversed. For a word having no example, 0 is stored in the number of example information. example
The ID is a serial number with the first example being 1 as in the case of the word ID.

図において例えば、『買う』という単語は300という
連続番号で区別され、読みが『かう』、表記が『買
う』、品詞が『動詞』であるという単語情報を持つ。そ
して『酒を買う』と『喧嘩を買う』という2つの個別単
語用例を持つ。また、『鮭』という単語は500という連
続番号で区別され、読みが『さけ』、表記が『鮭』、品
詞が『名詞』であり、意味属性が『動物』である単語で
ある。用例個数に0が格納されているので『鮭』を見出
し語とする用例は登録されていない。
In the figure, for example, the word "buy" is distinguished by a serial number of 300, and has word information that the reading is "ka", the notation is "buy", and the part of speech is "verb". It has two separate word examples, "buy sake" and "buy quarrel." Also, the word "salmon" is distinguished by a consecutive number of 500, the word is "salmon", the notation is "salmon", the part of speech is "noun", and the semantic attribute is "animal". Since 0 is stored in the number of examples, no example in which “salmon” is a headword is registered.

第3図は、同音語プールDBPOOLおよび用例情報プール
YJPOOLの構成を示した図である。(a)は同音語プール
の全体構成である。同音語プールはカナ漢字変換処理に
よって作成された各同音語情報から構成される。(b)
は同音語情報の構成を示した図である。同音語情報は、
その同音語を他の同音語と区別するための連続番号であ
る同音語ID、その同音語情報の使用メモリ・サイズを表
わすデータ長、格納されている同音語の候補の個数を格
納する候補個数、同音語の候補の情報を格納する候補情
報、および、同音語の中に格納されている候補情報の中
で、後述する優先候補の個数を格納する優先個数から構
成されている。このような同音語の構成において、候補
情報の列の先頭の候補情報が変換結果として出力すべき
第1候補になるものとし、列の先頭から優先個数によっ
て示される個数の候補情報が、後述する優先候補になる
ものとする。(c)は候補情報の構成を示した図であ
る。候補情報は、候補の表記、その単語ID、文節末の活
用形を格納する文節末活用、および、後述の用例情報へ
のポインタを格納する用例情報ポインタから構成され
る。候補情報に用例が適用されずに用例情報が存在しな
い場合には、用例情報ポインタに無効値−1が格納され
る。(d)は用例情報プールYJPOOLの全体構成である。
用例情報プールは、同音語の各候補に適用される用例の
情報を格納する用例情報から構成される。(e)は用例
情報の構成を示した図である。用例情報は、用例の相手
となる同音語のIDを格納するペア同音語ID、適用されて
いる用例のIDを格納する用例ID、適用されている用例の
タイプ(個別用例または意味用例)を格納する用例タイ
プ、および、同じ候補情報に適用されている別の用例情
報へのポインタが格納されている用例情報ポインタから
構成される。このように、用例情報はリスト構造となっ
ている。次の用例情報が存在しない場合には、用例情報
ポインタには無効値−1が格納される。
Fig. 3 shows a homophone pool DBPOOL and an example information pool
It is a figure showing the composition of YJPOOL. (A) is an entire configuration of a homophone pool. The homophone pool is composed of each homophone information created by the kana-kanji conversion process. (B)
FIG. 3 is a diagram showing a configuration of homophone information. Homophone information is
A homophone ID which is a serial number for distinguishing the homophone from other homophones, a data length indicating a used memory size of the homophone information, and a candidate number for storing the number of stored homophone candidates. , Candidate information storing information on homophone candidates, and a priority number storing the number of priority candidates described later among candidate information stored in the homophone. In such a homophone configuration, the candidate information at the head of the column of candidate information is assumed to be the first candidate to be output as a conversion result, and the number of pieces of candidate information indicated by the priority number from the head of the column will be described later. It shall be a priority candidate. (C) is a diagram showing a configuration of candidate information. The candidate information is composed of a phrase of the candidate, its word ID, a phrase end utilization for storing a phrase end utilization form, and an example information pointer for storing a pointer to example information to be described later. When the example is not applied to the candidate information and the example information does not exist, the invalid value -1 is stored in the example information pointer. (D) is the entire configuration of the example information pool YJPOOL.
The example information pool is composed of example information for storing information on examples applied to each homophone candidate. (E) is a diagram showing the configuration of example information. The example information stores the pair homophone ID that stores the ID of the homophone that is the partner of the example, the example ID that stores the ID of the applied example, and the type of the applied example (individual example or semantic example). And an example information pointer in which a pointer to another example information applied to the same candidate information is stored. Thus, the example information has a list structure. If the next example information does not exist, an invalid value -1 is stored in the example information pointer.

以上説明したような同音語プールおよび用例情報プー
ルの構成において、ある同音語のある候補に用例が適用
されている場合、その候補情報に用例情報を格納すると
ともに、用例の相手となる同音語の候補に対する候補情
報にも、同じ用例の情報を格納した用例情報を格納する
ものとする。
In the configuration of the homophone pool and the example information pool as described above, when an example is applied to a certain candidate of a certain homonym, the example information is stored in the candidate information, and the homonym that is a partner of the example is stored. It is assumed that the candidate information for a candidate also stores example information in which information of the same example is stored.

第4図は、付属語列変換テーブルFZTBLの構成を示し
た図である。付属語列変換テーブルは文節を構成する付
属語列を単語辞書DICが持つ用例情報中の結合情報に対
応させるための対応変換表である。付属語読みはその付
属語列の読みを表わし、対応結合情報はその付属語列が
置換可能な辞書の用例情報中の結合情報を表わす。
FIG. 4 is a diagram showing a configuration of an attached word string conversion table FZTBL. The attached word string conversion table is a correspondence conversion table for associating an attached word string constituting a phrase with combination information in the example information of the word dictionary DIC. The attached word reading indicates the reading of the attached word string, and the corresponding combined information indicates combined information in the example information of the dictionary in which the attached word string can be replaced.

例えば、付属語『こそ』は結合情報『が』または
『を』に、付属語列『さえもが』は結合情報『が』に、
それぞれ置換して結合判定することができる。
For example, the ancillary word "kana" is combined information "ga" or "wo", the ancillary word string "Saemoga" is combined information "ga",
Each of them can be replaced to determine the binding.

第5図は、学習データLRNDATの構成を示した図であ
る。(a)は学習データの全体構成である。学習データ
は単語学習データと用例学習データの2つから構成され
る。単語学習へのポインタは学習データ内の単語学習列
先頭へのインデックスを格納し、用例学習へのポインタ
は学習データ内の用例学習データ列先頭へのインデック
スを格納する。(b)は単語学習データ列の構成を示し
た図である。単語学習データ列は使用サイズと各単語学
習データから構成される。単語学習データ使用サイズは
単語学習データ列の使用サイズを格納する。単語学習デ
ータは各単語のIDに対応しており、学習されている単語
には1、学習されていない単語に対しては0が格納され
る。(c)は用例学習データ列の構成を示した図であ
る。用例学習データ列は使用サイズと各用例学習データ
から構成される。用例学習データ使用サイズは用例学習
データ列の使用サイズを格納する。用例学習データは各
用例IDに対応しており、抑制されている使用禁止用例に
は1、抑制されていない使用か脳用例に対しては0が格
納される。
FIG. 5 is a diagram showing a configuration of the learning data LRNDAT. (A) is an entire configuration of learning data. The learning data is composed of two pieces of word learning data and example learning data. The pointer to the word learning stores an index to the head of the word learning string in the learning data, and the pointer to the example learning stores the index to the head of the example learning data string in the learning data. (B) is a diagram showing a configuration of a word learning data sequence. The word learning data string is composed of the used size and each word learning data. The word learning data use size stores the use size of the word learning data sequence. The word learning data corresponds to the ID of each word, and 1 is stored for a learned word and 0 is stored for an unlearned word. (C) is a diagram showing a configuration of an example learning data sequence. The example learning data sequence is composed of the used size and each example learning data. The example learning data use size stores the use size of the example learning data sequence. The example learning data corresponds to each example ID, and 1 is stored for a suppressed use prohibited example and 0 is stored for an unrestricted use or brain example.

上述の実施例の作動をフローに従って説明する。 The operation of the above embodiment will be described according to a flow.

第6図は本発明文字処理装置の動作を示すフローチャ
ートである。
FIG. 6 is a flowchart showing the operation of the character processing apparatus of the present invention.

S6−1においてキーボードよりキーが押下され、割り
込みが発生するのを待つ。キーが入力されるとS6−2に
おいてキー判別し、キーの種類に応じてS6−3、S6−
4、S6−5、S6−6、S6−7のいずれかのステップに分
岐する。
In step S6-1, the process waits until a key is pressed from the keyboard and an interrupt occurs. When a key is input, the key is determined in S6-2, and S6-3, S6-
4. The process branches to any one of steps S6-5, S6-6, and S6-7.

S6−3は読み入力キーYOMIが押下されたときの処理で
あり、押下された読みのコードを入力読みバッファ・メ
モリYBUFに蓄える。
S6-3 is a process when the reading input key YOMI is pressed, and the code of the pressed reading is stored in the input reading buffer memory YBUF.

S6−4は変換キーCONが押下されたときの処理であ
り、S6−3で入力されてYBUFに蓄えられている、カナ漢
字変換の対象となる文字列を漢字に変換し、出力バッフ
ァに出力する。漢字に変換する際に、単語辞書DIC中に
存在する用例情報を用いて、同音語の第1候補を決定す
る。
S6-4 is a process performed when the conversion key CON is pressed, and converts the character string to be converted into kana to kanji, which is input in S6-3 and stored in YBUF, and outputs it to the output buffer. I do. When converting to kanji, the first candidate of the same phonetic word is determined using the example information existing in the word dictionary DIC.

S6−5は次候補変換キーNXTが押下されたときの処理
であり、S6−4によって出力された出力バッファ中の同
音語の別の候補を表示する。
S6-5 is processing when the next candidate conversion key NXT is pressed, and displays another homophone candidate in the output buffer output in S6-4.

S6−6は選択キーSELが押下されたときの処理であ
り、画面に表示されている出力バッファ中の同音語を確
定し、確定された文字列を文書中に出力する。さらに、
選択された単語を学習する処理を行なう。
S6-6 is processing when the selection key SEL is pressed, and determines the homophone in the output buffer displayed on the screen, and outputs the determined character string in the document. further,
A process for learning the selected word is performed.

S6−7は、YOMI、CON、NXT、SEL以外のキー(例え
ば、カーソル移動キーなどの文書編集で用いるキーな
ど)が押下された場合の処理であり、同種の文字処理装
置において一般に行なわれている処理であり、公知であ
るので特に記述しない。
S6-7 is processing when a key other than YOMI, CON, NXT, and SEL (for example, a key used for editing a document such as a cursor movement key) is pressed, and is generally performed in the same type of character processing apparatus. This process is well-known and will not be described in particular.

S6−8は上記の処理の結果、変更された部分を表示す
る表示処理である。文書中のデータ1文字を読んではパ
ターンに展開し、表示バッファに出力するという通常広
く行なわれている処理である。
S6-8 is a display process for displaying a portion changed as a result of the above process. This is a widely-used process in which one character of data in a document is read, developed into a pattern, and output to a display buffer.

第7図は、S6−4の処理を詳細化したフローチャート
である。
FIG. 7 is a detailed flowchart of the process in S6-4.

S7−1は、文節単位に分ち書きされて入力されたカナ
漢字変換の対象となる文字列を解析し、カナ漢字変換の
出力の候補を同音語プールに出力する処理である。分ち
書きされた単位に文字列を順々に取り出し、単語辞書を
検索して解析を行ない、文節として認定される候補のみ
を同音語プールに出力する処理であって、同種の文字処
理装置において一般に行なわれている処理であり、公知
であるので特に記述しない。
S7-1 is a process of analyzing a character string to be subjected to kana-kanji conversion, which is input after being divided and written in units of phrases, and outputting candidates for kana-kanji conversion output to the homophone pool. A process in which character strings are sequentially taken out in unit of division, a word dictionary is searched and analyzed, and only candidates recognized as phrases are output to a homophone pool. This is a generally performed process, and is not particularly described because it is known.

S7−2はS7−1において同音語プールに出力された解
析結果に対して、単語辞書中に格納されている用例のパ
ターンが存在するかどうかをチェックし、用例のパター
ンが存在すれば、その用例の対象となる同音語の候補を
優先候補としてピックアップする。
S7-2 checks whether or not the example pattern stored in the word dictionary exists for the analysis result output to the homophone pool in S7-1, and if the example pattern exists, the Pick up homophone candidates to be used as examples as priority candidates.

S7−3はS7−2でピックアップされた優先候補や、単
語学習されている候補の中から、カナ漢字変換の第1候
補を決定する。
In step S7-3, the first candidate for kana-kanji conversion is determined from the priority candidates picked up in step S7-2 and the candidates whose words have been learned.

S7−4は、出力バッファに格納されたカナ漢字変換の
出力を表示する処理であり、同種の文字処理装置におい
て一般に行なわれている処理であり、公知であるので特
に記述しない。
S7-4 is a process for displaying the output of the Kana-Kanji conversion stored in the output buffer. This process is generally performed in the same type of character processing device, and is not particularly described since it is known.

第8図はS7−2の処理を詳細化したフローチャートで
ある。
FIG. 8 is a detailed flowchart of the process of S7-2.

優先候補抽出の対象となる同音語を先頭から順次、取
り出してきて、対象同音語がなくなるまですべての同音
語に対して、以下の処理を行なう。
Homophone words to be subjected to priority candidate extraction are sequentially extracted from the beginning, and the following processing is performed on all the homophone words until there is no more target homophone word.

S8−1で同音語中の候補情報を取り出してくる。 In S8-1, candidate information in the homophone is extracted.

S8−2ですべての候補情報について処理したかどうか
を判定し、すべて処理済であるならば優先候補抽出を終
了する。次の候補情報が取り出せたならば、S8−3で候
補情報に用例情報が存在するかどうかを判定する。用例
情報が存在するかどうかは、候補情報中の用例情報ポイ
ンタによって判定できる。すなわち、用例情報ポインタ
の値が“−1"であるならば用例情報は存在しない。そう
でなければ用例情報ポインタの示す領域に用例情報が存
在する。用例情報が存在しないならば優先候補抽出処理
を終了する。
In S8-2, it is determined whether or not all candidate information has been processed, and if all have been processed, priority candidate extraction ends. If the next candidate information can be extracted, it is determined in S8-3 whether the candidate information includes example information. Whether or not the example information exists can be determined by the example information pointer in the candidate information. That is, if the value of the example information pointer is “−1”, there is no example information. Otherwise, the example information exists in the area indicated by the example information pointer. If there is no example information, the priority candidate extraction process ends.

用例情報が存在する場合、S8−4で逆方向用例情報の
抽出を行ない、S8−5で正方向用例情報の抽出を行な
う。
If the example information exists, the backward example information is extracted in S8-4, and the forward example information is extracted in S8-5.

S8−5の処理を終了したならば、次の候補情報を処理
するためS8−1へループする。
When the process in S8-5 is completed, the process loops to S8-1 to process the next candidate information.

第9図は、S8−4の処理を詳細化したフローチャート
である。
FIG. 9 is a detailed flowchart of the process of S8-4.

S9−1において、候補情報に格納されている単語IDに
よって、その単語に存在する用例の情報を、一つずつ辞
書の中から取ってくる。
In S9-1, the information of the examples existing in the word is fetched one by one from the dictionary according to the word ID stored in the candidate information.

S9−2において、S9−1で候補情報の単語に対して辞
書中に用例が存在するかどうか、辞書中の用例をすべて
取り終えたかどうかを判定する。用例が存在していれば
S9−3へ進み、用例が存在していないか、辞書中の用例
をすべて取り終えていれば逆方向用例抽出処理を終えて
リターンする。
In S9-2, it is determined whether or not an example exists in the dictionary for the word of the candidate information in S9-1, and whether all the examples in the dictionary have been taken. If an example exists
Proceeding to S9-3, if there is no example or if all the examples in the dictionary have been taken, the backward example extraction processing is finished and the routine returns.

S9−3において、取り出されてきた用例を逆転させて
適用させることが可能かどうかをチェックする。その情
報は辞書中に格納されている。逆転可能であればS9−4
へ進み、逆転できなければS9−1へ進む。
In S9-3, it is checked whether or not the retrieved example can be applied in reverse. The information is stored in the dictionary. S9-4 if reversible
If not, go to S9-1.

S9−4において、取り出された用例を逆転して適用し
た場合に、入力された読みに対して成立可能かどうかの
判定を行なう。成立可能であればS9−5へ進み、成立可
能でなければS9−1へ進む。
In S9-4, when the retrieved example is applied in reverse, it is determined whether or not the input reading can be established. If it is possible, the process proceeds to S9-5, and if not, the process proceeds to S9-1.

S9−5において、成立可能な用例の情報を用例情報に
格納する。すなわち、用例情報プールに用例の情報を用
例情報として格納し、対象となっている同音語の候補情
報に用例情報が存在しなければ、用例情報ポインタに新
たに作成された用例情報へのポインタを格納する。候補
情報に用例情報が存在すれば、用例情報のリストの末尾
に新たに作成された用例情報を付け加える。また、対象
となっている同音語の候補情報だけでなく、用例の相手
となる同音語の候補情報にも同じようにして用例情報を
格納する。
In S9-5, the information of the feasible example is stored in the example information. That is, the example information is stored in the example information pool as example information, and if there is no example information in the target homophone candidate information, the example information pointer is replaced with a pointer to the newly created example information. Store. If the example information is present in the candidate information, the newly created example information is added to the end of the example information list. In addition, the example information is stored not only in the target homophone candidate information but also in the homophone candidate information to be the partner of the example.

第10図は、S9−4の処理を詳細化したフローチャート
である。
FIG. 10 is a detailed flowchart of the process in S9-4.

S10−1において、対象となっている文節に後続する
文節が存在するかどうかチェックする。後続する文節が
存在すればS10−2へ進み、存在しなければS10−7へ進
む。
In S10-1, it is checked whether or not a phrase following the target phrase exists. If a subsequent clause exists, the process proceeds to S10-2, and if not, the process proceeds to S10-7.

S10−2において、対象となっている文節の末尾の活
用形が連体形であるかどうかをチェックする。連体形で
あればS10−3へ進み、連体形でなければ S10−7へ進む。
In S10-2, it is checked whether the ending form of the target phrase is a continuous form. If it is a continuous type, go to S10-3; if not, go to S10-7.

S10−3において、後続する文節に対する同音語から
候補情報を一つずつ取ってくる。
In S10-3, candidate information is fetched one by one from the homophone for the following phrase.

S10−4において、S10−3で候補情報が取ってこれた
かどうかを判定する。候補情報が取ってこれればS10−
5へ進み、すべての候補情報を取り終えて、候補情報が
取ってこれなければS10−7へ進む。
In S10-4, it is determined whether or not the candidate information has been obtained in S10-3. S10−
The process proceeds to step S5, where all candidate information has been obtained. If no candidate information has been obtained, the process proceeds to step S10-7.

S10−5において、S10−3で得た候補情報の単語が用
例の相手となりうるかどうかを判定する。すなわち、用
例のタイプが個別用例であれば、辞書中の用例情報の用
例の項目に格納されている単語IDとS10−3で得た候補
情報の単語IDが一致していれば、用例の相手となるもの
とし、一致しなければ用例の相手とならないものとす
る。用例のタイプが意味用例であれば、辞書中の用例情
報の用例の項目に格納されている意味属性と、S10−3
で得た候補情報の単語IDから得られる意味属性とが一致
していれば、用例の相手となるものとし、一致しなけれ
ば用例の相手とならないものとする。用例の相手になる
と判定されればS10−6へ進み、用例の相手にならない
と判定されればS10−3へ進む。
In S10-5, it is determined whether the word of the candidate information obtained in S10-3 can be a partner of the example. That is, if the type of the example is an individual example, if the word ID stored in the example item of the example information in the dictionary matches the word ID of the candidate information obtained in S10-3, the partner of the example is If they do not match, it will not be the partner of the example. If the example type is a semantic example, the semantic attribute stored in the example item of the example information in the dictionary and S10-3
If the semantic attributes obtained from the word IDs of the candidate information obtained in step 1 match, it is determined that the candidate information becomes a partner of the example. If it is determined that it will be the partner of the example, the process proceeds to S10-6, and if it is determined that it will not be the partner of the example, the process proceeds to S10-3.

S10−6において、用例が成立するというリターン・
コードを設定する。
In S10-6, the return that the example is
Set the code.

S10−7において、用例が成立しないというリターン
・コードを設定する。
In S10-7, a return code indicating that the example is not established is set.

第11図は、S8−5の処理を詳細化したフローチャート
である。
FIG. 11 is a flowchart detailing the processing of S8-5.

S11−1において、候補情報に格納されている単語ID
によって、その単語に存在する用例の情報を、一つずつ
辞書の中から取ってくる。
In S11-1, the word ID stored in the candidate information
Retrieves the information of the examples existing in the word one by one from the dictionary.

S11−2において、S11−1で候補情報の単語に対して
辞書中に用例が存在するかどうか、辞書中の用例をすべ
て取り終えたかどうかを判定する。用例が存在していれ
ばS11−3へ進み、用例が存在していないか、辞書中の
用例をすべて取り終えていれば正方向用例抽出処理を終
えてリターンする。
In S11-2, it is determined whether or not there is an example in the dictionary for the word of the candidate information in S11-1 and whether or not all the examples in the dictionary have been taken. If an example exists, the process proceeds to S11-3. If the example does not exist, or if all the examples in the dictionary have been taken, the forward-direction example extracting process ends, and the process returns.

S11−3において、取り出された用例を正方向に適用
した場合に、入力された読みに対して成立可能かどうか
の判定を行なう。成立可能であればS11−4へ進み、成
立可能でなければS11−1へ進む。
In S11-3, when the extracted example is applied in the forward direction, it is determined whether or not the input reading can be established. If it is possible, the process proceeds to S11-4, and if not, the process proceeds to S11-1.

S11−4において、成立可能な用例の情報を用例情報
に格納する。すなわち、用例情報プールに用例の情報を
用例情報として格納し、対象となっている同音語の候補
情報に用例情報が存在しなければ、用例情報ポインタに
新たに作成された用例情報へのポインタを格納する。候
補情報に用例情報が存在すれば、用例情報のリストの末
尾に新たに作成された用例情報を付け加える。また、対
象となっている同音語の候補情報だけでなく、用例の相
手となる同音語の候補情報にも同じようにして用例情報
を格納する。
In S11-4, the information of the feasible example is stored in the example information. That is, the example information is stored in the example information pool as example information, and if there is no example information in the target homophone candidate information, the example information pointer is replaced with a pointer to the newly created example information. Store. If the example information is present in the candidate information, the newly created example information is added to the end of the example information list. In addition, the example information is stored not only in the target homophone candidate information but also in the homophone candidate information to be the partner of the example.

第12図は、S11−3の処理を詳細化したフローチャー
トである。
FIG. 12 is a detailed flowchart of the process in S11-3.

S12−1において、対象となっている文節の前の文節
が存在するかどうか チェックする。前の文節が存在すればS12−2へ進み、
存在しなければS12−8へ進む。
In S12-1, it is checked whether a phrase before the target phrase exists. If the previous clause exists, proceed to S12-2,
If not, the process proceeds to S12-8.

S12−2において、前の文節に対する同音語から候補
情報を一つずつ取ってくる。
In S12-2, candidate information is fetched one by one from the homophone for the previous phrase.

S12−3において、S12−2で候補情報が取ってこれた
かどうかを判定する。候補情報が取ってこれればS12−
4へ進み、すべての候補情報を取り終えて、候補情報が
取ってこれなければS12−8へ進む。
In S12-3, it is determined whether the candidate information has been fetched in S12-2. If the candidate information is taken, S12-
Then, the process proceeds to S12-8, where all candidate information has been obtained. If no candidate information has been obtained, the process proceeds to S12-8.

S12−4において、S12−2で得た候補情報の単語が用
例の相手となりうるかどうかを判定する。すなわち、用
例のタイプが個別用例であれば、辞書中の用例情報の用
例の項目に格納されている単語IDとS12−2で得た候補
情報の単語IDが一致していれば、用例の相手となるもの
とし、一致しなければ用例の相手とならないものとす
る。用例のタイプが意味用例であれば、辞書中の用例情
報の用例の項目に格納されている意味属性と、S12−2
で得た候補情報の単語IDから得られる意味属性とが一致
していれば、用例の相手となるものとし、一致しなけれ
ば用例の相手とならないものとする。用例の相手になる
と判定されればS12−5へ進み、用例の相手にならない
と判定されればS12−2へ進む。
In S12-4, it is determined whether the word of the candidate information obtained in S12-2 can be a partner of the example. That is, if the type of the example is an individual example, if the word ID stored in the example item of the example information in the dictionary matches the word ID of the candidate information obtained in S12-2, the partner of the example is If they do not match, it will not be the partner of the example. If the type of the example is a semantic example, the semantic attribute stored in the example item of the example information in the dictionary and S12-2
If the semantic attributes obtained from the word IDs of the candidate information obtained in step 1 match, it is determined that the candidate information becomes a partner of the example. If it is determined that it will be the partner of the example, the process proceeds to S12-5, and if it is determined that it does not become the partner of the example, the process proceeds to S12-2.

S12−5において、S12−2で得た候補情報の自立部以
外の残り読み(付属語列)を付属語列変換テーブルによ
って、結合情報に変換する。
In S12-5, the remaining reading (attached word string) of the candidate information obtained in S12-2 other than the independent part is converted into combined information by the attached word string conversion table.

S12−6において、前の文節の同音語の候補が、用例
の結合条件を満たしているかどうかを判定する。すなわ
ち、S12−5において、付属語列変換テーブルによって
結合情報に変換できなければ、結合条件を満たしていな
いものとする。また、S12−5で得た結合情報と、辞書
中の用例情報の結合情報との間に、一致する情報があれ
ば結合条件を満たしているものとし、一致する情報がな
ければ結合条件を満たしていないものとする。結合条件
を満たしていればS12−7へ進み、結合条件を満たして
いなければS12−2へ進む。
In S12-6, it is determined whether or not the homophone candidate of the previous phrase satisfies the combining condition of the example. That is, in S12-5, if conversion to connection information cannot be performed by the attached word string conversion table, it is determined that the connection condition is not satisfied. If there is matching information between the combination information obtained in S12-5 and the combination information of the example information in the dictionary, it is assumed that the combining condition is satisfied. Shall not be. If the connection condition is satisfied, the process proceeds to S12-7, and if the connection condition is not satisfied, the process proceeds to S12-2.

S10−7において、用例が成立するというリターン・
コードを設定する。
In S10-7, the return that the example is
Set the code.

S12−8において、用例が成立しないというリターン
・コードを設定する。
In S12-8, a return code indicating that the example is not established is set.

第13図はS7−3の処理を詳細化したフローチャートで
ある。
FIG. 13 is a detailed flowchart of the process of S7-3.

第1候補決定を行なわなければならない同音語を先頭
から順次、取り出してきて、対象同音語がなくなるまで
すべての同音語に対して、以下の処理を行なう。
Homophones for which the first candidate must be determined are sequentially extracted from the beginning, and the following processing is performed on all the homophones until there is no more target homophone.

S13−1で同音語内の候補情報のうちから優先候補を
ピックアップする。優先候補のピックアップは同音語が
持つ候補情報のうち、用例情報ポインタが“−1"でない
ものの個数を優先個数にセットし、優先個数にカウント
された候補情報を順次先頭に並び換えていく。すべての
候補情報について、優先候補のピックアップが終了した
ならば、S13−2に進み,抑制された用例を優先候補か
ら除外する処理を行なう。候補情報の先頭から優先個数
分の候補情報について、以下の処理を行なうことによ
り、抑制用例の優先除外を行なう。まず候補情報内の用
例情報ポインタをたどり、用例情報内の用例IDを取り出
す。取り出した用例IDの示す用例学習データが抑制状態
にあるかどうかをチェックする。用例情報ポインタが終
端に達するまで、すなわちポインタ値が“−1"を示すま
での用例IDについて抑制されているかどうかを調べた結
果、候補情報の用例情報ポインタが示すすべての用例情
報が抑制されていた場合のみ、その候補情報を優先候補
から除外する。すなわち、優先個数を1減らし、候補情
報を優先候補末尾の直後に並び換える。
In S13-1, a priority candidate is picked up from candidate information in the homophone. The priority candidate pickup sets the number of pieces of candidate information having the example information pointer that is not “−1” among the pieces of candidate information included in the same word as the priority number, and sequentially rearranges the candidate information counted as the priority number to the top. When the pickup of the priority candidate is completed for all the candidate information, the process proceeds to S13-2, and a process of excluding suppressed examples from the priority candidates is performed. The priority exclusion of the suppression example is performed by performing the following processing on the candidate information of the priority number from the head of the candidate information. First, the example information pointer in the candidate information is traced, and the example ID in the example information is extracted. It is checked whether or not the example learning data indicated by the extracted example ID is in the suppression state. As a result of checking whether or not the example ID until the pointer reaches the end, that is, until the pointer value indicates “−1”, all the example information indicated by the example information pointer of the candidate information is suppressed. Only when this occurs, the candidate information is excluded from the priority candidates. That is, the priority number is reduced by 1, and the candidate information is rearranged immediately after the end of the priority candidate.

S13−3でS13−2の結果、優先候補が残っているかど
うかを、優先個数が0か否かによって判定し、優先候補
が一つもない場合はS13−5へ、優先候補が1個以上残
っている場合はS13−4へそれぞれ分岐する。
In S13-3, as a result of S13-2, it is determined whether or not the priority candidate remains based on whether or not the priority number is 0. If there is no priority candidate, the process proceeds to S13-5, where one or more priority candidates remain. If so, the flow branches to S13-4.

S13−4で優先候補として残された候補情報のうち、
個別単語用例を持つ候補が存在するかどうかをチェック
する。個別単語用例の存在チェックは、候補情報の先頭
から優先個数分の候補情報について、以下の処理を行な
うことにより行なわれる。先ず、候補情報内の用例情報
ポインタをたどり、用例情報ポインタの示すすべての用
例情報について用例のタイプを調べ、一つでも個別単語
用例があれば“個別単語用例あり”と判定される。用例
情報ポインタが終端に達するまで、すなわちポインタ値
が“−1"を示すまで用例のタイプを調べてすべて意味属
性用例であれば“個別単語用例なし”と判定される。
Of the candidate information left as priority candidates in S13-4,
Check if there is a candidate with individual word example. The existence check of the individual word example is performed by performing the following processing on the candidate information of the priority number from the head of the candidate information. First, the example information pointer in the candidate information is followed, and the type of the example is checked for all the example information indicated by the example information pointer. If there is at least one individual word example, it is determined that "an individual word example exists". Until the example information pointer reaches the end, that is, until the pointer value indicates “−1”, the type of the example is checked. If all the examples are semantic attribute examples, it is determined that there is no “individual word example”.

判定の結果、個別単語用例ありならばS13−6へ、個
別単語用例なしならばS13−7へ分岐する。
As a result of the determination, if there is an individual word example, the flow branches to S13-6, and if there is no individual word example, the flow branches to S13-7.

S13−6でS13−5の個別単語用例検索の結果、すべて
意味属性用例である候補情報を優先候補から除外する。
すなわち、優先個数を1減らし、候補情報を優先候補末
尾の直後に並び換える。
In S13-6, as a result of the individual word example search in S13-5, candidate information that is all semantic attribute examples is excluded from priority candidates.
That is, the priority number is reduced by 1, and the candidate information is rearranged immediately after the end of the priority candidate.

上記処理の結果、優先候補が1つに絞られたかどうか
をS13−7で判定する。すなわち優先個数が1であるか
どうかを判定する。優先個数が1であるならばS13−9
へ進み、優先候補を第1候補として決定する。優先個数
が1でない場合は、まだ一つに絞られていないため、S1
3−8で単語学習による候補の絞り込みを行なう。
As a result of the above processing, it is determined in S13-7 whether the number of priority candidates has been reduced to one. That is, it is determined whether or not the priority number is one. If the priority number is 1, S13-9
Then, the priority candidate is determined as the first candidate. If the priority number is not 1, the number has not yet been reduced to one.
In 3-8, candidates are narrowed down by word learning.

S13−8で優先候補の単語IDを取り出し、単語IDの示
す単語学習データを調べ、単語学習されている候補が存
在したならば、S13−11で単語学習されている候補を第
1候補として決定する。単語学習されている候補が複数
個あったならば、先に格納されている候補情報を第1候
補とする。優先候補中のすべての候補に単語学習されて
いるものがなかった場合は、S13−10で優先候補の先頭
に格納されている候補を第1候補として決定する。
In step S13-8, the word ID of the priority candidate is extracted, the word learning data indicated by the word ID is examined, and if there is a candidate whose word has been learned, the candidate whose word has been learned is determined as the first candidate in step S13-11. I do. If there are a plurality of candidates for which the word has been learned, the previously stored candidate information is set as the first candidate. If none of the candidates in the priority candidates has been word-learned, the candidate stored at the head of the priority candidates is determined as the first candidate in S13-10.

S13−3で優先候補が一つも存在しないと判定された
場合は、S13−5で単語学習による第1候補決定の判定
を行なう。候補情報の単語IDを取り出し、単語IDの示す
単語学習データを調べ、単語学習されている候補が存在
したならば、S13−11で単語学習されている候補を第1
候補として決定する。単語学習されている候補が複数個
あったならば、先に格納されている候補情報を第1候補
とする。すべての候補情報に単語学習されているものが
なかった場合は、S13−12で先頭の候補情報を第1候補
として決定する。
If it is determined in S13-3 that no priority candidate exists, a determination is made in S13-5 to determine a first candidate by word learning. The word ID of the candidate information is extracted, the word learning data indicated by the word ID is examined, and if there is a candidate for which the word has been learned, the candidate for which the word has been learned is determined as the first candidate in S13-11.
Determined as a candidate. If there are a plurality of candidates for which the word has been learned, the previously stored candidate information is set as the first candidate. If none of the candidate information has been word-learned, the leading candidate information is determined as the first candidate in S13-12.

第14図はS6−6の処理を詳細化したフローチャートで
ある。
FIG. 14 is a detailed flowchart of the process of S6-6.

S14−1において選択キーSELによって選択・確定を指
示された候補が格納されている同音語内に用例が存在す
るかどうかを同音語中のすべての候補情報について、用
例情報ポインタを参照することにより判定する。すなわ
ち、用例情報ポインタの値が“−1"であるならば、用例
なしと判定される。すべての候補情報について用例が一
つも存在しなければ、S14−3へ、一つでも用例が存在
すれば、S14−2へそれぞれ分岐する。
In S14-1, it is determined whether or not an example exists in the homophone in which the candidate designated and selected by the selection key SEL is stored by referring to the example information pointer for all candidate information in the homophone. judge. That is, if the value of the example information pointer is “−1”, it is determined that there is no example. If there is no example for all candidate information, the process branches to S14-3, and if there is even one example, the process branches to S14-2.

S14−2で選択された単語によって成立する用例が用
例情報中に存在するかどうかを以下のように判定する。
It is determined as follows whether or not an example formed by the word selected in S14-2 exists in the example information.

まず、選択された単語の候補情報中における用例情報
ポインタをたどり、ペア同音語IDおよび用例IDを取り出
す。取り出したペア同音語IDの示す同音語内の先頭候補
情報の用例情報ポインタをたどり、ペア同音語IDが、選
択された単語の存在する同音語IDであるものがあるかど
うかを検索する。そのような用例情報が検索されなけれ
ば、用例は成立しないと判定される。ペア同音語IDが、
選択された単語の同音語IDと一致する用例情報が検索さ
れたならば、用例IDを取り出し、選択された単語の用例
情報中の用例IDと一致するかどうかをチェックする。用
例IDが一致すれば、成立用例が存在すると判定される。
一致しなければ用例は成立しないと判定される。用例が
成立すると判定されたならば、S14−6へ進み、用例が
成立しないと判定されたならば、ペア同音語の次の用例
情報について同様の判定を行なう。ペア同音語の用例情
報についてすべて用例が成立しなければ、選択された単
語の次の用例情報について、同様の判定処理を行なう。
選択された単語の用例情報がないならば、成立する用例
なしと判定され、S14−5へ分岐する。
First, the example information pointer in the candidate information of the selected word is followed, and the pair homophone ID and the example ID are extracted. The example information pointer of the head candidate information in the homophone indicated by the extracted pair homophone ID is followed to search whether there is any pair homophone ID that is the homophone ID in which the selected word exists. If such example information is not retrieved, it is determined that the example does not hold. Pair homophone ID is
When the example information that matches the homophone ID of the selected word is found, the example ID is taken out and it is checked whether it matches the example ID in the example information of the selected word. If the example IDs match, it is determined that an established example exists.
If they do not match, it is determined that the example does not hold. If it is determined that the example is established, the process proceeds to S14-6, and if it is determined that the example is not established, the same determination is performed for the example information next to the paired homonym. If all the examples are not satisfied for the example information of the paired homonym, the same determination processing is performed for the example information next to the selected word.
If there is no example information of the selected word, it is determined that there is no example to be established, and the flow branches to S14-5.

S14−4は用例抑制解除の処理である。S14−2で成立
用例と判定された用例の用例IDの示す用例学習データを
使用可能状態にする。
S14-4 is an example suppression canceling process. The example learning data indicated by the example ID of the example determined to be an established example in S14-2 is set in a usable state.

S14−3はS14−1にて選択された単語に用例が存在し
なかった場合に、選択されなかった他の同音語の用例を
抑制するための用例存在判定を行なう。
In step S14-3, when there is no example in the word selected in step S14-1, an example existence determination is performed to suppress the examples of other non-selected homonyms.

そのために、選択された単語の存在する同音語の選択
された候補情報以外のすべての用例情報に用例情報が存
在しているかどうかを判定し、用例が存在するならば、
S14−5で用例IDの示す用例学習データを使用禁止状態
にする。
For that purpose, it is determined whether or not the example information is present in all the example information other than the selected candidate information of the homophone in which the selected word exists, and if the example exists,
In step S14-5, the example learning data indicated by the example ID is set to the use prohibited state.

S14−6は単語学習処理を行なう。選択された表記の
単語IDの示す単語学習データを学習状態にし,同音語中
の選択されなかった候補情報の単語IDの示す単語学習デ
ータの学習状態を解除する処理を行なう。
In step S14-6, a word learning process is performed. The word learning data indicated by the word ID of the selected notation is set to the learning state, and the processing of canceling the learning state of the word learning data indicated by the word ID of the unselected candidate information in the homophone is performed.

S14−7で選択された表記の文書への確定処理を行な
う。確定処理は確定文字コードを文書バッファTBUFへ格
納するという同種の文字処理装置で通常行なわれている
処理であり、公知であるので詳述しない。
The determination processing for the document of the notation selected in S14-7 is performed. The determination process is a process that is normally performed in the same type of character processing device that stores the determined character code in the document buffer TBUF, and is well known and will not be described in detail.

〔他の実施例〕[Other embodiments]

以上の説明において用いた辞書は単語情報と用例情報
とを同一見出し語の下に記述した単一の辞書構造である
が、単語情報と用例情報とを分離した各辞書テーブルと
しても同様に処理することができる。さらに用例のタイ
プ別に辞書を構成し、各辞書に辞書個別のIDを持たせ、
用例の存在する辞書IDによって用例の優先順位を持たせ
て処理を行なってもよい。
Although the dictionary used in the above description has a single dictionary structure in which word information and example information are described under the same headword, the same processing is performed for each dictionary table in which word information and example information are separated. be able to. In addition, a dictionary is configured for each type of example, and each dictionary has a unique ID for the dictionary.
The process may be performed by giving the priority of the example according to the dictionary ID in which the example exists.

また、以上の説明では、隣接した文節間にのみ用例を
適用していたが、隣接していない文節間に用例を適用す
ることも、容易に実現できる。その際、文節間の構文解
析処理(係り受け解析処理)を施すことによって、用例
の誤った適用を避けることができる。
Further, in the above description, the example is applied only between adjacent phrases, but it is also easy to apply the example between non-adjacent phrases. At this time, by applying a syntactic analysis process (dependency analysis process) between the phrases, it is possible to avoid erroneous application of the example.

以上の説明においては、分ち書き入力された文節間に
用例を適用する場合を述べたが、べた書きに入力された
読み列に対しても、自動的に文節に分割する処理を付け
加えることによって、同じように用例を適用できる。ま
た、用例の存在を加味しながら文節に分割することも可
能である。
In the above explanation, the case where the example is applied between the segments input in the break-in mode has been described. By adding the processing for automatically dividing the reading sequence input in the solid-statement into the phrases, The example can be applied in the same way. It is also possible to divide the phrase into phrases while taking into account the existence of the example.

〔発明の効果〕〔The invention's effect〕

以上説明したように、本発明によれば、ある意味属性
を有する単語群と共起関係を有する単語と当該意味属性
との組と、該組を当該共起関係において結合可能な付属
語または付属語列を表わす結合情報とを用例として記憶
した用例辞書、及び1つの結合情報に複数の付属語また
は付属語列を対応づけ可能に、結合情報と付属語または
付属語列とを対応づけた付属語テーブルを参照して、前
記各文節の候補から、ある文節の自立語候補の1つと他
の文節の自立語候補の意味属性とが前記用例辞書に記憶
された用例の組に該当し、当該自立語候補同士を結合さ
せる付属語または付属語列と前記付属語テーブルにおい
て対応づけられた結合情報が当該用例の結合情報と一致
する文節候補の組を抽出するようにし、抽出された文節
候補の組があれば、該組をなす文節候補を優先させて、
前記各文節の第1候補を決定するようにしたので、ある
単語と共起する意味属性が同一の単語群について、1つ
の用例を記憶することで、単語群の各単語毎に個別の用
例を記憶することなく、各文節の単語の第1候補の表記
を出力する際に、共起する単語の組を優先させることが
でき、用例辞書に要する記憶容量が少なくて済むという
効果がある。また、同一の意味属性を持つ全ての単語に
対して、同一の用例が利用できるので、同一の意味属性
を持つ単語間で、個別の用例を利用する場合に生じる、
用例の有無による候補のばらつきが解消されるという効
果がある。また、用例に該当する候補を抽出する際に、
ある自立語候補と他の自立語候補との共起関係ととも
に、その自立語候補同士を結合する付属語または付属語
列も考慮されるため、誤った用例の適用で生じる誤変換
の少ない効率のよい変換が実現できるという効果があ
る。
As described above, according to the present invention, a set of a word group having a certain semantic attribute and a word having a co-occurrence relation and the corresponding semantic attribute, and an adjunct or an adjunct that can combine the set in the co-occurrence relation An example dictionary that stores, as an example, combination information representing a word string, and an attachment that associates a combination of information with an attachment word or an attachment word string so that a plurality of attachment words or an attachment word string can be associated with one combination information. Referring to the word table, one of the independent word candidates of a certain phrase and the semantic attribute of the independent word candidate of another phrase correspond to a set of examples stored in the example dictionary, from the candidate of each of the clauses. An attached word or an attached word string for joining independent word candidates is combined with the associated information in the attached word table to extract a set of clause candidates that match the combined information of the example. If there is a pair, The phrase candidates constituting a set by priority,
Since the first candidate of each phrase is determined, one example is stored for a group of words having the same semantic attribute that co-occurs with a certain word, so that an individual example is stored for each word in the group of words. When the notation of the first candidate word of each phrase is output without storing, a set of co-occurring words can be prioritized, so that the storage capacity required for the example dictionary can be reduced. In addition, since the same example can be used for all words having the same semantic attribute, a case occurs in which individual examples are used between words having the same semantic attribute.
There is an effect that variation in candidates due to the presence or absence of an example is eliminated. Also, when extracting a candidate corresponding to the example,
In addition to the co-occurrence relationship between one independent word candidate and another independent word candidate, the adjuncts or adjunct strings that join the independent word candidates are also considered. There is an effect that a good conversion can be realized.

また、用例辞書の用例として、共起関係を有する1つ
の自立語と他の1つの自立語の意味属性との組ととも
に、該自立語同士を当該共起関係において結合可能な付
属語または付属語列を表わす結合情報を記憶し、付属語
テーブルにおいて、1つの結合情報に複数の付属語また
は付属語列を対応づけ可能に、結合情報と付属語または
付属語列とを対応づけたことにより、共起関係を有する
自立語と自立語の意味属性との組が同一で、該自立語同
士を当該共起関係において結合可能な付属語または付属
語列が異なる複数個の組を1つの用例として記憶できる
ので、用例辞書に要する記憶容量が少なくて済むととも
に、ある付属語または付属語列に基づいて用例を登録す
れば、自立語と自立語の意味属性との組に対して同一の
共起関係で結合する他の付属語または付属語列を用いて
いる場合でも、用例に該当する候補として抽出できると
いう効果がある。
Further, as an example of the example dictionary, a set of one independent word having a co-occurrence relationship and a semantic attribute of another independent word, and an adjunct or an adjunct that can join the independent words in the co-occurrence relationship By storing the combination information representing the columns, and in the auxiliary word table, it is possible to associate a plurality of additional words or additional word sequences with one combination information, and to associate the additional information with the additional words or additional word sequences, A set of independent words having a co-occurrence relation and the semantic attribute of the independent word are the same, and a plurality of sets having different adjuncts or adjunct word sequences that can combine the independent words in the co-occurrence relation are taken as one example. Since it can be stored, the storage capacity required for the example dictionary can be reduced, and if an example is registered based on a certain auxiliary word or auxiliary word sequence, the same co-occurrence can be achieved for a set of independent words and semantic attributes of the independent words. Others joining in a relationship Even if you are using the included word or attached word strings, there is an effect that can be extracted as a candidate corresponding to examples.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の全体構成のブロック図、 第2図は本発明の辞書構成の例を示す図、 第3図は本発明の同音語プールおよび用例情報プールの
構成を示す図、 第4図は本発明の付属語変換テーブルの構成を示す図、 第5図は本発明の学習データの構成を示す図、 第6図〜第14図は本発明文字処理装置の動作を示すフロ
ーチャートである。
FIG. 1 is a block diagram of the overall configuration of the present invention, FIG. 2 is a diagram showing an example of a dictionary configuration of the present invention, FIG. 3 is a diagram showing the configurations of a homophone pool and an example information pool of the present invention, FIG. 5 is a diagram showing a configuration of an attached word conversion table of the present invention, FIG. 5 is a diagram showing a configuration of learning data of the present invention, and FIGS. 6 to 14 are flowcharts showing operations of the character processing device of the present invention. .

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】仮名文字列を入力する入力手段と、 単語の読みと、表記と、意味属性とを対応付けて記憶し
た単語辞書と、 ある意味属性を有する単語群と共起関係を有する単語と
当該意味属性との組と、該組を当該共起関係において結
合可能な付属語または付属語列を表わす結合情報とを用
例として記憶した用例辞書と、 1つの結合情報に複数の付属語または付属語列を対応づ
け可能に、結合情報と付属語または付属語列とを対応づ
けた付属語テーブルと、 前記単語辞書を参照して、前記入力手段より入力された
仮名文字列を読みとする文節列の各文節の候補を作成す
る文節候補作成手段と、 前記各文節の候補につき、前記用例辞書及び前記付属語
テーブルを参照して、ある文節の自立語候補の1つと他
の文節の自立語候補の意味属性とが前記用例辞書に記憶
された用例の組に該当し、当該自立語候補同士を結合さ
せる付属語または付属語列と前記付属語テーブルにおい
て対応づけられた結合情報が当該用例の結合情報と一致
する文節候補の組を抽出する抽出手段と、 該抽出手段により抽出された文節候補の組があれば、該
組をなす文節候補を優先させて、前記各文節の第1候補
を決定し、該第1候補の表記を出力する出力手段とを有
することを特徴とする文字処理装置。
An input means for inputting a kana character string, a word dictionary storing word reading, notation, and a semantic attribute in association with each other, a word having a co-occurrence relationship with a word group having a certain semantic attribute An example dictionary that stores, as an example, a set of a set of the set of the attribute set and the semantic attribute, and combination information indicating an adjunct or an adjunct string that can combine the set in the co-occurrence relationship. The kana character string input from the input means is read by referring to the attached word table in which the combined information is associated with the attached word or the attached word string so that the attached word string can be associated with the word dictionary. A phrase candidate creating means for creating a candidate for each phrase in the phrase sequence; and referring to the example dictionary and the adjunct word table for each of the phrase candidates, one of the independent word candidates of a certain phrase and the independence of another phrase. The meaning attribute of the word candidate is A phrase that corresponds to a set of examples stored in the example dictionary and has associated information associated with the attached word or the attached word string that joins the independent word candidates in the attached word table matches the combined information of the example. Extracting means for extracting a set of candidates; and if there is a set of clause candidates extracted by the extracting means, the first candidate of each of the clauses is determined by giving priority to the clause candidates forming the set. Output means for outputting a notation of a candidate.
【請求項2】仮名文字列を入力する入力工程と、 単語の読みと、表記と、意味属性とを対応付けて記憶し
た単語辞書を参照して、前記入力手段より入力された仮
名文字列を読みとする文節列の各文節の候補を作成する
文節候補作成工程と、 ある意味属性を有する単語群と共起関係を有する単語と
当該意味属性との組と、該組を当該共起関係において結
合可能な付属語または付属語列を表わす結合情報とを用
例として記憶した用例辞書、及び1つの結合情報に複数
の付属語または付属語列を対応づけ可能に、結合情報と
付属語または付属語列とを対応づけた付属語テーブルを
参照して、前記各文節の候補から、ある文節の自立語候
補の1つと他の文節の自立語候補の意味属性とが前記用
例辞書に記憶された用例の組に該当し、当該自立語候補
同士を結合させる付属語または付属語列と前記付属語テ
ーブルにおいて対応づけられた結合情報が当該用例の結
合情報と一致する文節候補の組を抽出する抽出工程と、 該抽出工程により抽出された文節候補の組があれば、該
組をなす文節候補を優先させて、前記各文節の第1候補
を決定し、該第1候補の表記を出力する出力工程とを有
することを特徴とする文字処理方法。
2. A method of inputting a kana character string, referring to a word dictionary storing word reading, notation, and semantic attributes in association with each other, and converting the kana character string input from the input means. A phrase candidate creation step of creating a candidate for each phrase in a phrase string to be read; a group of words having a co-occurrence relationship with a group of words having a certain semantic attribute; An example dictionary that stores, as an example, linkable appendixes or link information representing linkable adjuncts, and link information and appendixes or appendixes so that a plurality of appendixes or appendix strings can be associated with one linking information. An example in which one of the independent word candidates of a certain phrase and the semantic attribute of the independent word candidate of another phrase are stored in the example dictionary with reference to the attached word table in which the columns are associated with each other. And the independent word candidate An extraction step of extracting a set of phrase candidates whose combination information associated with the attached word or the attached word string to be combined with the combination information in the attached word table matches the combination information of the example, and a phrase extracted by the extraction step If there is a set of candidates, an output step of giving priority to the phrase candidates forming the set, determining first candidates of the respective phrases, and outputting a notation of the first candidates. Method.
JP63056546A 1988-03-09 1988-03-09 Character processor Expired - Fee Related JP2756252B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63056546A JP2756252B2 (en) 1988-03-09 1988-03-09 Character processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63056546A JP2756252B2 (en) 1988-03-09 1988-03-09 Character processor

Publications (2)

Publication Number Publication Date
JPH01229368A JPH01229368A (en) 1989-09-13
JP2756252B2 true JP2756252B2 (en) 1998-05-25

Family

ID=13030090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63056546A Expired - Fee Related JP2756252B2 (en) 1988-03-09 1988-03-09 Character processor

Country Status (1)

Country Link
JP (1) JP2756252B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0581241A (en) * 1991-09-24 1993-04-02 Nec Corp Homonym processing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
情報処理学会 第29回全国大会5J−7

Also Published As

Publication number Publication date
JPH01229368A (en) 1989-09-13

Similar Documents

Publication Publication Date Title
JP2009519534A (en) Text editing apparatus and method
JP2951956B2 (en) Character processing apparatus and method
JP2756252B2 (en) Character processor
JP2756251B2 (en) Character processor
JP2832003B2 (en) Character processor
JPH0576067B2 (en)
JP2662392B2 (en) Character processor
JP3847812B2 (en) Character processing method and apparatus
JP3727973B2 (en) Document processing method and apparatus
JPH01229369A (en) Character processor
JPH1115826A (en) Document analyzer and its method
JP3375979B2 (en) Character processing apparatus and method
JPH0567079A (en) Word processor
JP3304999B2 (en) Dictionary management method and device
JPH0442350A (en) Character processor
JPH05174004A (en) Method and device for character processing
JPH0628352A (en) Character processor
JPH10187705A (en) Method and device for document processing
JP2542384B2 (en) Character processor
JPH05135013A (en) Character processor
JP2005189953A (en) Document feature detecting method, document feature detector, control program, and recording medium
JP2005189954A (en) Document processing method, document processor, control program, and recording medium
JPH07182334A (en) Character processor
JPH05174005A (en) Method and device for character processing
JPH05233604A (en) Word registering method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees