JPH05174005A - Method and device for character processing - Google Patents

Method and device for character processing

Info

Publication number
JPH05174005A
JPH05174005A JP3345064A JP34506491A JPH05174005A JP H05174005 A JPH05174005 A JP H05174005A JP 3345064 A JP3345064 A JP 3345064A JP 34506491 A JP34506491 A JP 34506491A JP H05174005 A JPH05174005 A JP H05174005A
Authority
JP
Japan
Prior art keywords
field
group
word
kana
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3345064A
Other languages
Japanese (ja)
Other versions
JP3320087B2 (en
Inventor
Kazuyo Ikeda
和世 池田
Hiroki Suzuki
大記 鈴木
Eiichiro Toshima
英一朗 戸島
Yuji Kobayashi
雄二 小林
Katsumi Masaki
克己 正木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP34506491A priority Critical patent/JP3320087B2/en
Publication of JPH05174005A publication Critical patent/JPH05174005A/en
Application granted granted Critical
Publication of JP3320087B2 publication Critical patent/JP3320087B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To effectively decide the structures of paragraphs in the KANA (Japanese syllabary)/KANJI (Chinese character) conversion processing. CONSTITUTION:In a character processing method, where the KANA/KANJI conversion is carried out, an inputted KANA string is converted into a KANJI- KANA sentence based on a dictionary WDIC which stores the Japanese reading KANA of the words and the information on the words including the descriptions with correspondence secured between them. Then plural groups are defined to the word groups included in the dictionary WDIC, and the group likelihood BYUD showing the emerging easiness of the words belonging to the groups are stored for each group. Then the BYUD corresponding to at least one group is updated in response to the group where the words undergone the KANA/ KANJI conversion belong. In the KANA/KANJI conversion processing state, the BYUD corresponding to the groups where the words forming the candidates are compared with each other among the candidates of paragraph structures prepared to the KANA character strings to be converted. Thus the structure of the paragraph to be converted is decided.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、かな漢字変換処理にお
いて、同音異義語句の中から変換出力すべき語句を効率
的に決定する文字処理方法及び装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character processing method and apparatus for efficiently determining a phrase to be converted and output from homonymous phrases in the kana-kanji conversion process.

【0002】[0002]

【従来の技術】従来、入力された読みをかな漢字混じり
文に変換するかな漢字変換を用いて、日本語文章を作成
していく日本語ワードプロセッサが、幅広く利用されて
いる。
2. Description of the Related Art Conventionally, a Japanese word processor that creates a Japanese sentence using Kana-Kanji conversion for converting an input reading into a Kana-Kanji mixed sentence has been widely used.

【0003】ところが、日本語には、読みが同じで意味
が異なる単語(同音異義語)や句が多数存在するという
性質があり、これに対処するために、同音異義語を状況
に応じて正しく変換出力する同音異義語選択技術が、か
な漢字変換処理において重要な技術になっている。
However, Japanese has a characteristic that there are many words (homonyms) and phrases having the same reading but different meanings. In order to deal with this, the homonyms must be correctly selected according to the situation. The homonym synonym selection technology for conversion and output has become an important technology in kana-kanji conversion processing.

【0004】従来、同音異義語選択技術として、文章作
成に使用された時期が近い単語ほど候補として優先する
短期学習方式や、近接単語間の共起を利用する用例変換
方式が取られている。
Conventionally, as a homonym selection technique, a short-term learning method in which a word used closer to the time when a sentence is created is prioritized as a candidate, and an example conversion method using co-occurrence between adjacent words have been adopted.

【0005】短期学習方式は、同音異義語の中から変換
すべき単語を決定する時に、最も最近使用された単語を
変換結果とする方式であり、アルゴリズムも簡単で効率
も良いという利点があり、古くから使用されている。し
かし、対象としている同音異義語の前後の単語列の状況
を考慮していないので、同一文章中で他の同音異義語が
既に使用されているような場合には正しく機能しないと
いう欠点がある。例えば、「夏は暑い。」という文をか
な漢字変換によって入力して確定した後に、「あついお
ちゃがのみたい。」という読みを入力してかな漢字変換
すると、「あつい」という読みに対して、「暑い」とい
う単語が使用されているので、短期学習により「暑いお
茶が飲みたい。」というように変換されてしまう。
The short-term learning method is a method in which the most recently used word is used as a conversion result when determining a word to be converted from homophones, and has an advantage that the algorithm is simple and efficient. It has been used since ancient times. However, since the situation of the word string before and after the target homonym is not taken into consideration, there is a disadvantage that it does not function properly when another homonym is already used in the same sentence. For example, if you enter the sentence "Summer is hot." By Kana-Kanji conversion and confirm it, and then enter the reading "Autiochagana-like." Since the word "hot" is used, it will be converted into "I want to drink hot tea."

【0006】用例変換は、上記のような短期学習の欠点
を補う技術である。すなわち、意味的な結合関係を持っ
て共起する単語の組が、高い頻度で使用されていれば、
その単語の組をあらかじめ記憶しておき、かな漢字変換
する際にそのような単語の組と一致すれば、その単語の
組を変換結果とする。例えば、「熱い」と「お茶」とい
う2つの単語は、「熱い」が「お茶」を連体修飾すると
いう形でよく使用される単語の組である。したがって、
この単語の組を記憶しておき、「あついおちゃ」という
読みをかな漢字変換する際、「あつい」の同音異義語と
して「熱い」,「厚い」,「暑い」などがあるが、記憶
されている単語の組と一致する「熱い」が変換結果とし
て決定され、「熱いお茶」と変換される。これによって
短期学習の欠点をある程度補うことができる。
[0006] The example conversion is a technique for compensating for the shortcomings of short-term learning as described above. That is, if a set of words that co-occur with a semantic connection is used frequently,
The set of words is stored in advance, and if such a set of words matches when performing Kana-Kanji conversion, that set of words is used as the conversion result. For example, the two words “hot” and “tea” are a set of words that are often used in the form that “hot” adorns “tea”. Therefore,
Memorizing this set of words, and converting the reading "Atsuiocha" into kana-kanji, there are "hot", "thick", "hot", etc. as homonyms for "Atsu". “Hot” that matches the set of words that are present is determined as the conversion result and converted to “hot tea”. This can make up for some of the shortcomings of short-term learning.

【0007】しかし、用例変換の欠点として、意味的な
結合関係を持たないで出現した単語に対してはまったく
無力であるという問題がある。例えば、法律に関する文
章の作成時に「しこうする。」という読みが入力された
場合、「しこう」と共起関係にある語がないので、用例
変換では、「しこう」の同音異義語「思考」,「指
向」,「施行」などの中から変換すべき単語を決定する
ことができない。
However, as a drawback of the example conversion, there is a problem that it is completely useless for a word that appears without having a semantic connection. For example, if the word "shikou suru." Is entered when creating a sentence about law, there is no word that has a co-occurrence relationship with "shikou". Therefore, in the example conversion, the homonym "shikou" The word to be converted cannot be determined from among "thought", "oriented", and "execution".

【0008】そこで、この問題を解決するために、語ネ
ットワークを利用する方法が提案され、特開平3−22
167号公報に記載されている。語ネットワークは、1
つの単語を1つのノードに対応させ、各ノード間を対応
する単語間の意味的な距離を示す値を持つリンクによっ
て互いに結合させた相互結合型ネットワークである。ま
た、各ノードは、文書中での出現のしやすさを表す値を
持ち、単語が使用されるごとに、対応するノードの値が
高められ、高められたノードの値が結合されているリン
クによって伝搬し、意味的に距離が近い単語に対応する
ノードの値も大きくなる。
Therefore, in order to solve this problem, a method using a word network has been proposed.
No. 167. Word network is 1
It is an interconnected network in which one word is associated with one node and each node is interconnected by a link having a value indicating a semantic distance between corresponding words. In addition, each node has a value that indicates how easily it appears in the document, the value of the corresponding node is increased each time a word is used, and the value of the increased node is linked. The value of the node that corresponds to a word that is propagated by and is semantically close becomes large.

【0009】かな漢字変換では、ネットワーク内の同音
異義語の中から変換すべき単語を決定する時に、対応す
るノードの値が最も高い単語に変換する。例えば、「法
律」と「施行」は意味的に近い関係にあるので、「法
律」に対応するノードと「施行」に対応するノードは大
きい値を持つリンクで結合されているが、「法律」と
「思考」,「指向」は、意味的に近くないので、「法
律」に対応するノードと「思考」,「指向」に対応する
ノードは小さい値を持つリンクで結合されている。この
ような語ネットワークを利用して、法律に関する文章を
作成している時、「法律」という単語が使用されている
とすると、「法律」に対応するノードは高められている
ので、その値がネットワークを伝搬していき、大きい値
を持つリンクで結合されている「施行」に対応するノー
ドの値も高めらているが、小さい値を持つリンクで結合
されている「思考」,「指向」に対応するノードの値は
それほど高められていないことになる。したがって、こ
の状態で「しこうする。」という読みが入力された場
合、同音異義語「思考」,「指向」,「施行」の中では
対応するノードの値が最も高いのは「施行」であるの
で、「施行する。」が変換結果として決定される。
In kana-kanji conversion, when determining a word to be converted from homonyms in the network, it is converted into a word having the highest value of the corresponding node. For example, since "law" and "enforcement" are semantically close to each other, the node corresponding to "law" and the node corresponding to "enforcement" are linked by a link having a large value, but "law" Since "thinking" and "oriented" are not close in meaning, the node corresponding to "law" and the node corresponding to "thought" and "oriented" are connected by a link having a small value. If the word "law" is used when creating a sentence about law using such a word network, the number of nodes corresponding to "law" is increased. While propagating through the network, the value of the node corresponding to "enforcement" linked by links with large values is also increased, but "thinking" and "oriented" linked by links with small values The value of the node corresponding to is not so high. Therefore, in this state, if the reading "Shikou suru." Is entered, the value of the corresponding node is the highest among the homonyms "thinking", "direction", and "enforcement". Therefore, "enforce." Is determined as the conversion result.

【0010】[0010]

【発明が解決しようとしている課題】しかしながら、上
記の語ネットワークは、1つの単語に対して1つのノー
ドを割り当て、それぞれのノードを互いにリンクで相互
結合させているネットワークであり、この各ノードと各
リンクが値を持っているため、膨大なメモリ容量を必要
とするという欠点があった。例えば、単語辞書に10万
語の単語が登録されていれば、対応する語ネットワーク
のノードの数は10万個になり、リンクの数は100億
個にもなる。
However, the above-mentioned word network is a network in which one node is assigned to one word and the nodes are mutually connected by links. Since the link has a value, it has a drawback that it requires a huge memory capacity. For example, if 100,000 words are registered in the word dictionary, the number of nodes in the corresponding word network is 100,000, and the number of links is 10 billion.

【0011】また、使用された単語に対応するノードの
値を他のノードに伝搬させるために、すべてのノードの
値を再計算しなおさなければならないので、膨大な計算
が必要になるという欠点があった。
Further, since the values of all the nodes have to be recalculated in order to propagate the value of the node corresponding to the used word to other nodes, there is a drawback that a huge amount of calculation is required. there were.

【0012】また、上記ネットワークは、単語単位の候
補選択への利用を目的としており、複数の文節を含む文
字列の文節の区切り位置まで含めた文節構造の決定への
利用は考えられていなかった。
Further, the above network is intended to be used for selecting candidates in word units, and was not considered to be used for determining a bunsetsu structure including a delimiter position of a bunsetsu of a character string including a plurality of bunsetsu. ..

【0013】[0013]

【課題を解決するための手段】上記課題を解決するため
に、本発明によれば、入力されたかな文字列を、単語の
読みがなと表記を含む該単語の情報とを対応させて記憶
した辞書を参照して、漢字かな混じり文に変換するかな
漢字変換処理を実行する文字処理方法において、前記辞
書に格納されている単語群に対して、複数のグループを
定義し、文書入力時における前記グループに属する単語
の出現しやすさを示すグループ尤度を各グループごとに
記憶し、前記かな漢字変換処理によって変換された単語
が属するグループに応じて、少なくとも1つの前記グル
ープに対応する前記グループ尤度を更新し、前記かな漢
字変換処理では、変換対象のかな文字列に対する文節の
構造の候補の中から、該候補を構成する語句が属するグ
ループに対応するグループ尤度を比較して、変換すべき
文節の構造を決定することを特徴とする。
In order to solve the above problems, according to the present invention, an input kana character string is stored in association with the reading of a word and the information of the word including notation. In the character processing method for executing a kana-kanji conversion process for converting a kanji-kana mixed sentence by referring to the dictionary, a plurality of groups are defined for the word group stored in the dictionary, and A group likelihood indicating the likelihood of appearance of a word belonging to the group is stored for each group, and the group likelihood corresponding to at least one of the groups is stored according to the group to which the word converted by the kana-kanji conversion process belongs. In the kana-kanji conversion processing, the kana-kanji conversion process corresponds to a group to which a word or phrase constituting the candidate belongs, out of candidates of the structure of the phrase for the kana character string to be converted. Compare the loop likelihood, and determines the structure of the phrase to be translated.

【0014】また、本発明の他の態様によれば、文字処
理装置に、単語の読みがなと表記を含む該単語の情報と
を対応させて記憶した辞書と、文字を入力する入力手段
と、前記入力手段によって入力されたかな文字列を、前
記辞書を参照して漢字かな混じり文に変換するかな漢字
変換手段と、単語に対して当該単語の属するグループを
記憶するグループ情報記憶手段と、前記グループに属す
る単語の出現しやすさを、グループ尤度として各グルー
プごとに記憶するグループ尤度記憶手段と、前記かな漢
字変換手段によって、変換された単語が属するグループ
に応じて、少なくとも1つの前記グループに対応する前
記グループ尤度を更新するグループ尤度更新手段と、前
記かな漢字変換手段による変換対象のかな文字列に対す
る文節の構造の候補の中から、該候補を構成する語句が
属するグループに対応するグループ尤度を比較して、変
換すべき文節の構造を決定する変換制御手段とを具え
る。
According to another aspect of the present invention, the character processing device includes a dictionary in which word readings and word information including notations are stored in association with each other, and input means for inputting characters. A kana-kanji conversion means for converting the kana character string input by the input means into a kanji-kana mixed sentence by referring to the dictionary; group information storage means for storing a group to which the word belongs, At least one of the groups is stored according to the group to which the word converted by the kana-kanji conversion means stores the likelihood of appearance of a word belonging to a group as a group likelihood for each group. Group likelihood updating means for updating the group likelihood corresponding to, and the structure of the clause for the kana character string to be converted by the kana-kanji converting means. Among comprises a conversion control means for comparing a group likelihoods corresponding to word belongs groups constituting the candidate to determine the structure of the phrase to be translated.

【0015】[0015]

【作用】本発明によれば、例えば意味的に関係が深い単
語の集まりを同一のグループとして記憶し、グループに
属する単語の出現のしやすさの度合いを表すグループ尤
度を各グループに対して設定し、かな漢字変換で使用さ
れた単語が属するグループに応じてグループ尤度を更新
させ、かな漢字変換では同音異義語の中から単語が属す
るグループに対応したグループ尤度の値が最も大きい単
語を変換結果とする。
According to the present invention, for example, a group of words having a close relationship in terms of meaning is stored as the same group, and a group likelihood indicating the degree of ease of appearance of words belonging to the group is given to each group. Set and update the group likelihood according to the group to which the word used in Kana-Kanji conversion belongs. In Kana-Kanji conversion, the word with the largest group likelihood value corresponding to the group to which the word belongs is converted from the homonyms. The result.

【0016】[0016]

【実施例】以下図面を参照しながら本発明を詳細に説明
する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described in detail below with reference to the drawings.

【0017】図1は本発明の全体構成の一例である。FIG. 1 shows an example of the overall configuration of the present invention.

【0018】図示の構成において、CPUは、マイクロ
プロセッサであり、文字処理のための演算、論理判断等
を行ない、アドレスバスAB、コントロールバスCB、
データバスDBを介して、それらのバスに接続された各
構成要素を制御する。
In the configuration shown in the figure, the CPU is a microprocessor, which performs arithmetic operations for character processing, logical judgments, etc., an address bus AB, a control bus CB,
The respective components connected to those buses are controlled via the data bus DB.

【0019】アドレスバスABはマイクロプロセッサC
PUの制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロプロセ
ッサCPUの制御の対象となる各構成要素のコントロー
ル信号を転送して印加する。データバスDBは各構成機
器相互間のデータ転送を行なう。
The address bus AB is a microprocessor C
An address signal for instructing a component to be controlled by the PU is transferred. The control bus CB transfers and applies a control signal of each constituent element to be controlled by the microprocessor CPU. The data bus DB transfers data between the respective constituent devices.

【0020】次にROMは、読出し専用の固定メモリで
ある。ROMに設けられているPAは、図10〜図24
につき後述するマイクロプロセッサCPUによる制御の
手順を記憶させたプログラムエリアである。また、NK
は、図6〜図8において後述するマイクロプロセッサC
PUによる分野ネットワークの制御の手順を記憶させた
プログラムエリアである。
Next, the ROM is a read-only fixed memory. The PA provided in the ROM is shown in FIGS.
Is a program area in which the procedure of control by the microprocessor CPU described later is stored. Also, NK
Is a microprocessor C described later with reference to FIGS.
This is a program area in which the procedure of controlling the field network by the PU is stored.

【0021】また、RAMは、1ワード16ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。RAM
は、単語辞書WDIC,用例辞書YDIC,分野辞書B
DIC,分野読み辞書BYDI,分野尤度BYUD,分
野内部状態BNAI,分野外部入力BGAI,分野ウェ
イトBWAI,分野尤度固定フラグBKOT,分野モー
ドBMOD,最新使用単語リストWLISで構成されて
いる。
The RAM is a writable random access memory having a structure of 1 word and 16 bits, and is used for temporary storage of various data from each constituent element. RAM
Is a word dictionary WDIC, an example dictionary YDIC, a field dictionary B
DIC, field reading dictionary BYDI, field likelihood BYUD, field internal state BNAI, field external input BGAI, field weight BWAI, field likelihood fixed flag BKOT, field mode BMOD, latest use word list WLIS.

【0022】単語辞書WDICは、かな漢字変換を行う
ための単語の情報を格納したものであり、詳細は図2を
用いて後述する。
The word dictionary WDIC stores word information for performing kana-kanji conversion, and details will be described later with reference to FIG.

【0023】用例辞書YDICは、かな漢字変換の変換
精度を向上するために、意味的に関係を持ってよく使わ
れる単語対の情報を格納したものであり、詳細は図3を
用いて後述する。
The example dictionary YDIC stores information on word pairs that are often used in a semantically related manner in order to improve conversion accuracy of Kana-Kanji conversion, and details will be described later with reference to FIG.

【0024】分野辞書BDICは、単語辞書WDICに
格納されている単語の中で特定の分野に属する単語を集
めて格納したものであり、詳細は図4を用いて後述す
る。
The field dictionary BDIC is a collection and storage of words belonging to a specific field among the words stored in the word dictionary WDIC, and details will be described later with reference to FIG.

【0025】分野読み辞書BYDIは、同音異義語が存
在しない単語の中で特定の分野に属する単語を集めて、
読みと対応させて格納したものであり、詳細は図5を用
いて後述する。
The field reading dictionary BYDI collects words belonging to a specific field among words having no homonyms,
It is stored in association with reading, and details will be described later with reference to FIG.

【0026】分野尤度BYUDは、現在かな漢字変換で
入力されている文章の内容と各分野との関係の深さを表
す情報を各分野について格納するものであり、図6にお
いて後述する分野ネットワークの一部を構成する。詳細
は図6,図7を用いて後述する。
The field likelihood BYUD stores, for each field, information indicating the depth of the relationship between the content of the text currently input by the kana-kanji conversion and each field, and is stored in the field network described later in FIG. Make up a part. Details will be described later with reference to FIGS. 6 and 7.

【0027】分野内部状態BNAIは、図6において後
述する分野ネットワークの一部を構成し、分野ネットワ
ークの各ノードの内部状態の値を格納するものである。
詳細は図6,図7を用いて後述する。
The field internal state BNAI constitutes a part of the field network described later with reference to FIG. 6, and stores the value of the internal state of each node of the field network.
Details will be described later with reference to FIGS. 6 and 7.

【0028】分野外部入力BGAIは、図6において後
述する分野ネットワークの一部を構成し、分野ネットワ
ークの各ノードへの外部入力の値を格納するものであ
る。詳細は図6,図7を用いて後述する。
The field external input BGAI constitutes a part of the field network, which will be described later with reference to FIG. 6, and stores the value of the external input to each node of the field network. Details will be described later with reference to FIGS. 6 and 7.

【0029】分野ウェイトBWAIは、各分野の間のリ
ンクの重みを格納するものであり、図6において後述す
る分野ネットワークの一部を構成する。詳細は図6,図
8を用いて後述する。
The field weight BWAI stores the weight of a link between fields and constitutes a part of a field network described later in FIG. Details will be described later with reference to FIGS.

【0030】分野尤度固定フラグBKOTは、分野尤度
BYUDの値を変化させるかどうかを示すフラグを各分
野について格納するものであり、図6において後述する
分野ネットワークの一部を構成する。詳細は図6,図7
を用いて後述する。
The field likelihood fixed flag BKOT stores a flag indicating whether to change the value of the field likelihood BYUD for each field, and constitutes a part of the field network described later in FIG. Details are shown in Figs.
Will be described later.

【0031】分野モードBMODは、後述するかな漢字
変換において、分野の処理を行うかどうかを示すフラグ
であり、この値が1であれば分野の処理を行うことを表
し、0であれば分野の処理は行わないことを表す。
The field mode BMOD is a flag indicating whether or not to process fields in Kana-Kanji conversion, which will be described later. If this value is 1, it indicates to process fields, and if it is 0, the field processing is performed. Indicates not to do.

【0032】最新使用単語リストWLISは、最近使用
された単語を格納する配列であり、最も最近使用された
単語から順番に格納されている。格納する情報として
は、後述する単語コードを格納する。かな漢字変換にお
いて、変換結果として単語が使用されるごとに、その単
語の単語コードをリストの先頭に格納し、古い情報を後
ろにずらす。このリストに格納されている単語は、後述
するように短期学習されている単語として扱われる。
The most recently used word list WLIS is an array for storing recently used words, and is stored in order from the most recently used word. As the information to be stored, a word code described later is stored. Each time a word is used as a conversion result in kana-kanji conversion, the word code of that word is stored at the beginning of the list, and the old information is shifted backward. The words stored in this list are treated as short-term learned words as described later.

【0033】KBはキーボードであって、アルファベッ
トキー、ひらがなキー、カタカナキー等の文字記号入力
キー、及び、カーソル移動を指示するカーソル移動キー
等のような各種のファンクションキーを備えている。フ
ァンクションキーとしては、KID,SET,JUS,
KET,CHG,CLR,およびMODを備えている。
The KB is a keyboard, which is provided with various function keys such as an alphabet key, a hiragana key, a katakana key and other character symbol input keys, and a cursor movement key for instructing cursor movement. Function keys include KID, SET, JUS,
It has KET, CHG, CLR, and MOD.

【0034】KIDは、かな漢字変換の開始を指示する
キーである。SETは、分野の処理の各種環境設定機能
を起動するキーである。JUSは、住所録作成する機能
を起動するキーである。KETは、かな漢字変換の同音
異義語の候補の中から変換すべき候補を決定指示するキ
ーである。CHGは、オペレータが入力する文章の分野
を指定するためのキーである。CLRは、分野尤度BY
UDの値をクリアするキーである。MODは、分野の処
理を実行するか否かのモードの切り替えを行うキーであ
る。
KID is a key for instructing the start of kana-kanji conversion. SET is a key for activating various environment setting functions for field processing. JUS is a key that activates the function of creating an address book. KET is a key for determining and instructing a candidate to be converted from among homonymous synonyms for kana-kanji conversion. CHG is a key for designating the field of a sentence input by the operator. CLR is field likelihood BY
This key clears the UD value. The MOD is a key for switching the mode of whether or not to execute the processing of the field.

【0035】DISKは文書データ等を記憶するための
外部メモリである。文書データ等は必要に応じて外部メ
モリDISKに保管され、また、保管されたデータはキ
ーボードの指示により、必要な時呼び出される。
DISK is an external memory for storing document data and the like. Document data and the like are stored in the external memory DISK as needed, and the stored data is called when necessary by an instruction from the keyboard.

【0036】CRはカーソルレジスタである。CPUに
より、カーソルレジスタの内容を読み書きできる。後述
するCRTコントローラCRTCは、ここに蓄えられた
アドレスに対応する表示装置CRT上の位置にカーソル
を表示する。
CR is a cursor register. The CPU can read and write the contents of the cursor register. The CRT controller CRTC, which will be described later, displays a cursor at a position on the display device CRT corresponding to the address stored here.

【0037】DBUFは表示用バッファメモリであり、
表示すべきデータのパターンを蓄える。
DBUF is a display buffer memory,
Stores the pattern of data to be displayed.

【0038】CRTCはカーソルレジスタCR及びバッ
ファDBUFに蓄えられた内容を表示器CRTに表示す
る役割を担う。
The CRTC plays a role of displaying the contents stored in the cursor register CR and the buffer DBUF on the display CRT.

【0039】また、CRTは陰極線管等を用いた表示装
置であり、その表示装置CRTにおけるドット構成の表
示パターンおよびカーソルの表示をCRTコントローラ
で制御する。
The CRT is a display device using a cathode ray tube or the like, and the display pattern of the dot configuration and the display of the cursor on the display device CRT are controlled by the CRT controller.

【0040】さらに、CGはキャラクタジェネレータで
あって、表示装置CRTに表示する文字、記号のパター
ンを記憶するものである。
Further, CG is a character generator, which stores patterns of characters and symbols to be displayed on the display device CRT.

【0041】かかる各構成要素からなる本発明文字処理
装置においては、キーボードKBからの各種の入力に応
じて作動するものであって、キーボードKBからの入力
が供給されると、まず、インタラプト信号がマイクロプ
ロセッサCPUに送られ、そのマイクロプロセッサCP
UがROM内に記憶してある各種の制御信号を読出し、
それらの制御信号に従って、各種の制御が行なわれる。
The character processing apparatus of the present invention comprising the above components operates in response to various inputs from the keyboard KB, and when an input from the keyboard KB is supplied, an interrupt signal is first sent. Sent to the microprocessor CPU, which microprocessor CP
U reads out various control signals stored in the ROM,
Various controls are performed in accordance with those control signals.

【0042】図2は、単語辞書WDICの構成例を説明
した図である。1つの単語の情報として、読みと表記と
品詞と単語IDが格納される。単語IDは他の単語と区
別し、単語IDによってその単語を指し示すことができ
るようにつけられたユニークな番号である。例えば、図
2によって示される辞書には、読みが「あつい」で表記
が「熱い」で品詞が「形容詞」で単語IDが「123
4」なる単語が格納されている。各単語の情報は読みに
よってソートされて格納されている。
FIG. 2 is a diagram for explaining an example of the structure of the word dictionary WDIC. As information on one word, reading, notation, part of speech, and word ID are stored. The word ID is a unique number assigned so that the word ID can be used to distinguish it from other words. For example, in the dictionary shown in FIG. 2, the reading is “hot”, the notation is “hot”, the part of speech is “adjective”, and the word ID is “123”.
The word "4" is stored. The information of each word is sorted and stored by reading.

【0043】図3は、用例辞書YDICの構成例を説明
した図である。用例辞書は、意味的に結合関係があり、
よく使われる2つの単語をその結合関係と共に格納する
ものである。例えば、「夏は暑い」というよく使われる
文においては、「夏」と「暑い」という2つの単語が
「は」という助詞によって意味的に結合しており、用例
辞書にはこのような情報が格納される。これらの情報
は、2つの単語の単語IDと結合関係とを対応させるこ
とによって格納する。例えば、図3によって示される用
例辞書には、単語ID「34567」によって示される
単語「夏」と、単語ID「1235」によって示される
単語「暑い」と、結合関係「は」とを対応させて格納さ
れており、「夏」と「熱い」が結合関係「は」によって
意味的に結合していることを表している。
FIG. 3 is a diagram for explaining a configuration example of the example dictionary YDIC. Example dictionaries are semantically connected,
It stores two commonly used words together with their connection. For example, in the commonly used sentence "summer is hot", the two words "summer" and "hot" are semantically linked by the particle "ha", and such information is stored in the example dictionary. Is stored. These pieces of information are stored by associating the word IDs of the two words with the connection relationship. For example, in the example dictionary shown in FIG. 3, the word “summer” indicated by the word ID “34567”, the word “hot” indicated by the word ID “1235”, and the connection relation “ha” are associated with each other. It is stored and indicates that "summer" and "hot" are semantically connected by the connection relation "ha".

【0044】図4は、分野辞書BDICの構成例を説明
した図である。分野辞書BDICは、単語や句がどの分
野とどの程度関係があるのかの情報を格納するものであ
る。例えば、「公判」という単語は「法律」という分野
に密接に関係があるということができるが、分野辞書B
DICはこのような情報を格納するものである。分野辞
書BDICには、このような単語と分野の関係の情報を
単語IDと分野と確信度とを対応させて格納する。
FIG. 4 is a diagram for explaining a configuration example of the field dictionary BDIC. The field dictionary BDIC stores information on which field and degree the word or phrase is related to. For example, it can be said that the word “trial” is closely related to the field of “law”, but the field dictionary B
The DIC stores such information. In the field dictionary BDIC, information on the relationship between such words and fields is stored in association with the word ID, field and certainty factor.

【0045】例えば、図4によって示される分野辞書B
DICでは、単語ID「12346」と分野「法律」と
確信度「8」とを対応させて格納することによって、単
語ID「12346」によって示される単語「公判」が
分野「法律」に確信度「8」で関係していることを表し
ている。ここで、確信度とは、単語と分野の関係の度合
いを表す数値であり、値が大きくなるほど単語と分野の
関係が深いことを意味する。確信度として、負の値を取
ることも可能である。負の値を取るということは、単語
と分野がまったく無関係であることを積極的に表してい
るものとし、値が小さくなるほど無関係である度合いが
高くなる。換言すれば、その分野でその単語が使用され
る可能性が低くなることを示している。例えば、図4に
よって示される分野辞書BDICでは、単語ID「89
012」で表される単語「湯」が分野「政治」と確信度
「−2」で関係していることを表しているが、これは、
確信度「2」で無関係であることを示している。
For example, the field dictionary B shown by FIG.
In the DIC, the word ID "12346", the field "law", and the certainty factor "8" are stored in association with each other, so that the word "trial" indicated by the word ID "12346" corresponds to the field "law". 8 ”indicates that they are related. Here, the certainty factor is a numerical value indicating the degree of the relationship between the word and the field, and the larger the value, the deeper the relationship between the word and the field. It is also possible to take a negative value as the certainty factor. Taking a negative value positively indicates that the word and the field are completely irrelevant, and the smaller the value, the higher the degree of irrelevance. In other words, it indicates that the word is less likely to be used in the field. For example, in the field dictionary BDIC shown in FIG. 4, the word ID “89
The word "yu" represented by "012" is related to the field "politics" with a certainty factor "-2".
A certainty factor of "2" indicates that it is irrelevant.

【0046】また、分野辞書BDICでは、一つの単語
が複数の分野と関係があることも記述できる。例えば、
単語ID「23456」で表される単語「裁判」は、分
野「法律」と確信度「10」で関係があり、分野「政
治」とは確信度「2」で関係があることを示している。
The field dictionary BDIC can also describe that one word is related to a plurality of fields. For example,
The word "trial" represented by the word ID "23456" is related to the field "law" with a certainty factor "10", and is related to the field "politics" with a certainty factor "2". ..

【0047】図5は、分野読み辞書BYDIの構成例を
説明した図である。分野読み辞書BYDIは、分野辞書
BDICと同じように、単語や句がどの分野とどの程度
関係があるのかの情報を格納するものであるが、この分
野読み辞書BYDIには同音異義語が存在しない単語
(句)に関する情報だけを格納するようにされている。
従って、この辞書の単語は読みだけで特定でき、分野辞
書BDICが見出しとして単語IDを使用していたのに
対し、見出しとして読みを使用する。すなわち、分野読
み辞書には、単語(句)の読みと分野と確信度とを対応
させて格納する。例えば、図4によって示される分野辞
書では、「さいばん」という読みが分野「法律」に確信
度「10」で関係していることを表す情報が格納されて
いる。
FIG. 5 is a diagram for explaining an example of the structure of the field reading dictionary BYDI. Like the field dictionary BDIC, the field reading dictionary BYDI stores information on which field and degree the word or phrase is related to. To the field reading dictionary BYDI, homonyms do not exist. Only information about words (phrases) is stored.
Therefore, the word in this dictionary can be specified only by reading, and the field dictionary BDIC uses the word ID as the heading, while the reading is used as the heading. That is, in the field reading dictionary, the reading of a word (phrase), the field, and the certainty factor are stored in association with each other. For example, in the field dictionary shown in FIG. 4, information indicating that the reading "saiban" is related to the field "law" with a certainty factor "10" is stored.

【0048】図6は、分野ネットワークの構成例を説明
した図である。分野ネットワークは、分野1つ1つに対
してノードを対応させ、各ノードはリンクを介して相互
結合したネットワーク構造をなすものである。図6によ
って示される例では、分野として「住所録」,「法
律」,「政治」,「料理」などがあり、それぞれに対応
するノードはお互いにリンクを介して相互結合してい
る。
FIG. 6 is a diagram for explaining a configuration example of the field network. In the field network, a node is associated with each field, and each node forms a network structure in which nodes are interconnected via links. In the example shown by FIG. 6, there are “address book”, “law”, “politics”, “cooking”, etc. as fields, and the nodes corresponding to each are mutually connected via a link.

【0049】そして、分野に対応する各ノードは、分野
iの確からしさ(分野の尤度と呼ぶ)を表す出力値Oi
をそれぞれ持つ。この出力値Oi は、基本的には分野i
に属する単語が選択された時に値が高められ、値が高い
ほどその時点で入力されている文章が分野iに関係する
内容であることを示す。そして高められた出力値は、リ
ンクを介して結合されている他のノードの値Oj が更新
された時、これに伴って後述するように更新されるよう
になっている。このノードの出力値の更新は連鎖的に行
われる。このノードの出力値は、分野尤度BYUDによ
って格納される。分野尤度BYUDは、例えば図7に示
されるような構成をしており、分野に対応するノード1
つ1つに対して領域を確保した配列であり、その要素に
ノードの出力値が格納される。
Then, each node corresponding to a field outputs an output value O i representing the likelihood of the field i (referred to as the field likelihood).
Have each. This output value O i is basically the field i.
The value is increased when a word belonging to is selected, and the higher the value, the more the text input at that time is related to the field i. The increased output value is updated when the value O j of another node connected via the link is updated, as will be described later. The output value of this node is updated in a chain. The output value of this node is stored by the field likelihood BYUD. The field likelihood BYUD has a configuration as shown in FIG. 7, for example, and the node 1 corresponding to the field
This is an array in which an area is secured for each one, and the output value of the node is stored in that element.

【0050】また、複数のノードを相互に結合するリン
クは、ノード間(分野iと分野j)の間の関係の深さを
示す値(リンクの重み)wijを持つものである。リンク
の重みは、例えば、−1≦wij≦1,wii=0,wji
ijの条件を満たす範囲で与えられる。リンクの重みw
ijは、分野iと分野jとの間の関係が深いほど、すなわ
ち、分野iに属する単語と、分野jに属する単語が共起
しやすいほど、大きな値を取る。リンクの重みは、分野
ウェイトBWAIによって格納される。分野ウェイトB
WAIは、リンクの重みノード1つ1つに対して領域を
確保され、例えば図8に示されるような構成をしてい
る。ここではwji=wijであるので、三角行列で表し、
各要素に、対応するリンクの重みが格納されるものとす
る。例えば、図8における要素aには、「政治」分野と
「法律」分野の間のリンクの重みが格納される。
A link connecting a plurality of nodes to each other has a value (link weight) w ij indicating the depth of the relationship between the nodes (field i and field j). The link weights are, for example, −1 ≦ w ij ≦ 1, w ii = 0, w ji =
It is given within a range that satisfies the condition of w ij . Link weight w
ij takes a larger value as the relationship between the fields i and j is deeper, that is, the words belonging to the field i and the words belonging to the field j are more likely to co-occur. The link weight is stored by the field weight BWAI. Category weight B
The WAI has an area reserved for each weight node of the link, and has a configuration as shown in FIG. 8, for example. Since w ji = w ij here, it is represented by a triangular matrix,
It is assumed that the weight of the corresponding link is stored in each element. For example, the element a in FIG. 8 stores the weight of the link between the “politics” field and the “law” field.

【0051】分野iに対応するノードの出力値Oi は、
マイクロプロセッサCPUによるROMに格納されたプ
ログラムの計算により、例えば、 Oi(t+1)=f(ui(t+1)) ui(t+1)=δui(t)+(1−δ)Σwijj(t)+θi(t) ここで、Oi(t)は、ノード分野iの時刻tにおける出力
値 ui(t)は、ノード分野iの時刻tにおける内部状態値 fは、上限,下限を持つ単調増加関数 δは、0≦δ≦1の定数 θi(t)は、分野iに属する単語が選択された時にθi(t)
≧0, 選択されない時にθi(t)≦0となる外部入力値 のような処理により更新される。
The output value O i of the node corresponding to the field i is
By calculation of the program stored in the ROM by the microprocessor CPU, for example, O i (t + 1) = f (u i (t + 1)) u i (t + 1) = δu i (t) + (1 −δ) Σ w ij O j (t) + θ i (t) where O i (t) is the output value of node field i at time t and u i (t) is the internal state of node field i at time t. the value f is the upper limit, the [delta] monotonically increasing function with a lower limit, the constant of 0 ≦ δ ≦ 1 θ i ( t) , when the word belongs to the field i is selected theta i (t)
It is updated by a process such as an external input value ≧ 0, θ i (t) ≦ 0 when not selected.

【0052】上記第2式において、ui は分野iに対応
するノードの内部状態の値であり、この値は分野内部状
態BNAIによって格納される。分野内部状態BNAI
は、例えば図7に示されるような構成をしており、分野
に対応するノード1つ1つに対応して領域を確保した配
列であり、その要素にノードの内部状態の値ui が格納
される。さらに、第2式における第1項は、ノードの出
力値Oi の急激な出力変化を抑える慣性モーメントであ
る。そして第2式における第2項は、隣接ノードの出力
値が自ノードの出力値に及ぼす影響を示す項であり、リ
ンクの重みwijは、上述のように分野ウェイトBWAI
によって格納される。また、Oj は分野尤度BYUDに
よって格納される。次に、第3項θi は分野iに属する
単語が選ばれた時、対応する分野のノードの出力値を大
きくし、選択されなかった場合にはそのノードの出力値
を徐々に小さくするための外部入力を表す項であり、こ
の値は、分野外部入力BGAIによって格納される。分
野外部入力BGAIは、例えば図7に示されるような構
成をしており、分野に対応するノード1つ1つに対して
領域を確保した配列であり、その要素にノードの外部入
力の値が格納される。θi の求め方は後述する。
In the above second equation, u i is the value of the internal state of the node corresponding to the field i, and this value is stored by the field internal state BNAI. Field internal condition BNAI
Has an arrangement as shown in FIG. 7, for example, and is an array in which an area is secured for each node corresponding to a field, and the value u i of the internal state of the node is stored in that element. To be done. Furthermore, the first term in the second equation is the moment of inertia that suppresses a sudden output change of the output value O i of the node. The second term in the second equation is a term indicating the influence of the output value of the adjacent node on the output value of the own node, and the link weight w ij is the field weight BWAI as described above.
Stored by. Further, O j is stored by the field likelihood BYUD. Next, the third term θ i is to increase the output value of the node of the corresponding field when the word belonging to the field i is selected, and to gradually decrease the output value of the node when it is not selected. Of the field external input BGAI. The field external input BGAI has a configuration as shown in FIG. 7, for example, and is an array in which an area is secured for each node corresponding to the field, and the value of the external input of the node is set in that element. Is stored. A method of obtaining θ i will be described later.

【0053】また、上記第1式における単調増加関数f
は、ノードの出力値Oi を特定の範囲内に抑えておくた
めのものであり、例えば、シグモイド関数f(x)=1/(1+e
xp(-x))とする。なお、このような関数の場合、関数値
を求めるには、変数値と関数値とを対応させた関数値テ
ーブルをメモリに用意すればよい。
Further, the monotonically increasing function f in the above equation 1
Is for keeping the output value O i of the node within a specific range. For example, the sigmoid function f (x) = 1 / (1 + e
xp (-x)). In the case of such a function, in order to obtain the function value, a function value table in which the variable value and the function value are associated with each other may be prepared in the memory.

【0054】従って、上記プログラムは、分野内部状態
BNAI、分野ウェイトBWAI、分野尤度BYUD、
分野外部入力BGAIに格納された時刻tの内部状態u
i 、リンクの重みwij、各ノードの出力値Oj 、外部入
力値θi より第2式に従って、時刻t+1のui を求
め、このui の値により関数fの関数値テーブルを参照
して、時刻t+1のノードの出力値Oi を求めるものと
なる。
Therefore, the above program is composed of the field internal state BNAI, the field weight BWAI, the field likelihood BYUD,
Internal state u at time t stored in field external input BGAI
i, the weight w ij of the link, the output value O j of each node, in accordance with the second equation from the external input value theta i, determine the time t + 1 of u i, refers to the function value table of the function f the value of the u i Thus, the output value O i of the node at time t + 1 is obtained.

【0055】ここで、各ノードには、出力値を変化させ
るかどうかのフラグが設けられており、このフラグの値
が1であるノードに対しては、上記の式によるノードの
出力値の更新処理は行わない。このノードの値が0であ
るノードに対してのみ、ノードの出力値の更新が行われ
る。このフラグは、分野尤度固定フラグBKOTによっ
て格納される。分野尤度固定フラグBKOTは、例えば
図7に示されるような構成をしており、分野に対応する
ノード1つ1つに対して領域を確保した配列であり、そ
の要素にフラグの値が格納される。通常このフラグの値
は0であるが、後述する分野設定変更によってオペレー
タが分野を指定した場合などに、その分野に対して、こ
のフラグの値を1にする。これは、オペレータによって
指定された分野の尤度(すなわち、ノードの出力値)を
一定に保つためなどに用いられる。
Here, each node is provided with a flag as to whether or not to change the output value, and for the node whose flag value is 1, the output value of the node is updated by the above equation. No processing is done. Only when the value of this node is 0, the output value of the node is updated. This flag is stored by the field likelihood fixed flag BKOT. The field likelihood fixed flag BKOT has, for example, a configuration as shown in FIG. 7, is an array in which an area is secured for each node corresponding to the field, and the value of the flag is stored in that element. To be done. Normally, the value of this flag is 0, but when the operator specifies a field by changing the field setting described later, the value of this flag is set to 1 for that field. This is used to keep the likelihood of the field designated by the operator (that is, the output value of the node) constant.

【0056】マイクロプロセッサCPUは、このような
更新処理を逐次実行し、分野ネットワークにおけるノー
ドの値をそのリンク構造に従って連鎖的に更新する。こ
のノード値の更新処理は、プログラムエリアPAのプロ
グラムに従ってCPUによって制御実行されるかな漢字
変換処理とは独立に、逐次連鎖的に実行される。しか
し、上記第2式の第3項θi(t)は、後述のように、かな
漢字変換処理において単語の選択がなされるつど、その
選択情報に従って決定される。つまり、かな漢字変換処
理によって更新される。そしてかな漢字変換処理は、そ
の時点での分野ネットワークの状態、すなわち、分野尤
度BYUDに応じて進められる。以上のような分野ネッ
トワークの各ノードの出力値の更新処理の手順は、ネッ
トワーク管理手順NKに格納されている。
The microprocessor CPU sequentially executes such update processing, and updates the values of the nodes in the field network in a chained manner in accordance with the link structure. The updating process of the node value is sequentially and sequentially executed independently of the Kana-Kanji conversion process controlled and executed by the CPU according to the program in the program area PA. However, the third term θ i (t) of the second expression is determined according to the selection information each time a word is selected in the kana-kanji conversion processing, as described later. That is, it is updated by the kana-kanji conversion processing. Then, the kana-kanji conversion processing proceeds according to the state of the field network at that time, that is, the field likelihood BYUD. The procedure for updating the output value of each node of the field network as described above is stored in the network management procedure NK.

【0057】図9は、SETキーに続いてCHGキーが
入力されて、オペレータが入力する分野の指定を行う分
野指定画面の一例である。図示にあるように、各分野に
対して、「番号」と「分野名」と分野指定の状況(指定
あり/なし)を表す「分野指定」とを対応させて表示さ
せ、オペレータによって指定されている分野の状況を表
わしている。例えば図9においては、「政治」,「法
律」分野に分野指定がなされており、「住所録」,「ス
ポーツ」,「料理」分野には分野指定がなされていな
い。このことは、オペレータが、「政治」,「法律」分
野の文を入力しようとしていることを表している。
FIG. 9 shows an example of a field designation screen in which the operator inputs a field by inputting the CHG key after the SET key. As shown in the figure, for each field, a "number", a "field name", and a "field designation" indicating the status (designated / not designated) of the field designation are displayed in association with each other and designated by the operator. It shows the situation in the field. For example, in FIG. 9, the fields are designated in the fields of "politics" and "law", and the fields are not designated in the fields of "address book", "sports", and "cooking". This means that the operator is trying to input a sentence in the "politics" or "law" field.

【0058】上述の動作をプログラムエリアPAに格納
されたプログラムに従って実行する手順を、フローチャ
ートを用いて説明する。
A procedure for executing the above operation according to the program stored in the program area PA will be described with reference to a flowchart.

【0059】図10は本発明文字処理装置の動作を示す
フローチャートである。
FIG. 10 is a flow chart showing the operation of the character processing apparatus of the present invention.

【0060】ステップS10−1は、本発明文字処理装
置のいろいろな初期設定を行う処理であり、かかる初期
設定は同種の文字処理装置において一般的に行われてい
る処理である。本実施例では特に、分野尤度BYUD,
分野内部状態BNAI,分野外部入力BGAI,および
分野尤度固定フラグBKOTの各要素の値を0にして初
期化したり、分野モードBMODの値を0にして初期化
したりしている。また、NKに格納された分野ネットワ
ークのノードの更新処理手順に従うプロセスを本プロセ
スと並行動作させる。処理を終えると、ステップS10
−2へ進む。
Step S10-1 is a process for making various initial settings of the character processing device of the present invention, and such initial setting is a process generally performed in a character processing device of the same type. In this embodiment, in particular, the field likelihood BYUD,
The value of each element of the field internal state BNAI, field external input BGAI, and field likelihood fixed flag BKOT is initialized to 0, or the field mode BMOD value is initialized to 0. Further, the process according to the update processing procedure of the node of the field network stored in NK is operated in parallel with this process. When the processing is completed, step S10
-2.

【0061】ステップS10−2はキーボードからのデ
ータを取り込む処理である。ステップS10−3で取り
込まれたキーの種別を判定し、各キーの処理ルーチンに
分岐する。
Step S10-2 is a process for fetching data from the keyboard. The type of the key fetched in step S10-3 is determined, and the process branches to the processing routine for each key.

【0062】KIDキーが入力された時はステップS1
0−4に分岐し、図11につき詳述するかな漢字変換処
理が行なわれる。変換処理が行なわれた後、ステップS
10−8へ進む。
When the KID key is input, step S1
Branching to 0-4, the kana-kanji conversion processing described in detail with reference to FIG. 11 is performed. After the conversion process is performed, step S
Proceed to 10-8.

【0063】SETキーが入力されたときはステップS
10−5に分岐し、図24につき詳述する分野環境設定
処理が行なわれる。その後ステップS10−8進む。
When the SET key is pressed, step S
The process branches to 10-5, and the field environment setting process described in detail with reference to FIG. 24 is performed. Then, it progresses to step S10-8.

【0064】JUSキーが入力されたときはステップS
10−6に分岐し、住所録作成処理が行われる。住所録
作成処理では、まず、分野尤度固定フラグBKOTの住
所録分野に対応する要素の値を1に設定し、それ以外の
要素の値を0に設定する。すなわち、分野ネットワーク
における住所録分野に対応するノードの出力値の値が変
化しないように設定する。
When the JUS key is pressed, step S
Branching to 10-6, the address book creation process is performed. In the address book creation process, first, the value of the element corresponding to the address book field of the field likelihood fixed flag BKOT is set to 1, and the values of the other elements are set to 0. That is, the output value of the node corresponding to the address book field in the field network is set so as not to change.

【0065】次に、分野ネットワークにおける住所録分
野に対応するノードの内部状態の値および出力値を、出
力値として取り得る最大値に設定し、それ以外のノード
の内部状態の値および出力値を0に設定する。すなわ
ち、分野尤度BYUD,分野内部状態BNAIにおい
て、住所録分野に対応する要素の値を最大値に設定し、
それ以外の要素の値を0に設定する。また、分野外部入
力BGAIのすべての要素の値を0にし、分野ネットワ
ークにおける各ノードへの外部入力の値を0にする。
Next, the internal state value and the output value of the node corresponding to the address book field in the field network are set to the maximum possible output values, and the internal state value and the output value of the other nodes are set. Set to 0. That is, in the field likelihood BYUD and the field internal state BNAI, the value of the element corresponding to the address book field is set to the maximum value,
Set the values of the other elements to 0. Further, the values of all elements of the field external input BGAI are set to 0, and the values of external input to each node in the field network are set to 0.

【0066】しかる後に、住所録作成処理が行われる。
住所録作成処理は、同種の文字処理装置において、一般
に行われている処理であり、公知であるので特に詳細な
説明はしない。ただし、住所録作成処理の中では、ステ
ップS10−4で行われているかな漢字変換と同じ処理
が行われるが、上述のように分野尤度と分野尤度固定フ
ラグの値を設定しているので、ネットワーク管理手順N
Kに従って、マイクロプロセッサCPUがかな漢字変換
処理と独立に分野ネットワークを動作させても、住所録
分野の尤度は常に最大値を維持しており、かな漢字変換
処理において、住所録分野に属する単語は他の分野に属
する単語よりも優先して変換されるようになる。住所録
作成処理を終えると、ステップS10−8進む。
Then, the address book preparation process is performed.
The address book creating process is a process that is generally performed in the same type of character processing device and is well known, so a detailed description thereof will not be given. However, in the address book creation process, the same process as the Kana-Kanji conversion performed in step S10-4 is performed, but since the field likelihood and the field likelihood fixed flag value are set as described above. , Network management procedure N
According to K, even if the microprocessor CPU operates the field network independently of the kana-kanji conversion processing, the likelihood of the address book field always maintains the maximum value. It will be converted in preference to words belonging to the field. When the address book creation process is completed, the process proceeds to step S10-8.

【0067】その他のキーのときはステップS10−7
に分岐し、挿入、削除等の通常の文字処理装置において
行なわれるその他の処理が行なわれる。これらの処理は
同種の文字処理装置において一般に行われている処理で
あり、公知であるので特に記述しない。処理が行われた
後ステップS10−8に進む。
For other keys, step S10-7.
And other processing such as insertion and deletion that is performed in a normal character processing device is performed. These processes are processes that are generally performed in the same type of character processing device, and are known, and therefore will not be described here. After the processing is performed, the process proceeds to step S10-8.

【0068】ステップS10−8は上述の処理の各処理
の結果、変更された部分を表示する表示処理である。文
書中のデータ1文字を読むごとに文字パターンに展開
し、表示バッファに出力するというように通常一般に行
われている処理である。処理を終えると、ステップS1
0−2へ戻る。
Step S10-8 is a display process for displaying the changed portion as a result of the above-mentioned processes. This is a generally-used process of expanding one character of data in a document into a character pattern each time it is read and outputting it to a display buffer. When the processing is completed, step S1
Return to 0-2.

【0069】図11はステップS10−4の「かな漢字
変換」を詳細化したフローチャートである。
FIG. 11 is a detailed flowchart of "Kana-Kanji conversion" in step S10-4.

【0070】ステップS11−1はキーボードからのデ
ータを取り込む処理である。ステップS11−2で取り
込まれたキーの種別が読みであるかどうかを判定し、読
みであればステップS11−3に分岐し、読みでなけれ
ばステップS11−4に分岐する。
Step S11-1 is a process for fetching data from the keyboard. It is determined whether or not the type of the key fetched in step S11-2 is read, and if read, the process branches to step S11-3, and if not read, the process branches to step S11-4.

【0071】ステップS11−3において、入力された
読みを入力された順にバッファに格納する。この処理は
同種のかな漢字変換処理において一般的に行われている
処理である。入力された読みの格納が終われば、ステッ
プS11−1に移行する。
In step S11-3, the input readings are stored in the buffer in the order of input. This process is a process generally performed in the same type of kana-kanji conversion process. When the storage of the input reading is completed, the process proceeds to step S11-1.

【0072】ステップS11−4では、ステップS11
−3においてバッファに格納された読みを漢字に変換す
る。この処理は図12につき詳述する。その後ステップ
S11−5へ進む。
In step S11-4, step S11
In -3, the reading stored in the buffer is converted into Kanji. This process will be described in detail with reference to FIG. After that, it advances to step S11-5.

【0073】ステップS11−5において、ステップS
11−4で変換された漢字を修正する。この処理は図1
5につき詳述する。処理が終えるとリターンする。
In step S11-5, step S
Correct the Kanji converted in 11-4. This process is shown in Figure 1.
5 will be described in detail. When the processing is completed, it returns.

【0074】図12はステップS11−4の「読み変
換」を詳細化したフローチャートである。
FIG. 12 is a detailed flowchart of the "reading conversion" in step S11-4.

【0075】ステップS12−1は、バッファに格納さ
れた読みの変換対象位置から連続する2文節の組み合わ
せの中から読みの長さが最良となる組み合わせをすべて
抽出する処理である。この処理は、二文節最長一致法と
呼ばれる方法で、変換対象の読みによって単語辞書WD
ICを検索することにより、文法的に正しい文節を抽出
し、連続する2文節の組み合わせの中から、2文節あわ
せた読みの長さが最も長い組み合わせを抽出する処理で
あり、同種のかな漢字変換処理において一般に行われて
いる処理であるので、詳細な説明は行わない。
Step S12-1 is a process for extracting all the combinations having the best reading length from the combinations of two consecutive phrases stored in the buffer from the reading conversion target position. This processing is a method called the two-segment longest-match method, and the word dictionary WD
This is a process to extract grammatically correct phrases by searching ICs, and to extract a combination with the longest reading length of the two phrases from the combination of two consecutive phrases, which is a kana-kanji conversion process of the same kind. Since this is a process generally performed in, the detailed description will not be given.

【0076】なお、この処理においては、連続する2文
節が抽出できずに、1文節しか抽出できない場合があ
る。この場合は、最も長い文節のみを抽出する。ステッ
プS12−2は、これをチェックする処理であり、1文
節しか抽出できない場合は、バッファに格納されたすべ
ての読みが文節として抽出されているので、ステップS
12−6へ分岐する。連続する2文節が抽出できた場合
は、ステップS12−3に分岐する。
In this process, there are cases where two consecutive phrases cannot be extracted and only one phrase can be extracted. In this case, only the longest clause is extracted. Step S12-2 is a process for checking this. If only one phrase can be extracted, all the readings stored in the buffer have been extracted as a phrase, so step S12-2.
Branch to 12-6. If two consecutive phrases have been extracted, the process branches to step S12-3.

【0077】ステップS12−3は、ステップS12−
1で抽出された2文節の組み合わせの中に、2つの文節
の区切り位置が異なるものがあるかどうか、すなわち、
区切り位置の候補が複数個あるかどうかをチェックす
る。複数個ある場合は、ステップS12−4に分岐し、
区切り位置が1つだけであればステップS12−5に分
岐する。
Step S12-3 is step S12-
In the combination of the two clauses extracted in 1, whether there is a difference in the delimiter position of the two clauses, that is,
Check if there are multiple candidates for delimiter positions. If there is more than one, branch to step S12-4,
If there is only one delimiter position, the process branches to step S12-5.

【0078】ステップS12−4では、複数個の異なる
区切り位置の中から、最も適切と思われる区切り位置を
1つだけ選んで決定する処理であり、決定後は、決定さ
れた区切り位置とは異なる位置で区切られる2文節の組
み合わせは変換候補から除かれる。この処理は、図13
につき詳述する。処理を終えると、ステップS12−5
へ進む。
In step S12-4, only one of the most appropriate delimiter positions is selected from a plurality of different delimiter positions and the determined position is determined. After the determination, the determined delimiter position is different. The combination of two clauses separated by the position is excluded from the conversion candidates. This process is shown in FIG.
Will be described in detail. When the processing ends, step S12-5
Go to.

【0079】ステップS12−5は、連続する2文節の
うち、最初の文節に対して変換結果を決定し、決定され
た変換結果を出力し、変換対象の読みを後続する文節の
先頭位置に移す処理である。この処理は、図14につき
詳述する。処理を終えると、ステップS12−1に進
む。
In step S12-5, the conversion result is determined for the first phrase of the two consecutive phrases, the determined conversion result is output, and the reading of the conversion target is moved to the head position of the succeeding phrase. Processing. This process will be described in detail with reference to FIG. When the process is completed, the process proceeds to step S12-1.

【0080】ステップS12−6は、ステップS12−
1において抽出された文節に対して変換結果を決定し、
変換結果を出力する処理である。これらの処理は、ステ
ップS12−5で行われている処理と同じであるので、
特に詳細な説明はしない。処理を終えるとリターンす
る。
Step S12-6 is step S12-
The conversion result is determined for the phrase extracted in 1.
This is a process of outputting the conversion result. Since these processes are the same as the processes performed in step S12-5,
No detailed description will be given. When the processing is completed, it returns.

【0081】図13はステップS12−4の「区切り決
定」の処理を詳細化したフローチャートである。
FIG. 13 is a detailed flow chart of the process of "delimitation determination" in step S12-4.

【0082】ステップS13−1は、用例によって複数
個ある区切り位置を絞り込む処理である。すなわち、連
続する2文節を構成する2つの自立語の組み合わせが用
例辞書YDICに格納されており、かつ、用例辞書に記
述された結合関係を満たしていれば、その2文節の間の
区切りは用例がある区切りとみなす。
Step S13-1 is a process of narrowing down a plurality of delimiter positions according to an example. That is, if a combination of two independent words forming two consecutive phrases is stored in the example dictionary YDIC and the connection relation described in the example dictionary is satisfied, the delimiter between the two phrases is an example. There is a break.

【0083】また、すでに変換出力された文節を構成す
る自立語と、連続する2文節のいずれか一方の文節を構
成する自立語の組み合わせが用例辞書YDICに格納さ
れており、かつ、用例辞書に記述された結合関係を満た
していれば、その2文節の間の区切りは用例がある区切
りとみなす。このようにして、各区切りに対して用例が
あるかどうかを調べ、用例がある区切りが存在していれ
ば、用例がない区切りを持つ2文節の組み合わせを候補
から外す。
Further, a combination of the independent word which has already been converted and output and which constitutes one of the two consecutive bunsetsus is stored in the example dictionary YDIC, and the combination of the independent words is also stored in the example dictionary. If the described connection relation is satisfied, the break between the two clauses is regarded as a break with an example. In this way, it is checked whether or not there is an example for each delimiter, and if there is a delimiter with an example, a combination of two clauses having a delimiter without an example is excluded from the candidates.

【0084】このようにして、用例によって、区切り位
置の絞り込みを行うことができる。例えば、「ひととは
なす」という読みに対して、「ひとと(人と)/はなす
(話す)」という2文節と「ひととは(人とは)/なす
(茄子)」という2文節が可能であるが、「人」と「話
す」が「と」という結合関係で結合する用例が用例辞書
YDICに格納され、「人」と「茄子」が上記のように
結合する用例が辞書にない場合、「ひとと(人と)/は
なす(話す)」の区切りには用例があるが、「ひととは
(人とは)/なす(茄子)」の区切りには用例がないこ
とになり、この処理の結果、「ひとと(人と)/はなす
(話す)」の区切りのみが残されることになる。この処
理を終えると、ステップS13−2へ進む。
In this way, it is possible to narrow down the delimiter position depending on the example. For example, for the reading "Hitoto Hanasu", two clauses "Hitoto (Human) / Hanasu (Speak)" and "Hitoto (Human) / Eggplant (Eggplant)" are possible. However, when the example in which "person" and "speak" are combined in the combination relation "to" is stored in the example dictionary YDIC, and the example in which "person" and "eggplant" are combined as described above is not in the dictionary , There is an example in the section of "Hitoto (with person) / Hanasu (speak)", but there is no example in the section of "Hitoto (with person) / Eggplant (eggplant)". As a result of the processing, only the delimiter of "people (with people) / release (speaking)" is left. When this process ends, the process proceeds to step S13-2.

【0085】ステップS13−2は、ステップS13−
1で、用例によって区切り位置が1つに決定できたかど
うかを判定する処理であり、区切りの候補が複数個存在
していればステップS13−3へ分岐し、区切りの候補
が1つのみであればリターンする。
The step S13-2 is the step S13-
In step 1, it is a process of determining whether or not the break position can be determined to be one according to the example. If there are a plurality of break candidates, the process branches to step S13-3, and if there is only one break candidate. If you return.

【0086】ステップS13−3は、分野によって、複
数個ある区切り位置を絞り込む処理である。分野尤度の
状態、すなわち、分野ネットワークの状態と2文節を構
成する単語が属する分野との関係によって、2文節の確
からしさを求め、その確からしさによって、区切りを絞
り込む処理である。この処理は、図14につき詳述す
る。この処理が終えると、ステップS13−4へ進む。
Step S13-3 is a process of narrowing down a plurality of delimiter positions depending on the field. This is a process of determining the likelihood of two phrases based on the state of the category likelihood, that is, the relationship between the state of the category network and the category to which the words forming the two phrases belong, and narrowing the delimiter based on the certainty. This process will be described in detail with reference to FIG. When this process ends, the process proceeds to step S13-4.

【0087】ステップS13−4は、ステップS13−
3において、分野により区切り位置が1つに決定できた
かどうかを判定する処理であり、区切りの候補が複数個
存在していればステップS13−5へ分岐し、区切りの
候補が1つのみであればリターンする。
The step S13-4 is the step S13-
3 is a process for determining whether or not one break position can be determined depending on the field. If there are a plurality of break candidates, the process branches to step S13-5, and if there is only one break candidate. If you return.

【0088】ステップS13−5は、短期学習によって
複数個ある区切り位置を絞り込む処理である。すなわ
ち、2文節を構成する2つの自立語のうち、いずれか一
方でも最新使用単語リストWLISに格納されていれ
ば、その2文節の区切りは、短期学習がある区切りとす
る。このようにして、各区切りに対して短期学習がある
かどうかを調べ、短期学習がある区切りが存在していれ
ば、短期学習がない区切りを持つ2文節の組み合わせを
候補から外す。
Step S13-5 is a process of narrowing down a plurality of delimiter positions by short-term learning. That is, if either one of the two independent words forming the two phrases is stored in the most recently used word list WLIS, the segment of the two phrases is a segment with short-term learning. In this way, it is checked whether or not there is short-term learning for each segment, and if there is a segment with short-term learning, a combination of two clauses having a segment without short-term learning is excluded from candidates.

【0089】例えば、「ここではきものを」という読み
に対して、「ここで/はきものを(履物を)」という2
文節と「ここでは/きものを(着物を)」という2文節
が可能である。この時、最新使用単語リストWLIS
に、「きもの(着物)」が登録されており、「ここ」と
「履物」は登録されていなかった場合、「ここでは/き
ものを(着物を)」の区切りには短期学習があるが、
「ここで/はきものを(履物を)」の区切りには短期学
習がないことになり、この処理の結果、「ここでは/き
ものを(着物を)」の区切りのみが残されることにな
る。この処理を終えると、ステップS13−6へ進む。
For example, in contrast to the reading "here is a kimono", 2 is "here / has a kimono (footwear)".
It is possible to have two clauses, a clause and "Here / Kimono (Kimono)". At this time, the latest word list WLIS
If "Kimono (Kimono)" is registered and "Here" and "Footwear" are not registered, there is a short-term learning at the "Here / Kimono (Kimono)" section.
There is no short-term learning in the "here / footwear (footwear)" section, and as a result of this processing, only the "here / kimono (kimono) section" remains. When this process ends, the process proceeds to step S13-6.

【0090】ステップS13−6は、ステップS13−
5において、短期学習によって区切り位置が1つに決定
できたかどうかを判定する処理であり、区切りの候補が
複数個存在していればステップS13−7へ分岐し、区
切りの候補が1つのみであればリターンする。
Step S13-6 is step S13-
In step 5, it is a process of determining whether or not one break position can be determined by short-term learning. If there are a plurality of break candidates, the process branches to step S13-7, and only one break candidate exists. If there is, return.

【0091】ステップS13−7は、上記以外の方法に
よって区切りを決定する処理であり、例えば、単語の使
用頻度などによって区切りを決定する処理である。この
ような処理は、同種のかな漢字変換処理において一般的
に行われている処理であり、公知であるので特に詳細な
説明は行わない。処理を終えると、区切りは1つに決定
されているので、リターンする。
Step S13-7 is a process for determining a break by a method other than the above, for example, a process for determining a break according to the frequency of use of words. Such a process is a process generally performed in the same type of kana-kanji conversion process and is well known, so a detailed description thereof will not be given. When the processing is completed, the number of divisions is determined to be one, so the process returns.

【0092】図14は、ステップS13−3の「分野で
決定」処理を詳細化したフローチャートである。
FIG. 14 is a detailed flowchart of the "determine by field" process in step S13-3.

【0093】まず、ステップS14−1において、分野
モードBMODの値に従って分岐する。分野モードBM
ODの値が1であれば、分野処理を行うモードであるの
で、ステップS14−2へ分岐する。分野モードBMO
Dの値が0であれば、分野処理を行わないモードである
ので、以降の処理を行わずにリターンする。
First, in step S14-1, the process branches according to the value of the field mode BMOD. Field mode BM
If the value of OD is 1, it is the mode in which the field processing is performed, and the process branches to step S14-2. Field mode BMO
If the value of D is 0, it is a mode in which no field processing is performed, and therefore the processing returns without performing the subsequent processing.

【0094】ステップS14−2において、2文節の候
補の中から、ステップS14ー4〜6の処理の対象とす
る2文節を1つ1つ順番に取り出していく。ステップS
14−3においては、ステップS14ー2で未処理の候
補を取り出すことができれば、ステップS14−4へ分
岐し、すべての候補を取り出し終えていれば、ステップ
S14−3において分岐し、ステップS14−7へ進
む。
At step S14-2, the two bunsetsu targeted for the processing at steps S14-4 to S6 are taken out one by one from the two bunsetsu candidates. Step S
In 14-3, if unprocessed candidates can be extracted in step S14-2, the process branches to step S14-4, and if all candidates have been extracted, the process branches to step S14-3 and step S14- Proceed to 7.

【0095】ステップS14−4において、2文節のう
ち、最初の文節に対して、分野による文節尤度、すなわ
ち、分野処理による文節の確からしさの度合いを求め
る。この処理の詳細は図15につき詳述する。処理を終
えるとステップS14−5へ進む。
In step S14-4, for the first bunsetsu among the two bunsetsu, the bunsetsu likelihood by the field, that is, the degree of certainty of the bunsetsu by the field processing is obtained. Details of this processing will be described in detail with reference to FIG. When the processing is completed, the process proceeds to step S14-5.

【0096】ステップS14−5では、2文節のうち、
後ろの文節に対して、分野による文節尤度を求める。こ
の処理もステップS14−4と同じようにして行われる
ので、詳細は図15につき詳述する。処理を終えるとス
テップS14−6へ進む。
In step S14-5, of the two clauses,
For the bunsetsu behind, find the bunsetsu likelihood by field. Since this processing is also performed in the same manner as step S14-4, the details will be described with reference to FIG. When the processing is completed, the process proceeds to step S14-6.

【0097】ステップS14−6において、ステップS
14−4で求めた、最初の文節に対する分野による文節
尤度と、ステップS14−5で求めた、後ろの文節に対
する分野による文節尤度とを加え合わせる。この値は、
対象となっている2文節の分野による尤度となる。そし
て、この値を、対象となっている2文節に対応させて格
納して保存する。処理を終えると、ステップS14−2
へ進む。
In step S14-6, step S
14-4, the bunsetsu likelihood by the field for the first bunsetsu and the bunsetsu likelihood by the field for the succeeding bunsetsu, which are found in step S14-5, are added. This value is
It is the likelihood depending on the field of the target two clauses. Then, this value is stored and saved in association with the target two clauses. When the processing ends, step S14-2
Go to.

【0098】ステップS14−7において、ステップS
14−6において格納保存した2文節の分野による尤度
によって、2文節の候補の絞り込みを行う。例えば、2
文節の分野による尤度の値が最も高い値を持つ候補のみ
を残して、他の2文節を候補から外す。処理を終えると
リターンする。
In step S14-7, step S
The candidates for the two phrases are narrowed down according to the likelihood of the two phrases stored and saved in 14-6. For example, 2
The other two clauses are excluded from the candidates, leaving only the candidate having the highest likelihood value depending on the clause field. When the processing is completed, it returns.

【0099】図15は、ステップS14−4の「分野文
節尤度(1)」処理、および、ステップS14−5の
「分野文節尤度(2)」処理を詳細化したフローチャー
トである。
FIG. 15 is a detailed flowchart of the "field clause likelihood (1)" processing of step S14-4 and the "field clause likelihood (2)" processing of step S14-5.

【0100】ステップS15−1は、対象となっている
文節を構成する自立語が、分野辞書BDICに登録され
ているかどうかの検索を行う処理である。分野辞書BD
ICの先頭から順々に検索していき、登録されている分
野の情報が1つ見つかるごとにステップS15−2にお
いてステップS15−3に分岐する。分野辞書BDIC
の最後まで検索を終えたら、ステップS15−2におい
てステップS15−5へ分岐する。
Step S15-1 is a process for searching whether or not the independent word forming the target clause is registered in the field dictionary BDIC. Field dictionary BD
The IC is sequentially searched from the beginning, and each time one piece of information on the registered field is found, the process branches to step S15-3 in step S15-2. Field dictionary BDIC
When the search is completed to the end of, the process branches to step S15-5 in step S15-2.

【0101】ステップS15−3において、ステップS
15−1で検索された分野の情報と、分野ネットワーク
の出力値、すなわち分野尤度とによって、その分野によ
る文節の尤度を求める。検出された分野の情報が、分野
が分野iで確信度がci であるとすると、分野iによる
対象となる文節の尤度BYi は、分野ネットワークの分
野iに対応するノードの出力値(すなわち分野尤度)O
i をもちいて、例えば、次の式で求める。
In step S15-3, step S
The likelihood of the clause according to the field is obtained from the information of the field searched in 15-1 and the output value of the field network, that is, the field likelihood. Assuming that the information of the detected field is the field i and the certainty factor is c i , the likelihood BY i of the target bunsetsu by the field i is the output value () of the node corresponding to the field i of the field network. Ie field likelihood) O
Using i , for example, the following formula is used.

【0102】 BYi = Oii (for ci ≧0) BYi = 0 (for ci <0) このようにして、分野iによる文節の尤度BYi を求め
ると、分野尤度の値が正で大きければ大きいほど(すな
わち入力されている文章が分野iに関係があればあるほ
ど)、また、文節を構成する自立語が分野iに属する確
信度が正で大きければ大きいほど(すなわちその自立語
が分野iに関係が深ければ深いほど)、このBYi の値
が大きくなることになる。分野による文節の尤度を求め
たら、ステップS15−4へ進む。
BY i = O i c i (for c i ≧ 0) BY i = 0 (for c i <0) In this way, when the likelihood BY i of the phrase by the field i is obtained, The larger the positive value and the larger the value (that is, the more the input sentence is related to the field i), and the larger the certainty factor that the independent words constituting the clause belong to the field i, the larger ( That is, the deeper the independent word is related to the field i), the larger the value of BY i becomes. When the likelihood of the phrase according to the field is obtained, the process proceeds to step S15-4.

【0103】ステップS15−4では、ステップS15
−3で求められる分野による文節の尤度の最大値を求め
る処理である。古い最大値とステップS15−3で求め
られた値を比較し、ステップS15−3で求められた値
のほうが大きければ、その値を新たな最大値として保存
する処理である。処理を終えるとステップS15−1へ
進む。
In step S15-4, step S15
-3 is a process of obtaining the maximum value of the likelihood of a phrase according to the field obtained. In this process, the old maximum value is compared with the value obtained in step S15-3, and if the value obtained in step S15-3 is larger, that value is saved as a new maximum value. When the processing is completed, the process proceeds to step S15-1.

【0104】ステップS15−5は、単語辞書中に格納
されている品詞によって対応する分野を求め、分野によ
る文節の尤度を求める処理である。すなわち、対象とな
っている文節の自立語の品詞を単語辞書から求め、その
品詞が特定の分野に対応づけられていれば、その単語は
その分野に属するものとして扱う。例えば、読みが「い
けだ」で表記が「池田」という単語の品詞が「人名」で
あり、「人名」という品詞が分野「住所録」に対応づけ
てあるとすると、単語「池田」は、分野「住所録」に属
することになる。
In step S15-5, the corresponding field is obtained by the part of speech stored in the word dictionary, and the likelihood of the phrase by the field is obtained. That is, the part of speech of the independent word of the target phrase is obtained from the word dictionary, and if the part of speech is associated with a specific field, the word is treated as belonging to that field. For example, if the word "Ikeda" is read and the part of speech of the word "Ikeda" is "person's name" and the part of speech "person's name" is associated with the field "Address Book", the word "Ikeda" is It belongs to the "address book".

【0105】この場合、確信度は、例えば一定値を持つ
ものとする。そして、ステップS15−3で使用した計
算式に従って、文節による尤度を求める。対象となる単
語の品詞が特定の分野に対応づけられていなければ、分
野による文節の尤度は0であるとする。以上のようにし
て品詞から分野による文節の尤度を求めたらステップS
15−6へ進む。
In this case, the certainty factor has a constant value, for example. Then, according to the calculation formula used in step S15-3, the likelihood by clause is obtained. If the part of speech of the target word is not associated with a specific field, the likelihood of the bunsetsu depending on the field is 0. When the likelihood of the bunsetsu depending on the field is obtained from the part of speech as described above, step S
Proceed to 15-6.

【0106】ステップS15−6は、ステップS15−
4で求めた分野による文節の尤度の最大値を、ステップ
S15−5で求めた分野による文節の尤度と比較し、ス
テップS15−5で求めた値のほうが大きければ、最大
値をその値に更新する処理である。処理を終えるとリタ
ーンする。
Step S15-6 is step S15-
The maximum value of the likelihood of the phrase by the field obtained in 4 is compared with the likelihood of the phrase by the field obtained in step S15-5. If the value obtained in step S15-5 is larger, the maximum value is set to that value. Is a process of updating to. When the processing is completed, it returns.

【0107】図16は、ステップS12−5、および、
ステップS12−6の「変換結果決定」処理を詳細化し
たフローチャートである。
FIG. 16 shows steps S12-5 and
It is the flowchart which detailed the "conversion result determination" process of step S12-6.

【0108】ステップS16−1において、対象となる
文節の変換結果を決定する。この処理は図17につき詳
述する。処理を終えるとステップS16−2へ進む。
In step S16-1, the conversion result of the target clause is determined. This process will be described in detail with reference to FIG. When the processing is completed, the process proceeds to step S16-2.

【0109】ステップS16−2は、ステップS16−
1において決定された文節の構造に従って、変換結果を
出力する処理である。この処理は、同種のかな漢字変換
処理において一般的に行われている処理であり、特に詳
細な説明は行わない。
The step S16-2 is the step S16-
This is a process of outputting the conversion result in accordance with the clause structure determined in 1. This process is a process generally performed in the same type of kana-kanji conversion process, and a detailed description thereof will not be given.

【0110】ステップS16−3において、分野モード
BMODの値によって分岐する。分野モードBMODの
値が1であれば、分野処理を行うモードであるのでステ
ップS16−4へ分岐し、分野モードBMODの値が0
であれば、分野処理を行わないモードであるのでリター
ンする。
In step S16-3, the process branches depending on the value of the field mode BMOD. If the value of the field mode BMOD is 1, it is the mode in which the field processing is performed, so the process branches to step S16-4, and the value of the field mode BMOD is 0.
If so, the mode is a mode in which field processing is not performed, and the process returns.

【0111】ステップS16−4において、文節の読み
によって分野ネットワークへの外部入力の値を必要に応
じて更新する。この処理は図19につき詳述する。処理
を終えるとリターンする。
In step S16-4, the value of the external input to the field network is updated as necessary by reading the clause. This process will be described in detail with reference to FIG. When the processing is completed, it returns.

【0112】図17は、ステップS16−1の「変換単
語決定」処理を詳細化したフローチャートである。
FIG. 17 is a detailed flowchart of the "conversion word determination" process of step S16-1.

【0113】ステップS17−1は、用例によって変換
する単語を絞り込む処理である。すなわち、対象となる
文節と他の文節を構成する2つの自立語の組み合わせが
用例辞書YDICに格納されており、かつ、用例辞書に
記述された結合関係を満たしていれば、対象となる文節
は用例がある文節とみなす。このようにして、文節の候
補に対して用例があるかどうかを調べ、用例がある文節
が存在していれば、用例がない文節を候補からはずす。
このようにして、用例によって、変換する文節の候補の
絞り込みを行うことができる。この処理は、同種のかな
漢字変換処理において一般的に行われている処理であ
る。この処理を終えると、ステップS17−2へ進む。
Step S17-1 is a process of narrowing down the words to be converted according to the example. That is, if a combination of a target phrase and two independent words that form another phrase is stored in the example dictionary YDIC, and if the combination relation described in the example dictionary is satisfied, the target phrase is Consider it as a phrase with an example. In this way, it is checked whether or not there is an example for a bunsetsu candidate, and if there is a bunsetsu with an example, a bunsetsu with no example is removed from the candidates.
In this way, it is possible to narrow down the candidate bunsetsu to be converted according to the example. This process is a process generally performed in the same type of kana-kanji conversion process. When this process ends, the process proceeds to step S17-2.

【0114】ステップS17−2は、ステップS17−
1において、変換する文節の候補が1つに決定できたか
どうかを判定する処理であり、文節の候補がが複数個存
在していればステップS17−3へ分岐し、文節の候補
が1つのみであればリターンする。
The step S17-2 is the step S17-
1 is a process of determining whether or not one bunsetsu candidate to be converted can be determined. If there are a plurality of bunsetsu candidates, the process branches to step S17-3, and only one bunsetsu candidate is present. If so, return.

【0115】ステップS17−3は、複数個ある文節の
候補を、分野によって絞り込む処理である。分野尤度の
状態、すなわち、分野ネットワークの状態と、対象とな
る文節を構成する単語が属する分野との関係によって、
文節の確からしさを求め、その確からしさによって、文
節の候補を絞り込む処理である。この処理は、図18に
つき詳述する。この処理を終えると、ステップS17−
4へ進む。
Step S17-3 is a process of narrowing down a plurality of clause candidates by field. Depending on the state of the field likelihood, that is, the state of the field network and the field to which the words that make up the target clause belong,
This is a process of obtaining the certainty of a phrase and narrowing down the candidates of the phrase based on the certainty. This process will be described in detail with reference to FIG. When this process ends, step S17-
Go to 4.

【0116】ステップS17−4は、ステップS17−
3において、変換する文節の候補が1つに決定できたか
どうかを判定する処理であり、文節の候補が複数個存在
していればステップS17−5へ分岐し、文節の候補が
1つのみであればリターンする。
The step S17-4 is the step S17-
3 is a process of determining whether or not one bunsetsu candidate to be converted can be determined. If there are a plurality of bunsetsu candidates, the process branches to step S17-5, and only one bunsetsu candidate exists. If there is, return.

【0117】ステップS17−5は、短期学習によって
複数個ある文節の候補を絞り込む処理である。すなわ
ち、文節を構成する自立語が最新使用単語リストWLI
Sに格納されていれば、その文節は短期学習されている
とする。このようにして、各文節の候補に対して短期学
習されているかどうかを調べ、短期学習されている文節
が存在していれば、短期学習されていない文節を候補か
らはずす。このような処理は、同種のかな漢字変換処理
において一般に行われている処理である。この処理を終
えると、ステップS17−6へ進む。
Step S17-5 is a process of narrowing down a plurality of clause candidates by short-term learning. That is, the independent words that make up the phrase are the most recently used word list WLI
If it is stored in S, it is assumed that the phrase has been short-term learned. In this manner, it is checked whether or not each phrase candidate has been short-term learned, and if there is a phrase that has been short-term learned, the phrase that has not been short-term learned is removed from the candidates. Such processing is generally performed in the same type of kana-kanji conversion processing. When this process ends, the flow proceeds to step S17-6.

【0118】ステップS17−6は、ステップS17−
5において、変換する文節の候補が1つに決定できたか
どうかを判定する処理であり、文節の候補がが複数個存
在していればステップS17−7へ分岐し、文節の候補
が1つのみであればリターンする。
The step S17-6 is the step S17-
5 is a process for determining whether or not one bunsetsu candidate to be converted can be determined. If there are a plurality of bunsetsu candidates, the process branches to step S17-7, and only one bunsetsu candidate is present. If so, return.

【0119】ステップS17−7は、上記以外の方法に
よって変換する文節の構造を決定する処理であり、例え
ば、単語の頻度などによって変換する単語を決定する処
理である。このような処理は、同種のかな漢字変換処理
において一般的に行われている処理であり、公知である
ので特に詳細な説明は行わない。処理を終えると、変換
する文節の構造は1つに決定されているので、リターン
する。
Step S17-7 is a process for determining the structure of the phrase to be converted by a method other than the above, and is a process for determining the word to be converted according to the frequency of words, for example. Such a process is a process generally performed in the same type of kana-kanji conversion process and is well known, so a detailed description thereof will not be given. When the processing is completed, the structure of the bunsetsu to be converted is determined to be one, so the process returns.

【0120】図18は、ステップS17−3の「分野で
決定」処理を詳細化したフローチャートである。
FIG. 18 is a detailed flowchart of the "determine by field" process in step S17-3.

【0121】ステップS18−1において、分野モード
BMODの値によって分岐する。分野モードBMODの
値が1であれば、分野処理を行うモードであるのでステ
ップS18−2へ分岐し、分野モードBMODの値が0
であれば、分野処理を行わないモードであるのでリター
ンする。
In step S18-1, the process branches depending on the value of the field mode BMOD. If the value of the field mode BMOD is 1, it is the mode in which the field processing is performed, so the process branches to step S18-2, and the value of the field mode BMOD is 0.
If so, the mode is a mode in which field processing is not performed, and the process returns.

【0122】ステップS18−2において、文節の候補
の中から、対象となる文節を1つ1つ順番に取り出して
いく。ステップS18ー2で文節を取り出すことができ
れば、ステップS18−3においてステップS18−4
へ分岐し、すべての候補を取り出し終え、ステップS1
8ー2で新たな文節を取り出せなかった場合は、ステッ
プS18−3においてステップS18−6へ分岐する。
At step S18-2, the target bunsetsu is taken out one by one from the bunsetsu candidates. If the clause can be extracted in step S18-2, step S18-4 is executed in step S18-3.
Branch to, complete extraction of all candidates, step S1
If a new phrase cannot be extracted in 8-2, the process branches to step S18-6 in step S18-3.

【0123】ステップS18−4において、対象となる
文節に対して、分野による文節尤度、すなわち、分野処
理による文節の確からしさの度合いを求める。この処理
は、ステップS14−4やステップS14−5における
処理と同様の処理であり、すでに図15につき詳述して
いるので、ここでは特に説明しない。この処理を終える
とステップS18−5へ進む。
In step S18-4, for the target bunsetsu, the bunsetsu likelihood by the field, that is, the degree of certainty of the bunsetsu by the field processing is obtained. This processing is the same as the processing in steps S14-4 and S14-5, and since it has already been described in detail with reference to FIG. 15, it will not be particularly described here. When this process ends, the flow proceeds to step S18-5.

【0124】ステップS18−5において、ステップS
18−4で求めた分野による文節尤度を、対象となって
いる文節に対応させて格納して保存する。この処理を終
えると、ステップS18−2へ進む。
In step S18-5, step S
The phrase likelihood by the field obtained in 18-4 is stored and saved in association with the target phrase. When this process ends, the process proceeds to step S18-2.

【0125】ステップS18−6においては、ステップ
S18−5において格納保存した文節の分野による尤度
によって、文節の候補の絞り込みを行う。例えば、文節
の分野による尤度の値が最も高い値を持つ候補のみを残
して、他の文節を候補からはずす。処理を終えるとリタ
ーンする。
In step S18-6, bunsetsu candidates are narrowed down based on the likelihood of the bunsetsu field stored and saved in step S18-5. For example, only the candidate having the highest likelihood value depending on the field of the phrase is left and other phrases are excluded from the candidates. When the processing is completed, it returns.

【0126】図19は、ステップS16−4の「読みで
分野更新」の処理を説明したフローチャートである。
FIG. 19 is a flow chart for explaining the "reading and updating field" processing in step S16-4.

【0127】ステップS19−1は、ステップS16−
1において決定された変換する文節の構造に従って、こ
の文節内の自立語の読みによって分野読み辞書BYDI
を検索する処理である。分野読み辞書BYDIの先頭か
ら自立語の読みと一致する辞書項目を1つ1つ順番に見
つけ出し、見つかるごとにステップS19−2において
ステップS19−3に分岐する。従って、文節内の自立
語の読みが分野読み辞書BYDIの複数の項目に対応す
るときは、各項目についてステップS19ー3の処理が
実行される。分野読み辞書BYDIの最後まで検索を終
えたらリターンする。
The step S19-1 is the step S16-
According to the structure of the phrase to be converted determined in 1, the field reading dictionary BYDI is obtained by reading the independent word in this phrase.
Is a process of searching for. From the head of the field reading dictionary BYDI, dictionary items that match the reading of the independent word are sequentially found one by one, and each time it is found, the process branches to step S19-3 in step S19-2. Therefore, when the reading of the independent word in the phrase corresponds to a plurality of items in the field reading dictionary BYDI, the process of step S19-3 is executed for each item. When the field reading dictionary BYDI has been searched to the end, the process returns.

【0128】ステップS19−3は、ステップS19−
1において見つかった分野読み辞書BYDIの辞書項目
に従って、分野ネットワークの外部入力を更新する処理
である。ステップS19−1において見つかった分野読
み辞書BYDIの辞書項目の内容が、分野が分野iで、
確信度がci とすると、分野ネットワークにおける分野
iに対応するノードに対する外部入力θi の値を、以下
の式のようにする。
The step S19-3 is the step S19-
This is a process of updating the external input of the field network according to the dictionary item of the field reading dictionary BYDI found in 1. If the content of the dictionary item of the field reading dictionary BYDI found in step S19-1 is field i,
If the certainty factor is c i , the value of the external input θ i for the node corresponding to the field i in the field network is expressed by the following equation.

【0129】θi = Zii ここで、Zi は、分野ごとに設定される正の定数であ
る。外部入力をこのように更新することによって、ci
が正の値で、大きければ大きいほどノードiへの外部入
力θi は大きくなり、ノードiの出力値、すなわち、分
野iの尤度Oi は大きくなり、分野iに属する単語が優
先されて変換されやすくなる。また、ciが負の値で、
小さければ小さいほどノードiへの外部入力θi は小さ
くなり(負で絶対値が大きくなり)、ノードiの出力
値、すなわち、分野iの尤度Oi は小さくなり、分野i
に属する単語は変換されにくくなる。
Θ i = Z i c i Here, Z i is a positive constant set for each field. By updating the external input in this way, c i
In There positive value, the external input theta i to node i larger increases, the output value of the node i, i.e., the likelihood O i of the field i is increased by words belonging to the field i has priority It is easy to convert. Also, c i is a negative value,
External input theta i to smaller the node i is smaller becomes small (negative absolute value is large), the output value of the node i, i.e., the likelihood O i of the field i is reduced, the field i
Words belonging to are hard to convert.

【0130】図20は、ステップS11−5の「変換結
果修正」の処理を説明したフローチャートである。
FIG. 20 is a flow chart for explaining the "conversion result correction" processing of step S11-5.

【0131】ステップS20−1は、ステップS11−
4の「読み変換」で変換出力された変換結果の先頭か
ら、文節を1つ1つ順番に取り出してきて、オペレータ
に変換結果として正しいかどうかを問い合わせる処理で
ある。文節を1つ取り出すごとにステップS20−2に
おいてステップS20−3に分岐する。すべての文節を
取り出し終えたら、ステップS20−2においてリター
ンする。
The step S20-1, the step S11-
In this processing, the clauses are taken out one by one from the beginning of the conversion result converted and output by the "reading conversion" in 4, and the operator is inquired whether the conversion result is correct. Each time one clause is taken out, the process branches to step S20-3 in step S20-2. When all the clauses have been taken out, the process returns in step S20-2.

【0132】ステップS20−3において、キーボード
KBからのデータを取り込む。入力されたキーがKET
キーであれば、ステップS20−4においてステップS
20−7に分岐する。KETキー以外のキーが入力され
た場合は、ステップS20−4においてステップS20
−5に分岐する。
At step S20-3, the data from the keyboard KB is fetched. The entered key is KET
If it is a key, step S20-4
Branch to 20-7. If any key other than the KET key is pressed, the step S20 is performed in the step S20-4.
Branch to -5.

【0133】ステップS20−5は、ステップS20−
1で取り出された文節に対して、同音異義語の候補を求
めて表示する処理である。この処理は図21につき詳述
する。処理を終えるとステップS20−6へ進む。
In step S20-5, step S20-
This is a process for obtaining and displaying candidates for homonyms for the phrase extracted in 1. This process will be described in detail with reference to FIG. When the process is completed, the process proceeds to step S20-6.

【0134】ステップS20−6は、ステップS20−
5で表示されている候補の中からオペレータが変換すべ
き候補を選択する処理である。例えば、ステップS20
−5において、各同音異義語に対して番号をつけて表示
しておけば、オペレータは番号を指定して対応する数字
キーを入力することによって、変換すべき候補を選択で
きる。変換すべき候補が選択されたら、ステップS20
−7へ進む。
In step S20-6, step S20-
This is a process in which the operator selects a candidate to be converted from the candidates displayed in 5. For example, step S20
In -5, if each homonym is displayed with a number, the operator can select the candidate to be converted by designating the number and inputting the corresponding numeric key. When a candidate to be converted is selected, step S20
Go to -7.

【0135】ステップS20−7は、分野ネットワーク
の全ノードに対する外部入力を更新する処理である。こ
の処理は図23につき詳述する。処理を終えるとステッ
プS20−8へ進む。
Step S20-7 is a process of updating the external input to all the nodes of the field network. This process will be described in detail with reference to FIG. When the process is completed, the process proceeds to step S20-8.

【0136】ステップS20−8は、対象となる文節に
ついて、オペレータによって選択された変換結果を決定
出力する処理である。この処理は同種のかな漢字変換処
理において一般的に用いられている処理であり、公知で
あるので特に詳細な説明は行わない。処理が終われば、
ステップS20−1へ進む。
Step S20-8 is a process of determining and outputting the conversion result selected by the operator for the target clause. This process is a process generally used in the same type of kana-kanji conversion process and is well known, so a detailed description thereof will not be given. When the processing is over,
It proceeds to step S20-1.

【0137】図21は、ステップS20−5の「同音異
義語表示」処理を説明したフローチャートである。
FIG. 21 is a flow chart for explaining the "homogeneous synonym display" processing of step S20-5.

【0138】ステップS21−1は、対象となる文節に
対する変換候補をすべて抽出する処理である。この処理
は、同種のかな漢字変換処理において一般に用いられて
おり、公知であるので特に詳細な説明は行わない。処理
を終えるとステップS21−2へ進む。
Step S21-1 is a process for extracting all conversion candidates for the target clause. This process is generally used in the same type of kana-kanji conversion process and is well known, so a detailed description thereof will not be given. When the processing is completed, the process proceeds to step S21-2.

【0139】ステップS21−2は、ステップS21−
1で抽出された候補を表示する順番を決定する処理であ
る。この処理は図22において後述する。処理を終える
とステップS21−3へ進む。
The step S21-2 is the step S21-
This is a process of determining the order in which the candidates extracted in 1 are displayed. This process will be described later in FIG. When the process is completed, the process proceeds to step S21-3.

【0140】ステップS21−3は、ステップS21−
1で抽出された変換候補をステップS21−2で決定さ
れた順番で表示する処理である。例えば、各候補に番号
を対応させて表示させる。この処理は、同種のかな漢字
変換処理において一般に用いられており、公知であるの
で特に詳細な説明は行わない。処理を終えるとリターン
する。
The step S21-3 is the step S21-
This is a process of displaying the conversion candidates extracted in 1 in the order determined in step S21-2. For example, a number is displayed corresponding to each candidate. This process is generally used in the same type of kana-kanji conversion process and is well known, so a detailed description thereof will not be given. When the processing is completed, it returns.

【0141】図22は、ステップS21−2の「表示順
序変更」処理を説明したフローチャートである。
FIG. 22 is a flow chart for explaining the "display order change" processing of step S21-2.

【0142】ステップS22−1は、ステップS21−
1で抽出された候補の中から、用例がある候補を取り出
して優先順位の先頭に持ってくる処理である。用例があ
る文節かどうかの判定はステップS17−1で説明して
いるのでここでは特に説明は行わない。処理が終われば
ステップS22−2へ進む。
The step S22-1 is the step S21-
This is a process of extracting a candidate having an example from the candidates extracted in 1 and bringing it to the head of the priority order. The determination as to whether or not the example has a certain phrase has been described in step S17-1 and will not be particularly described here. When the processing ends, the process proceeds to step S22-2.

【0143】ステップS22−2では、分野モードBM
ODの値によって分岐する。分野モードBMODの値が
1であれば、分野処理を行うモードであるのでステップ
S22−3へ分岐し、分野モードBMODの値が0であ
れば、分野処理を行わないモードであるのでステップS
22−4へ分岐する。
In step S22-2, the field mode BM
Branch depending on the value of OD. If the value of the field mode BMOD is 1, it is the mode for performing the field processing, and thus the process branches to step S22-3. If the value of the field mode BMOD is 0, it is the mode for not performing the field processing, so that the step S22-3 is performed.
It branches to 22-4.

【0144】ステップS22−3は、ステップS22−
1で取り出されなかった候補の中から、分野による文節
尤度によって優先する候補を取り出して、ステップS2
2−1で優先した候補の後ろに並べる処理である。例え
ば、対象となる各文節候補に対して、分野による文節尤
度を求め、その値が一定値以上である候補のみを取り出
し、その値の大きい順に、ステップS22−1で優先し
た候補の次に並べる。分野による文節尤度を求める方法
は、すでに図15につき詳述しているので、ここでは特
に説明しない。処理を終えるとステップS22−4へ進
む。
The step S22-3 is the step S22-
From the candidates that are not extracted in step 1, the priority candidate is extracted according to the phrase likelihood depending on the field, and step S2
This is the process of arranging after the candidate that has been prioritized in 2-1. For example, for each target bunsetsu candidate, a bunsetsu likelihood by field is obtained, only candidates whose value is a certain value or more are taken out, and in the descending order of the value, the candidate prioritized in step S22-1 is searched. Line up. The method of obtaining the phrase likelihood according to the field has already been described in detail with reference to FIG. 15, and will not be described here. When the process is completed, the process proceeds to step S22-4.

【0145】ステップS22−4は、ステップS22−
1、ステップS22−3で取り出されなかった候補の中
から、単語学習によって優先する候補を取り出して、ス
テップS22−3で優先した候補の後ろに並べる処理で
ある。例えば、対象となる各文節候補の中で、自立語が
最新使用単語リストWLISに格納されていれば、その
自立語は単語学習されているので、それを自立語とする
文節の候補をステップS22−3で優先した候補の後ろ
に並べる。処理を終えるとステップS22−5へ進む。
In step S22-4, step S22-
1. This is a process of extracting a priority candidate by word learning from the candidates not extracted in step S22-3 and arranging it after the priority candidate in step S22-3. For example, if an independent word is stored in the most recently used word list WLIS among the target bunsetsu candidates, the independent word has been subjected to word learning. Place them behind the candidate that was prioritized in -3. When the processing ends, the process proceeds to step S22-5.

【0146】ステップS22−5は、ステップS22−
1,3ステップS22−3,ステップS22−4で取り
出されなかった候補に対して、他の方法で出力順序を決
定して、ステップS22−4で優先した候補の後ろに並
べる処理である。この処理は、同種のかな漢字変換処理
において一般的に行われている処理である。処理を終え
るとリターンする。
In step S22-5, step S22-
This is a process in which the output order is determined by another method for the candidates that have not been extracted in step S22-3 and step S22-4, and the candidates are arranged after the priority candidate in step S22-4. This process is a process generally performed in the same type of kana-kanji conversion process. When the processing is completed, it returns.

【0147】図23は、ステップS20−7の「外部入
力更新」処理を説明したフローチャートである。
FIG. 23 is a flow chart for explaining the "external input update" processing of step S20-7.

【0148】ステップS23−1では、分野モードBM
ODの値によって分岐する。分野モードBMODの値が
1であれば、分野処理を行うモードであるのでステップ
S23−2へ分岐し、分野モードBMODの値が0であ
れば、分野処理を行わないモードであるのでリターンす
る。
In step S23-1, the field mode BM
Branch depending on the value of OD. If the value of the field mode BMOD is 1, it is the mode for performing the field processing, so the process branches to step S23-2. If the value of the field mode BMOD is 0, the mode is not for the field processing, and the process returns.

【0149】ステップS23−2において、分野ネット
ワークの各ノードに対する外部入力の値、すなわち、分
野外部入力BGAIの各要素の値を更新する。例えば、
外部入力の値が正の値であれば、その値から1を引いた
値に更新し、負の値であれば、その値に1を加えた値に
更新し、値が0であれば、更新は行わない。これは、外
部入力の値が0に近づくように更新していることにな
る。処理を終えるとステップS23−3へ進む。
In step S23-2, the value of the external input to each node of the field network, that is, the value of each element of the field external input BGAI is updated. For example,
If the value of the external input is a positive value, it is updated to a value obtained by subtracting 1 from the value, if it is a negative value, it is updated to a value obtained by adding 1 to the value, and if the value is 0, Do not update. This means that the value of the external input is updated so as to approach 0. When the processing is completed, the process proceeds to step S23-3.

【0150】ステップS23−3は、対象となる単語、
すなわちオペレータによって選択された文節を構成する
自立語によって、分野辞書BDICを検索する処理であ
る。分野辞書BDICの先頭から単語IDによって検索
を行い、単語IDが一致する辞書情報が見つかる度に、
ステップS23−4においてステップS23−5に分岐
する。分野辞書BDICの最後まで検索を終えれば、ス
テップS23−4においてステップS23−6へ分岐す
る。
The step S23-3 is a target word,
That is, it is a process of searching the field dictionary BDIC by the independent words that form the clause selected by the operator. A search is performed by word ID from the beginning of the field dictionary BDIC, and whenever dictionary information with a matching word ID is found,
In step S23-4, the process branches to step S23-5. When the search is completed up to the end of the field dictionary BDIC, the process branches to step S23-6 in step S23-4.

【0151】ステップS23−5は、ステップS23−
3において見つかった辞書情報の内容に従って、対応す
る分野のノードへの外部入力の値、すなわち、分野外部
入力BGAIを更新する処理である。すなわち辞書情報
の分野が分野iで、確信度がci であるとすると、BG
AIにおける分野iの外部入力の値θi に、次の値をセ
ットする。
The step S23-5 is the step S23-
This is a process of updating the value of the external input to the node of the corresponding field, that is, the field external input BGAI according to the content of the dictionary information found in 3. That is, assuming that the field of dictionary information is field i and the certainty factor is c i , BG
Set the following value to the value θ i of the external input of the field i in AI.

【0152】θi = Xii ここで、Xi は、分野ごとに設定される正の定数であ
る。外部入力をこのように更新することによって、ci
が正の値で、大きければ大きいほどノードiへの外部入
力は大きくなり、ノードiの出力値、すなわち、分野i
の尤度Oi は大きくなり、分野iに属する単語が優先さ
れて変換されやすくなる。また、ci が負の値で、小さ
ければ小さいほどノードiへの外部入力は小さくなり、
ノードiの出力値、すなわち、分野iの尤度Oi は小さ
くなり、分野iに属する単語は変換されにくくなる。処
理が終われば、ステップS23−3へ進む。
Θ i = X i c i Here, X i is a positive constant set for each field. By updating the external input in this way, c i
Is a positive value, and the larger it is, the larger the external input to the node i becomes, and the output value of the node i, that is, the field i.
The likelihood O i of is large, and words belonging to the field i are prioritized and easily converted. Also, as c i is a negative value, the smaller it is, the smaller the external input to the node i is,
The output value of the node i, that is, the likelihood O i of the field i is small, and words belonging to the field i are hard to be converted. When the processing ends, the process proceeds to step S23-3.

【0153】ステップS23−6は、対象となる単語の
品詞、すなわちオペレータによって選択された文節を構
成する自立語の品詞によって、外部入力の値、すなわち
分野外部入力BGAIを更新する処理である。ステップ
S15−5において説明したように、特定の品詞は特定
の分野に対応づけられており、その場合の確信度は、一
定値を持つようにすることができる。この処理では、こ
の関係を用いて外部入力を更新する。すなわち、品詞に
対応する分野が分野iであり、確信度をci とすると、
ステップS23−5で用いた式を用いて、分野iの外部
入力の値θi の値をセットする。処理を終えるとリター
ンする。
Step S23-6 is a process of updating the value of the external input, that is, the field external input BGAI, by the part of speech of the target word, that is, the part of speech of the independent word forming the clause selected by the operator. As described in step S15-5, the specific part of speech is associated with the specific field, and the certainty factor in that case can have a constant value. In this process, this input is used to update the external input. That is, if the field corresponding to the part of speech is field i and the certainty factor is c i ,
Using the formula used in step S23-5, the value of the external input value θ i of the field i is set. When the processing is completed, it returns.

【0154】図24は、ステップS10−5の「分野環
境設定」処理を説明したフローチャートである。
FIG. 24 is a flow chart for explaining the "field environment setting" processing of step S10-5.

【0155】ステップS24−1はキーボードからのデ
ータを取り込む処理である。ステップS24−2で取り
込まれたキーの種別を判定し、各キーの処理ルーチンに
分岐する。
Step S24-1 is a process for fetching data from the keyboard. The type of the key fetched in step S24-2 is determined, and the process branches to each key processing routine.

【0156】CLRキーが入力された時はステップS2
4−3へ分岐し、分野ネットワークの各ノードの出力
値、すなわち、分野尤度BYUDの各要素の値を0にす
ることで、分野尤度をクリアする。処理を終えるとリタ
ーンする。
When the CLR key is pressed, step S2
By branching to 4-3 and setting the output value of each node of the field network, that is, the value of each element of the field likelihood BYUD to 0, the field likelihood is cleared. When the processing is completed, it returns.

【0157】MODキーが入力された時はステップS2
4−4へ分岐し、分野モードBMODの値を切り替え
る。すなわち、分野モードBMODの値が1であれば0
にし、0であれば1にすることで、分野の処理を行うか
どうかを切り替える。処理を終えるとリターンする。
When the MOD key is pressed, step S2
It branches to 4-4 and switches the value of the field mode BMOD. That is, 0 if the field mode BMOD value is 1.
If it is 0, it is set to 1 to switch whether or not to process the field. When the processing is completed, it returns.

【0158】CHGキーが入力された時はステップS2
4−5へ分岐し、図9において示したような、その時点
における分野の指定状態を表示する。分野指定の「あ
り」,「なし」は、分野尤度固定フラグBKOTの各要
素の値による判断の結果である。ここでは、対象となる
分野に対応した要素の値が1であれば「あり」と判断
し、0であれば「なし」と判断する。表示が終われば、
ステップS24−6へ進む。
When the CHG key is pressed, step S2
The flow branches to 4-5 to display the designated state of the field at that time, as shown in FIG. The "presence" and "absence" of the field designation are the results of the judgment based on the value of each element of the field likelihood fixed flag BKOT. Here, if the value of the element corresponding to the target field is 1, it is determined to be “present”, and if it is 0, it is determined to be “none”. When the display is finished,
It proceeds to step S24-6.

【0159】ステップS24−6では、更にキーボード
からのデータを取り込む。そしてステップS24−7に
おいて、取り込まれたキーが数字キーであるかどうかを
判定し、数字キーであればステップS24−8へ分岐
し、数字キーでなければステップS24−6へ分岐す
る。
In step S24-6, the data from the keyboard is further fetched. Then, in step S24-7, it is determined whether or not the taken-in key is a numeric key. If it is a numeric key, the process branches to step S24-8, and if it is not a numeric key, the process branches to step S24-6.

【0160】ステップS24−8は、ステップS24−
6で取り込まれた数字キーの数字に対応する分野の指定
を変更する処理である。図9に示されているように、数
字に対応する分野の指定が「あり」であれば「なし」に
変更し、「なし」であれば「あり」に変更する。分野の
指定を「あり」にすることは、対象となる分野に対応し
た分野尤度固定フラグBKOTの要素の値を1にし、さ
らに、対象となる分野に対応した分野尤度BYUDの要
素の値を最大値に設定することである。分野の指定を
「なし」にすることは、、対象となる分野に対応した分
野尤度固定フラグBKOTの要素の値を0にし、さら
に、対象となる分野に対応した分野尤度BYUDの要素
の値を0に設定することである。処理を終えるとリター
ンする。
The step S24-8 is the step S24-
This is a process of changing the designation of the field corresponding to the number of the number key taken in in 6. As shown in FIG. 9, if the designation of the field corresponding to the numeral is “present”, it is changed to “none”, and if “no”, it is changed to “present”. Setting the field to "Yes" sets the value of the element of the field likelihood fixed flag BKOT corresponding to the target field to 1, and further sets the value of the element of the field likelihood BYUD corresponding to the target field. Is set to the maximum value. Setting the field designation to "none" sets the value of the element of the field likelihood fixed flag BKOT corresponding to the target field to 0, and further sets the value of the element of the field likelihood BYUD corresponding to the target field. To set the value to 0. When the processing is completed, it returns.

【0161】本実施例によれば、初めて出現した単語
や、意味的な結合関係を持たない単語に対しても、すで
に使用された単語の情報に従って適切な単語を効果的に
変換結果とすることができる。また、そのために必要な
メモリ容量、計算量も少なくて済む。
According to this embodiment, even for a word that appears for the first time or a word that does not have a semantic connection, an appropriate word can be effectively used as a conversion result according to the information of the already used word. You can Moreover, the memory capacity and the amount of calculation required for that are small.

【0162】すなわち、特開平3−22167で提案さ
れている前述の語ネットワークが単語1つに対して単語
の出現しやすさの度合いを表す尤度を1つ設けているの
に対し、本発明では、単語をグループ化し、1つのグル
ープに対してそのグループに属する単語の出現しやすさ
の度合いを表す尤度を1つ設けるので、尤度や尤度を更
新するために用いるリンクの値などに必要なメモリが大
幅に軽減される。また、更新すべき尤度の数も少ないの
で、計算量も大幅に軽減され、実用的なかな漢字変換を
実現できる。
That is, in contrast to the above-mentioned word network proposed in Japanese Patent Laid-Open No. Hei 3-22167, one likelihood representing the degree of appearance of a word is provided for each word. In this case, since words are grouped and one likelihood representing the degree of appearance of a word belonging to the group is provided for one group, the likelihood and the value of the link used to update the likelihood, etc. The memory required for is greatly reduced. Also, since the number of likelihoods to be updated is small, the amount of calculation is greatly reduced, and practical kana-kanji conversion can be realized.

【0163】[他の実施例]なお、本発明は上述した実
施例に限定されるものではない。
[Other Embodiments] The present invention is not limited to the above embodiments.

【0164】例えば、上記実施例では、意味的に関係が
深い単語の集まりの単位を分野としているが、もっと細
かい単位の集まりにしてもよい。例えば、「自動車」と
「車」のように、意味的にまったく同じ単語の集まりを
単位としてもよいし、「右」と「左」のように意味的な
属性が同じ単語の集まりを単位としてもよい。
For example, in the above-mentioned embodiment, the unit of a group of words having a close semantic relation is used as a field, but a unit of a smaller unit may be used. For example, a group of words that are semantically identical, such as "car" and "car," may be used as a unit, or a group of words that have the same semantic attribute, such as "right" and "left", may be used as a unit. Good.

【0165】また、単語をグループ化する手段として、
単語辞書WDICとは別の分野辞書BDICを用いてい
るが、単語辞書WDIC中にグループの情報を格納して
もよい。
As a means for grouping words,
Although a field dictionary BDIC different from the word dictionary WDIC is used, group information may be stored in the word dictionary WDIC.

【0166】また、分野ネットワークの構成は日本語処
理システムの仕様に応じて構築すればよいものであり、
ノードの出力値の設定やリンクの重みの値の設定、およ
びノードの出力値の更新処理手続き等も、その仕様に応
じて定めればよい。
The field network may be constructed according to the specifications of the Japanese language processing system.
The setting of the output value of the node, the setting of the value of the link weight, the update processing procedure of the output value of the node, and the like may be determined according to the specifications.

【0167】また、分野ネットワークのノードの出力値
の更新処理は、PAによって格納されている手順に基づ
く制御をも実行しているCPUによって制御されている
が、出力値の更新処理を行う専用のハードウェアを用い
てもよい。
Further, although the output value update processing of the node of the field network is controlled by the CPU which also executes the control based on the procedure stored in the PA, it is dedicated to the output value update processing. Hardware may be used.

【0168】また、単語と分野の関係の度合いを表すも
のとして確信度を用いていたが、処理を簡単にするため
に確信度はすべて正の一定値を持つものとして扱い、確
信度を省略してもよい。
Although the certainty factor is used as a measure of the degree of relationship between a word and a field, the certainty factor is treated as having a positive constant value in order to simplify the processing, and the certainty factor is omitted. May be.

【0169】また、かな漢字変換において文節の区切り
を決定する際、図13に示されるように、用例による決
定と分野による決定と短期学習による決定とその他の方
法による決定を、この順番に適用して決定しているが、
この決定アルゴリズムは種々変形可能である。例えば、
この順番の逆の順序で適用して決定してもよいし、それ
ぞれの決定方法をすべての候補に対して行い、それぞれ
の処理結果に所定の重み付けを行い、総合的に判断して
もよい。
Further, when deciding a paragraph break in kana-kanji conversion, as shown in FIG. 13, the decision by example, the decision by field, the decision by short-term learning and the decision by other methods are applied in this order. I have decided,
This decision algorithm can be variously modified. For example,
The determination may be performed by applying in the reverse order of this order, or each determination method may be performed for all candidates and a predetermined weighting may be given to each processing result to make a comprehensive determination.

【0170】また、かな漢字変換における文節の区切り
を決定する方法の1つに、短期学習による決定がある
が、以上の実施例では、2文節のうち、いずれか一方で
も短期学習されていれば優先されていたが、この方法で
は、両方の文節が短期学習されている候補と、一方の文
節のみが短期学習されている候補が同等に扱われること
になる。そこで、両方の文節が短期学習されている候補
と、一方の文節のみが短期学習されている候補が存在す
る場合は、両方の文節が短期学習されている候補のみを
優先させるようにしてもよい。例えば、「ここではきも
のを」という読みに対して、「ここで/はきものを(履
物を)」という2文節と「ここでは/きものを(着物
を)」という2文節が可能である。この時、最新使用単
語リストWLISに、「ここ」と「きもの(着物)」が
登録されており、「履物」は登録されていなかった場
合、「ここでは/きものを(着物を)」の区切りには両
方の文節が短期学習されているが、「ここで/はきもの
を(履物を)」の区切りには一方の文節しか短期学習さ
れていないことになり、「ここでは/きものを(着物
を)」の区切りのみが残されることになる。
Further, one of the methods for determining the segment breaks in the kana-kanji conversion is the determination by short-term learning. In the above embodiment, if either one of the two phrases has been short-term learned, it is prioritized. However, in this method, a candidate whose both clauses have been short-term learned and a candidate whose only clause has been short-term learned are treated equally. Therefore, if there is a candidate in which both clauses are short-term learned and a candidate in which only one clause is short-term learned, only the candidate in which both clauses are short-term learned may be prioritized. .. For example, in response to the reading "here, kimono", two clauses, "here / footwear (footwear)" and "here / kimono (kimono)" are possible. At this time, if “here” and “kimono (kimono)” are registered in the latest word list WLIS, and “footwear” is not registered, “here / kimono (kimono)” delimiter Both bunsetsu are learned for a short period of time, but only one bunsetsu is learned for a short time in the delimiter of "here / footwear (footwear)". Only the break of "))" will be left.

【0171】また、かな漢字変換において変換する単語
を決定する際、図17に示されるように、用例による決
定と分野による決定と短期学習による決定とその他の方
法による決定を、この順番に適用して決定しているが、
この決定アルゴリズムも、区切り決定と同様、種々変形
可能である。例えば、この順番の逆の順序で適用して決
定してもよいし、それぞれの決定方法をすべての候補に
対して行い、それぞれの処理結果に所定の重み付けを行
い、総合的に判断してもよい。
Further, when determining a word to be converted in the kana-kanji conversion, as shown in FIG. 17, the determination by the example, the determination by the field, the determination by the short-term learning, and the determination by other methods are applied in this order. I have decided,
This determination algorithm can also be modified in various ways, as in the case of delimitation determination. For example, it may be applied in the reverse order of this order to make a decision, or each decision method may be applied to all candidates and a predetermined weight may be given to each processing result to make a comprehensive decision. Good.

【0172】また、かな漢字変換において、文節に対す
るすべての同音異義語の変換候補の表示順序を決定する
際、図22に示されるように、用例による決定と分野に
よる決定と短期学習による決定とその他の方法による決
定を、この順番に適用して決定しているが、この決定ア
ルゴリズムも種々変形可能である。例えば、この順番の
逆の順序で適用して決定してもよいし、それぞれの決定
方法をすべての候補に対して行い、それぞれの処理結果
に所定の重み付けを行い、総合的に判断してもよい。
Further, in the kana-kanji conversion, when determining the display order of all the homonymous conversion candidates for a phrase, as shown in FIG. 22, determination by example, determination by field, determination by short-term learning and other The determination by the method is applied in this order to determine, but this determination algorithm can be variously modified. For example, it may be applied in the reverse order of this order to make a decision, or each decision method may be applied to all candidates and a predetermined weight may be given to each processing result to make a comprehensive decision. Good.

【0173】また、以上の説明において、分野ネットワ
ークのノードの値の更新処理は、かな漢字変換とは独立
に実行されているが、かな漢字変換の特定の処理と同期
を取りながら実行されてもよい。例えば、ステップS2
0−7で、分野ネットワークのノードへの外部入力の値
を更新した後に、ノードの値の更新処理を逐次連鎖的に
実行してもよい。
Further, in the above description, the updating process of the value of the node of the field network is executed independently of the kana-kanji conversion, but it may be executed in synchronization with the specific process of the kana-kanji conversion. For example, step S2
After updating the value of the external input to the node of the field network at 0-7, the updating process of the value of the node may be sequentially executed in a chain.

【0174】また、以上の説明において、分野ネットワ
ークの各ノードは相互結合されていたが、必ずしも全て
相互結合されている必要はない。また、ノードの値の更
新が連鎖的に行われる必要もない。例えば、分野iに確
信度ci で属する単語が変換する単語として決定された
時に、ステップS20−7において外部入力の更新を行
っていたところでのみ、すべてのノードに対して次の式
によってノードの値を更新するようにしてもよい。
Further, in the above description, the nodes of the field network are mutually connected, but it is not always necessary that all nodes are mutually connected. Further, the updating of the value of the node does not have to be performed in a chain. For example, when the word belonging to the field i with the certainty factor c i is determined as the word to be converted, only when the external input is updated in step S20-7, the node expression The value may be updated.

【0175】Oj(t+1)=f(uj(t+1)) uj(t+1)=δuj(t)+(1−δ)Vjii ここで、Oj(t)は、ノード分野jの時刻tにおける出力
値 uj(t)は、ノード分野jの時刻tにおける内部状態値 fは、上限,下限を持つ単調増加関数 δは、0≦δ≦1の定数 ここで、Vjiは、分野iの単語が変換する単語として決
定された時に分野jに対応するノードの値に影響を与え
る度合いであり、分野iと分野jとの間の関係が深いほ
ど、すなわち、分野iに属する単語と、分野jに属する
単語が共起しやすいほど、大きな値を取る。
O j (t + 1) = f (u j (t + 1)) u j (t + 1) = δu j (t) + (1-δ) V ji c i where O j ( t) is an output value u j (t) of the node field j at time t, an internal state value f of the node field j at time t, a monotonically increasing function δ having upper and lower limits, and 0 ≦ δ ≦ 1 Here, V ji is the degree of affecting the value of the node corresponding to the field j when the word of the field i is determined as the word to be converted, and the deeper the relationship between the field i and the field j is, That is, the larger the co-occurrence of the word belonging to the field i and the word belonging to the field j, the larger the value.

【0176】その他、本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。
In addition, the present invention can be variously modified and implemented without departing from the scope of the invention.

【0177】また、本発明は、単体の装置に限らず、複
数の装置からなるシステムにも適用可能であり、更に、
装置またはシステムに、ソフトウェアを提供することに
よっても、実現可能であることは、言うまでもない。
The present invention is applicable not only to a single device but also to a system composed of a plurality of devices.
It goes without saying that it can be realized by providing software to the device or system.

【0178】[0178]

【発明の効果】以上の説明から明らかなように本発明に
よれば、意味的に関係が深い単語の集まりをグループと
してまとめ、グループに属する単語の出現のしやすさの
度合いを表すグループ尤度を各グループに対応させ、使
用された単語が属するグループに従ってグループ尤度を
更新させ、かな漢字変換では同音異義語の中から単語が
属するグループに対応したグループ尤度の値が最も大き
い単語を変換結果とするので、初めて出現した読みや、
意味的な結合関係のない単語の読みに対しても、すでに
使用された単語の情報によって適切な単語を変換結果と
して決定することが、少ないメモリ容量,少ない計算量
で実現できる。
As is apparent from the above description, according to the present invention, a group likelihood that represents a degree of easiness of appearance of words belonging to a group by grouping a group of words having a semantically close relationship. Is associated with each group, and the group likelihood is updated according to the group to which the used word belongs, and in the Kana-Kanji conversion, the word with the largest group likelihood value corresponding to the group to which the word belongs among the homonyms is converted. So, the reading that first appeared,
Even for the reading of words having no semantic connection, it is possible to determine an appropriate word as a conversion result based on the information of already used words with a small memory capacity and a small calculation amount.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の全体構成のブロック図である。FIG. 1 is a block diagram of the overall configuration of the present invention.

【図2】単語辞書WDICの構成例を示した図である。FIG. 2 is a diagram showing a configuration example of a word dictionary WDIC.

【図3】用例辞書YDICの構成例を示した図である。FIG. 3 is a diagram showing a configuration example of an example dictionary YDIC.

【図4】分野辞書BDICの構成例を示した図である。FIG. 4 is a diagram showing a configuration example of a field dictionary BDIC.

【図5】分野読み辞書BYDIの構成例を示した図であ
る。
FIG. 5 is a diagram showing a configuration example of a field reading dictionary BYDI.

【図6】分野ネットワークの構成例を示した図である。FIG. 6 is a diagram showing a configuration example of a field network.

【図7】分野尤度BYUF,分野内部状態BNAI,分
野外部入力BGAI,分野尤度固定フラグBKOTの構
成例を示した図である。
FIG. 7 is a diagram showing a configuration example of a field likelihood BYUF, a field internal state BNAI, a field external input BGAI, and a field likelihood fixed flag BKOT.

【図8】分野ウェイトBWAIの構成例を示した図であ
る。
FIG. 8 is a diagram showing a configuration example of a field weight BWAI.

【図9】分野指定画面の構成例を示した図である。FIG. 9 is a diagram showing a configuration example of a field designation screen.

【図10】文字処理装置の動作を示すフローチャートで
ある。
FIG. 10 is a flowchart showing the operation of the character processing device.

【図11】かな漢字変換の動作を示すフローチャートで
ある。
FIG. 11 is a flowchart showing an operation of kana-kanji conversion.

【図12】読み変換の動作を示すフローチャートであ
る。
FIG. 12 is a flowchart showing an operation of reading conversion.

【図13】区切り決定の動作を示すフローチャートであ
る。
FIG. 13 is a flowchart showing an operation of determining a break.

【図14】区切りを分野で決定する動作を示すフローチ
ャートである。
FIG. 14 is a flowchart showing an operation of determining a break in a field.

【図15】分野による文節尤度を求める動作を示すフロ
ーチャートである。
FIG. 15 is a flowchart showing an operation of obtaining a phrase likelihood according to a field.

【図16】変換結果決定の動作を示すフローチャートで
ある。
FIG. 16 is a flowchart showing an operation of determining a conversion result.

【図17】変換単語決定の動作を示すフローチャートで
ある。
FIG. 17 is a flowchart showing an operation of determining a converted word.

【図18】変換する単語を分野で決定する動作を示すフ
ローチャートである。
FIG. 18 is a flowchart showing an operation of determining a word to be converted in a field.

【図19】読みで分野外部入力を更新する動作を示すフ
ローチャートである。
FIG. 19 is a flowchart showing an operation of updating a field external input by reading.

【図20】変換結果修正の動作を示すフローチャートで
ある。
FIG. 20 is a flowchart showing an operation of correcting a conversion result.

【図21】同音異義語表示の動作を示すフローチャート
である。
FIG. 21 is a flowchart showing an operation of homonym display.

【図22】表示順序変更の動作を示すフローチャートで
ある。
FIG. 22 is a flowchart showing the operation of changing the display order.

【図23】外部入力更新の動作を示すフローチャートで
ある。
FIG. 23 is a flowchart showing an operation of updating an external input.

【図24】分野環境設定の動作を示すフローチャートで
ある。
FIG. 24 is a flowchart showing an operation for setting a field environment.

【符号の説明】[Explanation of symbols]

CPU マイクロプロセッサ AB アドレスバス CB コントロールバス DB データバス ROM 読出し専用メモリ NK プログラムエリア PA プログラムエリア RAM ランダムアクセスメモリ WDIC 単語辞書 YDIC 用例辞書 BDIC 分野辞書 BYDI 分野読み辞書 BYUD 分野尤度 BNAI 分野内部状態 BGAI 分野外部入力 BWAI 分野ウェイト BKOT 分野尤度固定フラグ BMOD 分野モード WLIS 最新使用単語リスト DISK 外部メモリ KB キーボード KID 変換開始指示キー SET 環境設定起動キー JUS 住所録作成機能起動キー KET 候補決定指示キー CHG 分野指定キー CLR 分野尤度クリアキー MOD 分野モード切替キー CR カーソルレジスタ DBUF 表示用バッファメモリ CRTC CRTコントローラ CRT 表示装置 CG キャラクタジェネレータ CPU Microprocessor AB Address bus CB Control bus DB Data bus ROM Read only memory NK Program area PA Program area RAM Random access memory WDIC Word dictionary YDIC example dictionary BDIC field dictionary BYDI field reading dictionary BYUD field likelihood BNAI field Internal state BGAI field External Input BWAI field weight BKOT field likelihood fixed flag BMOD field mode WLIS latest word list DISK external memory KB keyboard KID conversion start instruction key SET environment setting activation key JUS address book creation function activation key KET candidate determination instruction key CHG field designation key CLR Field likelihood clear key MOD Field mode switching key CR Cursor register DBUF Display buffer memory CRTC CRT controller CRT display device CG character generator

───────────────────────────────────────────────────── フロントページの続き (72)発明者 小林 雄二 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 (72)発明者 正木 克己 東京都大田区下丸子3丁目30番2号キヤノ ン株式会社内 ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Yuji Kobayashi 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Katsumi Masaki 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Within the corporation

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 入力されたかな文字列を、単語の読みが
なと表記を含む該単語の情報とを対応させて記憶した辞
書を参照して、漢字かな混じり文に変換するかな漢字変
換処理を実行する文字処理方法において、 前記辞書に格納されている単語群に対して、複数のグル
ープを定義し、 文書入力時における前記グループに属する単語の出現し
やすさを示すグループ尤度を各グループごとに記憶し、 前記かな漢字変換処理によって変換された単語が属する
グループに応じて、少なくとも1つの前記グループに対
応する前記グループ尤度を更新し、 前記かな漢字変換処理では、変換対象のかな文字列に対
する文節の構造の候補の中から、該候補を構成する語句
が属するグループに対応するグループ尤度を比較して、
変換すべき文節の構造を決定することを特徴とする文字
処理方法。
1. A kana-kanji conversion process for converting an input kana character string into a kanji-kana mixed sentence by referring to a dictionary in which the pronunciation of a word and the information of the word including the notation are stored in association with each other. In the character processing method to be executed, a plurality of groups are defined for the word group stored in the dictionary, and a group likelihood indicating the likelihood of appearance of words belonging to the group at the time of document input is set for each group. The group likelihood corresponding to at least one of the groups is updated according to the group to which the word converted by the kana-kanji conversion processing belongs, and in the kana-kanji conversion processing, the phrase for the kana character string to be converted is stored. From the candidates of the structure of, by comparing the group likelihood corresponding to the group to which the words constituting the candidate belong,
A character processing method characterized by determining the structure of a phrase to be converted.
【請求項2】 前記複数のグループ間の関連の度合いを
記憶しておき、前記グループ尤度の更新において、当該
度合いに基づいて、前記変換された単語が属するグルー
プ以外のグループのグループ尤度を更新することを特徴
とする請求項1の文字処理方法。
2. The degree of association between the plurality of groups is stored, and in updating the group likelihood, the group likelihoods of groups other than the group to which the converted word belongs are updated based on the degree. The character processing method according to claim 1, which is updated.
【請求項3】 前記複数のグループの中から所望の1ま
たは複数のグループを指定して、前記グループ尤度の更
新対象より除外可能とすることを特徴とする請求項2の
文字処理方法。
3. The character processing method according to claim 2, wherein one or more desired groups are designated from the plurality of groups so that they can be excluded from the update targets of the group likelihood.
【請求項4】 決定される前記文節の構造は、文節の区
切り位置を含むことを特徴とする請求項1の文字処理方
法。
4. The character processing method according to claim 1, wherein the structure of the determined phrase includes a delimiter position of the phrase.
【請求項5】 単語の読みがなと表記を含む該単語の情
報とを対応させて記憶した辞書と、 文字を入力する入力手段と、 前記入力手段によって入力されたかな文字列を、前記辞
書を参照して漢字かな混じり文に変換するかな漢字変換
手段と、 単語に対して当該単語の属するグループを記憶するグル
ープ情報記憶手段と、 前記グループに属する単語の出現しやすさを、グループ
尤度として各グループごとに記憶するグループ尤度記憶
手段と、 前記かな漢字変換手段によって、変換された単語が属す
るグループに応じて、少なくとも1つの前記グループに
対応する前記グループ尤度を更新するグループ尤度更新
手段と、 前記かな漢字変換手段による変換対象のかな文字列に対
する文節の構造の候補の中から、該候補を構成する語句
が属するグループに対応するグループ尤度を比較して、
変換すべき文節の構造を決定する変換制御手段とを有す
ることを特徴とする文字処理装置。
5. A dictionary in which word reading and word information including notation are stored in association with each other, input means for inputting characters, and kana character strings input by the input means are stored in the dictionary. Kana-kanji conversion means for converting to kanji-kana mixed sentences, group information storage means for storing a group to which a word belongs, and easiness of appearance of words belonging to the group as a group likelihood. Group likelihood storing means for storing each group, and group likelihood updating means for updating the group likelihood corresponding to at least one of the groups according to the group to which the converted word belongs by the kana-kanji converting means. And among the candidates of the structure of the bunsetsu for the kana character string to be converted by the kana-kanji conversion means, the phrase to which the candidate belongs belongs. Group likelihoods corresponding to
A character processing device comprising: a conversion control unit that determines a structure of a phrase to be converted.
JP34506491A 1991-12-26 1991-12-26 Character processing method and apparatus Expired - Fee Related JP3320087B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34506491A JP3320087B2 (en) 1991-12-26 1991-12-26 Character processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34506491A JP3320087B2 (en) 1991-12-26 1991-12-26 Character processing method and apparatus

Publications (2)

Publication Number Publication Date
JPH05174005A true JPH05174005A (en) 1993-07-13
JP3320087B2 JP3320087B2 (en) 2002-09-03

Family

ID=18374046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34506491A Expired - Fee Related JP3320087B2 (en) 1991-12-26 1991-12-26 Character processing method and apparatus

Country Status (1)

Country Link
JP (1) JP3320087B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423298A1 (en) 2006-07-06 2012-02-29 Nippon Oil Corporation Compressor oil composition

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423298A1 (en) 2006-07-06 2012-02-29 Nippon Oil Corporation Compressor oil composition

Also Published As

Publication number Publication date
JP3320087B2 (en) 2002-09-03

Similar Documents

Publication Publication Date Title
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
CA1203916A (en) Method and apparatus for automated spelling correction
JP3320087B2 (en) Character processing method and apparatus
CN108829266A (en) Syllable complementing method and device, storage medium and electronic equipment
JP2951956B2 (en) Character processing apparatus and method
JPH07334499A (en) Input device for character string
JP3847812B2 (en) Character processing method and apparatus
JP3266755B2 (en) Chinese information processing device
KR102668118B1 (en) Learning device and learning method for natural language-based video search
JP3873305B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP2756252B2 (en) Character processor
JP2832003B2 (en) Character processor
JP3041002B2 (en) Kana-kanji conversion method and kana-kanji conversion device
JPH10187696A (en) Method and device for document processing
JPH10334114A (en) Document retrieval device and storage medium where document retrieval program is recorded
JPH0567079A (en) Word processor
JP2003173332A (en) Kana-kanji conversion method and character processor
JP3768597B2 (en) Character processing method and apparatus
JP2662392B2 (en) Character processor
JPH10187705A (en) Method and device for document processing
JPH1125087A (en) Character processor, its method and recording medium
JPH05233604A (en) Word registering method
JPH07200568A (en) Character processor
JPH1125079A (en) Character processor and method therefor and recording medium
JPH0675943A (en) Kana-kanji conversion device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20001205

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080621

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090621

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees