JPS6223909B2 - - Google Patents
Info
- Publication number
- JPS6223909B2 JPS6223909B2 JP55044489A JP4448980A JPS6223909B2 JP S6223909 B2 JPS6223909 B2 JP S6223909B2 JP 55044489 A JP55044489 A JP 55044489A JP 4448980 A JP4448980 A JP 4448980A JP S6223909 B2 JPS6223909 B2 JP S6223909B2
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- word
- key
- character
- kanji
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000006243 chemical reaction Methods 0.000 claims description 336
- 240000000220 Panda oleosa Species 0.000 claims description 53
- 235000016496 Panda oleosa Nutrition 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 44
- 230000015654 memory Effects 0.000 description 38
- 238000004260 weight control Methods 0.000 description 27
- 101100464070 Arabidopsis thaliana PIGM gene Proteins 0.000 description 26
- 101100520635 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PNT1 gene Proteins 0.000 description 26
- 238000010586 diagram Methods 0.000 description 26
- 238000000034 method Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 18
- 230000021615 conjugation Effects 0.000 description 14
- 238000003825 pressing Methods 0.000 description 11
- 102100028538 Guanylate-binding protein 4 Human genes 0.000 description 10
- 101001058851 Homo sapiens Guanylate-binding protein 4 Proteins 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 230000007704 transition Effects 0.000 description 4
- 101100465519 Arabidopsis thaliana MPA1 gene Proteins 0.000 description 3
- 101100300012 Mannheimia haemolytica purT gene Proteins 0.000 description 3
- 101100067996 Mus musculus Gbp1 gene Proteins 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 101100111947 Arabidopsis thaliana CYP72C1 gene Proteins 0.000 description 1
- 101100256876 Dictyostelium discoideum shkA gene Proteins 0.000 description 1
- 101100241858 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) OAC1 gene Proteins 0.000 description 1
- 101100258025 Schizosaccharomyces pombe (strain 972 / ATCC 24843) shk1 gene Proteins 0.000 description 1
- 101100256875 Schizosaccharomyces pombe (strain 972 / ATCC 24843) shk2 gene Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 101150092906 pmt1 gene Proteins 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Description
[技術分野]
本発明は仮名、ローマ字、英語の如き第1の文
字を入力して、該仮名、ローマ字に対応する同音
語漢字群もしくは日本語群の如き第2の文字群の
中より所望の第2の文字を選択して第1の文字を
第2の文字に変換する文字処理装置に関するもの
である。
[従来技術]
第1の文字を第2の文字に変換するに際して、
複数の第2の文字が有る場合は、この第2の文字
を順次出力するものがある。例えば表示器上にお
いて入力された第1の文字等と変換された第2の
文字を混在させた文章の形で表示する訳である
が、複数の第2の文字の長さが等しいとは限らな
い。この様な場合出力された第2の文字に引続い
て第1の文字等を出力してしまうと、前記第2の
文字が適切でなくて新たな第2の文字を出力する
度に、第2の文字に引続く第1の文字等の位置が
ずれてしまい非常に見にくいものである。
[目的]
そこで本発明においては、複数の第2の文字の
内短い第2の文字を出力するに際しては空白を付
加して出力する如く構成することにより上述の如
き欠点を取り除いたものである。
本願発明の目的は、仮名/漢字混じりの文中の
候補文字列が複数存在する当該位置において、表
示される候補文字列のうち、最多文字数の候補文
字列が表示可能な領域を上記当該位置に設定し、
その領域内において、候補文字列を1つずつ切換
え表示する様にして、該切換え表示を行つても後
続する文の並びを乱すことがない様にし、見やす
く、文の編集が容易で、ミスが少なく操作性の良
い文字処理装置を提供することにある。
以下本発明による一実施例を図面を用いて説明
するが、説明を始めるにあたつて本実施例におい
て使われる用語の説明を簡単に行う。
第1の文字あるいは第1の文字列とは、本装置
に対する初期入力の文字あるいは文字列を指す。
第2の文字あるいは第2の文字列とは、第1の文
字あるいは第1の文字列が本装置により変換され
た結果の文字あるいは文字列を指す。又第2の文
字列は一義的に決まるものではなく、部分的に複
数個の変換された文字を含むことがある。
変換単位とは、第1の文字列の内、第2の文字
列への変換のために特別に指定された範囲の文字
又は文字列を指す。
変換語とは、第2の文字又は第2の文字列の
内、第1の文字又は第1の文字列に含まれる変換
単位に対応する文字又は文字列を指す。
語とは、変換語を構成する最小単位である。即
ち、変換語は単数個あるいは複数個の語から成り
立つ。
以上の用語の説明を具体的に例をとつて説明す
る。今、“〓きほんてき〓な”という入力文字列
が“基本的な”という出力文字列に変換されたと
すると、上記用語はそれぞれ下記の様になる。
第1の文字列 “〓きほんてき〓な”
第2の文字列 “基本的な”
変換単位 “きほんてき”
変 換 語 “基本的”
語 “基本”及び“的”
さてここで第1図に示すのは本発明の一実施例
であるところの文字変換装置を示すものである
が、この文字変換装置11は前記第1の文字列及
び種々の命令等を入力するキーボード12、前記
第1の文字列に対応する第2の文字列を表示する
CRTの如きスクリーン13、スクリーン13上
に表示された第2の文字列を記録紙14上に記録
するべく文字変換装置筐体内に収納された不図示
の記録装置、及び前記筐体内もしくは不図示の別
個の筐体内に収納された前記第1の文字列を第2
の文字列に変換処理する処理部より成るものであ
る。
この文字変換装置の詳細な説明を始める前に、
前記キーボード12上のキーの機能について説明
することにより、文字変換装置の概略の機能につ
いて説明する。
第1図において15で示すのは前記第1の文字
列を入力するためのキー群KB1であり、後述の
選択キーにより入力文字を選択することにより、
それぞれのキートツプ上に表記されている信号の
1つに対応する情報を入力するものである。即
ち、16で示すのは和文字を入力するか英文字を
入力するかを選択する選択キーであり、ローマ字
で入力するか仮名で入力するかを選択するキー1
7と共働して以下の如く入力文字を決定するもの
である。
即ち、キー16を和文字入力モードとした状態
でキー17をローマ字入力モードとすると、キー
群15のアルフアベツトを付したキーを操作して
ローマ字入力することができ、この入力されたロ
ーマ字は仮名に変換されて前記処理部において処
理された表示に際しても仮名もしくは仮名漢字ま
じりで表示されるものである。又この状態でキー
17と仮名モードとすると、キー群15の仮名を
付したキーを操作して仮名入力することができる
ものである。
前記キー16を英文字入力モードとした時は、
キー群15のアルフアベツトを付したキーを操作
して前記キー17のモードとは無関係に英文字を
そのまま(ローマ字としてではなく)処理部にお
いて処理し、表示に際しても英文字のまま表示す
るものである。
18で示すキーは前記キー16が和文モードの
時用いるものであり、前記キー17が仮名モード
の時該キー18を押すことにより平仮名の小文字
又はキー15−44,15−45のキートツプの
右端に表示した記号を入力するものであり、前記
キー17がローマ字モードの時は入力されたロー
マ字を平仮名の小文字に変換して処理部で処理す
るものである。
19で示すキーは平仮名の大文字を入力するか
英文字の小文字を入力するかを選択するキーであ
り、前記キー16が和文モードで前記キー17が
仮名モードの時、キー群15において仮名が付さ
れたキーを操作することにより平仮名の大文字を
入力し、前記キー17がローマ字モードの時はキ
ー群15において英文字を付したキーを操作して
ローマ字入力することにより、該ローマ字が平仮
名の大文字に変換されて処理部に入力するもので
ある。
又前記キー16を英文字入力モードとした状態
でキー19を英文字小文字モードとすることによ
り、キー群15において英文字が付されたキーを
操作することにより英文字の小文字を入力するも
のである。
なおかかるキー16,18,19はシフトキー
SHK1を構成するものである。
20で示すキーはスペースキーであり、このキ
ー20を押すことにより入力した文字間にスペー
スを形成するものである。
21で示すのは片仮名小文字及びキートツプ
(例えば15−44,15−45)の左端に表記
してある記号を入力するためのキーであり、キー
16を和文字入力モードとしたキー17を仮名入
力モードとしておくならば、キー群15において
仮名を付したキーを操作することにより該仮名を
片仮名小文字として入力し、キー17をローマ字
入力モードとするならば入力されたローマ字を対
応する仮名の小文字に変換して入力するものであ
る。
22で示すキーは片仮名大文字を入力するか、
英大文字を入力するかを選択するキーであり、キ
ー16を和文モードとしてキー17を仮名モード
とすることにより、キー群15において仮名を付
したキーを操作することにより片仮名大文字を入
力することができ、キー17をローマ字モードと
することにより、キー群15において英文字を付
したキーを操作して入力したローマ字を片仮名大
文字に変換して入力することができるものであ
る。なおかかるキー21,22でシフトキー
SHK2を構成しているものである。
23で示すのは漢字に変換すべき文字の入力開
始もしくは入力終了を知らせるキーであり、該キ
ー23の押下が奇数回目の押下であることを検知
して漢字に変換すべき文字の入力が開始すること
を報知する開始信号を発生し、該キー23の押下
が偶数回目の押下であることを検知して漢字に変
換すべき文字の入力が終了したことを報知する終
了信号を発生するものである。
24で示すキーはカーソルキーであり、スクリ
ーン13上に現われるカーソルを1文字相当分ず
つ移動して所望の場所に移動させるためのもので
ある。
25で示すのは初期セツトキーであり、本文字
変換装置11の使用に先だつて押下することによ
り処理部を初期状態に設定するためのものであ
る。26で示すのは編集キーであり、スクリーン
13上に表示された第2文字列において、複数個
の変換語が存在する個所を探すことを指令するキ
ーである。
27で示すのはプリント指令キーであり、スク
リーン13上に表示された第2文字列を記録紙1
4上に記録することを指令するキーである。
28で示すのは、第1文字列が第2文字列に変
換され、変換語が複数個存在した場合にスクリー
ン上に表示されている1つの変換語が正しい変換
語であることを指示するキーであり、キー29は
誤つた変換語であることを指示し、このキー29
を押すことによりスクリーン上には他の変換語が
表示されるものである。従つて正しい変換語がス
クリーン13上に表示されるまでキー29を押
し、正しい変換語が表示された時キー28を押す
ことにより、該正しい変換語が選択されることと
なる。
キー30は前記キー29とその機能は同じもの
であるが、変換語の表示順序を前記キー29と逆
方向としてあるものである。
キー31は表示されている第2文字列(変換
語)を第1の文字列(変換単位)に変換すること
を指示するキーである。
32で示すのはキー群15より入力した第1の
文字列を処理部において第2の文字列に変換して
スクリーン13上に表示する自動変換モード、も
しくはキー群15より単漢字に相当する文字を入
力し、該入力した文字に対応するすべての漢字を
スクリーン13上に表示し、この表示された単漢
字より所望の漢字を選択する単漢字入力モードを
選択するキーである。
33で示すのは数値キー34を用いて漢字コー
ドを直接入力する直接入力モードと、キー群15
により第1文字列を入力することにより処理部よ
り第2文字列を出力する間接入力モードとを選択
するキーである。
上述の如き機能を有するキーを用いて、第2図
に示す原稿に従つて入力をし、第5図に示す如き
出力をスクリーン13上に得るための操作につい
て説明する。
先ず平仮名で入力する場合は、先ずキー25で
初期リセツトをした後キー16を和文モードと
し、キー17を仮名モードとし、キー19を平仮
名大字モードとする。但し第3図において丸印で
示した文字37−1は小文字平仮名であるので、
この文字を入力する時はキー18を押す。
そうして第3図に示す如くキー23を押して漢
字に変換すべき文字入力の開始を報知した後キー
群15を操作して漢字に変換すべき仮名“こんか
い”を入力し、しかる後キー23を押して漢字に
変換すべき文字の入力が終つたことを報知し、こ
れに続いて仮名“の”を入力し、と言う具合に仮
名で第3図に示す如く順次入力していく。
後述の如く本実施例による文字変換装置におい
ては、キーボード12から点「、」丸「。」等の文
章の区切れを示す信号が入力されることにより、
第1の文字列から第2の文字列への変換を開始す
るものであるので、点36が入力されたならば第
2の文字列が第5図の如くスクリーン13上に表
示される。そして更に第3図の如くして入力が続
けられ、最後の丸37が入力されたならば、第5
図に示す如くすべての第2の文字列が表示され
る。
なお、第3図において35で示す記号はキー2
3が押されたことを示す記号である。
この第5図において※で示す記号38が付され
ている変換語は表示されている語以外にも同音語
が存在していることを示しているものである。換
言するならば記号38が付されていない変換語
は、入力された文字に対して一義的に決定する変
換語である。
この様にしてすべての入力が終了したならば、
次はキー26を押すとカーソル39が最初の記号
38−1の位置に配置される。
このカーソル39が指示する変換語“基本的”
は正しい変換語であるのでキー28を押すと、カ
ーソル39は次の記号38−2の下まで移動す
る。
カーソル39が指示する変換語“以降”も正し
い変換語であるのでキー28を押すと、カーソル
39は次の記号38−3の下まで移動する。
カーソル39が指示する変換語“帰途”は誤つ
ているのでキー29を押す次の同音語“企図”が
前記“帰途”の替りにスクリーン13上に表示さ
れる。
この変換語“企図”は正しい変換語であるので
キー28を押すと、この変換語“企図”が選択さ
れる。
この様にしてすべての編集が終了したならば、
キー27を押すことにより、スクリーン13上に
表示されている第2文字列をそのまま記録紙14
上に記録するものである。
次にローマ字モードで入力する場合を例にとり
本装置を更に詳細に説明するならば、キー16を
和文モードとし、キー17をローマ字モードと
し、キー19を平仮名大文字モードとして第4図
に示す如き順序で入力する。但し丸印で示した文
字40を入力する時はキー18を押す。
上述の如く入力された原稿の内容は装置内で処
理され、例えば第5図に図示する如く漢字仮名ま
じり文で表示される。
上述の処理において、同音の漢字が複数組存在
した場合、第5図の如く*付で表示される。
(例 *帰途)
ここで*は、同音漢字(変換語)が2つ以上あ
ることをオペレータに知らせるためのものであ
る。
入力された原稿の読みに対して複数の同音漢字
(変換語)が存在した場合、以下の様な手段で必
要な漢字(変換語)を選択する。
例えば第5図の“*基本的”の表示の“*”の
位置にカーソル記号CCを移動させる。かかる移
動はEDITキーを操作することで自動的に行うこ
とができる。今選択したい漢字は、表示されてい
る漢字そのものであるがYESキーが操作され
る。すると、カーソル信号CCは自動的に次に選
択すべき“*以降”の“*”の位置に移動する。
今選択したい漢字は“移行”であるので、表示さ
れていない漢字を呼び出すために、NOキーが操
作される。すると、“以降”が表示面から消え
“威光”がその同じ場所に表示される。更にNOキ
ーが操作されると、上述の表示手順が表1に示す
如く行われ、当面必要とする“移行”が表示され
た時、YESキーが操作されると、“移行”が選択
され、装置はカーソル信号CCを次の“*帰途”
の“*”の位置に自動的にシフトさせ、操作者の
次の選択対象の位置を知らせる。
[Technical field] The present invention inputs a first character such as a kana, a Roman character, or an English character, and selects a desired character from a second character group such as a homophone Kanji group or a Japanese character group corresponding to the kana or Roman character. The present invention relates to a character processing device that selects a second character and converts the first character into the second character. [Prior Art] When converting a first character into a second character,
When there are a plurality of second characters, some devices output the second characters sequentially. For example, the input first character and the converted second character are displayed in the form of a mixed sentence on the display, but the lengths of the multiple second characters are not necessarily equal. do not have. In such a case, if the first character is output following the output second character, the second character will be incorrect and each time a new second character is output, the second character will be output. The position of the first character following character 2 is shifted, making it very difficult to see. [Objective] Therefore, in the present invention, the above-mentioned drawbacks are eliminated by configuring the apparatus to add a blank space when outputting the shorter second character among the plurality of second characters. The object of the present invention is to set an area where the maximum number of candidate character strings among the candidate character strings to be displayed at the position where there are multiple candidate character strings in a sentence containing mixed kana/kanji characters to be set at the position. death,
Within that area, candidate character strings are switched and displayed one by one, so that the sequence of the following sentences is not disturbed even when the switching display is performed, making it easy to see, editing sentences, and avoiding mistakes. It is an object of the present invention to provide a character processing device that is small in number and has good operability. An embodiment of the present invention will be described below with reference to the drawings. Before starting the explanation, terms used in this embodiment will be briefly explained. The first character or first character string refers to a character or character string that is initially input to the device.
The second character or second character string refers to a character or character string resulting from conversion of the first character or first character string by the present device. Further, the second character string is not uniquely determined and may partially include a plurality of converted characters. The conversion unit refers to a range of characters or character strings specifically designated for conversion into a second character string within the first character string. The conversion word refers to a character or a character string that corresponds to a conversion unit included in the first character or the first character string, among the second characters or the second character string. A word is the smallest unit that constitutes a converted word. That is, the conversion word consists of a single word or a plurality of words. The above terms will be explained using specific examples. Now, if the input character string "Kihon Tekina" is converted to the output character string "Basic", the above terms will be as follows. 1st character string “Kihonteki na” 2nd character string “Basic” Conversion unit “Kihonteki” Conversion word “Basic” word “Basic” and “Target” Now, here is the first The figure shows a character conversion device which is an embodiment of the present invention, and this character conversion device 11 includes a keyboard 12 for inputting the first character string and various commands, Display the second string corresponding to the first string
A screen 13 such as a CRT, a recording device (not shown) housed in a character conversion device housing to record the second character string displayed on the screen 13 onto a recording paper 14, and a a second string of characters housed in a separate housing;
It consists of a processing unit that performs conversion processing into a character string. Before starting a detailed explanation of this character converter,
By explaining the functions of the keys on the keyboard 12, the general functions of the character conversion device will be explained. In FIG. 1, 15 is a key group KB1 for inputting the first character string, and by selecting input characters using the selection keys described below,
This is for inputting information corresponding to one of the signals written on each keytop. That is, 16 is a selection key for selecting whether to input Japanese characters or English characters, and key 1 is for selecting whether to input in Roman characters or kana.
7 to determine the input character as follows. That is, if the key 16 is set to the Japanese character input mode and the key 17 is set to the Roman character input mode, the keys with alphanumeric characters in the key group 15 can be operated to input Roman characters, and the input Roman characters are converted into kana. When converted and processed in the processing unit, the converted text is displayed in kana or kana mixed with kanji. If the key 17 is set to the kana mode in this state, the kana characters can be input by operating the keys with kana characters in the key group 15. When the key 16 is set to the alphabet input mode,
By operating the keys with alphanumeric characters in the key group 15, alphabetic characters are processed in the processing unit as they are (not as Roman characters) regardless of the mode of the key 17, and are displayed as they are when displayed. . The key indicated by 18 is used when the key 16 is in the Japanese mode, and when the key 17 is in the kana mode, pressing the key 18 displays lowercase letters in hiragana or the right end of the key tops of keys 15-44 and 15-45. The displayed symbols are input, and when the key 17 is in the Roman alphabet mode, the input Roman characters are converted into lowercase hiragana letters and processed by the processing section. The key indicated by 19 is a key for selecting whether to input uppercase hiragana letters or lowercase English letters. When the key 16 is in Japanese mode and the key 17 is in kana mode, the key group 15 selects whether to enter uppercase letters in hiragana or lowercase English letters. When the key 17 is in the romaji mode, input the romaji by operating the key with an alphabetic character in the key group 15. It is converted into and input to the processing section. Further, by setting the key 19 to the lowercase alphabetic character mode while the key 16 is in the alphabetic character input mode, lowercase English letters can be input by operating the keys labeled with alphabetic characters in the key group 15. be. Note that these keys 16, 18, and 19 are shift keys.
This constitutes SHK1. The key indicated by 20 is a space key, and pressing this key 20 creates a space between input characters. Reference numeral 21 indicates keys for inputting katakana lowercase letters and symbols written on the left end of key tops (for example, 15-44, 15-45); key 16 is used for Japanese character input mode, and key 17 is used for inputting kana characters. If the key group 15 is set to the mode, the kana is input as a lowercase katakana by operating the key with a kana in the key group 15, and if the key 17 is set to the Roman character input mode, the entered Roman character is changed to the lowercase character of the corresponding kana. It is to be converted and input. Use the key indicated by 22 to input katakana capital letters, or
This key is used to select whether to input uppercase English letters. By setting key 16 to Japanese mode and key 17 to Kana mode, it is possible to input Katakana capital letters by operating keys with kana in key group 15. By setting the key 17 to the Roman character mode, the Roman characters input by operating the keys with alphabetic characters in the key group 15 can be converted into katakana capital letters and input. Furthermore, keys 21 and 22 are used as shift keys.
This is what makes up SHK2. Reference numeral 23 indicates a key that indicates the start or end of inputting characters to be converted to kanji, and when it is detected that the key 23 is pressed an odd number of times, inputting of characters to be converted to kanji begins. It generates a start signal to notify that the key 23 has been pressed for an even number of times, and generates an end signal to notify that the input of characters to be converted into kanji has been completed. be. The key indicated by 24 is a cursor key, and is used to move the cursor appearing on the screen 13 one character at a time to a desired location. Reference numeral 25 indicates an initial set key, which is used to set the processing section to an initial state by pressing it before using the character conversion device 11. Reference numeral 26 indicates an edit key, which instructs to search for a location in the second character string displayed on the screen 13 where a plurality of converted words exist. Reference numeral 27 indicates a print command key, which prints the second character string displayed on the screen 13 onto the recording paper 1.
This key instructs to record on 4. 28 is a key that indicates that when the first character string is converted to the second character string and there are multiple converted words, the one converted word displayed on the screen is the correct converted word. , the key 29 indicates that it is an incorrect conversion word, and this key 29
By pressing , other converted words will be displayed on the screen. Therefore, by pressing the key 29 until the correct converted word is displayed on the screen 13 and pressing the key 28 when the correct converted word is displayed, the correct converted word is selected. The key 30 has the same function as the key 29, but the display order of converted words is reversed. The key 31 is a key for instructing to convert the displayed second character string (conversion word) into a first character string (conversion unit). 32 indicates an automatic conversion mode in which the first character string inputted from the key group 15 is converted into a second character string in the processing unit and displayed on the screen 13, or a character corresponding to a single kanji is inputted from the key group 15. This key is used to select a single kanji input mode in which all kanji corresponding to the inputted character are displayed on the screen 13, and a desired kanji is selected from the displayed single kanji. 33 shows the direct input mode in which the kanji code is directly input using the numerical keys 34, and the key group 15.
This key is used to select an indirect input mode in which a second character string is output from the processing section by inputting a first character string. An explanation will be given of an operation for inputting data according to the document shown in FIG. 2 using keys having the functions described above, and obtaining an output as shown in FIG. 5 on the screen 13. When inputting in hiragana, first, after initial reset with key 25, key 16 is set to Japanese mode, key 17 is set to kana mode, and key 19 is set to hiragana large character mode. However, since the character 37-1 indicated by a circle in Figure 3 is a lowercase hiragana,
To input this character, press key 18. Then, as shown in Fig. 3, press the key 23 to signal the start of inputting characters to be converted into kanji, operate the key group 15 to input the kana ``konkai'' to be converted into kanji, and then press the key 23. Press 23 to notify that the input of characters to be converted into kanji is complete, then input the kana "no", and so on, and then input the kana in sequence as shown in FIG. 3. As will be described later, in the character conversion device according to this embodiment, by inputting a signal indicating a sentence break such as a dot "," or a circle "." from the keyboard 12,
Since the conversion from the first character string to the second character string is started, when the point 36 is input, the second character string is displayed on the screen 13 as shown in FIG. Then, input continues as shown in Figure 3, and when the last circle 37 is input, the fifth
All the second character strings are displayed as shown. In addition, the symbol indicated by 35 in Fig. 3 is the key 2.
This symbol indicates that 3 has been pressed. In FIG. 5, the converted words marked with a symbol 38 (*) indicate that there are homophones other than the displayed word. In other words, conversion words to which the symbol 38 is not attached are conversion words that are uniquely determined for input characters. Once all input has been completed in this way,
Next, when the key 26 is pressed, the cursor 39 is placed at the position of the first symbol 38-1. The conversion word “basic” indicated by this cursor 39
is a correct conversion word, so when key 28 is pressed, cursor 39 moves to below the next symbol 38-2. Since the conversion word "after" indicated by the cursor 39 is also a correct conversion word, when the key 28 is pressed, the cursor 39 moves to below the next symbol 38-3. Since the converted word "on the way home" indicated by the cursor 39 is incorrect, the next homophone word "intention" when the key 29 is pressed is displayed on the screen 13 in place of the above-mentioned "on the way home". Since this converted word "Kaku" is a correct converted word, when the key 28 is pressed, this converted word "Kaku" is selected. Once all editing is completed in this way,
By pressing the key 27, the second character string displayed on the screen 13 is transferred directly to the recording paper 14.
This is recorded above. Next, to explain the device in more detail by taking as an example the case of inputting in the Roman alphabet mode, the key 16 is set to the Japanese mode, the key 17 is set to the Romaji mode, and the key 19 is set to the Hiragana capital character mode, in the order shown in Fig. 4. Enter. However, when entering the character 40 indicated by a circle, the key 18 is pressed. The contents of the manuscript input as described above are processed within the apparatus and displayed, for example, as a mixture of kanji and kana, as shown in FIG. In the above process, if there are multiple sets of kanji with the same sound, they are displayed with * as shown in FIG. (Example: *On the way home) Here, * is used to inform the operator that there are two or more homophone kanji (converted words). If multiple homophone kanji (conversion words) exist for the reading of the input manuscript, the necessary kanji (conversion words) are selected by the following means. For example, move the cursor symbol CC to the position of "*" in the "*Basic" display in FIG. Such movement can be performed automatically by operating the EDIT key. The kanji that you want to select now is the kanji that is displayed, but the YES key is operated. Then, the cursor signal CC automatically moves to the "*" position "after *" to be selected next.
Since the kanji you want to select now is "transition", the NO key is operated to call up the kanji that is not displayed. Then, "later" disappears from the display screen and "majesty" appears in the same place. Furthermore, when the NO key is operated, the above-mentioned display procedure is performed as shown in Table 1, and when the currently required "transition" is displayed, when the YES key is operated, "transition" is selected, The device sends the cursor signal CC to the next “*Return”
automatically shifts to the "*" position to inform the operator of the position of the next selection target.
【表】
上述と同様なキー操作を繰り返すことによつ
て、その選択を終えることができる。
ここで、前記選択の操作性をより良くするため
の機能について表2を用い説明する。
NOキーを操作した結果“*移行”と表示され
た時、更にNOキーを操作すると“*移項”が表
示される。(表2、6行目)ここで“いこう”に
対応する同音漢字(変換語)はすべて表示された
ことになる。ここで更にNOキーを操作すると再
び第1番目に表示された“*以降”が出力され
る。この様に常に繰り返し表示することにより、
選択の容易さが向上される。次に、BACKキーを
操作すると、NOキーを操作した時と全く逆の表
示の仕方をする。即ち、再び“*移項”が表示さ
れ、更にBACKキーの操作により“*移行”が表
示されることになる。
ここで前回と同じくYESキーを操作すること
により移行を選択することができる。以下前回と
同様である。[Table] By repeating the same key operations as above, the selection can be completed. Here, functions for improving the operability of the selection will be explained using Table 2. When "*Transfer" is displayed as a result of operating the NO key, "*Transfer" is displayed when the NO key is operated further. (Table 2, line 6) All homophone kanji (converted words) corresponding to "Ikou" are now displayed. If the NO key is pressed again here, the first displayed "* and later" will be output again. By constantly displaying it repeatedly like this,
Ease of selection is improved. Next, when you press the BACK key, the display is completely opposite to when you press the NO key. That is, "*Transfer" is displayed again, and when the BACK key is pressed further, "*Transfer" is displayed. Here, you can select migration by operating the YES key as before. The following is the same as last time.
【表】【table】
【表】
次に以上の方法で訂正できないのものについて
は、もとの第1の文字(該当する変換単位)に簡
単にもどせる必要がある。このためにはINVキー
を用いる。先ずカーソルを前述した方法(EDIT
キーあるいはYESキーを用いる方法)あるいは
CURSOR SHIFTキー(CURSOR SHIFTキー
は1操作により1文字分だけカーソルを移動させ
ることができる)を用いる方法で、第1の文字に
変換したい漢字に対応する“*”の位置に、カー
ソル信号CCを移動させる。ここでINVキーを操
作することにより第2の文字が第1の文字に変換
され表示される。
この様子を表3に示す。
以上第1の文字列を第2の文字列に変換する過
程において自動的に変換する方法について述べて
きた。
次に、漢字単位に1字ずつ入力する方法につい
て述べる。
漢字単位の入力方法には2種類ある。一方は間
接的に入力する方法であり他は直接的に入力する
方法である。
先ず自動単漢字選択キーAMKを、単漢字側に
セツトし、次に間接直接選択キーIDKを、オペレ
ータが欲する方にセツトする。しかる後、カーソ
ル信号CCを、カーソルシフトキーCSKによりシ
フトさせ、入力したい該当位置にもつてくる。
間接直接選択キーIDKが間接側にセツトされて
いる場合は以下の様な手順で漢字の入力を行う。
先ず第1図の漢字シフトキーKK23を押し、
次に漢字の読みを入力する。漢字の読みはローマ
字仮名選択キーRKKがローマ字の場合は漢字の
読みをローマ字で入力し、又RKKが仮名の場合
は仮名で入力する。漢字の読みは音又は訓で入力
することができ、又該漢字の読みの先頭からの一
部分のみの入力であつても良い。しかる後再び漢
字シフトキーKKを押すと、スクリーン13に第
30図T1の如く該当の漢字が列挙される。列挙
された漢字群は第1図Bの下から2段目のキー群
に対応するものであつて、英文字のキーA,S,
D,F,G,H,J,K,L;にそれぞれ順に対
応している。
次に所望の漢字が表示中にあればその漢字の位
置に対応するキーを押すことにより入力をするも
のである。表示に所望の漢字がない場合は「:」
キー又はスペースキーを押すことにより現画面の
漢字群に続く漢字群を表示し、前記と同様に所望
の漢字を入力することができる。例えば、第32
図においてT2の位置の「本」を「来」にかえた
い時はカーソルをカーソルシストキーCSKによ
りT2の位置にもつてきて単漢字選択キーを押す
と画面がすべて消えてカーソルが最下段左部に移
る。しかる後前述の如く漢字シフトキーKK、
「ラ」、漢字シフトキーKKを押すことで第30図
T1の如く「ラ」から始まる漢字が列挙される。
ここで「来」に対応するキー「S」を押すとT2
の位置に「来」の字が入りデータは修正されて画
面に表示され、カーソルは次の文字の位置に進
む。上述の如き制御を行うのが後述の単漢字入力
制御部である。
なお本例においては、オペレータの標準搭な指
つかい、例えば右手の中指は9、I、K、ヨ、
ニ、ノ、ネを入力するのに用いられるが、その中
のいずれのキーを押しても右手の中指に対応する
第30図の左から3つ目の文字が指定されるが如
く構成されている。
間接直接選択キーが直接側にセツトされている
場合は、漢字の直接入力手段DINにより現在カー
ソルのある位置に対応するデータバツフアに漢字
コードを入力することができ、且つ、現カーソル
の位置に該漢字を表示することができる。入力後
はカーソルは次の位置に自動的に進む。この直接
入力手段は漢字のみならず、仮名英数字その他の
記号等も入力可能なものである。単独の漢字は上
記の如く入力することができるので、単語の辞書
フアイルにない語も容易に入力することができ又
変換の際に誤変換された漢字等の修正も容易にで
きる。
以上の様にして文章を容易に且つ迅速に作成で
きる。
次にプリントキーが操作されると表示された文
章がプリントアウトされる。この際複数個の同音
語(変換語)の存在を示した*記号と余分な空白
(例えば第5図の“年”の後の空白)は抹消され
つめて記録される。
本実施例による文字変換装置の最も基本的操作
は以上の如きものであるが、図面を用いてこの文
字変換装置を更に詳しく説明する。
第7図は本実施例による文字変換装置を示すブ
ロツクダイアグラムであり、KB1,KB2,KB
3は前述の如き機能を有するキーであり、それぞ
れキーに対応したコード信号を発生するためのエ
ンコーダをそなえているものである。
上述の各キーの他の機能は後で更に詳述され
る。
CPUは処理部で、例えば16ビツト処理を行
う。かかる処理部CPUはデータ転送、加算、比
較等の機能を有するもので、例えばテキサス・イ
ンスツルメント社のTMS9900、ナシヨナルセミ
コンダクタのPACE、パナフアコム社PFL16A、
日本電気μPD16等で構成する。
ROMは制御メモリで、キーボートKB1,KB
2,KB3からの入力指示を判別し、それぞれに
応じた処理を行う制御手順、制御データ等を格納
している読み出し専用メモリである。このROM
は第7図に示す如き、各ブロツクに分けられる。
各ブロツクの説明は後述する。各制御部は、その
名前に関する制御を行うものである。例えば、
KB1入力制御部においてはKB1入力制御を行う
ものである。又メイン制御部は、他の制御部をス
ーパバイスするものである。
FIFOはKB2からの出力を一時蓄えるメモリ
で、フアーストインフアーストアウトメモリであ
り、64W(1W16bit)の容量をもつ。CPUの処理
能力を越えた情報が蓄えられる。
PM1はページメモリで、第5図に示す如く原
稿1ページ例えば16(文字)×12(行)の文字容
量即ち192WORDの容量を有する。又かかるペー
ジメモリPMの内容は後述するCRTにより表示さ
れ、又出力機器例えばプリンタ、磁気デイスク等
に出力される。
なおページメモリPMの各WORDの第14bit、第
15bitには以下の情報が記憶される。(第8図を参
照されたし)
bit15−0、bit14−0の時、
bit13〜bit0に文字コードが入る。
bit15−0、bit14−1
同音語メモリのアドレスがbit9〜bit0に来
る。
bit15−1、bit14−1
ラブアウトコードを意味する。このコードが
存在した時表示手段の表示面上にはスペースが
表示される。又プリントアウト時には無視され
る。
PM2はページメモリで、構成はPM1と同じで
ある。本メモリの内容は、PM1と同様、CRTに
表示することができる。
WFは単語フアイルで、第11図に示す如く単
語(漢字)の読みがキーワードとなつて、その単
語の読みに対する単語の文字コード、文法情報等
が入力されている。
本実施例では1単語に対し32Wの記憶容量を用
意し、その内訳は、単語の読み(仮名見出し)に
対し10WORD、不変化仮名部の読み即ち漢字の
送り仮名の内活用により変化しない部分(例えば
“美しい”の“し”)に対し3WORD、単語の文字
コードに対し5WORD、品詞情報に対し
1WORD、活用形の情報に対し1WORD、接辞情
報に対し1WORD、分野情報に対し4WORD、漢
字の個数即ち文字コードの欄に記入された文字コ
ードの数の情報に対して1WORD、不変化仮名部
に記入された読みコードの数の情報に対して
1WORD、頻度情報として1WORD、空きとして
4WORDの配分から成る。
品詞情報は第10図に示す様に1WORDの各ビ
ツトに品詞を対応させたものである。この中に
は、接頭語、接尾語といつた情報も含めてある。
活用形の情報は第11図に示す様に1WORDの
各ビツトに動詞、形容動詞等の活用形を対応させ
たものである。
接辞情報は第12図に示す様に1WORDの各ビ
ツトに各接辞情報を対応させたものである。接辞
情報は、地名、人名、組織名、接地(地名に接続
するもの例えば県、市)、接人(人名に接続する
もの例えば氏、君)、接組(組織名に接続するも
の例えば課、会)といつたものに分類してある。
頻度情報は国立国語研究所資料を参考にして決
めたものである。
分野情報は第13図に示す様に1WORDの各ビ
ツトに各分野情報を対応させたものである。各単
語について使用頻度の多い分野を示している。
なお単語フアイルWFに蓄えられている単語は
前記変換語の語となり得るものである。
単漢字辞書KFは第14図に示す如く漢字の読
みがキーワード(5W)になつていて、漢字コー
ドを検索することができる様になつている。漢字
の読み方は音、訓いずれからも検索できる様に、
各漢字について異る読み方があれば、その読み方
に対してKFが作られている。
なお本例においては1仮名見出しに対して1漢
字の構造をとつたが同音の漢字が複数個ある場合
はまとめて、1見出しに対して複数の同音の漢字
を記憶したテーブルにすることができることは、
明らかである。
PNT1はポインタメモリで、8bitの記憶容量を
有する。かかるメモリは表示手段の表示面に表示
されるカーソル記号CCの位置を指定するための
アドレスレジスタ及びページメモリPM1のリー
ドライト用のアドレスレジタの役目を行う。
PNT2はページメモリPM2のリードラト用の
アドレスレジスタである。
PNT1,PNT2ともアドレス値として1〜192
までが意味をもつ。他の値にセツトされている時
は無効となる。
DCOTは表示制御回路(第16図)で、第15
図に示す如くコードコンバータCCT、セレクタ
(SLT)、キヤラクタジエネレータCG、CRTコン
トローラCCLから構成される。
コードコンバータはPM1から出力された情報
のコード変換を下記の規則で行うものである。
即ち、
bit15=0、bit14=0の時、
そのまま出力する。
bit15=0、bit14=1の時、
“*”に対応する文字コードに変換する。
bit15=1、bit14=1の時、
スペースコードに変換する。
bit15=1、bit14=1の時、
スペースコードに変換する。
セレクタはコードコンバータを介してPM1の
出力とPM2の出力との一方を、ロツクキーAMK
とIDKとの関連において選択する役割を担う。
CRTコントローラはセレクタからの出力情報
を表示体で表示する機能と、ポインタPNT1に
よつて指定された位置にカーソル信号を表示する
ものである。
かかるCRTコントローラはキヤラクタジエネ
レータCGを参照し、該CGに文字コードを入力す
ることにより該文字のパターンを発生させ、ペー
ジメモリPM内の文字コードを表示するものであ
る。
表示制御回路DCOTは縦12行、横16文字となる
様に制御する。
従つてページメモリPM1あるいはPM2にキヤ
リツジリターンコード、あるいはラインフイード
コードが含まれていない場合、表示制御回路内に
1行16文字表示となるために文字数をカウントす
るカウンタ、又12行となる様に行をカウンンタ、
又12行となる様に行をカウントするカウンタがそ
なえられている。
又処理部CPUがページメモリPM、ポインタ
PNTを制御する時機は表示制御コントロール
DCOTが1行のライン表示から次のライン表示に
移る時間に行われる。
CRTは表示部で、カソード、レイ、チユーブ
から成る。かかる表示部CRTに表示制御回路
DCOTの制御のもとに情報を表示する。
直接入力手段DINは第16図に示す如く、TEN
KEY 34(KB4)とエンコーダENCDとから成
る。エンコーダはKB4から出力された4ケタの
数字を文字コードに変換する役割を負う。これに
よつて、10進数4ケタによつて定義された文字
が、その文字に対応した文字コードに変換され
る。
又直接入力手段DINは漢字入力装置、例えば、
オキ電気工業株式会社KANJI TAB ENTRY−
500、富士通株式会社FACOM6802B等であつても
良い。
OUは出力機器で、表示部CRT上に表示された
文字を印字する。例えばワイヤドツト、インクジ
エツト、サーマル、プリンタ等で構成される。
又出力機器として磁気デイスク等を接続し、記
憶容量を増加させても良い。
RAMはメモリで、処理部CPUで処理されたデ
ータの転送等の制御を行うためにそなえられてい
るものである。その構成は、第17図に示される
様に各種REGISTER、WORKING、AREA、変
換用パラメータ1、変換文バツフア、変換単語テ
ーブル、変換用パラメータ2、変換単位テーブ
ル、ネストテーブル、単語辞書テーブル等から成
る。
又上記REGISTERはキーワードレジスタ、選
択番号レジスタ、入力文分野レジスタ、変換語分
野レジスタ等を含む。
次に、各パラメータ、バツフア、テーブル、各
制御部につき、その詳細及び相互の関係について
説明する。個々の説明にあたつては、それぞれの
図面を利用する他、相互の関係の説明にあたつて
は第18図を利用する。
変換文BUFを第19図に示す。変換文BUFは
これから変換すべき文章を蓄えるためのバツフア
であり、後述するKB1入力制御部の制御により
KB1より入力された文章の読み情報が定められ
たフオーマツトに従つて変換され蓄えられる。変
換文BUFのフオーマツトは第19図に示す通り
である。文字情報は、すべての仮名及び記号の
JISコードにより表現される。又漢字に変換した
い部分(以下変換単位と呼ぶ)を示すための特殊
コードα,βが使用される。KB1入力制御部の
制御により蓄えらた情報の中には、上記文章情報
と特殊コードαとβが含まれる。αは変換単位の
先頭を指定するものであり、βは変換単位の最後
尾を指定するものである。
変換用パラメータMPA1,MPA2は、変換文
バツフアに蓄えられた情報の内第2文字列に変換
すべき範囲を指定するパラメータであり、KB1
入力制御部によつててセツトされ、以後の変換の
ためのパラメータとなる(第20図参照)。
MPA3は、前記範囲の内変換が終了した範囲
を除く先頭アドレスを指定するものである。KB
1入力制御部によつて、イニシヤライズされ、
MPA3−MPA1にセツトされる。
MPA4は、後述する変換語テーブルの空き番
号を格納するレジスタである。MPA4の具体的
役割については後述する。MPA4はINTキー制
御部によりイニシヤライズされる。
MPA5及びMPA6は変換すべき範囲、即ち
MPA1とMPA2の間を変換するにあたり、参照
すべき先頭のアドレスと最後のアドレスをそれぞ
れ示すものである。
KB1入力制御部は、AMKキーが自動であり、
且つKB1からの入力が存在した時に、メイン制
御部の指令により動作開始する。又動作終了後
は、メイン制御部にその制御をもどす。KB1入
力制御部は、KB1から入力された情報を変換文
BUFによつて規定されるフオーマツトに変換
し、しかる後変換文BUFにかかる情報を書き込
むと同時に、変換用パラメータ1に変換に必要な
パラメータを書き込み、変換制御部に変換開始の
指示を与える役割を担う。KB1からの入力は、
RKKキーの操作により、仮名入力あるいはロー
マ字入力の選択を行うことができる。又KB1の
漢字シフトキーKKは、奇数回目の打鍵は、変換
単位の先頭を指示するものであり、偶数回目は、
変換単位の後端を指示するものである。KB1入
力制御部は以上の入力を前述した変換文バツフア
で規定されたフオーマツトに変換を行い、且つ変
換された情報を変換文バツフアに書き込む。
変換文バツフアに蓄えられた情報を漢字まじり
文(第2文字列)に変換することを開始するの
は、次の条件のいずれかが満足された時であり、
下記条件のいずれかが満足された時、変換制御部
に対し、変換開始の指示を与える。
1 KB1からの入力情報中に記号例えば「,、。
等が存在した時。
2 漢字シフトキーにより漢字始まりコードが生
成された時。
3 漢字シフトキーが2回打鍵された後特定の数
の文字が入力された時。
4 バツフアがオーバーフローする時。
KB1入力制御部は、変換開始の指示を変換制
御部に対し与える前に変換用パラメータ1に、変
換文BUFに蓄えられた情報の変換開始位置と終
了位置をセツトする。第2文字列への変換はこの
範囲内を行うものである。又同時に変換のための
関連情報としての参照範囲をも変換用パラメータ
1にセツトする。
仮名漢字変換においては、単語の前後の情報が
重要となるため、文章の中間にある単語を漢字に
変換する場合は常に前後の情報を付けて仮名漢字
変換を起動する様に制御する。
ローマ字仮名変換の起動はKB1入力制御部に
よりローマ字モードにおいて平板名もしくは片仮
名の入力において母音、即ち〔A、I、U、E、
O〕もしくは〔X〕にキーボード(第1図参照)
上で対応する仮名、即ち〔ち、に、な、い、ら〕
もしくは〔さ〕、〔チ、ニ、ナ、イ、ラ〕もしくは
〔サ〕及びそれぞれの小文字のいずれかが入力さ
れた場合に行われる。変換はローマ字仮名対応テ
ーブル(第21図)を参照して行われる。例えば
「あ」を入力する場合は第1図のキーボードにお
いてローマ字入力にして、平仮名シフト状態で
「A」のキー即ち「ち」のキーが押されると、ロ
ーマ字仮名変換制御部は起動され第21図のテー
ブルで「あ」が取り出される。
単語辞書テーブルは、第22図に示す通り、単
語辞書WFに格納されていた情報の内、変換にお
いて必要なものだけを抜き出し格納しておくため
のバツフアであり、32×24Wの容量をもつ。即
ち、前述した如く1単語32Wの容量を有するた
め、24単語分の情報が格納でき、格納された情報
は、各単語ごとに順に1〜24の番号が付されてい
る。本単語辞書テーブルへの書き込みは、後述す
る変換制御により行われる。
ネストテーブルは、後述する変換制御部が各変
換単位から変換語を見つけ出すにあたつて書込む
テーブルであり、第23図に示す如く、28×8W
の容量を有する。
本実施例は、変換単位を自動的に分割する機能
を有する。例えば、〓キホンテキ〓という変換単
位に対しては自動的に、〓キホン〓と〓テキ〓と
いう2つに分割するものである。この分割の数は
上記例の如く2分割に限るものではない。
本実施例においては8分割まで許すものとし
た。又分割されて得られた語は、自立語、接頭
語、接尾語のいずれかである。この分割の情報を
格納するのがこのネストテーブルである。分割さ
れた各語に対し、28Wの情報格納場所がある。
第23A図において、Aは該語の読みが格納さ
れている変換文バツフア中のアドレスである。B
は該語の読みの数である。Cは該語の読みに対応
する語が複数個存在した時、その数である。Dは
該語に対応する単語辞書情報を格納する単語辞書
テーブルの先頭番号(前述した単語辞書テーブル
の1〜24の番号の1つ)である。Eは該語に対応
する単語辞書情報が蓄えられている単語辞書テー
ブル中の番号である。
今、〓キホンテキ〓という変換単位が変換文バ
ツフアの頭に格納されており、今後述する変換制
御部により前記変換単位に対応するネストテーブ
ルが書き込まれたとする。その際“キホン”と
“テキ”とは分割され、前者に対応する文字列
(語)として“基本”、後者に対応する文字列
(語)として“敵”、“滴”、“適”、“的”の4種が
後述する変換制御部により見つけられたとする。
この時のネストテーブルの例を第23図Bに示
す。
変換用パラメータ2は、後述する変換制御部に
より、変換単位を変換語に変換する時に書き込ま
れるもので、各種パラメータを含むものである。
第24図に示す如く9Wの容量を有し、MCW1〜
MCW9までの名前が付されている。
MCW1は、後述する変換制御部が、変換文バ
ツフアの指定された範囲(変換用パラメータ1に
よつて指定された範囲)の中から、捜し出した変
換単位の先頭アドレスを記入するレジスタであ
る。
MCW2は、前記変換単位の長さである。
MCW3は、前記変換単位の中で実際に後述す
る変換制御部が単語辞書WFの検索を行う単語の
先頭アドレスである。
MCW4は、前記検索を行う単語の長さであ
る。
MCW5は、前記検索の結果得られた語の数を
記入するレジスタである。但し負の時は検索した
結果該当するものが存在しなかつたことを示す。
MCW6は、前記検索の結果得られた各語の単
語辞書情報を格納する単語辞書テーブル中の空き
No.即ち単語辞書テーブルの中で前記MCW6で
規定されたNo.から24までの間が、空きテーブル
となつていることを示している。
MCW7は、前記変換単位の分割において、分
割された数である。
MCW8は、該変換単位に対応して、変換され
た変換語の数を記入するレジスタである。正の時
は、変換された第2文字列の数、負の時は、変換
できなかつたことを示すものとする。
MCW9は、前記MCW8個の変換語の内“確
かさ”(後述)があるしきい値を越えるものの数
である。
変換制御部は、KB1入力制御部の指示により動
作開始し、終了後その制御をKB1入力制御部にも
どす。
本制御部は、変換文バツフアに蓄えられた情報
(第1の文字列)の内変換用パラメータ1によつ
て定められた範囲を第2文字列へ変換を行いその
結果をネストテーブル、単語辞書テーブル、変換
用パラメータ2に書き込む。その後変換単位テー
ブル作成制御部及び変換結果処理制御部を起動す
る役割を担う。ここで変換制御部の考え方を述べ
る。変換制御部は先ずMPA3からMPA2の範囲
の中から変換単位を捜す。変換単位が見つかつた
ら、MCW1,MCW2をセツトする。又同時に
単語辞書テーブルをクリアするためにMCW6を
1にセツトする。次に単語辞書WFを検索し、該
変換単位に対応する変換語を見つけ出すために、
MCW3,MCW4に単語辞書WFのキーワードを
設定する。当然のことながら、先ず初めは、
MCW3=MCW1、MCW4=MCW2と設定す
る。又、MCW7に初期値として1を与える。
(MCW7については後述する。)検索は変換制御
部の中に配置される検索制御部によつて行われ
る。検索制御は、MCW3,MCW4に設定され
た、キーワードに対応する辞書情報を単語辞書
WFから検索し、その結果を、単語辞書テーブル
及びMCW5に設定する。検索の結果もし見つか
つたら、MCW5にその数を設定し、且つ単語辞
書テーブルにMCW6で示される位置を先頭にし
て辞書情報を蓄える。もし検索の結果見つからな
かつたら、MCW5に−1をセツトする。
以上の検索制御部の動作が終了したならば、変
換制御部は、その検索結果を調べる。もし、
MCW5が負であるなら、MCW4から1を減じ
て、再び検索制御部により単語辞書を検索する。
該当語が見つかるまで、この動作を繰り返す。
該当語が見つかつたなら、即ちMCW5が正数
であつたなら、その時の状態をネストテーブルに
書き込む。即ち、MCW3を第23図Aに、
MCW4をBに、MCW5をCに、MCW6をDに
保存する。又、Eには該当語の辞書情報が格納さ
れている単語辞書テーブル中の該当ナンバーを
MCW5にセツトされている数分だけ記入する。
前回まででの検索で変換単位に残余部のある場
合、MCW7に1を加算し、変換単位の残余部に
ついての単語辞書検索を前回と同様の方法で行
う。その際MCW3及びMCW4は、残余部を示
すアドレスとレングスに変換する。但し、残余部
についての検索において該当語に見つからなかつ
た時は、前回ネストテーブルに書き込んだ時に検
索して見つかつた語は、キヤンセルするものとす
る。従つてこの時には、MCW7から1を減じ、
ネストテーブルに既に書き込んである情報を再び
MCW3〜MCW6にもどす。そして、更にMCW
4から1を減じて再び検索制御を実行する。残余
部についての単語辞書検索が成功した場合は前回
と同じ様に、MCW3〜MCW6をネストテーブ
ルに保存し、ネストテーブルの(E)項に所定事項を
記入し、又、なお残余部がある時は、以上の説明
を繰り返す。
かくして該変換単位が単数又は複数個の語とし
て変換される。以上の過程でMCW7には変換単
位を分割した数が記入されていることになる。
以上で変換が終了するが、最終的に変換ができ
なかつた場合には、MCW7=1、MCW5=−
1、MCW4=1とセツトされていることは、以
上の説明から明らかである。
変換制御部はしかる後変換が成功した場合は変
換単位テーブル作成制御部を起動し、その後変換
結果処理制御部を起動する。又変換が不成功であ
つた場合MCW8を−1にセツトし、変換結果処
理制御部を起動する。
変換結果処理制御部がその制御を終了した後、
変換制御部は再び変換文バツフアの中から次の変
換すべき変換単位を捜す。もし存在すれば前記制
御を繰り返す。変換用パラメータ1で指定される
範囲をすべて変換し終えた後、変換制御部はその
制御をKB1入力制御部にもどす。KB1入力制御部
は、前述した様にその制御を、メイン制御部に移
す。
変換単位テーブルは、変換単位に対応する語の
組合わせ(1語だけのことも有る)を記憶する場
所で、且つそれぞれの組合わせに対する変換の確
かさを記入するテーブルである。変換単位テーブ
ルは第25図に示す如く、11×24Wの容量を有す
る。各組合わせに対して11Wの容量を有する。従
つて全部で24通りの組合わせを格納できる。例え
ば、前述の様に〓キホンテキ〓という変換単位に
対し“キホン”と“テキ”とに対応する語がそれ
ぞれ、1通りと4通り得られたとする(この情報
はネストテーブルに記載されている)と、両者の
組合わせとして1×4の4通りの組合わせが作れ
る。これらの4通りに対してそれぞれ11Wの情報
を格納する。始めの8Wは語の組合わせを定義す
るもので、それらの数値は単語辞書テーブル中に
格納されている語情報の番号である。次の1Wは
語の個数即ち最初の8Wに記入された番号の数、
次の1Wは該組合わせの全体としての品詞を記入
する欄である。例えば“基本”と“的”とを組合
わせた“基本的”という複合語は、形容動詞とし
て捉える。次の1Wは該組合わせの“確かさ”を
記入する欄である。変換単位テーブルへの書き込
みは、変換単位テーブル作成制御部により先ず行
われ、しかる後“確かさ”の欄については、後述
する文法ウエイト制御部、頻度ウエイト制御部、
接辞ウエイト制御部及び分野ウエイト制御部によ
り、モデフアイされる。
変換単位テーブル作成制御部は、前記変換単位
テーブルを作成することを主機能とする。作成に
あたつてはネストテーブル及び単語辞書テーブル
変換用パラメータ2を利用する。又MCW8に
は、変換単位テーブルに記入した語の組合わせの
種類の数即ち変換器の数を記入する。
次に、該組合わせの全体としての品詞及び活用
形を記入する。ここで問題になるのは、これら複
数個の変換語の中から何を選択するかということ
である。
そこで、変換単位テーブルの“確かさ”の項を
モデフアイするため文法ウエイト制御部、頻度ウ
エイト制御部、接続ウエイト制御部、分野ウエイ
ト制御部を起動する。
以上で変換単位テーブルを完成することができ
る。
次にMCW9の設定を行うが、MCW9は前述
した様に、変換単位テーブルに記入した語の組合
わせの種類の数としても良いが、ここでは他の設
定方法を用いることにし、それを説明する。
即ち、前記各ウエイト制御部によつてモデフア
イした確かさを考慮し、あるスレツシヨルド以上
のものの数という形で定義するものとする。又ス
レツシヨルドは常に一定であつても良いし、又、
各変換単位によつて変化させても良い。スレツシ
ヨルドの決定は、変換単位作成制御部に含まれる
スレツシヨルド決定制御部により行われる。これ
によつて明らかに誤りと思われる変換語の出力を
除くことができる。
文法ウエイト制御部は、変換単位から変換され
た第2文字列のそれぞれに対し、文法的なチエツ
クをくわえ、ウエイト付けをする役割を担う。な
お文法的チエツクは、MPA5,MPA6で示され
る参照範囲内を行う。変換単位テーブル作成制御
部により起動され、終了後変換単位テーブル作成
制御部にその制御をもどす。
文法ウエイト制御部は2つに大別される。1つ
は、変換文バツフアにおいて、該変換単位の前部
とのつながりを調べる前記文法チエツク部と、後
部とのつながりを調べる後部文法チエツク部とに
分かれる。
前部文法チエツク部は、第2文字列が動詞であ
つた時該変換単位の前部が格動詞であるかどうか
をチエツクするもので、格助詞であつた場合ウエ
イトを増やし、それ以外の時ウエイトを減ずるこ
とを行う。
後部文法チエツク部は、更に2つに分かれる。
一方は、該変換単位に続く文字が、単語辞書テー
ブル中の不変化仮名部の読みに一致するか否かを
チエツクする不変化仮名部チエツクであり、他
は、該変換単位に続く文字が、動詞等の活用形と
一致するか否かをチエツクする活用形チエツクで
ある。
動詞、形容動詞等の活用形は衆知の様にその変
化に規則性があり、動詞の活用形の型が決まれ
ば、必然的にそれに続く文字が決定する。不変化
仮名部チエツク、活用形チエツクのいずれも第2
文字列の“確かさ”を判定する上で重要な役割を
担う。
変換単位テーブルに記載されたすべての第2文
字列に対してウエイトの計算を行う。
頻度ウエイト制御部は、変換単位から変換され
た変換語のそれぞれに対し頻度的なチエツクをく
わえウエイト付けをする役目を担う。本制御部
は、変換単位テーブル作成制御部により起動さ
れ、終了後変換単位テーブル作成制御部にその制
御をもどす。頻度ウエイト制御部は、変換単位テ
ーブルに記載された各語の頻度情報を単語辞書テ
ーブルから求め、それを各第2文字列のウエイト
にくわえるという制御を行うものである。
接続テーブル1は、第26図に示す如く自立語
の各品詞あるいは接頭語、あるいは接尾語の間の
接続関係を示すテーブルである。表中の数字は各
要素間の接続の度合を示すものである。但しこの
数字は経験的に決定したものであるが、随意変更
することにより、よりすぐれたものに近づき得
る。図中×印は接続する可能性の非常に低いもの
である。
接続テーブル2は、第27図に示す如く第12
図に示す接続情報を基準にしたところの接続関係
を示すテーブルである。図の見方は、接続テーブ
ル1と同じである。
接続ウエイト制御部は、変換単位から変換され
た単数個あるいは複数個の変換語のそれぞれに対
し、接続的チエツクをくわえウエイト付けをする
役目を担う。本制御部は、変換単位テーブル作成
制御部により起動され、動作終了後変換単位テー
ブル作成制御部にもどす。
本制御部は大きく2つに分けられる。1つは接
辞テーブル1を用いた品詞接続チエツク部であ
り、他は接続テーブル2を用いた意味接続チエツ
ク部である。いずれも第2文字列が2つの語から
成る時、そのつながりを調べるものである。
品詞接続チエツク部は、第2文字列を構成する
2つの語の品詞からその接続を調べるものである
が、各語の品詞は変換単位テーブルに記されてい
る単語辞書テーブル1の格納ナンバーから、単語
辞書テーブルを参照することにより得られ、又そ
れらの接続のウエイトは、接続テーブル1から求
めることができる。このウエイト情報を、変換単
位テーブルの“確かさ”の欄(フイールド)にく
わえる。
意味接続チエツク部は、第2の文字列を構成す
る2つの語の意味関係からそのつながりを調べる
ものである。この立場から語を分類したのが第1
2図に示す接続情報である。各語の接続情報は、
変換単位テーブルに記されている単語辞書テーブ
ルへの格納ナンバーから単語辞書テーブルを参照
することにより得られ、又それらの接続のウエイ
トは、接続テーブル2から求めることができる。
これらのウエイト情報を変換単位テーブルの確か
さの欄(フイールド)にくわえる。変換単位テー
ブルに記されたすべての第2文字列に対しウエイ
ト付けをして終る。
第17図のREGISTER内にある変換語分野レ
ジスタへは第13図に示される如き分野情報が、
セツトされるのであるが、このセツトは2つの場
合がある。
1つは、仮名漢字変換により単語が一義的に決
まつてしまつた場合であり、変換単位テーブル内
の一義的に決まつた単語の分野情報が変換結果処
理制御部により変換語分野レジスタにセツトされ
る。もちろん同音の語が1つの場合は一義的に決
まつたものとして上記と同様に扱われる。そう1
つの場合は、同音語が複数個あり一義的に変換さ
れなかつた状態において、YESキー、NOキーに
より1語が選択された時、該選択された語の分野
情報を変換語テーブルから、YESキー制御部に
より変換語分野レジスタに入れる。変換語分野レ
ジスタは2WORDあり、複合語即ち単語が2つ以
上で1変換単位となつている場合は2つの語の分
野情報を変換語分野レジスタに入れる。
変換語分野レジスタに入つた分野情報は、分野
決定制御部により入力文分野レジスタ内の情報に
加算される。入力文分野レジスタは16WORDよ
り成り各分野ごとに1WORDあてられる。例え
ば、過去に文芸の分野のビツトが立つている語が
28回、法律が20回、会社が10回、科学が2回、家
庭が4回入力されているとすれば、上記入力文分
野レジスタの16WORDはそれぞれ28、20、10、
24.、即ち第13図に対応して示せば〔0、28、
20、10、2、0、4、0、0、0、0、0、0、
0、0、0、〕が蓄積されている。ここで変換語
分野レジスタに文芸の項のみが立つている分野情
態、即ち第13図の分野情報WORD内の1つが
0′Sビツトから順に〔0、1、0、0、0、0、
0、0、0、0、0、0、0、0、0、0〕であ
る分野情報がセツトされると、分野決定制御部に
より変換語分野レジスタの各ビツトが入力文分野
レジスタの各WORDにくわえられる。従つて、
この例では文芸のWORDに1がくわえられて文
芸の分野のWのRDが119となる。従つてこの例の
場合は入力文分野レジスタの各WORDの値は
〔0、29、20、10、2、0、4、0、0、0、
0、0、0、0、0、0〕となる。
分野ウエイト制御部は、変換単位から変換され
た単数個あるいは複数個の第2文字列のそれぞれ
に対し、分野情報によるチエツクをくわえ、それ
ぞれに対しウエイト付けをする役目を担う。本制
御部は、変換単位テーブル作成制御部により起動
され動作終了後起動された制御部にその制御をも
どす。第50図のフローに示す如く分野情報に基
くウエイト付けがなされるものであり、前述の入
力文分野レジスタの内容と、単数個あるいは複数
個の変換語のそれぞれの分野情報とを各分野ごと
に、掛けた後に各変換語ごとに上記掛算の結果を
合計し各変換語のウエイト情報の基礎データと
し、他のウエイト情報例えば文法チエツクによる
ウエイト情報等とのバランスを合わせるために、
補正定数例えば30を掛け第25図の変換単位テー
ブル内の各該当の単語のACにそれぞれくわえ
る。上記の方法によつて分野情報によるウエイト
付けを行う。
変換語テーブルは、変換単位テーブルにまとめ
られた変換結果の情報を、CRTへ表示する時の
ために、まとめたテーブルである。第28図にそ
のフオーマツトを示す。容量は1024Wである。1
つの変換単位に対応して1つのブロツクがわりあ
てられる。1つのブロツクはそのブロツクの定義
を与えるHEADと複数個の変換語に対応する複数
個のレコードから成り立つ。
HEAD部は、iRL,iRN,iDN,iCL,iCCの5
個のアイテムから成る。iCCは20W、他は1Wで
ある。iRLはレコードレングス、iRNはレコード
数、iCLは該変換単位の仮名読みの文字数、iCC
は該変換単位の仮名読みの文字コードである。
iDNはCRTに表示されている変換語の番号を示す
レジスタである。例えば、あるブロツクの3番目
のレコードに記入された変換語が表示されている
時、iDNは3となる。又、もし、HEAD部の仮名
読みが表示されている時は、0とすることにす
る。
レコードは、iFL1,iFL2,iAC,iKCの4個
のアイテムから成る。iFL1,iFL2,iACは
1W、iKCは一般に数Wである(可変長)。
各レコードは、該変換単位の変換結果即ち変換
語を文字コードの形で記入したものである。iFL
1は該変換語の分野を、記入するアイテムで、単
語辞書に記載されいるものと同じである。iFL2
は該変換器が複数の語から成る時、第2の語に対
応する分野を記入するものである。iACは該変換
器の“確かさ”である。これは、すでに変換単位
テーブルに記載されているものである。
iKCは該変換器の文字コードである。
なお、iKCのレングスiKLは、変換器の文字コ
ード列の最大長で決まるものとする。例えば“ト
シ”の変換語に対応して“都市”と“年”が選ば
れた場合、年の後にラブアウトコード(オール
1)を追加してそのレングスを合わせるものとす
る。
変換語テーブルは、変換結果処理制御部により
初期設定される。又、iDNについては変換結果処
理制御部により1にイニシヤライズされ、BACK
キー制御部、INVキー制御部、NOキー制御部に
より変更される。
単漢字選択テーブル第29図は、キーボードよ
りの入力データに対するPM2のアドレスを示す
対照表であり、単漢字入力における単漢字選択制
御に用いられる。
変換結果処理制御部は、変換制御部及び変換単
位テーブル作成制御部により得られた結果を、
CRTに表示するためにページメモリPM1に書き
込むとともに、オペレータによるBACKキー、
INVキー、NOキー等の操作に従つて表示文字を
変更するための準備として変換語テーブルを作成
する役割を担う。
変換結果処理制御部は、先ず変換用パラメータ
1で示される範囲の変換文バツフアの内容を頭か
ら漢字シフトコードαが見つかるまでPNT1に
よつて示されるPM1の中に移す。もちろんPNT
1は、順次インクリメントする。もし、αが見つ
かつたならMCW9の正負を判断する。MCW9
が負、即ち該変換単位に対応する変換語が見つか
らなかつた時、再び漢字シフトコードαの次か
ら、変換用パラメータ1、MPA2で示される範
囲又は、再び漢字シフトコードαが見つかるま
で、変換文バツフアからページメモリPM1に情
報を移動する。担し漢字シフト解除コードβの転
送は省略するものとする。
MCW9が1の時、即ち、該変換単位に対応す
る変換語が1個見つかつた時、変換単位テーブル
に記入された該変換語に対応する単語辞書テーブ
ルの番号を文字コードに変換し、PNT1の示す
ページメモリPM1に書き込む。その際PNT1は
順次インクリメントする。次に該変換語の分野を
変換語分野レジスタにセツトし、分野決定制御部
を起動する。分野決定制御部からその制御がもど
つたなら、次に再び該変換単位の漢字シフト解除
コードβの次から変換用パラメータ1、MPA2
で示されるまでの範囲又は再び漢字シフトコード
αが見つかるまで変換文バツフアからページメモ
リPM1に情報を移動する。
MCW9が2以上、即ち該変換単位に対応する
変換語が複数個見つかつた時は、変換用パラメー
タMPA4のbit15を0、bit14を1にセツトしたも
のを、PNT1の示すPM1に書き込み、PNT1を
インクリメントする。次に、変換語テーブルの書
き込みを開始する。変換語テーブルのフオーマツ
トは前述の通りである。変換結果処理制御部は変
換単位テーブルを参照し、変換単位テーブルから
“確かさ”の高い順にMCW9個変換語を抜き出
す。単語辞書テーブルを参照することにより、該
変換語の文字コード、分野情報を見つけ出し、変
換語テーブルに書き込む。又、変換単語テーブル
に書さ込まれた該ブロツクのHEADには、該変換
単位の読み、その他の情報を書き込む。その際
iDNには1を記入する。
以上変換器テーブルへの書き込みを終了したな
らMPA4を更新する。しかる後再びPM1に、今
変換語テーブルに書き込んだブロツクの第1レコ
ードに対応する文字コードを書き込む。その際該
文字コードの中にラブアウトコードが記入されて
いても省略せずそのまま書き込むものとする。但
しCRT上には前述した様にラブアウトコードは
スペースとして表示される。以上変換語の書き込
みが終了したなら再び、該変換単位の漢字シフト
解除コードβの次から、変換用パラメータ1、
MPA2で示されるまでの範囲又は再び漢字シフ
トコードαが見つかるまで変換文バツフアからペ
ージメモリPM1に情報を移動する。
以上でMCW9が負の場合と1の場合と2以上
の場合の説明を終る。次に変換結果処理制御部
は、変換終了範囲+1を指定するパラメータ
MPA3のセツトを行う。
MPA3のセツト値は、前記変換文バツフアか
らPM1へ情報転送された最後の番地+1とす
る。
次に変換結果処理制御部は、該変換単位に対応
する変換語の数が1か否かを調べ、もし1であつ
たなら該変換語の分野を変換語分野レジスタに記
入する。分野決定制御部を起動する。分野決定制
御部から制御がもどされると、変換結果処理制御
部は、その制御を変換制御部にもどす。
分野決定制御部は、前述の如く変換語分野レジ
スタに入つたデータを入力文分野レジスタの各分
野にくわえるものである。従つて学習語分野レジ
スタの内容が次々とくわえられると、入力文分野
レジスタはオーバーフローすることになるが、分
野決定制御部はかかるオーバーフローがない様に
加算結果が31以上となつた場合はすべての入力文
分野レジスタから1を減ずる様に制御を行う。分
野決定制御部は、変換結果処理制御部又はYES
キー制御部によつて起動され、その制御終了後起
動した制御部にその制御をもどすものである。
プリントキー制御部は、ページメモリに蓄えら
れた情報を外部に出力する役割をもつ。メイン制
御部により起動され、動作終了後再びその制御を
メイン制御部にもどす。プリントキー制御部は、
ページメモリPM1の頭から終りまでの情報を順
に出力装置OUに出力するのであるが、その際
bit15=bit14=0以外のものは、コントロールコ
ードであるので出力しないものとする。
カーソルシフトキー制御部は、CRT上に表示
されているカーソルを1つずつ移動させる役割を
もつ。メイン制御部により起動され、カーソルシ
フトキーの動作終了後その制御をメイン制御部に
もどす。カーソルシフトキー制御部は、カーソル
のシフトを行うためPNT1を、インクリメント
する機能を有するものである。
EDITキー制御部は、表示画面上の第2文字列
の中から複数個の変換語が存在する場所を捜す役
割をもつ。EDITキー制御部は、メイン制御部に
より起動され、その動作終了後再びその制御をメ
イン制御部にもどす。
EDITキー制御部は、ページメモリPM1をス
キヤンし、bit15=0、bit14=1である位置を捜
す。ページメモリPM1をスキヤンするにあたつ
ては、順次PNT1をインクリメントするので、
前記情報を見つけた位置で本制御部の動作を終了
することで、自動的にPNT1を前記情報の位置
にセツトできる。前記情報は、それに続く変換語
が複数個存在していることを意味しているので、
以上の動作により第2文字列の中から複数個の変
換語が存在する場所を捜し求めることができ、
CRT上においてはカーソル記号CCが該変換語の
前に表示されている*印の位置に表示されること
になる。
YESキー制御部は、第1文字列が第2文字列
に変換され変換語が複数個存在した時に、複数個
の第2の文字列の内CRT上に表示されている第
2の文字列を選択する機能と、選択した第2の文
字列を利用し、入力文の分野を決定するために、
分野決定制御部を起動する役割と分野決定制御部
からその制御がもどつた時CRT上の次に選択す
べき、第2文字列の位置を捜す機能とを有する。
YESキー制御部は、メイン制御部により起動
され、その動作終了後メイン制御部にその制御を
もどす。
YESキー制御部は、先ずPNT1の指し示して
いるPM1内の情報がbit15=0且つbit14=1であ
るかを確める。もし、bit15=0且つbit14=1で
なければその制御をすぐメイン制御部にもどす。
他の例においては、bit15=0且つbit14=1でな
ければ、その制御を次頁の第14行以降の制御に移
してもよい。もしbit15=0且つbit14=1である
なら下記動作を行う。
YESキー制御部は、PNT1の指示しているPM
1内の情報の下位bit0〜bit9が指しているアドレ
スによつて変換語テーブルを参照する。変換語テ
ーブルの該ブロツクのHEAD部には現在CRT上
に表示されている変換語を格納しているレコード
No.がiDNに格納されている。該レコードには、
該変換語の該分野が格納されている。YESキー
制御部は該分野情報を変換語分野レジスタに書き
込み、分野決定制御部を起動する。分野決定制御
部からその制御がもどされると、YESキー制御
部は、現在カーソル記号CCが指し示している
CRT上の*印に対応するページメモリPM1の内
容のbit15を1にする。これによりDCOT(表示
制御回路)は、今までCRT上に表示していた*
印をスペースに変更する。
次に選択すべきCRT上の変換語を捜す。この
機能はEDITキー制御部と基本的には同じであ
る。但し、EDITキー制御部がPM1の頭からス
キヤンするのに対し、本制御部では現在PNT1
が指している場所以後をスキヤンする点で異る。
以上でYESキー制御部の動作は終了する。
NOキー制御部は、第1の文字列が第2の文字
列に変換され、第2文字列が複数個存在した時
に、現在CRT上に表示されている第2文字列の
かわりに、それ以外の第2文字列を表示する役割
を担う。
NOキー制御部は、メイン制御部により起動さ
れ、その動作終了後メイン制御部にその制御をも
どすものである。
NOキー制御部は、先ずPNT1の指し示してい
るPM1内の情報がbit15=0且つbit14=1である
かを確める。もし、bit15=0且つbit14=1でな
ければその制御をすぐメイン制御部にもどす。も
し、bit15=0且つbit14=1であるなら下記動作
を行う。
NOキー制御部は、先ず前記PM1内の情報の下
位bit0〜bit9が指し示しているアドレスによつて
変換器テーブルを参照する。変換語テーブルの該
ブロツクのHEAD部には現在CRT上に表示され
ている変換語を格納しているレコードナンバーが
iDNに格納されている。
NOキー制御部は、現在のiDNをインクリメン
トする。この時もしiDNが、総レコード数iRNを
オーバーするならば、iDNを1に変更する。従つ
て、NOキー制御部は、それが起動されるたびに
iDNを1〜iRNまでの範囲内で、一定方向に回転
させることになる。しかる後NOキー制御部は、
今変更したiDNに対応するレコードに格納された
文字コードを拾い出し、ページメモリPM1内の
該当情報を変更する。以上動作終了後メイン制御
部にその制御をもどす。
BACKキー制御部は、NOキー制御部とほぼ同
一である。異る点はNOキー制御部が変換語テー
ブルのiDNを1〜iRNの範囲内で増加方向に回転
させるのに対し、BACKキー制御部は減少方向に
回転させることである。
INVキー制御部は、第2の文字列(変換語)を
第1の文字列(変換単位)に変換する役割を担
う。
INVキー制御部はメイン制御部により起動さ
れ、その動作終了後メイン制御部にその制御をを
どすものである。
INTキー制御部は、先ず前記PM1内の情報の
下位bit0〜bit9が指し示しているアドレスによつ
て変換語テーブルを参照する。変換語テーブルの
該ブロツクのHEAD部には現在CRT上に表示さ
れている変換語に対応する読み、即ち第1の文字
列が記入されている。INVキー制御部は、ページ
メモリPM1上の該第2の文字列を前記第1の文
字列に変更する。一般に第1の文字列は第2の文
字列よりその文字数が多いので、ページメモリ
PM1内の情報はその分すべてずらすことによ
り、情報の欠落が生じない様にする。
以上の動作終了後メイン制御部にその制御をも
どす。
INTキー制御部は、すべての制御部及び各種メ
モリ、レジスタ等のイニシヤライズを行う制御部
で文章入力開始時にメイン制御部により起動され
るものである。動作終了後は再びメイン制御部に
その制御をもどす。
DIN入力制御部は、前述の如き直接に漢字を指
定して入力する手段DINよりのデータを読み込
み、PM1に入力する制御を行う。即ちAMKが単
漢字入力であつて、IDKが直接入力の状態の時に
DINからのデータを読み込みPM1に出力するも
のである。
単漢字入力制御部は、AMKが単漢字入力とな
つている時FIFOからのデータ、即ち漢字の読み
をキーワードレジスタに送る。KF検索制御部
は、キーワードレジスタに入つた漢字の読みで
KF、即ち漢字フアイルを参照し該当の漢字群を
ページメモリ2(PM2)のアドレスPNT2に送
る。PM2に入つた漢字群は単漢字入力制御部の
制御によりDCOTを通つてCRTに表示される。
表示前述の如く、第30図に示す如く最下行のみ
が表示され、他の行は消えた状態となつている。
即ち単漢字入力状態では単漢字入力制御部の制御
によりDCOTのPM2のデータを選択しCRTに表
示する。この表示された漢字群の中から所望の漢
字を表示に対応するキーを押すことにより選択し
該漢字コードをPM1に送る。
変形例としては、前記の単漢字入力では文章
と、単漢字の列挙表示は同時に行わなかつたが、
第31図の如く行うことにより、より操作性を良
好とすることができる。
ここで第33図〜第60図に示したフローチヤ
ートにより文字処理装置の動作について説明する
ならば、第33図はメイン制御フローチヤートを
示し、図中YはYES、NはNOの略号である。
メイン制御部はモードキーDIN,IDK,
AMK、FIFO、プリントキー、カーソルシフトキ
ー、EDITキー、YESキー、BACKキー、INVキ
ー、NOキー、INTキー等のDEVICEから情報を
読み取り、該当する仕事(JOB)を、決定し、そ
れに対応する制御部を起動する。ここでモードキ
ーは、いつでも読取りのできる機能を有する。又
他のDEVICEは、そのDEVICEに情報が貰えられ
ているか否か即ち、まだ読取りが行われていない
情報が存在するか否かを示す機能と該情報を、読
取りが行なわれるまで保存しておく機能とを有す
るものとする。
FIFOからの入力が有つた場合はモードキーの
状態により起動する制御部が異る。即ちAMKキ
ーが自動になつている時はKB1入力制御部、
AMKキーが単漢字でかつIDKキーが間接の時は
単漢字入力制御部、AMKキーが単漢字でかつ
IDKキーが直接の時はDIN入力制御部を起動す
る。
プリントキーから入力が有つたらプリント制御
部、カーソルシフトキーから入力が有つたらカー
ソルシフトキー制御部、EDITキーから入力があ
つたらEDITキー制御部YESキーから入力があつ
たらYESキー制御部、BACKキーから入力が有つ
たらBACKキー制御部、INVキーから入力があつ
たらINVキー制御部、NOキーから入力が有つた
らNOキー制御部、INTキーから入力が有つたら
INTキー制御部をそれぞれ起動するものとする。
第34図で示すのはKB1入力制御のフローチ
ヤートであり、点線101で囲撓した部分は変換
を既に終つた仮名データの終りの6文字の部分を
必要に応じて変換文バツフアに残す制御ルーチン
を示すものである。又このフローチヤートにおい
てN(I)とあらわす時はバツフアもしくはメモ
リNの番地1のデータを示す。
又IHBUFは変換文バツフア、ILAはIHBUFの
データが変換された後に次に入力されるデータの
変換の参照範囲先頭データ部分を転送するために
用いられるIHBUFのアドレス情報、INPUTは初
期状態あるいは変換制御が完了した時は0で入力
途中では1である。IKSは漢字のシフト状態を示
し、αは漢字へのシフト、βは非漢字へのシフト
を示すものである。入力がされると“INPUT”
が初期値として0のとき即ち入力が開始されたと
きまたはカナ漢字変換が完了した直後に於ては、
101内のフローにしたがつて、前者の場合は変
換範囲の先頭を決定し、また後者の場合はすでに
変換し終つた部分の終りの6文字の部分を
IHBUFの先頭即ちIHBUF1よりつめるはたらき
をした後変換範囲の先頭即ちMPA1と変換参照
範囲の先頭即ちMPA5を決める。
“INPUT”が0でないときまたは上記101
内のフローを通過後入力されたキーが漢字シフト
コードであれば、現在の状態が非漢字へのシフト
状態即ちIKS=βであるかどうかを検べてもし
IKS=βのときは漢字シフトコードをαに変更し
て、またほかのときはβに変更して〓〓または〓
〓へ移る。〓〓で始まるフローはローマ字入力の
場合であり必要に応じてローマ字→カナの変換が
なされる。
第34図Cに於てはカナ漢字変換を開始すべき
かどうかの判定と開始すべき場合に於ての変換範
囲及び参照範囲を決定している。又34図Bにお
いて、102は平仮名、片仮名以外であるかを判
別するステツプであり、103は平仮名、片仮名
のち、に、な、い、ら、さ、チ、ニ、ナ、イ、
ラ、サの大文字もしくは小文字以外であるかを判
別するステツプである。
第34図Cにおいて、ステツプ104は、オー
バーフローはカレントアドレスが20より大の時
であり、ステツプ105において変換開始コード
は丸「。」、点「、」、「、」、EOP、EOF、NL等で
ある。
第35図はローマ字−仮名変換のフローチヤー
トである。
第36図はDIN即ち直接入力手段による漢字等
の入力フローチヤートである。
第37図は単漢字入力即ち漢字の音又は訓によ
る読み方をカナまたはローマ字で入力して列挙表
示してその中から所望の漢字を選択入力する制御
部のフローチヤートであり、ステツプ106にお
けるPM2(177)={はPM2のアドレス177に
“{”を入れることを示し、PM2(182)=}はPM
2のアドレス182に“}”を入れることを示す
ものである。
又ステツプ107はPM2のアドレスPNT2に
データを入れることを示しているものである。
又第37図Cにおいてステツプ108,109
は平仮名ち、に、な、い、ら、さ、片仮名チ、
ニ、ナ、イ、ラ、サ以外であるかを判別するステ
ツプであり、ステツプ110は平仮名、片仮名以
外であるかを判別するステツプである。
第38図はKF検索制御のフローチヤートであ
り、第39図は単漢字選択フローチヤートであ
り、第40図は変換制御フローチヤートであり、
このフローチヤートにおいて各ステツプについて
説明する。
1 MPA3>MPA2ならば変換すべき文字列が
変換文バツフアの中に存在しなかつたのでリタ
ーンする。
2 MPA3とMPA2との範囲内で変換文BUF内
に変換単位を捜す。
3 もし変換単位が存在しなければリターンす
る。本ルーチンが初めて起動されて2のステツ
プに来た時は一般に変換単位が存在するので次
のステツプ4に進む。
4 ステツプ2で捜した変換単位の範囲をMCW
1,MCW2にセツトする。
5 単語辞書テーブルNOをイニシヤライズす
る。
6 単語辞書WFから検索すべき第1の文字例と
してMCW3,MCW4に初期値をセツトす
る。
7 複合語の語数に対応するNEST DEPTHを1
にイニシヤライズする。即ち最初は、変換単位
が単数の語より成ると仮定する。
8 検索制御部を起動し、MCW3,MCW4で
規定される文字列をキーワードーとする語の検
索を行う。
9 検索の結果該当語が見つかればMCW5>0
でありステツプ10に進む、もし該当語が見つ
からなかつたらMCW5=−1でステツプ25
に進む。
10〜13 MCW3〜MCW6をNESTテーブルにリ
ザーブする。
14 ネストテーブルのEフイールドに検索した結
果見つかつた語の辞書情報が格納されている単
語辞書テーブルの先頭アドレスを、見つかつた
語の数だけ書き込む。本実施例では24個までの
同音語を書き込むことができる。
15 単語辞書テーブル空きNO.を更新する。
16 MCW3,MCW4とMCW1,MCW2が一
致していない時即ち変換単位が2つ以上の語か
らつくられる時、MCW3+MCW4の値と
MCW1+MCW2の値と比較することにより
変換単位のすべての検索を終了しているか否か
を判定できる。もし判定の結果残余部が有るな
らステツプ19に残余部が無ければステツプ1
7に進む。
17 変換単位テーブル作成制御部を起動し変換語
テーブルに変換語を書き込む準備等を行う。
18 変換結果処理制御部を起動しPM1への書き
込み、変換語テーブルへの書き込み等を行う。
変換文BUFに変換していない残りの第1の文
字列が存在していないかどうかを確めるためス
テツプ1に進む。
19 NEST DEPTHを更新する。
20 NEST DEPTHがオーバフローするか否かを
確かめ、もしオーバフローするなら検索不能と
判断されステツプ24に進む。
21 単語辞書テーブルがオーバフローするか否か
を確かめもしオーバーフローするならステツプ
24に進む。
22、23 MCW3,MCW4を残余部の範囲を示
す値にセツトし、再び単語辞書WFを検索する
ためのステツプ8に進む。
24 変換語が見つからなかつた時パラメータ
MCW8を−1にセツトする。ステツプ18に
進む。
25、26 検索の結果語が見つからなかつた時
MCW4から1を減じて、もしMCW40≠な
らば再び検索を行うためステツプ8に進む。も
しMCW=0ならばステツプ27に進む。
27 MCW7=0ならばこれ以上検索しても意味
がないのでステツプ33に進む。MCW7≠1
ならば、MCW7−1の段階での検索をやり直
すためにステツプ28に進む。
28 MCW7=MCW7−1
29 MCW7の段階での読みの数が1であつた
ら、再びステツプ27へ進む。1でなかつたら
MCW7の段階での再検索が可能でありステツ
プ30に進む。
30、31、32 リザーブしておいたMCW3,
MCW4,MCW6を復帰させ、MCW4につい
ては1を減じる。再検索のためステツプ8に進
む。
第41図は検索制御フローチヤートである。
第42図で示すのは変換単位テーブル作成制御
フローチヤートであり、Iは変換単位テーブルの
ROWナンバーであり、以下各ステツプの動作に
ついて説明する。
1 ネストテーブルには、変換制御部による、検
索結果が記入されている。このネストテーブル
から、語の組合せから成る複合語(即ち変換
語)を作成し、変換単位テーブルの1W目〜8W
目に、単語辞書テーブルの番号を記入する。
(もちろん複合語でない場合もある)
2 複合語の組合せの数をMCW8に記入する。
3 変換単位テーブルの語数の欄に組合せの語数
を記入する。
4 ステツプ4〜ステツプ24はステツプ1で作
成した変換語に対しそれぞれの品詞を確定する
ものである。
ステツプ4でほまず変換単位テーブルの
ROW NO.を1にイニシヤライズする。
5 MCW≠即ち複合語である時はステツプ6に
進む。
MCW7=1即ち1語からなる変換語の時は
ステツプ24に進む。
6 2語から成る複合語の時はステツプ7へ進
む。
3語以上から成る複合語の時はステツプ23
に進む。
7 第1語目の品詞を調べる。
8 接頭語であるならステツプ20に進む。接頭
でないならステツプ9へ進む。
9 名詞であるならステツプ10へ、名詞でない
ならステツプ23へ進む。
10 第2語目の品詞を調べる。
11 第2語目の品詞が名詞ならステツプ21へ進
む。名詞でないならステツプ13へ進む。
12 第2語目の品詞がサ変名詞であるならステツ
プ22へ進む。
サ変名詞でないならステツプ13へ進む。
13 第2語目の品詞が接尾語ならステツプ14へ
進む。接尾語でないならステツプ23へ進む。
14、15 第2語目の文字コードが“的”であるな
らステツプ16へ、そうでなければステツプ2
3へ進む。
16 変換単位テーブルの品詞欄に形容動詞である
ことを記入する。
17 活用欄にダ活用であることを記入する。
18、19 変換単位テーブルに記入されたスベテの
変換語に対し、ステツプ5〜ステツプ24を適
用する。
20 第2語目の品詞及び活用形を変換単位テーブ
ルに記入する。
21 変換単位テーブルの品詞欄に名詞であること
を記入する。
22 変換単位テーブルの品詞欄にサ変名詞である
ことを記入する。
23 変換テーブルの品詞欄と活用形欄に0を記入
する。
24 変換テーブルの品詞欄と活用形欄に、該語の
品詞と活用形を記入する。
25 変換単位テーブルの確かさの欄を0にイニシ
ヤライズする。
26〜29 変換単位テーブルの確かさの欄をセツト
するため文法ウエイト制御部、頻度ウエイト制
御部、接続ウエイト制御部、分野ウエイト制御
部を起動する。
30 変換語として採用するスレツシヨルドを決定
するため、スレツシヨルド決定制御部を起動す
る。
31 MCW9をセツトする。
第43図はスレツシヨルド決定制御フローチヤ
ートであり、変換単位テーブルに記入された確か
さの値においてその最大値から1000を減じたもの
と、0との大きい方の値をスレツシヨルドとし
て、決定する。
第44図は文法ウエイト制御フローチヤートを
示し、Iは変換単位テーブルのROWナンバーを
示すものである。
このフローチヤートにおいて、該変換単位の前
部に参照すべき文字列が存在するならば前部文法
チエツクルーチンを起動する。
又該変換単位の後部に参照すべき文字列が存在
するならば、不変化仮名部チエツクルーチンと活
用形チエツクルーチンとを起動する。
以上による文法チエツクを変換単位テーブルに
記述されたすべての変換語について適用する。
第45図で示すのは前部文法チエツクフローチ
ヤートであり、該変換語が動詞でありかつ該変換
単位の前部が格助詞である場合、確かさの値を増
加させる。
第46図は不変化仮名部チエツクフローチヤー
トであり、変換語の語数が1でかつ不変化仮名部
を持つ場合その不変化仮名部が、該変換単位につ
づく文字例と一致するか否かを調べ確かさの値を
与える。
第47図は活用形チエツクフローチヤートであ
り、該変換語が動詞、形容動詞、サ変動詞である
時、それらの活用形が確定すれば、それに続く文
字列も数文字に限定される。このことを利用し、
各変換語に対しての確さの値を与える。
第48図は頻度ウエイト制御フローチヤートで
あり、Iは変換単位テーブルのROWナンバーで
ある。ここでは変換語が1語より成る時は、該語
の頻度を、2語以上から成る時は、それらの頻度
の和を、確かさの値として与える。
第49図は接続ウエイト制御フローチヤート、
であり、語数が2の時の変換語に関し、接続テー
ブル1,2によつてその結合の強さを求め確かさ
を与える。
変換単位テーブルに記入されたすべての変換語
について上記操作を行う。
第50図は分野ウエイト制御フローチヤートで
あり、IWDは単語辞書テーブル、IBRは入力文分
野レジスタ(16W)である。そしてこのフローチ
ヤートは、入力文分野レジスタIBRの内容と各変
換語の分野情報より各変換語のウエイトを決める
フローを示しているものである。
第51図は変換結果処理フローチヤート、であ
り以下各ステツプについて説明する。
1 カレントアドレスJをMPA3に初期設定す
る。
2 カレントアドレスJがMPA2+1になるま
で以下の動作を繰り返す。
3 変換文BUFからカレントアドレスJの内容
を読み出す。
4 読み出した内容が漢字シフトコードαである
からステツプ9へαでないならステツプ5へ進
む。
5 読み出した内容をPNT1で示されるPM1の
中へ移す。
6 PNT1をインクリメントする。
7 カレントアドレスJをインクリメントする。
8 ステツプ8の段階で、カレントアドレスJに
は処理済アドレス+1が格納されており、その
値をMPA3にセツトする。
9 MCW9=−1、即ち、変換語が存在しなか
つた時ステツプ10に進む
MCW9≠−1、即ち、変換語が存在した時
ステツプ17に進む。
10〜16 変換文BUFの内容を読み出しページメ
モリPM1に順に書き込む。その際カレントア
ドレスJとPNT1は順次インクリメントす
る。途中でカレントアドレスJがMPA2+1
に達したらステツプ8へ進む。又読出した内容
が漢字シフトコードαであつたらステツプ8へ
進む。又読出した内容が漢字シフト解除コード
βであつたら、該コードをPM1に書き込むの
は省略する。
17 変換語が1個ならばステツプ23に進む、変
換語が2個以上ならばステツプ18に進む。
18 MPA4のbit15=0、bit14=0にしたものを
PNT1の示すPM1に書き込む。
19 PMT1をインクリメントする。
20 変換単位テーブルから“確かさ”の高い順に
MCW9に示される数だけ抜き出す。
21、22 単語辞書テーブルを参照し該変換語の文
字コード及び分野情報を見出し、変換語テーブ
ルに書き込む。
その際iDN=1にする。
23 MPM4を更新する。
24〜26 変換単位テーブルに記入された変換語の
内“確かさ”の最も高いものを抜き出し、該変
換語を単語辞書テーブルを参照することにより
文字コードに変換する。然る後、該文字コード
をPM1に書き込む。
27 カレントアドレスJを更新する。
28 変換語が1個ならステツプ29へ進む、
変換語が2個以上ならステツプ10へ進む。
29 該変換語を構成する語の分野情報を単語辞書
テーブルより見出し、変換語分野レジスタに記
入、分野決定制御部を起動する。
<注> 実際にはPNT1のインクリメントに対
し193以上の値をとらないよい、制限をする必
要がある。
第52図は入力文の分野を自動的に決定する分
野決定制御フローチヤートであり、IHBRは変換
語分野レジスタ、IBRは入力文分野レジスタ
(16W)である。
第53図はカーソルシフトキー制御フローチヤ
ートであり、PNT1が1〜192までをサイクリツ
クにインクリメントするようにする。
第54図はEDITキー制御フローチヤートであ
り、ページメモリPM1の頭からbit15=0、bit14
=1である場所をさがし、その値をPNT1にセ
ツトする。
第55図はNOキー制御フローチヤートであ
り、カーソルが*印の位置にある時のみ本
ROuTiNEを有効とする。
PNT1が示すPM1の内容から、変換語テーブ
ルに格納されている変換語情報が存在するアドレ
スを知ることができる。変換語テーブルに記入さ
れているiDNを1〜iRNの範囲でサイクリツクに
インクルメントし、かつiDNによつて示される変
換語をPM1に書き込む。
第56図はBACKキー制御フローチヤートであ
り、NOキー制御部と下記の点で異るのみであ
る。即ち、iDNとiDNと1との間をサイクリツク
にデクリメントする点である。
第57図はINVキー制御フローチヤートであ
り、カーソルが*印の位置にある時、PNT1で
示されるPM1の内容を調べることにより、変換
語テーブルの中に格納されている読み情報(第1
の文字列)が存在するアドレスを知ることができ
る。このようにして見つけた第1の文字列をPM1
内に移す。その際、一般に第2の文字列の長さが
第1の文字列の長さより短かいので、第1の文字
列をPM1に格納する場所を確保するためにPM1
のカーソル以後に存在する文字列を移動しなけれ
ばならない。
第58図はYESキー制御フローチヤートであ
り、カーソルが*印の上にある時のみ本ルーチン
が動作する。PNT1が指し示しているPM1の内
容より、変換語テーブルの該当位置を操す。iDN
に対応するレコードに格納されている分野情報を
分野レジスタに格納した後分野決定制御部を起動
する。
次にPNT1の示しているPM1の情報のbit15を
0にすることで、CRT表示から*印を消す。
次に、カーソル以後にある*印をサーチし、カ
ーソルをその位置まで移動する。その際カーソル
以後に*印が一つもなければPMN1=1として
カーソルをCRT表示の頭にもつてくる。
第59図はプリント制御フローチヤートであ
り、PM1の頭からプリンタにコードデータを出
力する。その際、コードデータのbit15とbit14が
共に0の時のみ文字データであり、その出力を行
う。
第60図はINTキー制御フローチヤートであ
り、各種パラメータ、BUFのイニシヤライズを
行うものである。
[効果]
以上詳述しました様に、本願発明により、仮
名/漢字混じり文中の候補文字列が複数存在する
当該位置において、表示される候補文字列の切換
を後続の文字列を乱すことなく行うことができ、
同音異義語の選択等、文字処理装置の操作性が大
幅に向上する。
又、本発明により、読み情報を入力する入力手
段、上記入力手段から入力された読み情報を仮
名/漢字混じり文に変換する変換手段、上記変換
手段によつて変換された仮名/漢字混じり文の表
示が可能な表示手段、上記読み情報に対応する候
補としての文字列が複数存在する上記文中の当該
位置において、所望の文字列を表示すべく、候補
文字列を切換え表示する切換え手段、上記切換え
手段の操作により、表示されるべき候補文字列の
内、最多文字数を導出する導出手段、上記導出手
段からの情報に基づいて、上記最多文字数の候補
文字列が表示可能な領域を上記文中の当該位置に
設定する設定手段、上記設定手段によつて設定さ
れた上記領域内において、上記指示手段からの指
示に基づいて1つづつ候補文字列が切換え表示す
る様、上記表示手段を制御するとを有した文字処
理装置を提供することが可能となつた。[Table] Next, for items that cannot be corrected using the above method, it is necessary to easily return them to the original first character (corresponding conversion unit). Use the INV key for this purpose. First, move the cursor using the method described above (EDIT
key or YES key) or
Using the CURSOR SHIFT key (the CURSOR SHIFT key can move the cursor by one character with one operation), send the cursor signal CC to the "*" position corresponding to the kanji you want to convert to the first character. move it. By operating the INV key, the second character is converted to the first character and displayed. This situation is shown in Table 3. The method for automatically converting a first character string into a second character string in the process of converting it has been described above. Next, a method for inputting kanji characters one by one will be described. There are two methods for inputting kanji units. One is an indirect input method and the other is a direct input method. First, the automatic single kanji selection key AMK is set to the single kanji side, and then the indirect direct selection key IDK is set to the direction desired by the operator. Thereafter, the cursor signal CC is shifted by the cursor shift key CSK and brought to the corresponding position where the input is desired. If the indirect direct selection key IDK is set to the indirect side, input kanji using the following procedure. First, press the kanji shift key KK23 in Figure 1,
Next, enter the reading of the kanji. For the reading of the kanji, enter the reading of the kanji in Roman characters if the Roman character/kana selection key RKK is in Roman characters, and if RKK is in kana, enter the reading in kana. The reading of a kanji can be input as a sound or a kun, or only a part of the reading of the kanji from the beginning can be input. Thereafter, when the kanji shift key KK is pressed again, the corresponding kanji are listed on the screen 13 as shown in FIG. 30 T1. The listed kanji groups correspond to the key group in the second row from the bottom in Figure 1B, and are the English character keys A, S,
They correspond to D, F, G, H, J, K, L; respectively in that order. Next, if a desired kanji is displayed, the user presses the key corresponding to the position of the kanji to input it. If the desired kanji is not displayed, ":"
By pressing the key or space key, a group of kanji following the kanji group on the current screen is displayed, and the desired kanji can be input in the same manner as described above. For example, the 32nd
In the diagram, if you want to change "hon" at position T2 to "ki", move the cursor to position T2 using the cursor shift key CSK and press the single kanji selection key.The entire screen will disappear and the cursor will move to the bottom left corner. Move to. After that, as mentioned above, press the Kanji shift key KK,
By pressing the kanji shift key KK for "la", kanji starting with "la" are listed as shown in T1 in FIG. 30.
If you press the key "S" corresponding to "come" here, T2
The character ``Kai'' is inserted at the position of , the data is corrected and displayed on the screen, and the cursor advances to the next character position. A single kanji input control section, which will be described later, performs the above-mentioned control. In this example, the operator's standard finger usage, for example, the middle finger of the right hand is 9, I, K, Yo, etc.
It is used to input the letters ``d'', ``no'', and ``ne'', but it is structured so that pressing any of the keys will specify the third letter from the left in Figure 30, which corresponds to the middle finger of the right hand. . When the indirect direct selection key is set to the direct side, the kanji code can be input into the data buffer corresponding to the current cursor position using the kanji direct input means DIN, and the kanji code can be input at the current cursor position. can be displayed. After input, the cursor automatically advances to the next position. This direct input means is capable of inputting not only kanji but also kana alphanumeric characters and other symbols. Since individual kanji characters can be input as described above, words that are not in the word dictionary file can also be easily input, and kanji characters that have been erroneously converted during conversion can also be easily corrected. In the manner described above, sentences can be created easily and quickly. Next, when the print key is operated, the displayed text is printed out. At this time, the * symbol indicating the existence of multiple homophones (converted words) and extra spaces (for example, the space after "Year" in FIG. 5) are deleted and recorded in a condensed manner. Although the most basic operation of the character conversion device according to this embodiment is as described above, this character conversion device will be explained in more detail using the drawings. FIG. 7 is a block diagram showing the character conversion device according to this embodiment.
Reference numeral 3 indicates keys having the above-mentioned functions, each of which is provided with an encoder for generating a code signal corresponding to the key. Other functions of each of the keys mentioned above will be explained in more detail below. The CPU is a processing unit that performs, for example, 16-bit processing. Such a processing unit CPU has functions such as data transfer, addition, and comparison, and examples include Texas Instruments' TMS9900, National Semiconductor's PACE, Panahuacom's PFL16A,
Consists of NEC μPD16, etc. ROM is control memory, keyboard KB1, KB
2. This is a read-only memory that stores control procedures, control data, etc. for determining input instructions from the KB3 and performing processing in accordance with each instruction. This ROM
is divided into blocks as shown in FIG.
A description of each block will be given later. Each control unit performs control regarding its name. for example,
The KB1 input control section performs KB1 input control. The main control section also supervises other control sections. FIFO is a memory that temporarily stores the output from KB2, is a first-in-first-out memory, and has a capacity of 64W (1W16bit). Information that exceeds the processing capacity of the CPU is stored. PM1 is a page memory, and as shown in FIG. 5, one document page has a character capacity of, for example, 16 (characters) x 12 (lines), ie, 192 WORD. The contents of the page memory PM are displayed on a CRT (described later) and output to an output device such as a printer, magnetic disk, etc. Note that the 14th and 14th bits of each WORD in page memory PM
The following information is stored in 15 bits. (Please refer to Figure 8) When bit15-0 and bit14-0, the character code is entered in bit13 to bit0. bit15-0, bit14-1 The address of the homophone memory comes from bit9 to bit0. bit15-1, bit14-1 means love out code. When this code exists, a space is displayed on the display surface of the display means. Also, it is ignored when printing out. PM2 is a page memory and has the same configuration as PM1. The contents of this memory can be displayed on a CRT like PM1. WF is a word file, and as shown in FIG. 11, the pronunciation of a word (kanji) is a keyword, and the word character code, grammatical information, etc. for the pronunciation of the word are input. In this embodiment, a storage capacity of 32W is prepared for one word, including 10WORD for the reading of the word (kana heading), the reading of the unchangeable kana part, that is, the part that does not change depending on the conjugation of the kanji okurikana. For example, 3WORD for "shi" in "beautiful", 5WORD for word character code, and 5WORD for part-of-speech information.
1WORD, 1WORD for conjugation information, 1WORD for affix information, 4WORD for field information, 1WORD for information on the number of kanji, that is, the number of character codes entered in the character code field, 1WORD for the invariant kana part. For information on the number of reading codes entered
1WORD, 1WORD as frequency information, as vacant
Consists of 4WORD allocation. The part of speech information corresponds to each bit of 1WORD as shown in FIG. 10. This includes information such as prefixes and suffixes. As shown in Figure 11, the conjugation information corresponds to each bit of 1WORD with a conjugation such as a verb or an adjective. As shown in FIG. 12, the affix information corresponds to each bit of 1WORD. Affix information includes place name, person's name, organization name, ground (things connected to place name such as prefecture, city), people (things connected to person's name such as Mr., Kimi), and affixes (things connected to organization name such as division, etc.). It is categorized as ``Association''. Frequency information was determined with reference to materials from the National Institute for Japanese Language and Linguistics. The field information corresponds to each bit of 1WORD, as shown in FIG. 13. The fields in which each word is frequently used are shown. Note that the words stored in the word file WF can be the converted words. As shown in Figure 14, the single kanji dictionary KF uses the readings of kanji as keywords (5W), making it possible to search for kanji codes. You can search how to read kanji by both sound and kun.
If there is a different reading for each kanji, a KF is created for that reading. Note that in this example, we used a structure of one kanji for one kana heading, but if there are multiple kanji with the same sound, it is possible to combine them into a table that stores multiple kanji with the same sound for one heading. teeth,
it is obvious. PNT1 is a pointer memory and has a storage capacity of 8 bits. This memory serves as an address register for specifying the position of the cursor symbol CC displayed on the display surface of the display means and as an address register for reading and writing the page memory PM1. PNT2 is an address register for read rat of page memory PM2. Both PNT1 and PNT2 have address values of 1 to 192.
has meaning. It is invalid when set to any other value. DCOT is the display control circuit (Fig. 16),
As shown in the figure, it consists of a code converter CCT, a selector (SLT), a character generator CG, and a CRT controller CCL. The code converter converts the code of the information output from PM1 according to the following rules. That is, when bit15=0 and bit14=0, output as is. When bit15=0 and bit14=1, convert to the character code corresponding to “*”. When bit15=1 and bit14=1, convert to space code. When bit15=1 and bit14=1, convert to space code. The selector selects either the output of PM1 or the output of PM2 via the code converter to the lock key AMK.
and the role of selection in relation to IDK. The CRT controller has the function of displaying output information from the selector on a display and displays a cursor signal at the position specified by the pointer PNT1. Such a CRT controller refers to a character generator CG, generates a character pattern by inputting a character code to the CG, and displays the character code in the page memory PM. The display control circuit DCOT controls the display to display 12 lines vertically and 16 characters horizontally. Therefore, if page memory PM1 or PM2 does not contain a carriage return code or line feed code, there is a counter in the display control circuit that counts the number of characters to display 16 characters per line, and 12 lines. counter the lines,
A counter is also provided to count the lines so that there are 12 lines. In addition, the processing unit CPU uses page memory PM and pointer
The time to control PNT is display control control
DCOT is performed during the transition from one line display to the next line display. A CRT is a display unit that consists of a cathode, a ray, and a tube. A display control circuit is installed in such a display unit CRT.
Display information under the control of DCOT. The direct input means DIN is TEN as shown in Figure 16.
Consists of KEY 34 (KB4) and encoder ENCD. The encoder is responsible for converting the 4-digit numbers output from KB4 into character codes. As a result, a character defined by a four-digit decimal number is converted into a character code corresponding to that character. In addition, the direct input means DIN is a kanji input device, for example,
Oki Electric Industry Co., Ltd. KANJI TAB ENTRY−
500, Fujitsu Ltd. FACOM6802B, etc. OU is an output device that prints the characters displayed on the display unit CRT. For example, it is composed of wire dots, ink jets, thermal printers, etc. Furthermore, a magnetic disk or the like may be connected as an output device to increase the storage capacity. RAM is a memory that is provided to control the transfer of data processed by the processing unit CPU. Its structure consists of various REGISTER, WORKING, AREA, conversion parameter 1, conversion sentence buffer, conversion word table, conversion parameter 2, conversion unit table, nest table, word dictionary table, etc. as shown in Figure 17. . Further, the above REGISTER includes a keyword register, a selection number register, an input sentence field register, a conversion word field register, etc. Next, the details and mutual relationships of each parameter, buffer, table, and each control section will be explained. For individual explanations, the respective drawings will be used, and for explanations of mutual relationships, FIG. 18 will be used. The converted sentence BUF is shown in Figure 19. The conversion sentence BUF is a buffer for storing sentences to be converted, and is controlled by the KB1 input control section described later.
The reading information of sentences inputted from KB1 is converted and stored according to a predetermined format. The format of the conversion sentence BUF is as shown in FIG. Character information includes all kana and symbols.
Expressed by JIS code. Also, special codes α and β are used to indicate the part to be converted into Kanji (hereinafter referred to as conversion unit). The information stored under the control of the KB1 input control section includes the text information and special codes α and β. α specifies the beginning of the conversion unit, and β specifies the end of the conversion unit. Conversion parameters MPA1 and MPA2 are parameters that specify the range of information stored in the conversion sentence buffer to be converted into the second character string, and KB1
It is set by the input control section and becomes a parameter for subsequent conversion (see FIG. 20). MPA3 specifies the first address within the range excluding the range where the conversion has been completed. KB
Initialized by the 1-input control section,
Set to MPA3-MPA1. MPA4 is a register that stores an empty number in a conversion word table, which will be described later. The specific role of MPA4 will be discussed later. MPA4 is initialized by the INT key control section. MPA5 and MPA6 are the ranges to be converted, i.e.
These indicate the first address and last address to be referenced when converting between MPA1 and MPA2. In the KB1 input control section, the AMK key is automatic,
In addition, when there is an input from KB1, the operation starts according to a command from the main control section. After the operation is completed, control is returned to the main control section. The KB1 input control unit converts the information input from KB1 into a converted sentence.
It plays the role of converting into the format specified by BUF, and then writing the information in the conversion statement BUF, and at the same time writing the parameters necessary for conversion into conversion parameter 1, and giving instructions to the conversion control unit to start conversion. take charge The input from KB1 is
By operating the RKK key, you can select between Kana input and Romaji input. Also, for the KB1's Kanji shift key KK, the odd-numbered presses indicate the beginning of the conversion unit, and the even-numbered presses indicate the beginning of the conversion unit.
This indicates the end of the conversion unit. The KB1 input control section converts the above input into a format specified by the above-described converted text buffer, and writes the converted information to the converted text buffer. The conversion of the information stored in the conversion sentence buffer into a kanji-mixed sentence (second string) starts when one of the following conditions is satisfied:
When any of the following conditions is satisfied, an instruction to start the conversion is given to the conversion control unit. 1 Symbols such as “,,” are included in the input information from KB1.
etc. existed. 2 When a kanji start code is generated by the kanji shift key. 3 When a certain number of characters are entered after the Kanji shift key is pressed twice. 4 When the buffer overflows. The KB1 input control section sets the conversion start position and end position of the information stored in the conversion sentence BUF in conversion parameter 1 before giving an instruction to start conversion to the conversion control section. Conversion to the second character string is performed within this range. At the same time, a reference range as related information for conversion is also set to conversion parameter 1. In kana-kanji conversion, the information before and after a word is important, so when converting a word in the middle of a sentence to kanji, the kana-to-kanji conversion is controlled so that the information before and after is always added. Romaji-kana conversion is activated by the KB1 input control unit when inputting vowels, ie [A, I, U, E,
Keyboard for [O] or [X] (see Figure 1)
The corresponding kana above, namely [chi, ni, na, i, ra]
Or, it is performed when either [sa], [chi, ni, na, i, la] or [sa] and their respective lowercase letters are input. Conversion is performed with reference to the Romaji-kana correspondence table (FIG. 21). For example, when inputting "A", enter Roman characters on the keyboard shown in Figure 1, and when the "A" key, that is, the "Chi" key is pressed in the hiragana shift state, the Romaji-kana conversion control unit is activated and the 21st "A" is extracted from the table shown in the figure. As shown in FIG. 22, the word dictionary table is a buffer for extracting and storing only information necessary for conversion from among the information stored in the word dictionary WF, and has a capacity of 32 x 24 W. That is, as mentioned above, since it has a capacity of 32 W per word, information for 24 words can be stored, and the stored information is sequentially numbered from 1 to 24 for each word. Writing to this word dictionary table is performed by conversion control, which will be described later. The nest table is a table written by the conversion control unit (described later) when finding a conversion word from each conversion unit, and as shown in FIG.
It has a capacity of This embodiment has a function of automatically dividing a conversion unit. For example, the conversion unit 〓Kihon-teki〓 is automatically divided into 〓Kihon〓 and 〓Text〓. The number of divisions is not limited to two as in the above example. In this embodiment, up to eight divisions are allowed. The words obtained by division are either independent words, prefixes, or suffixes. This nest table stores information about this division. For each segmented word, there are 28W of information storage locations. In FIG. 23A, A is the address in the converted sentence buffer where the pronunciation of the word is stored. B
is the number of readings of the word. C is the number of words when there are multiple words corresponding to the reading of the word. D is the leading number of the word dictionary table that stores the word dictionary information corresponding to the word (one of the numbers 1 to 24 of the word dictionary table mentioned above). E is a number in the word dictionary table in which word dictionary information corresponding to the word is stored. Assume that the conversion unit 〓Kihonteki〓 is stored at the head of the conversion sentence buffer, and a nest table corresponding to the conversion unit has been written by the conversion control unit, which will be described later. At that time, "kihon" and "teki" are separated, and the character string (word) corresponding to the former is "basic", and the character string (word) corresponding to the latter is "enemy", "drop", "suit", etc. Assume that four types of "targets" are found by the conversion control unit, which will be described later.
An example of the nest table at this time is shown in FIG. 23B. The conversion parameter 2 is written by a conversion control unit, which will be described later, when converting a conversion unit into a conversion word, and includes various parameters.
As shown in Figure 24, it has a capacity of 9W, and MCW1~
Names up to MCW9 are given. MCW1 is a register in which a conversion control unit, which will be described later, writes the start address of a conversion unit found within a specified range of the conversion sentence buffer (range specified by conversion parameter 1). MCW2 is the length of the conversion unit. MCW3 is the start address of the word in the conversion unit that is actually searched in the word dictionary WF by the conversion control unit, which will be described later. MCW4 is the length of the word for which the search is performed. MCW5 is a register in which the number of words obtained as a result of the search is entered. However, when it is negative, it indicates that the corresponding item did not exist as a result of the search. MCW6 is an empty space in the word dictionary table that stores word dictionary information for each word obtained as a result of the search.
No. 24 in the word dictionary table is an empty table. MCW7 is the number of divisions in the conversion unit division. MCW8 is a register in which the number of converted words corresponding to the conversion unit is written. A positive value indicates the number of converted second character strings, and a negative value indicates that the conversion could not be performed. MCW9 is the number of words whose "certainty" (described later) exceeds a certain threshold among the eight MCW conversion words. The conversion control section starts operating according to instructions from the KB1 input control section, and returns control to the KB1 input control section after completion. This control unit converts the range defined by conversion parameter 1 of the information (first character string) stored in the conversion sentence buffer into a second character string, and stores the result in the nest table and word dictionary. Write to table, conversion parameter 2. After that, it takes on the role of activating the conversion unit table creation control section and the conversion result processing control section. Here, the concept of the conversion control section will be described. The conversion control unit first searches for a conversion unit within the range from MPA3 to MPA2. Once the conversion unit is found, set MCW1 and MCW2. At the same time, MCW6 is set to 1 to clear the word dictionary table. Next, in order to search the word dictionary WF and find the conversion word corresponding to the conversion unit,
Set the keywords of the word dictionary WF in MCW3 and MCW4. Naturally, first of all,
Set MCW3=MCW1 and MCW4=MCW2. Also, give 1 to MCW7 as an initial value.
(The MCW 7 will be described later.) The search is performed by a search control unit located within the conversion control unit. Search control uses dictionary information corresponding to keywords set in MCW3 and MCW4 as a word dictionary.
Search from WF and set the results in the word dictionary table and MCW5. If a result of the search is found, the number is set in MCW5, and the dictionary information is stored in the word dictionary table starting from the position indicated by MCW6. If no result is found, MCW5 is set to -1. After the above operations of the search control section are completed, the conversion control section examines the search results. if,
If MCW5 is negative, 1 is subtracted from MCW4 and the word dictionary is searched again by the search control unit.
This operation is repeated until the corresponding word is found. If the corresponding word is found, that is, if MCW5 is a positive number, the state at that time is written into the nest table. That is, MCW3 is shown in Figure 23A,
Save MCW4 to B, MCW5 to C, and MCW6 to D. In addition, E indicates the corresponding number in the word dictionary table that stores the dictionary information of the corresponding word.
Fill in only the number of minutes set in MCW5. If there is a residual part in the conversion unit in the previous search, 1 is added to MCW7, and the word dictionary search for the remaining part in the conversion unit is performed in the same manner as the previous time. At this time, MCW3 and MCW4 convert into an address and length indicating the remaining part. However, if the corresponding word is not found in the search for the remaining part, the word found in the search when it was written into the nest table last time is canceled. Therefore, at this time, subtract 1 from MCW7,
Re-write the information already written to the nest table
Return to MCW3~MCW6. And further MCW
The search control is executed again by subtracting 1 from 4. If the word dictionary search for the remaining part is successful, save MCW3 to MCW6 in the nest table as before, enter the specified items in section (E) of the nest table, and if there is still a remaining part. repeats the above explanation. The conversion unit is thus converted as one or more words. Through the above process, the number of divisions of the conversion unit is written in MCW7. The conversion ends with the above steps, but if the conversion cannot be completed in the end, MCW7=1, MCW5=-
It is clear from the above explanation that MCW4 is set to 1. After that, if the conversion is successful, the conversion control section activates the conversion unit table creation control section, and then activates the conversion result processing control section. If the conversion is unsuccessful, MCW8 is set to -1 and the conversion result processing control section is activated. After the conversion result processing control unit finishes its control,
The conversion control unit again searches the conversion sentence buffer for the next conversion unit to be converted. If it exists, the above control is repeated. After converting the entire range specified by conversion parameter 1, the conversion control section returns control to the KB1 input control section. The KB1 input control section transfers its control to the main control section as described above. The conversion unit table is a place for storing combinations of words (sometimes only one word) corresponding to conversion units, and is a table in which the certainty of conversion for each combination is entered. As shown in FIG. 25, the conversion unit table has a capacity of 11×24W. It has a capacity of 11W for each combination. Therefore, a total of 24 combinations can be stored. For example, as mentioned above, suppose that for the conversion unit 〓Kihon Teki〓, 1 and 4 words corresponding to ``Kihon'' and ``Teki'' are obtained, respectively (this information is recorded in the nest table). , four combinations of 1×4 can be made as combinations of both. 11W of information is stored for each of these four ways. The first 8Ws define word combinations, and their numbers are the numbers of word information stored in the word dictionary table. The next 1W is the number of words, i.e. the number of numbers written in the first 8W,
The next 1W is a field in which to enter the part of speech of the combination as a whole. For example, the compound word ``basic'', which is a combination of ``basic'' and ``target'', is treated as an adjective verb. The next 1W is a column to enter the "certainty" of the combination. Writing to the conversion unit table is first performed by the conversion unit table creation control unit, and then the “certainty” column is written by the grammar weight control unit, frequency weight control unit,
It is modified by the affix weight control section and the field weight control section. The main function of the conversion unit table creation control section is to create the conversion unit table. For creation, the nest table and word dictionary table conversion parameter 2 are used. Also, in MCW8, the number of types of word combinations entered in the conversion unit table, that is, the number of converters is entered. Next, write down the part of speech and conjugation of the combination as a whole. The problem here is which one to select from among these multiple conversion words. Therefore, in order to modify the "certainty" term of the conversion unit table, the grammar weight control section, frequency weight control section, connection weight control section, and field weight control section are activated. With the above steps, the conversion unit table can be completed. Next, set MCW9, but as mentioned above, MCW9 can be the number of types of word combinations entered in the conversion unit table, but here we will use another setting method and explain it. . That is, it is defined in terms of the number of thresholds exceeding a certain threshold, taking into consideration the certainty modified by each of the weight control sections. Also, the threshold may always be constant, or
It may be changed depending on each conversion unit. The threshold is determined by a threshold determination control section included in the conversion unit creation control section. This makes it possible to eliminate the output of converted words that are clearly erroneous. The grammatical weight control unit performs a grammatical check and weights each second character string converted from the conversion unit. Note that the grammar check is performed within the reference range indicated by MPA5 and MPA6. It is started by the conversion unit table creation control section, and after completion, the control is returned to the conversion unit table creation control section. The grammar weight control section is roughly divided into two parts. One is that the converted sentence buffer is divided into the grammar check section that checks the connection with the front part of the conversion unit, and the rear grammar check section that checks the connection with the rear part of the conversion unit. The front grammar check part checks whether the front part of the conversion unit is a case verb when the second character string is a verb.If it is a case particle, it increases the weight, and in other cases, it increases the weight. Do something to reduce weight. The rear grammar check section is further divided into two parts.
One is the unchangeable kana part check which checks whether the character following the conversion unit matches the pronunciation of the unchangeable kana part in the word dictionary table, and the other is This is a conjugation check that checks whether it matches the conjugation of a verb, etc. The conjugations of verbs, adjectives, etc. have regularity in their changes, as is common knowledge, and once the type of conjugation of a verb is determined, the letters that follow it will inevitably be determined. Both the unchanged kana part check and the conjugated form check are
It plays an important role in determining the "certainty" of a string. Weights are calculated for all second character strings listed in the conversion unit table. The frequency weight control section has the role of checking the frequency and assigning weights to each of the converted words converted from the conversion unit. This control section is activated by the conversion unit table creation control section, and returns its control to the conversion unit table creation control section after completion. The frequency weight control section performs control such that frequency information of each word listed in the conversion unit table is obtained from the word dictionary table and added to the weight of each second character string. Connection table 1, as shown in FIG. 26, is a table showing connection relationships between parts of speech, prefixes, or suffixes of independent words. The numbers in the table indicate the degree of connection between each element. However, although this number was determined empirically, it can be approached to a better value by arbitrarily changing it. In the figure, the x mark indicates an extremely low possibility of connection. The connection table 2 has the 12th connection table as shown in FIG.
This is a table showing connection relationships based on the connection information shown in the figure. The view of the figure is the same as connection table 1. The connection weight control section is responsible for adding a connection check and weighting each of the single or plural conversion words converted from the conversion unit. This control section is activated by the conversion unit table creation control section, and returns to the conversion unit table creation control section after the operation is completed. This control section is roughly divided into two parts. One is a part-of-speech connection check section using affix table 1, and the other is a semantic connection check section using connection table 2. In both cases, when the second character string consists of two words, the connection between them is investigated. The part-of-speech connection check section checks the connection between the two words that make up the second character string based on the part-of-speech. This can be obtained by referring to the word dictionary table, and the weights of these connections can be obtained from the connection table 1. This weight information is added to the "certainty" column (field) of the conversion unit table. The semantic connection check section checks the connection between two words constituting the second character string based on their semantic relationship. The first classification of words was from this standpoint.
This is the connection information shown in Figure 2. Connection information for each word is
It can be obtained by referring to the word dictionary table from the storage number in the word dictionary table written in the conversion unit table, and the weight of these connections can be obtained from the connection table 2.
Add these weight information to the certainty column (field) of the conversion unit table. The process ends by assigning weights to all second character strings written in the conversion unit table. Field information as shown in Figure 13 is stored in the converted word field register in REGISTER in Figure 17.
There are two cases for this set. One is when a word is uniquely determined by kana-kanji conversion, and field information of the uniquely determined word in the conversion unit table is set in the converted word field register by the conversion result processing control unit. be done. Of course, if there is only one word with the same sound, it is treated as uniquely determined and treated in the same way as above. So 1
In this case, when one word is selected using the YES key or the NO key in a state where there are multiple homophones and cannot be uniquely converted, the field information of the selected word is retrieved from the converted word table using the YES key. It is placed in the converted word field register by the control unit. There are 2 words in the conversion word field register, and when a compound word, that is, two or more words constitute one conversion unit, the field information of the two words is entered in the conversion word field register. The field information entered in the converted word field register is added to the information in the input sentence field register by the field determination control section. The input sentence field register consists of 16 WORDs, with one word allocated to each field. For example, a word that has had a bit of significance in the field of literature in the past is
28 times, law 20 times, company 10 times, science 2 times, home 4 times, then the 16 WORDs in the input sentence field register above are 28, 20, 10, respectively.
24., that is, if shown corresponding to FIG. 13, [0, 28,
20, 10, 2, 0, 4, 0, 0, 0, 0, 0, 0,
0, 0, 0, ] are accumulated. Here, the field situation where only the literature item is set in the converted word field register, that is, one of the field information WORD in Figure 13 is
In order from 0'S bit [0, 1, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0], the field determination control unit sets each bit of the converted word field register to each WORD of the input sentence field register. It can be added to the mouth. Therefore,
In this example, 1 is added to the WORD of literature, and the RD of W in the field of literature becomes 119. Therefore, in this example, the values of each WORD in the input sentence field register are [0, 29, 20, 10, 2, 0, 4, 0, 0, 0,
0, 0, 0, 0, 0, 0]. The field weight control section has the role of checking each of the single or plural second character strings converted from the conversion unit based on field information and assigning a weight to each of them. This control section is activated by the conversion unit table creation control section, and after the operation is completed, returns control to the activated control section. As shown in the flowchart of Fig. 50, weighting is done based on field information, and the contents of the input sentence field register mentioned above and the field information of each single or multiple conversion word are calculated for each field. , and then add up the results of the above multiplication for each converted word and use it as the basic data for the weight information of each converted word.In order to balance it with other weight information, such as weight information from a grammar check, etc.
Multiply by a correction constant, for example 30, and add it to the AC of each corresponding word in the conversion unit table of FIG. 25. Weighting based on field information is performed using the method described above. The conversion word table is a table in which the information on the conversion results compiled in the conversion unit table is compiled for display on a CRT. FIG. 28 shows its format. The capacity is 1024W. 1
One block is assigned to one conversion unit. One block consists of a HEAD that provides the definition of the block and multiple records corresponding to multiple conversion words. The HEAD section consists of 5 iRL, iRN, iDN, iCL, and iCC.
Consists of items. iCC is 20W, others are 1W. iRL is the record length, iRN is the number of records, iCL is the number of characters in kana reading for the conversion unit, iCC
is the character code of the kana reading of the conversion unit.
iDN is a register indicating the number of the converted word displayed on the CRT. For example, when the converted word entered in the third record of a certain block is displayed, the iDN will be 3. Also, if the kana reading of the HEAD section is displayed, it is set to 0. The record consists of four items: iFL1, iFL2, iAC, and iKC. iFL1, iFL2, iAC are
1W, iKC is generally several W (variable length). Each record is a record in which the conversion result of the conversion unit, that is, the conversion word, is entered in the form of a character code. iFL
1 is an item for entering the field of the converted word, and is the same as that described in the word dictionary. iFL2
is used to fill in the field corresponding to the second word when the converter consists of a plurality of words. iAC is the "certainty" of the converter. This is already listed in the conversion unit table. iKC is the character code of the converter. Note that the length iKL of the iKC is determined by the maximum length of the character code string of the converter. For example, if "city" and "year" are selected in response to the converted word "toshi", a love out code (all 1s) is added after the year to match the lengths. The conversion word table is initialized by the conversion result processing control unit. Also, the iDN is initialized to 1 by the conversion result processing control unit, and the BACK
Changed by the key control section, INV key control section, and NO key control section. Single Kanji Selection Table FIG. 29 is a comparison table showing addresses of PM2 with respect to input data from the keyboard, and is used for single Kanji selection control in single Kanji input. The conversion result processing control unit processes the results obtained by the conversion control unit and the conversion unit table creation control unit.
In addition to writing to page memory PM1 for display on the CRT, press the BACK key by the operator.
It is responsible for creating a conversion word table in preparation for changing the displayed characters according to the operation of the INV key, NO key, etc. The conversion result processing control unit first moves the contents of the converted sentence buffer in the range indicated by conversion parameter 1 from the beginning into PM1 indicated by PNT1 until the kanji shift code α is found. Of course PNT
1 is incremented sequentially. If α is found, determine whether MCW9 is positive or negative. MCW9
is negative, that is, when the conversion word corresponding to the conversion unit is not found, the conversion sentence is repeated from the next kanji shift code α to the range indicated by conversion parameter 1, MPA2, or until the kanji shift code α is found again. Move information from buffer to page memory PM1. The transfer of the kanji shift release code β is omitted. When MCW9 is 1, that is, when one conversion word corresponding to the conversion unit is found, the word dictionary table number corresponding to the conversion word written in the conversion unit table is converted to a character code, and PNT1 is Write to the page memory PM1 shown. At this time, PNT1 is sequentially incremented. Next, the field of the converted word is set in the converted word field register, and the field determination control section is activated. When the control is returned from the field determination control unit, the conversion parameters 1 and MPA2 are changed again from the kanji shift release code β of the conversion unit.
The information is moved from the converted sentence buffer to the page memory PM1 within the range shown by or until the kanji shift code α is found again. When MCW9 is 2 or more, that is, when multiple conversion words corresponding to the conversion unit are found, bit 15 of conversion parameter MPA4 is set to 0 and bit 14 is set to 1, and written to PM1 indicated by PNT1, and PNT1 is incremented. do. Next, writing of the conversion word table is started. The format of the conversion word table is as described above. The conversion result processing control unit refers to the conversion unit table and extracts nine MCW conversion words from the conversion unit table in descending order of "certainty". By referring to the word dictionary table, the character code and field information of the converted word are found and written into the converted word table. Further, the reading of the conversion unit and other information are written in the HEAD of the block written in the conversion word table. that time
Enter 1 in iDN. Once the writing to the converter table is completed, update MPA4. After that, the character code corresponding to the first record of the block just written to the conversion word table is written into PM1 again. At this time, even if a love-out code is written in the character code, it shall be written as is without omitting it. However, as mentioned above, the love out code is displayed as a space on the CRT. Once the writing of the conversion word is completed, start again from the kanji shift release code β of the conversion unit, the conversion parameter 1,
Information is moved from the converted sentence buffer to the page memory PM1 until the range indicated by MPA2 or until the kanji shift code α is found again. This concludes the explanation of the cases where MCW9 is negative, the case where it is 1, and the case where it is 2 or more. Next, the conversion result processing control unit uses a parameter that specifies the conversion end range +1.
Set up MPA3. The set value of MPA3 is set to the last address at which information was transferred from the converted text buffer to PM1 +1. Next, the conversion result processing control unit checks whether the number of conversion words corresponding to the conversion unit is 1 or not, and if it is 1, writes the field of the conversion word in the conversion word field register. Start the field determination control section. When control is returned from the field determination control section, the conversion result processing control section returns the control to the conversion control section. The field determination control section adds the data entered into the converted word field register as described above to each field of the input sentence field register. Therefore, if the contents of the learning word field register are added one after another, the input sentence field register will overflow, but the field determination control section takes care to prevent such overflow by adding all the contents when the addition result is 31 or more. Control is performed to subtract 1 from the input sentence field register. The field determination control unit is a conversion result processing control unit or YES
It is activated by the key control section, and after the control is completed, the control is returned to the activated control section. The print key control unit has the role of outputting information stored in the page memory to the outside. It is started by the main control section, and after the operation is completed, control is returned to the main control section again. The print key control section is
The information from the beginning to the end of page memory PM1 is output to the output device OU in order.
Anything other than bit15=bit14=0 is a control code and should not be output. The cursor shift key control unit has the role of moving the cursor displayed on the CRT one by one. It is activated by the main control unit and returns the control to the main control unit after the operation of the cursor shift key is completed. The cursor shift key control unit has a function of incrementing PNT1 in order to shift the cursor. The EDIT key control unit has the role of searching the second character string on the display screen for locations where a plurality of converted words exist. The EDIT key control section is activated by the main control section, and returns its control to the main control section again after its operation is completed. The EDIT key control unit scans the page memory PM1 and searches for a position where bit15=0 and bit14=1. When scanning page memory PM1, PNT1 is sequentially incremented, so
By ending the operation of this control section at the position where the information is found, the PNT1 can be automatically set to the position of the information. The above information means that there are multiple conversion words that follow it, so
With the above operations, it is possible to search for locations where multiple conversion words exist in the second character string,
On the CRT, the cursor symbol CC will be displayed at the position of the * mark displayed in front of the conversion word. The YES key control unit converts the second character string displayed on the CRT out of the plurality of second character strings when the first character string is converted to a second character string and there are a plurality of converted words. In order to determine the field of the input sentence by using the selection function and the selected second string,
It has the role of activating the field determination control section and the function of searching for the position of the second character string to be selected next on the CRT when control is returned from the field determination control section. The YES key control section is activated by the main control section, and returns its control to the main control section after completing its operation. The YES key control unit first checks whether the information in PM1 pointed to by PNT1 is bit15=0 and bit14=1. If bit15=0 and bit14=1, the control is immediately returned to the main control section.
In another example, if bit15=0 and bit14=1, the control may be transferred to the control from the 14th line onward on the next page. If bit15=0 and bit14=1, perform the following operation. The YES key control unit controls the PM instructed by PNT1.
The conversion word table is referred to by the address pointed to by the lower bits 0 to 9 of the information in 1. The HEAD section of the block in the conversion word table contains a record that stores the conversion word currently displayed on the CRT.
No. is stored in iDN. The record includes
The field of the converted word is stored. The YES key control section writes the field information into the converted word field register and activates the field determination control section. When control is returned from the field determination control section, the YES key control section will move the cursor symbol CC currently pointing to.
Set bit 15 of the contents of page memory PM1 corresponding to the * mark on the CRT to 1. As a result, the DCOT (display control circuit), which was previously displayed on a CRT*
Change the mark to a space. Next, search for the conversion word on the CRT to be selected. This function is basically the same as the EDIT key control section. However, while the EDIT key control section scans from the beginning of PM1, this control section currently scans PNT1.
The difference is that it scans the area after the point pointed to. This completes the operation of the YES key control section. When the first character string is converted to the second character string and there are multiple second character strings, the NO key control section is used to convert other character strings to other characters instead of the second character string currently displayed on the CRT. It plays the role of displaying the second character string. The NO key control section is activated by the main control section and returns its control to the main control section after its operation is completed. The NO key control unit first checks whether the information in PM1 pointed to by PNT1 is bit15=0 and bit14=1. If bit15=0 and bit14=1, the control is immediately returned to the main control section. If bit15=0 and bit14=1, perform the following operation. The NO key control unit first refers to the converter table using the address pointed to by the lower bits 0 to 9 of the information in the PM1. The HEAD section of the block in the conversion word table contains the record number that stores the conversion word currently displayed on the CRT.
Stored in iDN. The NO key control increments the current iDN. At this time, if the iDN exceeds the total number of records iRN, change the iDN to 1. Therefore, the NO key control will be activated every time it is activated.
The iDN will be rotated in a fixed direction within the range from 1 to iRN. After that, the NO key control section will
Pick up the character code stored in the record corresponding to the iDN just changed, and change the corresponding information in page memory PM1. After the above operations are completed, control is returned to the main control section. The BACK key control section is almost the same as the NO key control section. The difference is that the NO key control section rotates iDN in the conversion word table in the increasing direction within the range of 1 to iRN, whereas the BACK key control section rotates it in the decreasing direction. The INV key control unit plays the role of converting the second character string (conversion word) into the first character string (conversion unit). The INV key control section is activated by the main control section and returns the control to the main control section after its operation is completed. The INT key control unit first refers to the conversion word table using the address pointed to by the lower bits 0 to 9 of the information in the PM1. The reading corresponding to the conversion word currently displayed on the CRT, that is, the first character string, is written in the HEAD portion of the block in the conversion word table. The INV key control unit changes the second character string on the page memory PM1 to the first character string. Generally, the first string has more characters than the second string, so the page memory
By shifting all the information in PM1 by that amount, no information is missing. After the above operations are completed, control is returned to the main control section. The INT key control unit initializes all control units, various memories, registers, etc., and is activated by the main control unit when inputting text begins. After the operation is completed, control is returned to the main control section. The DIN input control section reads data from DIN, the means for directly specifying and inputting kanji as described above, and performs control to input it to PM1. In other words, when AMK is a single kanji input and IDK is a direct input state,
It reads data from DIN and outputs it to PM1. The single kanji input control unit sends the data from the FIFO, that is, the reading of the kanji, to the keyword register when the AMK is set to input a single kanji. The KF search control section uses the reading of the kanji entered in the keyword register.
KF, that is, the kanji file, is referred to and the corresponding kanji group is sent to address PNT2 of page memory 2 (PM2). The kanji group that has entered PM2 is displayed on the CRT through the DCOT under the control of the single kanji input control section.
Display As mentioned above, only the bottom row is displayed as shown in FIG. 30, and the other rows have disappeared.
That is, in the single kanji input state, the data of PM2 of DCOT is selected and displayed on the CRT under the control of the single kanji input control section. A desired kanji is selected from the displayed kanji group by pressing the key corresponding to the display, and the kanji code is sent to PM1. As a modified example, in the single kanji input described above, the sentence and the enumeration of the single kanji were not displayed at the same time.
By performing the procedure as shown in FIG. 31, the operability can be improved. If the operation of the character processing device is explained using the flowcharts shown in FIGS. 33 to 60, FIG. 33 shows the main control flowchart, and in the figure, Y stands for YES and N stands for NO. . The main control section has mode keys DIN, IDK,
Reads information from DEVICE such as AMK, FIFO, print key, cursor shift key, EDIT key, YES key, BACK key, INV key, NO key, INT key, etc., determines the corresponding job, and controls accordingly. start the department. Here, the mode key has a function that can be read at any time. Other devices have a function that indicates whether information has been received by that device, that is, whether there is information that has not yet been read, and a function that stores this information until it is read. It shall have the following functions. When there is input from FIFO, the control section that is activated differs depending on the state of the mode key. In other words, when the AMK key is set to automatic, the KB1 input control section,
When the AMK key is a single kanji and the IDK key is indirect, the single kanji input control
When the IDK key is direct, it activates the DIN input control section. If there is an input from the print key, the print control part, if there is an input from the cursor shift key, the cursor shift key control part, if there is an input from the EDIT key, the EDIT key control part If there is an input from the YES key, the YES key control part, BACK key If there is an input from the INV key, it will be the BACK key control part. If there is an input from the INV key, it will be the INV key control part. If there is an input from the NO key, it will be the NO key control part. If there is an input from the INT key, it will be the
Assume that each INT key control unit is activated. Figure 34 is a flowchart of KB1 input control, and the part surrounded by dotted lines 101 is a control routine that leaves the last six characters of the kana data that have already been converted into the converted sentence buffer as necessary. This shows that. In this flowchart, N(I) indicates data at address 1 of buffer or memory N. Also, IHBUF is the conversion statement buffer, ILA is the address information of IHBUF used to transfer the first data part of the reference range for conversion of the next input data after the data in IHBUF is converted, and INPUT is the initial state or conversion control. It is 0 when input is completed, and 1 when input is in progress. IKS indicates a shift state of a kanji, α indicates a shift to a kanji, and β indicates a shift to a non-kanji. “INPUT” when input is made
When the initial value is 0, that is, when input is started or immediately after kana-kanji conversion is completed,
According to the flow in 101, in the former case, determine the beginning of the conversion range, and in the latter case, determine the 6-character part at the end of the part that has already been converted.
After filling from the beginning of IHBUF, ie, IHBUF1, the beginning of the conversion range, ie, MPA1, and the beginning of the conversion reference range, ie, MPA5 are determined. When “INPUT” is not 0 or 101 above
If the key input after passing through the flow in is a kanji shift code, check whether the current state is a shift state to a non-kanji character, that is, IKS = β.
When IKS=β, change the kanji shift code to α, and in other cases, change it to β and change it to 〓〓 or 〓
Move to 〓. The flow starting with 〓〓 is for Romaji input, and conversion from Romaji to Kana is performed as necessary. In FIG. 34C, it is determined whether or not kana-kanji conversion should be started, and if so, the conversion range and reference range are determined. In Fig. 34B, 102 is a step for determining whether it is other than hiragana or katakana, and 103 is a step for determining whether it is hiragana or katakana, followed by ni, na, i, ra, sa, chi, ni, na, i, etc.
This is a step to determine whether letters such as ``La'' and ``Sa'' are in uppercase or lowercase letters. In FIG. 34C, in step 104, overflow occurs when the current address is greater than 20, and in step 105, the conversion start code is a circle ".", a dot ",", ",", EOP, EOF, NL, etc. It is. FIG. 35 is a flowchart of Romaji-kana conversion. FIG. 36 is a flowchart for inputting kanji, etc. using DIN, that is, direct input means. FIG. 37 is a flowchart of the control unit for inputting a single kanji, that is, inputting the pronunciation of the kanji by sound or kun in kana or romaji, displaying the enumeration, and selecting and inputting the desired kanji from among them. 177) = { indicates that "{" is inserted in address 177 of PM2, PM2 (182) =} is PM
This indicates that "}" is inserted in the address 182 of No.2. Further, step 107 indicates that data is to be input to address PNT2 of PM2. Also, in FIG. 37C, steps 108 and 109
Hiragana chi, ni, na, i, ra, sa, katakana chi,
Step 110 is a step to determine whether it is a character other than ni, na, a, a, or sa, and step 110 is a step to determine whether it is a character other than hiragana or katakana. Fig. 38 is a flowchart of KF search control, Fig. 39 is a flowchart of single kanji selection, Fig. 40 is a flowchart of conversion control,
Each step will be explained in this flowchart. 1 If MPA3>MPA2, the character string to be converted does not exist in the conversion statement buffer, so return. 2 Search for the conversion unit in the conversion statement BUF within the range of MPA3 and MPA2. 3 If the conversion unit does not exist, return. When this routine is started for the first time and reaches step 2, there is generally a conversion unit, so the process proceeds to step 4. 4 Set the conversion unit range found in step 2 to MCW.
1. Set to MCW2. 5 Initialize the word dictionary table NO. 6. Set initial values to MCW3 and MCW4 as the first character examples to be searched from the word dictionary WF. 7 NEST DEPTH corresponding to the number of compound words is 1
Initialize to. That is, initially it is assumed that the conversion unit consists of a single word. 8 Start the search control unit and search for words using the character strings specified in MCW3 and MCW4 as keywords. 9 If the corresponding word is found as a result of the search, MCW5>0
Then, proceed to step 10. If the corresponding word is not found, set MCW5 = -1 and proceed to step 25.
Proceed to. 10~13 Reserve MCW3~MCW6 in the NEST table. 14 Write the start address of the word dictionary table that stores the dictionary information of the words found as a result of the search into the E field of the nest table for the number of words found. In this embodiment, up to 24 homophones can be written. 15 Update the free number in the word dictionary table. 16 When MCW3, MCW4 and MCW1, MCW2 do not match, that is, when the conversion unit is created from two or more words, the value of MCW3+MCW4
By comparing with the value of MCW1+MCW2, it can be determined whether all searches for conversion units have been completed. If there is a residual part as a result of the determination, go to step 19. If there is no residual part, go to step 1.
Proceed to step 7. 17 Activate the conversion unit table creation control unit and prepare to write conversion words into the conversion word table. 18 Activate the conversion result processing control unit and write to PM1, conversion word table, etc.
Proceed to step 1 to check whether there is any remaining first character string that has not been converted into the conversion statement BUF. 19 Update NEST DEPTH. 20 Check whether NEST DEPTH overflows or not. If it overflows, it is determined that the search is impossible and the process proceeds to step 24. 21 Check whether the word dictionary table overflows or not. If it overflows, proceed to step 24. 22, 23 Set MCW3 and MCW4 to values indicating the range of the remainder, and proceed to step 8 to search the word dictionary WF again. 24 Parameter when conversion word is not found
Set MCW8 to -1. Proceed to step 18. 25, 26 When the search result word is not found
Subtract 1 from MCW4, and if MCW40≠, proceed to step 8 to perform the search again. If MCW=0, proceed to step 27. 27 If MCW7=0, there is no point in searching any further, so proceed to step 33. MCW7≠1
If so, proceed to step 28 to redo the search at the stage of MCW7-1. 28 MCW7=MCW7-1 29 If the number of readings at the stage of MCW7 is 1, proceed to step 27 again. If it's not 1
It is possible to search again at the stage of MCW7, and the process proceeds to step 30. 30, 31, 32 Reserved MCW3,
Restore MCW4 and MCW6, and subtract 1 for MCW4. Proceed to step 8 for re-search. FIG. 41 is a search control flowchart. Figure 42 shows a conversion unit table creation control flowchart, where I is the conversion unit table.
This is the ROW number, and the operation of each step will be explained below. 1 The search results by the conversion control unit are entered in the nest table. From this nest table, create a compound word (i.e. conversion word) consisting of a combination of words, and then
Write the number of the word dictionary table in the second column.
(Of course, it may not be a compound word.) 2. Write the number of combinations of compound words in MCW8. 3 Enter the number of words for the combination in the word count column of the conversion unit table. 4 Steps 4 to 24 are for determining the respective parts of speech for the converted words created in step 1. In step 4, create the Homma conversion unit table.
Initialize ROW NO. to 1. 5 If MCW≠, that is, a compound word, proceed to step 6. If MCW7=1, that is, the converted word consists of one word, the process advances to step 24. 6 If the word is a compound word consisting of two words, proceed to step 7. If it is a compound word consisting of three or more words, go to step 23.
Proceed to. 7 Check the part of speech of the first word. 8 If it is a prefix, proceed to step 20. If it is not a prefix, proceed to step 9. 9 If it is a noun, go to step 10; if it is not a noun, go to step 23. 10 Check the part of speech of the second word. 11 If the part of speech of the second word is a noun, proceed to step 21. If it is not a noun, proceed to step 13. 12 If the part of speech of the second word is a noun, proceed to step 22. If it is not a paranormal noun, proceed to step 13. 13 If the part of speech of the second word is a suffix, proceed to step 14. If it is not a suffix, proceed to step 23. 14, 15 If the character code of the second word is “target”, go to step 16, otherwise go to step 2.
Proceed to step 3. 16 Enter that it is an adjective verb in the part of speech column of the conversion unit table. 17 Write in the usage column that it is da usage. 18, 19 Steps 5 to 24 are applied to the conversion word of Subete written in the conversion unit table. 20 Enter the part of speech and conjugated form of the second word in the conversion unit table. 21 Enter the noun in the part of speech column of the conversion unit table. 22 Write in the part of speech column of the conversion unit table that it is a sa-variant noun. 23 Enter 0 in the part of speech and conjugation columns of the conversion table. 24 Enter the part of speech and conjugation of the word in the part of speech and conjugation columns of the conversion table. 25 Initialize the certainty column of the conversion unit table to 0. 26-29 Activate the grammar weight control section, frequency weight control section, connection weight control section, and field weight control section to set the certainty column of the conversion unit table. 30 Activate the threshold determination control unit to determine the threshold to be adopted as the conversion word. 31 Set MCW9. FIG. 43 is a threshold determination control flowchart, in which the threshold is determined using the larger value of the maximum certainty value entered in the conversion unit table minus 1000 and 0. FIG. 44 shows a grammar weight control flowchart, where I indicates the ROW number of the conversion unit table. In this flowchart, if a character string to be referenced exists at the front of the conversion unit, a front grammar check routine is activated. If there is a character string to be referenced at the end of the conversion unit, an unchanged kana part check routine and a conjugated form check routine are activated. The grammar check described above is applied to all conversion words written in the conversion unit table. FIG. 45 shows a front part grammar check flowchart, which increases the certainty value when the converted word is a verb and the front part of the converted unit is a case particle. Figure 46 is an unchangeable kana part check flowchart. When a converted word has 1 word and has an unchangeable kana part, it is checked whether the unchangeable kana part matches the character example following the conversion unit. Gives the value of certainty. FIG. 47 is a conjugation form check flowchart. When the converted word is a verb, adjective, or subverb, once the conjugation form is determined, the character string that follows it is also limited to a few characters. Taking advantage of this,
Give a probability value for each converted word. FIG. 48 is a frequency weight control flowchart, where I is the ROW number of the conversion unit table. Here, when the converted word consists of one word, the frequency of the word is given as the certainty value, and when it consists of two or more words, the sum of those frequencies is given as the certainty value. Figure 49 is a connection weight control flowchart.
Regarding the converted word when the number of words is 2, the strength of the connection is determined using connection tables 1 and 2, and certainty is given. The above operation is performed for all conversion words entered in the conversion unit table. FIG. 50 is a field weight control flowchart, where IWD is a word dictionary table and IBR is an input sentence field register (16W). This flowchart shows the flow for determining the weight of each conversion word based on the contents of the input sentence field register IBR and the field information of each conversion word. FIG. 51 is a conversion result processing flowchart, and each step will be explained below. 1 Initialize current address J to MPA3. 2 Repeat the following operation until the current address J becomes MPA2+1. 3 Read the contents of the current address J from the conversion statement BUF. 4 Since the read content is the kanji shift code α, proceed to step 9. If not α, proceed to step 5. 5 Move the read contents into PM1 indicated by PNT1. 6 Increment PNT1. 7 Increment the current address J. 8 At step 8, the processed address +1 is stored in the current address J, and that value is set in MPA3. 9 When MCW9=-1, that is, the conversion word does not exist, proceed to step 10. When MCW9≠-1, that is, the conversion word exists, proceed to step 17. 10 to 16 Read the contents of the conversion statement BUF and write them to the page memory PM1 in order. At this time, the current address J and PNT1 are sequentially incremented. On the way, the current address J is MPA2+1
When this is reached, proceed to step 8. If the read content is the kanji shift code α, the process advances to step 8. Furthermore, if the read content is the Kanji shift release code β, writing the code to PM1 is omitted. 17 If there is one converted word, proceed to step 23; if there are two or more converted words, proceed to step 18. 18 MPA4 with bit15=0 and bit14=0
Write to PM1 indicated by PNT1. 19 Increment PMT1. 20 From the conversion unit table, in descending order of “certainty”
Extract only the number shown in MCW9. 21, 22 Refer to the word dictionary table, find the character code and field information of the converted word, and write it into the converted word table. At that time, set iDN=1. 23 Update MPM4. 24-26 Extract the conversion word with the highest "certainty" from among the conversion words entered in the conversion unit table, and convert the conversion word into a character code by referring to the word dictionary table. After that, the character code is written into PM1. 27 Update current address J. 28 If there is one converted word, proceed to step 29. If there are two or more converted words, proceed to step 10. 29 Find the field information of the word constituting the converted word from the word dictionary table, enter it in the converted word field register, and start the field determination control section. <Note> In reality, it is necessary to limit the increment of PNT1 to a value of 193 or more. FIG. 52 is a field determination control flowchart for automatically determining the field of an input sentence, where IHBR is a conversion word field register and IBR is an input sentence field register (16W). FIG. 53 is a cursor shift key control flowchart, in which PNT1 is cyclically incremented from 1 to 192. Figure 54 is an EDIT key control flowchart, from the beginning of page memory PM1 bit15 = 0, bit14
Find the location where =1 and set that value to PNT1. Figure 55 is a NO key control flowchart, and only when the cursor is at the position marked *
Enable ROuTiNE. From the contents of PM1 indicated by PNT1, it is possible to know the address where the converted word information stored in the converted word table exists. The iDN written in the conversion word table is cyclically incremented within the range of 1 to iRN, and the conversion word indicated by the iDN is written to PM1. FIG. 56 is a BACK key control flowchart, which differs from the NO key control section only in the following points. That is, the value is cyclically decremented between iDN and iDN and 1. FIG. 57 is an INV key control flowchart. When the cursor is at the * mark position, by checking the contents of PM1 indicated by PNT1, reading information stored in the conversion word table (first
character string) exists. The first string found in this way is PM 1
Move inside. At that time, since the length of the second character string is generally shorter than the length of the first character string, in order to secure a place to store the first character string in PM1,
The string that exists after the cursor must be moved. FIG. 58 is a YES key control flowchart, and this routine operates only when the cursor is placed on the * mark. The corresponding position in the conversion word table is manipulated based on the contents of PM1 pointed to by PNT1. iDN
After the field information stored in the record corresponding to is stored in the field register, the field determination control section is activated. Next, by setting bit 15 of the PM1 information indicated by PNT1 to 0, the * mark is removed from the CRT display. Next, search for the * mark after the cursor and move the cursor to that position. At this time, if there is no * mark after the cursor, PMN1 is set to 1 and the cursor is brought to the top of the CRT display. FIG. 59 is a print control flowchart, in which code data is output to the printer from the beginning of PM1. At this time, only when bit 15 and bit 14 of the code data are both 0, it is character data and is output. FIG. 60 is an INT key control flowchart, which initializes various parameters and BUF. [Effect] As detailed above, according to the present invention, at a position where there are multiple candidate character strings in a sentence containing mixed kana/kanji, the displayed candidate character strings can be switched without disturbing the subsequent character strings. It is possible,
The operability of the character processing device, such as the selection of homophones, is greatly improved. Further, according to the present invention, an input means for inputting reading information, a conversion means for converting the reading information inputted from the input means into a mixed kana/kanji sentence, and a mixed kana/kanji sentence converted by the above conversion means. a display means capable of displaying; a switching means for switching and displaying candidate character strings in order to display a desired character string at a position in the sentence where a plurality of character strings as candidates corresponding to the reading information exist; A derivation means for deriving the maximum number of characters among the candidate character strings to be displayed by operating the means, and based on information from the derivation means, an area in which the candidate character string with the maximum number of characters can be displayed is determined in the relevant sentence. a setting means for setting the position, and controlling the display means so that candidate character strings are switched and displayed one by one based on instructions from the instruction means within the area set by the setting means. It has now become possible to provide a character processing device with
第1図Aは本発明による文字処理装置の斜視
図、第1図Bは第1図Aに示した文字処理装置の
一部キーボードの正面図、第2図は原稿を示す正
面図、第3図、第4図は入力手順を示す説明図、
第5図はスクリーンを示す正面図、第6図は文字
処理装置を示すブロツク線図、第7図はROMを
示す説明図、第8図はページメモリPM1の説明
図、第9図は単語辞書を示す説明図、第10図は
品詞を示す説明図、第11図は活用形を示す説明
図、第12図は接続情報を示す説明図、第13図
は分野情報を示す説明図、第14図は単語辞書構
造を示す説明図、第15図はDCOTを示すブロツ
ク線図、第16図A、第16図BはDINを示すブ
ロツク線図、第17図はRAMを示す説明図、第
18図は文字処理装置を示すブロツク線図、第1
9図は変換文バツフアを示す説明図、第20図は
変換用パラメータを示す説明図、第21図はロー
マ字仮名対応テーブルを示す説明図、第22図は
単語辞書テーブルを示す説明図、第23図A、第
23図Bはネストテーブルを示す説明図、第24
図は変換用パラメータを示す説明図、第25図は
変換単位テーブルを示す説明図、第26図は接続
テーブルを示す説明図、第27図は接続テーブル
を示す説明図、第28図は変換語テーブルを示す
説明図、第29図は単漢字選択テーブルを示す説
明図、第30図、第31図、第32図はスクリー
ンを示す正面図、第33図はメイン制御フローチ
ヤート、第34図A、第34図B、第34図Cは
KB1入力制御フローチヤート、第35図はロー
マ字−仮名変換フローチヤート、第36図はDIN
入力制御フローチヤート、第37図A、第37図
B、第37図Cは単漢字入力制御フローチヤー
ト、第38図はKF検索制御フローチヤート、第
39図は単漢字選択制御フローチヤート、第40
図は変換制御フローチヤート、第41図は検索制
御フローチヤート、第42図A、第42図B、第
42図Cは変換単位テーブル作成制御フローチヤ
ート、第43図はスレツシヨルド決定制御フロー
チヤート、第44図は文法ウエイト制御フローチ
ヤート、第45図は前部文法チエツクフローチヤ
ート、第46図は不変化仮名部チエツクフローチ
ヤート、第47図A、第47図B、第47図Cは
活用形チエツクフローチヤート、第48図は頻度
ウエイト制御フローチヤート、第49図は接続ウ
エイト制御フローチヤート、第50図は分野ウエ
イト制御フローチヤート、第51図は変換結果処
理フローチヤート、第52図は分野決定制御フロ
ーチヤート、第53図はカーソルシフトキー制御
フローチヤート、第54図はEDITキー制御フロ
ーチヤート、第55図はNOキー制御フローチヤ
ート、第56図はBACKキー制御フローチヤー
ト、第57図はINVキー制御フローチヤート、第
58図はYESキー制御フローチヤート、第59
図はプリント制御フローチヤート、第60図は
INTキー制御フローチヤートである。
ここで、KB1,KB2,KB3,KB4はキーボ
ード、13はスクリーン、15〜33はキー、
ROMはリードオンリーメモリ、RAMはランダム
アクセスメモリ、KFは漢字フアイル、CPUは中
央処理ユニツトである。
1A is a perspective view of a character processing device according to the present invention, FIG. 1B is a front view of a partial keyboard of the character processing device shown in FIG. 1A, FIG. 2 is a front view showing a document, and FIG. Figure 4 is an explanatory diagram showing the input procedure,
FIG. 5 is a front view showing the screen, FIG. 6 is a block diagram showing the character processing device, FIG. 7 is an explanatory diagram showing the ROM, FIG. 8 is an explanatory diagram of the page memory PM1, and FIG. 9 is a word dictionary. FIG. 10 is an explanatory diagram showing parts of speech. FIG. 11 is an explanatory diagram showing conjugated forms. FIG. 12 is an explanatory diagram showing connection information. FIG. 13 is an explanatory diagram showing field information. The figure is an explanatory diagram showing the word dictionary structure, Fig. 15 is a block diagram showing DCOT, Figs. 16A and 16B are block diagrams showing DIN, Fig. 17 is an explanatory diagram showing RAM, and Fig. 18 The figure is a block diagram showing a character processing device.
FIG. 9 is an explanatory diagram showing the conversion sentence buffer, FIG. 20 is an explanatory diagram showing conversion parameters, FIG. 21 is an explanatory diagram showing the Romaji-kana correspondence table, FIG. 22 is an explanatory diagram showing the word dictionary table, and FIG. Figures A and 23B are explanatory diagrams showing nest tables, and Figure 24
Figure 25 is an explanatory diagram showing conversion parameters, Figure 25 is an explanatory diagram showing a conversion unit table, Figure 26 is an explanatory diagram showing a connection table, Figure 27 is an explanatory diagram showing a connection table, and Figure 28 is an explanatory diagram showing a conversion word. FIG. 29 is an explanatory diagram showing a single kanji selection table. FIGS. 30, 31, and 32 are front views showing the screen. FIG. 33 is a main control flowchart. FIG. 34A , Figure 34B, Figure 34C are
KB1 input control flowchart, Figure 35 is Romaji-kana conversion flowchart, Figure 36 is DIN
Input control flowchart, Figure 37A, Figure 37B, Figure 37C is a single kanji input control flowchart, Figure 38 is a KF search control flowchart, Figure 39 is a single kanji selection control flowchart, Figure 40
41 is a flowchart for conversion control, FIG. 41 is a flowchart for search control, FIG. 42A, FIG. 42B, and FIG. 42C are flowcharts for conversion unit table creation control, and FIG. 43 is a flowchart for threshold determination control. Figure 44 is a grammar weight control flowchart, Figure 45 is a front grammar check flowchart, Figure 46 is an invariant kana part check flowchart, and Figures 47A, 47B, and 47C are conjugated form checks. Flowchart: Figure 48 is a frequency weight control flowchart, Figure 49 is a connection weight control flowchart, Figure 50 is a field weight control flowchart, Figure 51 is a conversion result processing flowchart, and Figure 52 is a field determination control. Flowchart: Figure 53 is a flowchart for cursor shift key control, Figure 54 is a flowchart for EDIT key control, Figure 55 is a flowchart for NO key control, Figure 56 is a flowchart for BACK key control, Figure 57 is a flowchart for INV key control. Flowchart, Figure 58 is YES key control flowchart, Figure 59
The figure is a print control flowchart, and Figure 60 is
This is an INT key control flowchart. Here, KB1, KB2, KB3, KB4 are keyboards, 13 is a screen, 15 to 33 are keys,
ROM is read-only memory, RAM is random access memory, KF is Kanji file, and CPU is central processing unit.
Claims (1)
漢字混じり文に変換する変換手段、 上記変換手段によつて変換された仮名/漢字混
じり文の表示が可能な表示手段、 上記読み情報に対応する候補としての文字列が
複数存在する上記文中の当該位置において、所望
の文字列を表示すべく、候補文字列を切換え表示
する切換え手段、 上記切換え手段の操作により、表示されるべき
候補文字列の内、最多文字数を導出する導出手
段、 上記導出手段からの情報に基づいて、上記最多
文字数の候補文字列が表示可能な領域を上記文中
の当該位置に設定する設定手段、 上記設定手段によつて設定された上記領域内に
おいて、上記指示手段からの指示に基づいて1つ
づつ候補文字列を切換え表示する様、上記表示手
段を制御する制御手段とを有したことを特徴とす
る文字処理装置。[Claims] 1. An input means for inputting reading information; inputting the reading information inputted from the input means into kana/
A conversion means for converting into a sentence containing kanji, a display means capable of displaying a sentence containing mixed kana/kanji converted by the above conversion means, and a corresponding one in the above sentence in which there are multiple character strings as candidates corresponding to the above reading information. a switching means for switching and displaying candidate character strings in order to display a desired character string at a position; a deriving means for deriving the maximum number of characters from among the candidate character strings to be displayed by operating the switching means; and the deriving means a setting means for setting an area in which the candidate character string having the maximum number of characters can be displayed at the relevant position in the sentence, based on information from the instruction means, within the area set by the setting means; A character processing device comprising: control means for controlling the display means so as to switch and display candidate character strings one by one based on an instruction.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4448980A JPS5638668A (en) | 1980-04-02 | 1980-04-02 | Character processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4448980A JPS5638668A (en) | 1980-04-02 | 1980-04-02 | Character processor |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP12133678A Division JPS5549771A (en) | 1978-10-02 | 1978-10-02 | Character processing unit |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS5638668A JPS5638668A (en) | 1981-04-13 |
JPS6223909B2 true JPS6223909B2 (en) | 1987-05-26 |
Family
ID=12692953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4448980A Granted JPS5638668A (en) | 1980-04-02 | 1980-04-02 | Character processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS5638668A (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2579764B2 (en) * | 1987-04-20 | 1997-02-12 | 三洋電機株式会社 | Kana-Kanji conversion device |
-
1980
- 1980-04-02 JP JP4448980A patent/JPS5638668A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS5638668A (en) | 1981-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS6311708B2 (en) | ||
JPH08211987A (en) | Keyboard provided with solution logic of fuzziness | |
KR100704804B1 (en) | Text input system for ideographic and nonideographic languages | |
JPS6361702B2 (en) | ||
JPS6223909B2 (en) | ||
JPH0122659B2 (en) | ||
JPS6252908B2 (en) | ||
JPH0423297B2 (en) | ||
JPH02735B2 (en) | ||
JPS6360431B2 (en) | ||
JPS6311709B2 (en) | ||
JPS6311711B2 (en) | ||
WO1990002992A1 (en) | Symbol definition apparatus | |
JPS6311710B2 (en) | ||
JPH0552982B2 (en) | ||
JPS6327744B2 (en) | ||
JPH0423298B2 (en) | ||
JPH02736B2 (en) | ||
JPS59132033A (en) | Character processing device | |
JPS6362018B2 (en) | ||
JPH01309166A (en) | Character processor | |
JPS59132034A (en) | Character processing device | |
JP2634926B2 (en) | Kana-Kanji conversion device | |
JPS62263570A (en) | Document forming device | |
JPS6218952B2 (en) |