JPH0159614B2 - - Google Patents
Info
- Publication number
- JPH0159614B2 JPH0159614B2 JP57113125A JP11312582A JPH0159614B2 JP H0159614 B2 JPH0159614 B2 JP H0159614B2 JP 57113125 A JP57113125 A JP 57113125A JP 11312582 A JP11312582 A JP 11312582A JP H0159614 B2 JPH0159614 B2 JP H0159614B2
- Authority
- JP
- Japan
- Prior art keywords
- kana
- input
- kanji
- dictionary
- dictionary search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 235000016496 Panda oleosa Nutrition 0.000 claims description 27
- 240000000220 Panda oleosa Species 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000000034 method Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000000717 retained effect Effects 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
(1) 発明の技術分野
本発明は文書作成装置にかかり、特にカナ漢字
変換操作の伴う漢字情報処理装置、すなわち日本
語ワードプロセツサの改良に関する。DETAILED DESCRIPTION OF THE INVENTION (1) Technical Field of the Invention The present invention relates to a document creation device, and particularly relates to an improvement of a kanji information processing device that involves a kana-kanji conversion operation, that is, a Japanese word processor.
(2) 技術の背景
この2〜3年の間に日本語ワードプロセツサの
製品発表があいついでいる。通常の製品は5万語
程度の単語辞書を内蔵し、カナをキー入力装置で
打つて入力させ、カナ入力文を漢字混じり文に自
動変換してCRT等にカナ漢字混じり文をデイス
プレイし、プリントアウトできるようになされて
いる。(2) Technical background Over the past two to three years, Japanese word processor products have been announced one after another. A typical product has a built-in word dictionary of about 50,000 words, inputs kana characters using a key input device, automatically converts the kana input sentences into sentences containing kanji, displays the sentences containing kana and kanji on a CRT, etc., and prints them out. Being able to go out.
日本語の漢字の中には同音異義語が多く、カナ
入力で指示したカナ文によつて変換されたカナ漢
字混じり文が正しい文章として変換されない場合
が多く、これらの修正入力方法としては種々の方
法が提案されている。 There are many homonyms among Japanese kanji, and sentences containing kana and kanji that are converted using kana sentences specified by kana input are often not converted as correct sentences.There are various input methods for correcting these. A method is proposed.
一般的には追加指示や修正入力するものが多
く、これらは操作者がCRTに表示されたカナ漢
字混じり文をみて追加、修正等の再変換を行つて
いる。 In general, there are many additional instructions and correction inputs, and the operator looks at the text mixed with kana and kanji displayed on the CRT and performs reconversion such as additions and corrections.
操作者がこれら再変換を行つた後、すなわち目
的の文章が得られたとして次のカナ文字列の入力
を始めると、再変換した以前のカナ文字列に対応
した入力コードは保持されていないので文章が作
成されて見直し時に誤りを見つけ追加、修正を行
う場合には、その文字或いは文章を指定して漢字
カナ変換手段により漢字コードからカナ文字列コ
ードを得た後に再びカナ漢字変換を行つている。 After the operator performs these reconversions, that is, when the desired sentence is obtained, when the operator starts inputting the next kana character string, the input code corresponding to the previous reconverted kana character string is not retained. If you find an error in a written text and want to make additions or corrections when reviewing it, specify that character or text, obtain the kana character string code from the kanji code using the kanji-kana conversion means, and then perform kana-kanji conversion again. There is.
このような手順において、漢字カナ変換手段を
通すことで入力時のカナ文字列が復元される保証
がなく、誤る場合も多い等の問題があつた。 In such a procedure, there is a problem that there is no guarantee that the kana character string at the time of input will be restored by passing it through the Kanji-kana conversion means, and mistakes are often made.
(3) 従来技術と問題点
上記したような問題点を第1図の従来例につい
て説明する。(3) Prior art and problems The above-mentioned problems will be explained with respect to the conventional example shown in FIG.
第1図は従来の文書作成装置の系統図を示すも
のであり、点線で囲まれた部分1はカナ漢字混じ
り文処理部であり、入力バツフア2、出力バツフ
ア3、キー入力判定部4、漢字カナ変換部12と
辞書検索部5より構成され、該辞書検索部5内に
は辞書検索レジスタ6、最長一致処理部7、候補
格納フアイル8を有する。さらに、辞書9、デー
タセーブ用フアイル10、CRT等の表示装置1
1を有して文書作成装置を構成している。 FIG. 1 shows a system diagram of a conventional document creation device. Part 1 surrounded by a dotted line is a kana-kanji mixed sentence processing section, an input buffer 2, an output buffer 3, a key input determination section 4, and a kanji/kanji mixed sentence processing section. It is composed of a kana conversion section 12 and a dictionary search section 5, and the dictionary search section 5 has a dictionary search register 6, a longest match processing section 7, and a candidate storage file 8. Furthermore, a dictionary 9, a data save file 10, a display device 1 such as a CRT, etc.
1 constitutes a document creation device.
上記構成において、入力端子INに操作者がキ
ーから例えばカナ文字によつて「オンヤインニヨ
ルニユウリヨクホウホウノケントウ」という文書
を入力したとすると、該入力は入力バツフア2に
順次格納されて行き、操作者が入力を完了し入力
終了キーを押したときキー入力判定部4はこれを
検出して入力完了信号4aを出力すると入力バツ
フア2内の入力内容は一斉に辞書検索部5内の辞
書検索レジスタ6に転送される。辞書検索部5は
これに基づいて始動され辞書9の内容検索を行い
辞書9から上記入力された「オンセイニヨル……
ケントウ」の文例に基づいて「音声」…「音」…
「恩」…「尾」…等が読出されてゆく。すなわち
最長一致処理部7では辞書に格納された最長語彙
から順次取り出され候補格納フアイル8に格納さ
れ出力バツフア3を通してカナ漢字混じり文がデ
ータセーブ用フアイル10に与えられCRT11
に表示されて操作者による校正がなされキー入力
判定部4よりの校正用ライン9bで校正がなされ
る。入力端子INからキー入力した上記のカナ文
字データが「オンセイノヨルニユウロクホウホウ
ノケントウ」と誤入力されカナ漢字変換において
「音声の夜入六方法の検討」とCRT11に表示さ
れたとすれば誤り部の「の夜入六」を指示してカ
ナ漢字変換部12を通じて漢字コードからカナ文
字列コードに変換する。このときに例えば漢字カ
ナ変換部は「の夜入六」を「ノヤイリロク」とカ
ナ変換するためにカナ漢字再変換が不可能となる
場合が生じる。このため操作者はキー入力によつ
て「ニヨルニユウリヨク」を再入力することで
「による入力」とカナ漢字再変換を行うために再
度入力をインプツトする必要があり、正しく復帰
するか否かは実際にワードプロセツサを動作させ
てみなくては解らない問題があつた。 In the above configuration, if the operator inputs a document such as "Onyain niyoruniyuuriyokuhouhouhounokento" from the keys to the input terminal IN using kana characters, the input is sequentially stored in the input buffer 2. When the operator completes the input and presses the input end key, the key input determination unit 4 detects this and outputs the input completion signal 4a, and the input contents in the input buffer 2 are all stored in the dictionary search unit 5. The data is transferred to the dictionary search register 6 of. The dictionary search section 5 is started based on this, searches the contents of the dictionary 9, and searches the dictionary 9 for the above-mentioned "onseignol..."
Based on the sentence examples of "Kentou", "voice"..."sound"...
``On'', ``O'', etc. are read out. That is, in the longest match processing unit 7, the longest vocabulary stored in the dictionary is sequentially extracted and stored in the candidate storage file 8, and through the output buffer 3, sentences containing kana and kanji are given to the data save file 10, and the CRT 11
is displayed and calibrated by the operator, and the calibration is performed on the calibration line 9b from the key input determination section 4. Suppose that the above kana character data entered from the input terminal IN is incorrectly entered as "Onseinoyoruniyuurokuhouhounokento" and is displayed on the CRT 11 as "Study of the six methods of voice night entry" during kana-kanji conversion. The error section ``No Yairi Roku'' is specified and the kanji code is converted into a kana character string code through the kana-kanji conversion unit 12. At this time, for example, the kanji-kana converter converts "noyairiroku" into kana, so that kana-kanji reconversion may become impossible. Therefore, the operator needs to re-input "Niyoruniyuuriyoku" by key input to re-convert the kana-kanji with "input by", and it is difficult to determine whether it will return correctly or not. There was a problem that could only be solved by actually running the word processor.
(4) 発明の目的
本発明の上記従来の欠点に鑑み、操作者の判断
によつて入力文字列コードを保持させ、操作者は
文書の作成後見直しを行つて同音異義語等の誤り
を見つけた場合には保持させた入力文字列コード
を呼び出してカナ漢字変換を行うようにしたこと
を目的とするものである。(4) Purpose of the Invention In view of the above-mentioned conventional drawbacks of the present invention, the input character string code is retained at the discretion of the operator, and the operator reviews the document after creating it to find errors such as homophones. The purpose of this is to call up the retained input character string code and perform kana-kanji conversion.
(5) 発明の構成
この目的は本発明によれば、カナ文字等を入力
する入力バツフア手段と、入力終了を判定する入
力判定手段と、該入力判定手段の出力によつて入
力バツフア手段の入力を辞書検索レジスタに転送
させ辞書内に格納した内容を検索して候補格納フ
アイルに格納する辞書検索手段と、該辞書検索手
段の出力を出力バツフア手段を介して第1のデー
タセーブ用フアイルに与える手段とを有し、上記
辞書検索手段内の辞書検索レジスタに関連してカ
ナ漢字変換した文章が正しい漢字カナ混じり文が
生成されるまでカナ文字入力列と漢字コード列の
両者を第2のデータセーブ用フアイルに格納する
文書データ処理装置において、第2のデータセー
ブ用フアイルに格納されているカナ文字入力列を
再変換するときに、前記検索手段で誤つてカナ漢
字変換されて、前記第1のデータセーブ用フアイ
ルに記憶された漢字の使用頻度を、誤つて変換さ
れる前の頻度に復元することを特徴とする文書作
成装置によつて達成される。(5) Structure of the Invention According to the present invention, this object includes an input buffer means for inputting kana characters, etc., an input determination means for determining the end of input, and an input buffer means for inputting the input buffer means by the output of the input determination means. a dictionary search means for transferring the data to a dictionary search register, searching for the contents stored in the dictionary and storing it in a candidate storage file; and providing the output of the dictionary search means to a first data saving file via an output buffer means. and converts both the kana character input string and the kanji code string into second data until a correct kanji-kana mixed sentence is generated from the kana-kanji converted sentence in relation to the dictionary search register in the dictionary search means. In the document data processing device that stores the data in the save file, when reconverting the kana character input string stored in the second data save file, the search means mistakenly converts the kana/kanji input string, and the first This is achieved by a document creation device that is characterized in that it restores the frequency of use of kanji characters stored in a data save file to the frequency before they were erroneously converted.
(6) 発明の実施例
以下、本発明の一実施例を第2図について説明
する。なお、第1図と同一部分には同一符号を付
して重複説明は省略する。(6) Embodiment of the Invention An embodiment of the present invention will be described below with reference to FIG. Note that the same parts as in FIG. 1 are given the same reference numerals, and redundant explanation will be omitted.
辞書検索部5内の辞書検索レジスタ6では辞書
9との間でのやりとりで最長一致処理部7で最長
一致が採用された語彙だけ辞書検索レジスタ6を
シフトさせて除き引き続いて最長一致処理が行わ
れていく。そして、一致が採用された語の頻度情
報を変更(1加算)する。頻度情報は辞書9内に
単語単位で頻度回数として記憶されており、すな
わち最長一致で採用された語彙に対応する単語の
頻度情報を1加算する。 The dictionary search register 6 in the dictionary search unit 5 shifts and removes only the vocabulary for which the longest match has been adopted by the longest match processing unit 7 during exchange with the dictionary 9, and continues longest match processing. I'm getting lost. Then, the frequency information of the word for which a match is adopted is changed (added by 1). The frequency information is stored in the dictionary 9 as a frequency count for each word, that is, 1 is added to the frequency information of the word corresponding to the vocabulary adopted as the longest match.
例えば上記したように入力端子INに加えられ
た「オンセイノヨルニユウロクホウホウノケント
ウ」という文字列を本発明では入力バツフア2か
ら辞書検索レジスタ6に与えると同時に第2のデ
ータセーブ用フアイル13に格納しておく。上記
カナ入力文字列がカナ漢字変換によつて「音声の
夜入六方式の検討」とCRT11に表示された場
合に操作者はアンダーラインを施した「の夜入
六」部分が誤りであることを見い出して第2のデ
ータセーブ用フアイル13から「ノヨルニユウロ
ク」と場所を指定し、対応する入力文字列コード
を呼び出し、修正操作で「ニヨルニユウリヨク」
と修正を施した後にカナ漢字再変換を行えば「に
よる入力」とカナ漢字変換がなされる。 For example, in the present invention, the character string "ONSEINOYORUNIYUROKUHOHOUNOKENTO" added to the input terminal IN as described above is supplied from the input buffer 2 to the dictionary search register 6, and at the same time, it is sent to the second data save file 13. Store it in When the above kana input character string is displayed on the CRT 11 as "Study of the voice Yairi Roku method" by kana-kanji conversion, the operator should confirm that the underlined "Yairi Roku" part is incorrect. Find out the location from the second data save file 13, call up the corresponding input character string code, and use the correction operation to specify the location.
If you re-convert the kana-kanji after making the correction, the kana-kanji conversion will be done as "input by".
このとき、前述の動作によつて再変換された語
の頻度情報は修正される。すなわち、先の変換に
よつて変更された頻度情報を1減算し、後の再変
換によつて変換された語の頻度情報を1加算す
る。例えば、前述の「の夜入六」であるならば、
「の」、「夜」、「入」、「六」の頻度情報が1減算さ
れ、「に」、「よる」、「入力」の頻度情報が1加算
される。 At this time, the word frequency information re-converted by the above-described operation is corrected. That is, the frequency information changed by the previous conversion is subtracted by 1, and the frequency information of the word converted by the subsequent re-conversion is added by 1. For example, if it is the above-mentioned "No Yairi Roku",
The frequency information for "no", "night", "iri", and "roku" is subtracted by 1, and the frequency information for "ni", "by", and "input" is incremented by 1.
このように希望するカナ漢字混じり文が生成さ
れた後は操作者の意志により入力文字列コードを
消去し第2のデータセーブ用フアイル13の記憶
容量の増加を防ぐようにすればよい。 After the desired kana-kanji mixed sentence is generated in this manner, the input character string code may be deleted at the operator's will to prevent the storage capacity of the second data save file 13 from increasing.
さらに、カナ漢字再変換において、前の誤つて
呼び出された単語についいて頻度情報を復元して
置けば入力文字列コードの誤入力に対しても、位
置指定して入力文字列コードの修正を行つたのに
カナ漢字変換を行えばよい。また、入力文字列コ
ードに対してコード圧縮を行つて保持することも
可能である。 Furthermore, when reconverting kana-kanji, if the frequency information is restored for the previous incorrectly called word, even if the input string code is incorrectly input, the input string code can be corrected by specifying the position. All you have to do is perform kana-kanji conversion on tsuta. It is also possible to compress and hold the input string code.
上記、実施例では入力方法としてはキー入力で
説明したが入力を音声で行つてもよい。このとき
にはキー入力判定部4を音声入力判定部とし音声
認識手段を付加すればよい。 In the above embodiments, key input was used as the input method, but input may also be performed by voice. In this case, the key input determining section 4 may be used as a voice input determining section and a voice recognition means may be added.
(7) 発明の効果
本発明は叙上の如く構成させたのでカナ漢字変
換した漢字コードを気にすることなく修正が容易
であり、同音異義語等の誤変換に対して入力文字
列コードを復元する必要がなく再変換するだけで
よく再変換が高速化できる特徴を有する。(7) Effects of the Invention Since the present invention is configured as described above, it is easy to modify the kanji code converted into kana-kanji, and the input character string code can be corrected to prevent erroneous conversions such as homonyms. It has the feature that re-conversion can be speeded up by simply re-converting without needing to restore.
第1図は従来の文書作成装置の系統図、第2図
は本発明の文書作成装置の系統図である。
1……漢字混じり文処理部、2……入力バツフ
ア、3……出力バツフア、4……キー入力判定部
(音声入力判定部)、5……辞書検索部、6……辞
書検索レジスタ、7……最長一致処理部、8……
候補格納フアイル、9……辞書、10,13……
第1及び第2のデータセーブ用フアイル、11…
…表示装置。
FIG. 1 is a system diagram of a conventional document creation device, and FIG. 2 is a system diagram of a document creation device of the present invention. 1... Kanji mixed sentence processing unit, 2... Input buffer, 3... Output buffer, 4... Key input determination unit (voice input determination unit), 5... Dictionary search unit, 6... Dictionary search register, 7 ...Longest match processing section, 8...
Candidate storage file, 9... Dictionary, 10, 13...
First and second data save files, 11...
...display device.
Claims (1)
段の入力を辞書検索レジスタに転送させ辞書内に
格納した内容を検索して候補格納フアイルに格納
する辞書検索手段と、 該辞書検索手段の出力を出力バツフア手段を介
して第1のデータセーブ用フアイルに与える手段
とを有し、 上記辞書検索手段内の辞書検索レジスタに関連
してカナ漢字変換した文章が正しい漢字カナ混じ
り文が生成されるまでカナ文字入力列と漢字コー
ド列の両者を第2のデータセーブ用フアイルに格
納する文書データ処理装置において、 第2のデータセーブ用フアイルに格納されてい
るカナ文字入力列を再変換するときに、前記検索
手段で誤つてカナ漢字変換されて、前記第1のデ
ータセーブ用フアイルに記憶された漢字の使用頻
度を、誤つて変換される前の頻度に復元すること
を特徴とする文書作成装置。[Scope of Claims] 1. An input buffer means for inputting kana characters, etc., an input determination means for determining the end of input, and a dictionary for transferring the input of the input buffer means to a dictionary search register according to the output of the input determination means. a dictionary search means for searching the contents stored in the dictionary and storing it in a candidate storage file; and means for providing the output of the dictionary search means to the first data saving file via an output buffer means; Document data in which both a kana character input string and a kanji code string are stored in a second data save file until a correct kanji-kana mixed sentence is generated from a sentence converted into kana-kanji in relation to the dictionary search register in the search means. In the processing device, when reconverting the kana character input string stored in the second data save file, the search means mistakenly converts the kana character input string into kana kanji and stores it in the first data save file. A document creation device characterized by restoring the usage frequency of kanji characters to the frequency before they were erroneously converted.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57113125A JPS593630A (en) | 1982-06-30 | 1982-06-30 | Documentation device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57113125A JPS593630A (en) | 1982-06-30 | 1982-06-30 | Documentation device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS593630A JPS593630A (en) | 1984-01-10 |
JPH0159614B2 true JPH0159614B2 (en) | 1989-12-19 |
Family
ID=14604159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57113125A Granted JPS593630A (en) | 1982-06-30 | 1982-06-30 | Documentation device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS593630A (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0685169B2 (en) * | 1985-05-15 | 1994-10-26 | 株式会社日立製作所 | Document processing method |
JPH0731675B2 (en) * | 1986-01-28 | 1995-04-10 | カシオ計算機株式会社 | Kana-Kanji mutual conversion device |
JPH0731674B2 (en) * | 1986-01-28 | 1995-04-10 | カシオ計算機株式会社 | Kana-Kanji mutual conversion device |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57132272A (en) * | 1981-02-10 | 1982-08-16 | Canon Inc | Character processor |
-
1982
- 1982-06-30 JP JP57113125A patent/JPS593630A/en active Granted
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57132272A (en) * | 1981-02-10 | 1982-08-16 | Canon Inc | Character processor |
Also Published As
Publication number | Publication date |
---|---|
JPS593630A (en) | 1984-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0159614B2 (en) | ||
JPS5932062A (en) | Phrase searching system | |
JPH0130173B2 (en) | ||
JP2616628B2 (en) | Key input device | |
JPS6246029B2 (en) | ||
JPH0685169B2 (en) | Document processing method | |
JPS62156763A (en) | Document data processor | |
JPH04330565A (en) | Natural language processing system using universal file | |
JPS6175471A (en) | Logotype learning system | |
JPH0434189B2 (en) | ||
JPS60217452A (en) | Japanese word input processing unit | |
JPS5899829A (en) | Erroneous character detection and correction backing device | |
JPH0350669A (en) | Information processor | |
JPS62119665A (en) | Word processor | |
JPS5880770A (en) | Kana (japanese syllabary)-chinese character conversion processor | |
JPH0460754A (en) | Kana/kanji (chinese character) conversion system | |
JPH04115355A (en) | Document processor | |
JPS62267857A (en) | Word processor | |
JPH1091627A (en) | Automatic conversion method for kanji into equivalent kana and its system | |
JPH0146896B2 (en) | ||
JPS6255757A (en) | Word correcting device | |
JPS62189565A (en) | Kana/kanji converting device | |
JPS63310066A (en) | Kana(japanese syllabary)/kanji(chinese character) converting method | |
JPH0394367A (en) | Japanese input system | |
JPS63221461A (en) | Kana/kanji conversion system |