JPS59103136A - Kana (japanese syllabary)/kanji (chinese character) processor - Google Patents
Kana (japanese syllabary)/kanji (chinese character) processorInfo
- Publication number
- JPS59103136A JPS59103136A JP57212475A JP21247582A JPS59103136A JP S59103136 A JPS59103136 A JP S59103136A JP 57212475 A JP57212475 A JP 57212475A JP 21247582 A JP21247582 A JP 21247582A JP S59103136 A JPS59103136 A JP S59103136A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- word
- homophone
- kanji
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
技術分野
本発明は邦文ワードプロセッサ等に用いられるカナ漢字
変換処理装置に関し、特に同音異字語(以下、「同音語
」という)、後述する同種語等がある場合に、文節単位
で同音語の学習を行う機能により、オペレータの負担を
軽減しながら同音語および同種語の自動判別率を向上さ
せることを可能とするカナ漢字変換処理装置に関する。[Detailed Description of the Invention] Technical Field The present invention relates to a kana-kanji conversion processing device used in Japanese word processors, etc., and particularly relates to a kana-kanji conversion processing device used in Japanese word processors, etc. The present invention relates to a kana-kanji conversion processing device that can improve the automatic discrimination rate of homophones and homophones while reducing the burden on the operator by learning homophones in units.
従来技術
カナ漢字変換処理(以下、単に「変換処理」ともいう)
装置としては、種々の方式によるものか提案されている
。本出願人が先に特願昭56−149737号[カナ漢
字変換処理装置」として提案した装置もその1つである
。この装置は、[日本語文章をカナ文として入力する手
段と、該入力手段により入力された文字列を一時記憶す
る手段と、単語辞書記憶手段および該単語辞書記憶手段
を検索して前記一時記憶手段の内容を漢字まじり文に変
換するカナ漢字変換制御回路を有するカナ漢字変換処理
装置において、前記単語辞書は同音異字単語の出力順位
情報を含むとともに、前記単語辞書から抽出された単語
を記憶する単語バッファメモリと、該単語バッファメモ
リの内容を前記出力順位情報に従って出力する手段と、
該出力中から選択されて出力された単語とその直前に出
力された前記単語の同音異字語との出力順位情報を入替
える手段および該入替えられた出力順位情報を、前記単
語辞書の所定の場所に書込む手段を有することを特徴と
するカナ漢字変換処理装町であり、単語(自立語)単位
の学習機能を有するものと言うことができる。Conventional technology Kana-Kanji conversion processing (hereinafter also simply referred to as "conversion processing")
Various types of devices have been proposed. One such device is the device previously proposed by the present applicant in Japanese Patent Application No. 149737/1983 titled “Kana-Kanji Conversion Processing Device.” This device includes a means for inputting a Japanese sentence as a kana sentence, a means for temporarily storing a character string inputted by the input means, a word dictionary storage means, and a means for searching the word dictionary storage means for temporarily storing the character string. In a kana-kanji conversion processing device having a kana-kanji conversion control circuit for converting the contents of a means into a sentence mixed with kanji, the word dictionary includes output ranking information of homophone and allograph words and stores words extracted from the word dictionary. a word buffer memory; means for outputting the contents of the word buffer memory according to the output order information;
Means for replacing output ranking information between a word selected and output from the output and a homophone of the word output immediately before it, and a means for replacing the output ranking information with the replaced output ranking information at a predetermined location in the word dictionary. It is a kana-kanji conversion processing device that is characterized by having means for writing in words, and can be said to have a learning function on a word (independent word) basis.
しかしながら、例えば「火とは」という変換結果を得よ
うとする場合、次のような問題が生ずる。However, when trying to obtain a conversion result such as "What is fire?", the following problem arises.
すなわち、「ひとは」の入力に対しては、第1図に例を
示した如き自立語辞書が用いられる結果、最長一致法に
よる変換候補の表示順序は、「人は」→「−は」→「非
とは」→「火とは」となり、次候補キー(更新キー)を
何度も押さなければならない。That is, as a result of using an independent word dictionary such as the example shown in Figure 1 for the input of ``Hito wa'', the display order of conversion candidates using the longest match method is ``Hito wa'' → ``-wa''. → "What is fire" → "What is fire", and the next candidate key (update key) must be pressed many times.
このような問題を解消するものとして、本出願人が特願
昭57−76076号「カナ漢字変換処理装置」として
提案した装置がある。この装置は、「日本語文章をカナ
文として入力する手段と、該入力手段により入力された
文字列を一時記憶する手段と、同音異字単語の出力順位
情報を含む単語辞書記憶手段と、該単語辞書記憶手段を
検索して前記一時記憶手段の内容を漢字まじり文に変換
するカナ漢字変換制御回路と、該カナ漢字変換制御回路
による変換結果を表示する手段および前記変換結果のう
ちの確定情報を受ける手段を有するカナ漢字変換処理装
置において、前記確定情報を少なくとも入力文字列と対
応させて記憶する手段を設けたことを特徴とするカナ漢
字変換処理袋ft1Jであり、いわゆる同音語バッファ
メモリを有するものと言うことができる。To solve this problem, there is a device proposed by the present applicant as Japanese Patent Application No. 57-76076 titled "Kana-Kanji Conversion Processing Device." This device includes a means for inputting Japanese sentences as kana sentences, a means for temporarily storing character strings input by the input means, a word dictionary storage means including output ranking information of homophone words, and A kana-kanji conversion control circuit for searching a dictionary storage means and converting the contents of the temporary storage means into a sentence mixed with kanji, a means for displaying a conversion result by the kana-kanji conversion control circuit, and a means for displaying final information of the conversion result. The kana-kanji conversion processing device ft1J is characterized in that the kana-kanji conversion processing device has means for storing the confirmed information in correspondence with at least an input character string, and has a so-called homophone buffer memory. It can be said that it is a thing.
しかしながら、この装置においても、接頭辞や辞尾辞を
有する語(これを「同種語」という)は、前記同音語バ
ッファメモリの蓄積対象とならないため、入力される都
度同様の分析を行わねばならないという問題がある。However, even in this device, words with prefixes or suffixes (these are called "homogeneous words") are not stored in the homophone buffer memory, so the same analysis must be performed each time they are input. There is a problem.
目的
本発明はL記事情に鑑みてなされたもので、その目的と
するところは、前述の装置における問題を解消し、同音
語という概念を前記同種語の範囲まで拡張することによ
り、オペレータの負担を軽減しながら同音語の自動判別
率を向上させることの可能なカナ漢字変換処理装置を提
供することにある。Purpose The present invention was made in view of the above circumstances, and its purpose is to solve the problems with the above-mentioned device and to reduce the burden on the operator by extending the concept of homonyms to the range of the same words. An object of the present invention is to provide a kana-kanji conversion processing device capable of improving the automatic discrimination rate of homophones while reducing the noise.
構 成 以下、本発明の構成を実施例により詳細に説明する。composition Hereinafter, the configuration of the present invention will be explained in detail using examples.
第2図は本発明の一実施例を示すカナ漢字変換処理装置
のブロック図である。本実施例装置は、入力文を構成す
る日本語を自立語、接頭辞、接尾辞および付属語に分類
し、前記入力文を1個の自立語を中心とする分かち書き
単位に分解して仮名文字で入力し、該入力された文字列
を一時記憶手段に記憶しておき、該記憶内容を、前記自
立語、接頭辞、接尾辞および付属語の各々を記憶してい
る辞書の内容と照合するようにしたカナ漢字変換処理装
置に本発明を適用した例を示すものである。FIG. 2 is a block diagram of a kana-kanji conversion processing device showing one embodiment of the present invention. The device of this embodiment classifies Japanese words constituting an input sentence into independent words, prefixes, suffixes, and adjunct words, breaks down the input sentence into division units centered on one independent word, and divides the input sentence into kana characters. , the input character string is stored in a temporary storage means, and the stored content is compared with the content of a dictionary that stores each of the independent words, prefixes, suffixes, and attached words. This figure shows an example in which the present invention is applied to a kana-kanji conversion processing device.
なお、本実施例の説明において、分かち書き単位(「文
節」ともいう)とは次のものを言う。In addition, in the description of this embodiment, the parting unit (also referred to as "bunsetsu") refers to the following.
〔接頭辞〕 (自立語)〔接尾辞〕〔付属語〕8ここで
、自立語は必らず1個存在するものとし、〔〕で囲んだ
ものは無くても良く、付属語(※印)は複数偏速なって
も良い。[Prefix] (Independent word) [Suffix] [Adjunct word] 8 Here, there must be one independent word, the words enclosed in [ ] may be omitted, and the attached word (marked with *) ) may have multiple eccentric speeds.
第2図において、11は入力用鍵盤装置であり、12は
入力された文字列を一時記憶する入力文字バッファレジ
スタ、13は制御回路、14は出力編集器、15は表示
装置、ぞして16はプリンタである。17〜24は辞書
類を示しており、17は接続行列表、18は自立語辞書
、19は接頭辞表、20は接尾辞表、21は用言活用表
、22は付属語表、干して23はカタ仮名ひら仮名対応
表である。これらの辞書類の内容については後述する。In FIG. 2, 11 is an input keyboard device, 12 is an input character buffer register for temporarily storing input character strings, 13 is a control circuit, 14 is an output editor, 15 is a display device, and 16 is a printer. 17 to 24 indicate dictionary documents, 17 is a connection matrix table, 18 is an independent word dictionary, 19 is a prefix table, 20 is a suffix table, 21 is a word usage table, 22 is an adjunct word table, and 23 is a list of attached words. This is a katakana hirakana correspondence table. The contents of these dictionaries will be described later.
また、24は出力文レジスタ、25.27.29はそれ
ぞれ自立語、接頭辞および接尾辞の出力バッファメモリ
、26.28.30は順位制御器である。Further, 24 is an output sentence register, 25, 27, and 29 are output buffer memories for independent words, prefixes, and suffixes, respectively, and 26, 28, and 30 are rank controllers.
31は同音文節バッファメモリである。31 is a homophone phrase buffer memory.
以下、辞書2表の具体的内容について例を挙げて説明し
ておく。なお、辞書あるいは表の内容項目は次の通りで
ある。Hereinafter, the specific contents of the second dictionary table will be explained using an example. The contents of the dictionary or table are as follows.
O読み仮名:入力文字列を照合する部分0表 記:特
定の単語に確定した場合出力する文字
O品詞、活用:各自立語の品詞、活用を通番で記録しで
ある
O出力順位:ある時点における同音異字単語の使用頻度
順位で、使用ごとに上位
との入替えが行われる
0)自立語辞書18
第3図にその内容の一部を示した如く、自立語の中で、
名詞(数詞、固有名詞を含む)、す変名側(す変動制「
する」の付き得る名詞)、動詞、形容詞、形容動詞、連
体詞、副詞、感動詞等に属するものを記憶している。こ
れらのうち、用言は語幹のみであるが、1段活用動詞は
活用部の不変化部までを含み、す変動制「する」と力変
動詞「来る」は活用形の全部を含んでいる。O reading kana: The part that matches the input character string 0 Notation: Characters to be output when a specific word is determined O Part of speech, Conjugation: Record the part of speech and conjugation of each independent word with a number O Output order: At a certain point 0) Independent Word Dictionary 18 As part of the content is shown in Figure 3, among independent words,
Nouns (including numbers and proper nouns),
It memorizes things that belong to the following categories: verbs, adjectives, adjectives, adjectives, adverbs, interjections, etc. Among these, the verb is only the stem, but the first-stage conjugated verb includes the inflected part, and the conjugated verb ``suru'' and the force conjugated verb ``kuru'' include the entire conjugated form. .
Q)接頭辞表19
第4図にその内容の一部を示した如く、自立語の名詞等
につく接頭辞を記憶している。Q) Prefix Table 19 As part of its contents is shown in Figure 4, it stores prefixes attached to nouns, etc. of independent words.
(3)接尾辞表20
第5図にその内容の一部を示す如く、自立語の名詞等に
つく接尾辞を記憶している。(3) Suffix Table 20 As part of its contents is shown in Figure 5, it stores suffixes attached to independent word nouns, etc.
(4)用言活用表21
第6図にその内容の一部を示す如く、動詞、形容詞、形
容動詞の品詞、活用形による分類ごとにその活用語尾を
記憶している。なお、動詞の五段活用語尾を第7図に、
一段活用語尾を第8図に、また、形容詞、形容動詞の活
用語尾をそれぞれ第9図、第10図に示した。(4) Word Conjugation Table 21 As part of its contents is shown in Figure 6, the conjugation endings are stored for each classification of verbs, adjectives, parts of speech of adjective verbs, and conjugations. The five-stage conjugation endings of verbs are shown in Figure 7.
Figure 8 shows the single-stage conjugation endings, and Figures 9 and 10 show the conjugation endings of adjectives and adjective verbs, respectively.
(51付属語分類表22
大分類表22Aと小分類表22Bとで構成されており、
大分類表22Aは第11図にその内容の一部を示す如く
、形式名詞、補助動詞(形式動詞)、助動詞、助詞の容
器の単位で分類したもので、小分類表22Bとは番号で
対応させである。小分類表22Bは第12図にその内容
の一部を示した如く、形式名詞の容器、補助動詞、助動
詞の容器の活用形、助詞の容器の活用形の単位で分類し
たものである。(51 Adjunct word classification table 22 consists of a major classification table 22A and a minor classification table 22B,
The major classification table 22A is classified into containers of formal nouns, auxiliary verbs (formal verbs), auxiliary verbs, and particles, as part of its contents are shown in Figure 11, and corresponds to the minor classification table 22B by number. It's a shame. As part of the contents of the minor classification table 22B is shown in FIG. 12, the contents are classified by formal noun container, auxiliary verb, auxiliary verb container conjugation, and particle container conjugation.
(6)接続行列表17
自立語と付属語との文法的接続関係を、先行する語を行
に、後続する語を列に配して表した表で、1行j列の要
素C1jを次のように定めるものである。(6) Connection matrix table 17 This table shows the grammatical connection relationship between independent words and attached words by arranging preceding words in rows and succeeding words in columns. Element C1j in row 1 and column j is It is defined as follows.
←)Cg=1の場合
第1行の語が第j列の語に接続可能
(ロ)c1j=oの場合
第1行の語が第j列の語に接続不可能
第13図に内容の一部を示した。なお、第13図の列番
号は4列ごとにまとめて16進数で示しである。←) If Cg=1, the word in the first row can be connected to the word in the jth column (b) If c1j=o, the word in the first row cannot be connected to the word in the jth column. Some of them are shown. Note that the column numbers in FIG. 13 are shown in hexadecimal numbers for every four columns.
また、前記付属語の大分類表22Aの通番は、上記列番
号に対応している。Further, the serial numbers in the major classification table 22A of the adjunct words correspond to the column numbers.
第14図に接続行列表17を用いて、付属語を選択する
ステップをモデル的に示した。FIG. 14 shows a model of the step of selecting adjunct words using connection matrix table 17.
また、接続行列表17には終了可能性の項目を設けてあ
り、これが′1″である場合には、前記分節としての終
了可能性があることを示している。Furthermore, the connection matrix table 17 has an item for termination possibility, and when this is '1'', it indicates that there is a possibility of termination as the segment.
上述の如く構成された本実施例の動作について、以下、
説明する。The operation of this embodiment configured as described above will be described below.
explain.
(1)入力動作
入力は鍵盤装置11によって行う。鍵盤装置11の文字
配列の一例を第15図に示したが、これに限るものでは
ない。(1) Input operation Input is performed using the keyboard device 11. An example of the character arrangement of the keyboard device 11 is shown in FIG. 15, but the arrangement is not limited to this.
本鍵盤装置はシフトキーと○印または目印の特殊キーと
を絹合わせて打鍵することにより、文節区切り情報を出
力する如く構成されている。シフトキー(以下「■」と
表す)と、前記特殊キーとの組合せにより、以下の如く
変換態様を指示することができる。This keyboard device is configured to output phrase break information by pressing the shift key and a special key marked with a circle or a mark. By combining the shift key (hereinafter referred to as "■") and the special key, the following conversion mode can be specified.
(イ)漢字まじり文への変換処理を要する文節の直後に
は、■を打鍵し、次いで[相]を打鍵する。(b) Immediately after a phrase that requires conversion into a sentence containing kanji, press the ■ key, and then press the [Ao] key.
(例)打鍵順序 変換移出力
わたくしはO■→ 私は
かつこうへO■→ 学校へ
(ロ)入力文節をひら仮名、カタ仮名のまま出力させる
場合には、Oを打鍵し、次いて口または口を打鍵する。(Example) Keystroke order Conversion transfer output I am O → I am Katsukou O Or press your mouth.
(例)打鍵順序 変換後出力
さびしい■口→ さびしい
すく−る・けす■囲→ スクール・バス■変換処理動
作
最初に、「火とは何か。火とは人にとって無くてはなら
ないもの。」という文章を作成する例を示す。なお、以
下の説明においては、前記09゜■図、■囲等を文節区
切り記号■で代表させることにする。(Example) Keystroke sequence Output after conversion Lonely ■ Mouth → Lonely School/Kesu ■ Enclosure → School Bus ■ Conversion processing operation First, "What is fire? Fire is something that humans cannot live without." An example of creating a sentence is shown below. In the following explanation, the above-mentioned 09° ■ diagram, ■ enclosure, etc. will be represented by the bunsetsu delimiter ■.
また、本発明の特徴とする同音文節バッファ31は、第
16図にその一例を示す如く、同音語があって通常の変
換では表示順位が下位になるような文節、あるいは接頭
辞、接尾辞を有する語を含む文節を、読み仮名と表記と
を対応させて登録するものである。この同音文節バッフ
ァ31は、当初は何も登録されておらず、上述の如き状
況において、使用された文節を、必要により頻度をも含
めて登録するものである。In addition, the homophone phrase buffer 31, which is a feature of the present invention, can store phrases that have homophones and would be displayed at a lower order in normal conversion, or prefixes and suffixes, as shown in an example in FIG. This is to register phrases that include words that have the same pronunciation and notation. Initially, nothing is registered in this homophone phrase buffer 31, but in the above-mentioned situation, used phrases are registered, including their frequency, if necessary.
前記m1の例文にもどって、オペレータが鍵盤装置11
から、ひとは[相]なにか。ひとけ[相]ひとにとって
[相]なくては[相]ならないもの。Returning to the example sentence for m1 above, the operator uses the keyboard device 11.
Therefore, one is [phase] something. Hitoke [Ao] Something that a person cannot do without [Ao].
と入力すると、第1番目の文節「ひとけ」が入力され文
節区切り情報が入力されると、まず、前記同音文節バッ
ファ31をサーチする。しかし、この段階では、同音文
節バッファ31には何も記憶されていないので、通常の
辞書検索に移り、通常の辞書検索により前述の如く、「
人は」と変換される。When the first phrase "Hitoke" is input and the phrase delimiter information is input, first, the homophone phrase buffer 31 is searched. However, at this stage, nothing is stored in the homophone phrase buffer 31, so the routine moves on to a normal dictionary search.
It is translated as ``人は''.
これはオペレータの意図するものではないので、オペレ
ータが更新キーを押すと、「−は」となり更に更新キー
を押して「非とは」が表示され、その次に「火とは」が
表示される。これはオペレータの意図するものであるの
で、オペレータは次の文節の入力に移り、「なにか。」
を入力する。この入力動作(厳密には[なにか。Jの[
なJの入力動作)によって、先に入力された「ひとはコ
とその出力表示である「火とは」とが前記同音文節バッ
ファ31に登録される。次いで「なにか。」の入力終了
に伴い、前記同音文節バッファ31をサーチした後(同
音文節バッファ31には対応するものがない)、通常の
辞書検索により「何か。」と変換される。This is not what the operator intended, so when the operator presses the update key, "-wa" is displayed, and when the operator presses the update key again, "non and what" is displayed, and then "fire and what" is displayed. . This is what the operator intended, so he moves on to input the next clause and says, "Something."
Enter. This input operation (strictly speaking, [something. J's [
With the input operation of ``J''), the previously input ``Hitohako'' and its output display ``Fire and what'' are registered in the homophone phrase buffer 31. Next, upon completion of the input of "something.", after searching the homophone phrase buffer 31 (there is no corresponding item in the homophone phrase buffer 31), it is converted into "something." by a normal dictionary search.
次に「ひとけ」が入力され文節区切り情報が入力される
と、「ひとけ」の文字列で前記同音文節バッファ31を
サーチする。これにより、先に記憶された「火とは」を
取出すことができる。更に、「ひとにとって■」と入力
すると「ひとにとって」の文字列で同音文節バッファ3
1をサーチした後、通常の辞書検索により「人にとって
」ど出力表示する。Next, when "Hitoke" is input and phrase delimiter information is input, the homophone phrase buffer 31 is searched for the character string "Hitoke". As a result, the previously stored "What is Fire" can be retrieved. Furthermore, if you input "Hitoto ■", the character string "Hitoto" will be displayed in the homophone phrase buffer 3.
After searching for 1, a normal dictionary search is performed to output and display the words ``for people''.
次に、契約書の作成を行う場合を例に挙げる。Next, we will take the case of creating a contract as an example.
契約書は、一般には、10前後またはそれ以上の条項か
ら成る。このような場合、従来の処理においては、例え
は、「だいいちじょう■」という人力に対して、これを
自立語、自立語+付属語、自立語士接尾辞十付属語とし
て処理する過程を経て、接頭辞十自立語+付属語として
の処理に入り、接頭辞として「第」を取出し、rlJを
自立語(数詞)扱いとし、「じよう」を付属語とみなし
た検証(前記接続行列表と付属語表とによる)を行うが
成立する接続がないことから、接頭辞+自立冊子接尾辞
とみなした処理に入る。ここで、接尾辞「じよう」とし
て、最初に「場」が得られるが、これは目的とするもの
ではないので、次候補キーを操作することにより「条」
を得る。「第1条」の次の文字の入力動作により、「だ
いいちじょう」と「第1条」とが前記同音文節バッファ
31に登録される。A contract generally consists of around 10 or more clauses. In such a case, in conventional processing, for example, for the human power of ``daiichijo■'', it is processed through the process of processing it as an independent word, an independent word + attached word, and an independent language expert suffix ten attached words. , the prefix is processed as an independent word + an adjunct word, "dai" is taken out as a prefix, rlJ is treated as an independent word (numerical word), and "jiyou" is treated as an adjunct word. and adjunct word table), but since there is no connection that can be established, processing begins with the prefix being treated as a prefix + an independent booklet suffix. Here, as the suffix "jiyo", "ba" is first obtained, but this is not the purpose, so by operating the next candidate key, "jo" is obtained.
get. By inputting the next character of "Article 1", "Daichijo" and "Article 1" are registered in the homophone phrase buffer 31.
しかしながら、同一文書では「第1条」という語は、は
ば再出現せず、「第2条」、「第3条青。However, in the same document, the word "Article 1" does not appear again, but instead "Article 2" and "Article 3".
・・・と更新されるのが普通であり、前述の如く、「第
1条」を登録しても、その文書中では使用されず、「第
2条」、「第3条」、・・・を得るために、その都度前
と同様の分析を行うことになる可能性がある。そこで、
「第1東」を同音文節バッファ31に登録する際に、数
字の部分はそのまま登録するのではなく、品詞コード(
数詞)に変換してから登録し、入力文字列内に数字があ
る場合には、数字を品詞コード(数詞)に変換後、同音
文節バッファ31をサーチするようにする。こうするこ
とにより、)字部分が何であっても、接頭辞あるいは接
尾辞、またはその両方の読みが一致すれば前記同音文節
バッファ31の内容を取出すことができる。第17図は
上記処理のプログラム・フローチャートである。上述の
如き処理を行うことにより、同音文節バッファの容量を
少なくすることが可能になり、処理スピードが向上する
。As mentioned above, even if "Article 1" is registered, it is not used in the document, but "Article 2", "Article 3", etc. In order to obtain ・, the same analysis as before may be performed each time. Therefore,
When registering "Daiichi Higashi" in the homophone phrase buffer 31, instead of registering the numerical part as is, the part-of-speech code (
If there are numbers in the input character string, the numbers are converted into part-of-speech codes (number words) and then the homophone phrase buffer 31 is searched. By doing this, no matter what the ) character part is, if the readings of the prefix, suffix, or both match, the contents of the homophone phrase buffer 31 can be retrieved. FIG. 17 is a program flowchart of the above processing. By performing the above-described processing, it is possible to reduce the capacity of the same sound phrase buffer, and the processing speed is improved.
上述の如く、文節内で同音語が発生し、第1候補で正解
が得られなかったものを次々に同音文節バッファ31に
登録して行き、この同音文節バッファ31が一杯になっ
た場合には、すでに登録されているものを消失して、そ
こへ最新の同音語を登録するようにすると良い。消去す
る方法としては、
(1)一番古いものから消去する。As mentioned above, when homophones occur in a phrase and the first candidate does not give a correct answer, they are registered one after another in the homophone phrase buffer 31, and when this homophone phrase buffer 31 becomes full, , it is a good idea to delete the already registered homophones and register the latest homophones there. How to delete: (1) Delete the oldest item first.
■)ある登録順(例えば、登録文節数の半分)以前のも
ので一番使用頻度の少ないものから消去する。■) Delete phrases that are least frequently used before a certain registration order (for example, half the number of registered phrases).
等の方法が考えられるが、これに限られるものではない
。The following methods are possible, but are not limited to these methods.
なお、上記実施例においては、同音文節バッファ31に
は、通常の変換処理では表示順位が下位になるような文
節を登録するようにしたが、これは該バッファの容量と
の関連において、第2候補以下あるいは第3候補以下等
、適宜決定することもできる。In the above embodiment, phrases that would be displayed at a lower order in normal conversion processing are registered in the homophone phrase buffer 31. It is also possible to decide as appropriate, such as below the candidate or below the third candidate.
また、上記実施例においては、数詞を含む語(文節)に
ついて、これを同種語として扱う例を示したが、数詞の
ほかにも人名、地名等の固有名詞を同様に扱うようにし
ても良い。In addition, in the above example, an example was shown in which words (clauses) that include number words are treated as homogeneous words, but in addition to number words, proper nouns such as people's names and place names may also be treated in the same way. .
第16図にその一例を示した。An example is shown in FIG.
効果
以上述べた如く、本発明によれば、日本語文章をカナ文
として入力する手段と、該入力手段により入力された文
字列を一時記憶する手段と、同音異字単語の出力順位情
報を含む単語辞書記憶手段と、該単語辞書記憶手段を検
索して前記一時記憶手段の内容を漢字まじり文に変換す
るカナ漢字変換制御回路と、該カナ漢字変換制御回路に
よる変換結果を表示する手段および前記変換結果のうち
の確定情報を受ける手段を有するカナ漢字変換処理装置
において、前記単語辞書記憶手段に品詞情報。Effects As described above, according to the present invention, there is provided a means for inputting a Japanese sentence as a kana sentence, a means for temporarily storing a character string inputted by the input means, and a word including output ranking information of homophone and allograph words. a dictionary storage means, a kana-kanji conversion control circuit that searches the word dictionary storage means and converts the contents of the temporary storage means into a sentence mixed with kanji, a means for displaying the conversion result by the kana-kanji conversion control circuit, and the conversion. In a kana-kanji conversion processing device having means for receiving finalized information among the results, part-of-speech information is stored in the word dictionary storage means.
接頭辞および接尾辞を記憶させるとともに、前記確定情
報を入力文字列と対応させて記憶する手段を設けて、該
記憶手段の出力文字欄には、ある特定された品詞につい
ては、これを出力文字列のかわりに品詞コードを記録す
るようにしたので、オペレータの負担を軽減しながら同
音語、同種語の自動判別率を向上させることが可能とな
り、実用的なカナ漢字変換処理装置を実現できるという
顕著な効果を奏するものである。Prefixes and suffixes are stored, and means is provided for storing the confirmed information in correspondence with input character strings, and in the output character column of the storage means, for a certain specified part of speech, this is stored as an output character. By recording part-of-speech codes instead of columns, it is possible to improve the automatic recognition rate of homophones and homologous words while reducing the burden on the operator, making it possible to create a practical kana-kanji conversion processing device. This has a remarkable effect.
第1図は自立語辞書の一部を示す図、第2図は本発明の
一実施例であるカナ漢字変換処理装置の構成図、第3図
〜:¥’、 14図は辞書類の内容を示す図、第15図
は鍵盤装置の文字配歴を示す図、第16図は同音文節バ
ッファの内容を示す図、第17図はプログラム・フロー
チャートである。
11:鍵盤装置、12:入力文字バッファレジスタ、1
3二制御回路、14:出力編集器、15:表示装置、1
6:プリンタ、17:接続行列表、18:自立語辞書、
19:接頭辞表、20:接尾辞表、21:用言活用表、
22:付属語表、23:ひら仮名カタ仮名対応表、24
:出力文レジスタ、31:同音文節バッファ。
第 3 図
第 4 図
第5図
第6図
第 7 図
第 8 図
手続補正書(自発)
昭和58年2月28日
特許庁長官若杉和夫殿
J、事件の表示
昭和57年 特 詐 I第212478号2 発明の名
称 カナ漢字変換処理装置3 補正をする者
事件との関係 特許出願人
住 所 東京都大田区中馬込1丁目3秀〇−号エ
6(gゎ (0響株式会社 リ コ −代表者
大 植 武 士
4、代理人
5、& 補正により増加する発明の数 な
し0、??補正の対象
(1)「発明の詳細な説明」の欄の記載を以下の通り補
正する。
1)tJ4D第4D行「同音語バッファメモリ」を、r
liL音文節バッファメモリ」と補正する。
2)同第17行〜第20行全以下の通り補正する。
「接尾辞と数詞、地名等とから成る語(これを「同種語
」という)、例えば、第1条、第2灸、・・・;横浜市
、用崎市、・・・等はそれぞれ個別に前記同音文節バッ
ファメモリの蓄積対象となるため、上記同種詔について
は、使用頻度の少ない割に、同音文節バッファメモリの
容量が大きくなり、選択に要するオペレータの負相も増
加するという問題がある。」3)第5頁第6行〜第6行
「オペレータの負担を軽減しながら」を、「前記同音文
節バッファメモリの容量を増加させることなく、マた、
前述の如きオペレータの負担を軽減しなからdと補正す
る。
4)第14頁第20行「(数詞)」を、「(数詞\第1
6図に■と示されている)」と補正する。
5)M16頁第12行「第16図にその一例を示した。
」の後に、「なお、第16図において、■は地名フード
を示す。」を追加する。
6)第17頁第δ行〜第9行「オペレータの負担を幅減
しながら」を、[記憶手段の容量を増加させることなく
、また、オペレータの負担を軽減しながら、」と補正す
る。
■図面の第16図中にO印を補正する(赤線で示した○
全追加)。
第16図Fig. 1 is a diagram showing a part of an independent word dictionary, Fig. 2 is a block diagram of a kana-kanji conversion processing device which is an embodiment of the present invention, Figs. 15 is a diagram showing the character arrangement history of the keyboard device, FIG. 16 is a diagram showing the contents of the same sound phrase buffer, and FIG. 17 is a program flowchart. 11: Keyboard device, 12: Input character buffer register, 1
32 control circuit, 14: output editor, 15: display device, 1
6: Printer, 17: Connection matrix table, 18: Independent word dictionary,
19: Prefix table, 20: Suffix table, 21: Conjugation table,
22: Adjunct word table, 23: Hiragana katakana correspondence table, 24
: Output sentence register, 31: Homogeneous phrase buffer. Figure 3 Figure 4 Figure 5 Figure 6 Figure 7 Figure 8 Written amendment to the procedure (voluntary) February 28, 1980 Mr. Kazuo Wakasugi, Commissioner of the Patent Office, Case Description 1981 Special Fraud I No. 212478 No. 2 Name of the invention Kana-kanji conversion processing device 3 Relationship with the person making the amendment Patent applicant address Hide〇-E 1-3 Nakamagome, Ota-ku, Tokyo Representative: Takeshi Oue 4, Agent: 5 & Number of inventions to be increased by amendment
Shi0,? ? Target of amendment (1) The description in the "Detailed description of the invention" column is amended as follows. 1) tJ4D line 4D "Homophone buffer memory", r
liL syllable buffer memory”. 2) Correct everything from lines 17 to 20 as follows. ``Words consisting of a suffix, a numeral, a place name, etc. (these are called ``same words''), for example, Article 1, 2nd moxibustion,...; Yokohama city, Yozaki city, etc. are each individually Since the above-mentioned same-sound edicts are stored in the same-sound phrase buffer memory, there is a problem that the capacity of the same-sound phrase buffer memory becomes large even though they are used less frequently, and the negative phase of the operator required for selection also increases. . 3) Page 5, lines 6 to 6, ``while reducing the burden on the operator'' was changed to ``without increasing the capacity of the homophone phrase buffer memory.''
In order to reduce the burden on the operator as described above, the correction is made as d. 4) Change “(number word)” from page 14, line 20 to “(number word\first
(marked with ■ in Figure 6)". 5) On page M16, line 12, after "An example is shown in Fig. 16.", add "In Fig. 16, ■ indicates a place name hood." 6) On page 17, line δ to line 9, "while significantly reducing the burden on the operator" is corrected to "without increasing the capacity of the storage means and while reducing the burden on the operator." ■ Correct the O mark in Figure 16 of the drawing (○ indicated by the red line)
all additions). Figure 16
Claims (1)
により入力された文字列を一時記憶する手段と、同音異
字単語の出力順位情報を含む単語辞書記憶手段と、該単
語辞書記憶手段を検索して前記一時記憶手段の内容を漢
字まじり文に変換するカナ漢字変換制御回路と、該カナ
漢字変換制御回路による変換結果を表示する手段および
前記変換結果のうちの確定情報を受ける手段を有するカ
ナ漢字変換処理装置において、前記単語辞書記憶手段に
品詞情報、接頭辞および接尾辞を記憶させるとともに、
前記確定情報を入力文字列と対応させて記憶する手段を
設けて、該記憶手段の出力文字欄には、ある特定された
品詞についてはこれを出力文字列のかわりに品詞コード
を記録する如く構成したことを特徴とするカナ漢字変換
処理装置。A means for inputting Japanese sentences as kana sentences, a means for temporarily storing character strings input by the input means, a word dictionary storage means including output ranking information of homophone and allograph words, and a search for the word dictionary storage means. a kana-kanji conversion control circuit for converting the contents of the temporary storage means into a sentence mixed with kanji; a means for displaying a conversion result by the kana-kanji conversion control circuit; and a means for receiving definitive information of the conversion result. In the kanji conversion processing device, part of speech information, prefixes, and suffixes are stored in the word dictionary storage means, and
Means for storing the confirmed information in correspondence with the input character string is provided, and an output character column of the storage means is configured to record a part-of-speech code for a certain specified part of speech instead of the output character string. This is a kana-kanji conversion processing device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57212475A JPS59103136A (en) | 1982-12-03 | 1982-12-03 | Kana (japanese syllabary)/kanji (chinese character) processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57212475A JPS59103136A (en) | 1982-12-03 | 1982-12-03 | Kana (japanese syllabary)/kanji (chinese character) processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59103136A true JPS59103136A (en) | 1984-06-14 |
Family
ID=16623254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57212475A Pending JPS59103136A (en) | 1982-12-03 | 1982-12-03 | Kana (japanese syllabary)/kanji (chinese character) processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59103136A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01140371A (en) * | 1987-11-27 | 1989-06-01 | Nec Corp | Kana-kanji conversion system |
JPH01291366A (en) * | 1988-05-18 | 1989-11-22 | Nec Corp | Grammatical case recognizing system |
US5079701A (en) * | 1987-09-29 | 1992-01-07 | Sharp Kabushiki Kaisha | System for registering new words by using linguistically comparable reference words |
-
1982
- 1982-12-03 JP JP57212475A patent/JPS59103136A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5079701A (en) * | 1987-09-29 | 1992-01-07 | Sharp Kabushiki Kaisha | System for registering new words by using linguistically comparable reference words |
JPH01140371A (en) * | 1987-11-27 | 1989-06-01 | Nec Corp | Kana-kanji conversion system |
JPH01291366A (en) * | 1988-05-18 | 1989-11-22 | Nec Corp | Grammatical case recognizing system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5873055A (en) | Sentence translation system showing translated word and original word | |
JPH05314166A (en) | Electronic dictionary and dictionary retrieval device | |
JPS59103136A (en) | Kana (japanese syllabary)/kanji (chinese character) processor | |
JP2595934B2 (en) | Kana-Kanji conversion processor | |
JPH0578058B2 (en) | ||
JP3285149B2 (en) | Foreign language electronic dictionary search method and apparatus | |
JPH039502B2 (en) | ||
JPS5899828A (en) | "kana" (japanese syllabary) - chinese character converting processor | |
JPH0785040A (en) | Inscription nonuniformity detecting method and kana/ kanji converting method | |
JP2819766B2 (en) | Foreign language electronic dictionary search method | |
JPS6057425A (en) | Kana (japanese syllabary)/kanji (chinese character) conversion processor | |
JPH0260022B2 (en) | ||
JP2752025B2 (en) | Machine translation equipment | |
JPS59186030A (en) | Kana-kanji conversion processing device | |
JPS61260367A (en) | Mechanical translating system | |
JPS63173156A (en) | Device for supplying language information | |
JPS58101326A (en) | Kana(japanese syllabary)-kanji(chinese character) conversion processor | |
JPS61134866A (en) | Japanese word analyzer | |
JPS6217266B2 (en) | ||
JPS59186031A (en) | Kana-kanji conversion processing device | |
JPH0229858A (en) | Machine translation processing method | |
JPH0377166A (en) | Expression conversion system | |
JP2002117025A (en) | Device and method for japanese syllabary-to-chinese character conversion | |
JPH06162079A (en) | Parallel translation retrieving device | |
JPH04180167A (en) | English morpheme analyzing device |