JPH0578058B2 - - Google Patents

Info

Publication number
JPH0578058B2
JPH0578058B2 JP57076076A JP7607682A JPH0578058B2 JP H0578058 B2 JPH0578058 B2 JP H0578058B2 JP 57076076 A JP57076076 A JP 57076076A JP 7607682 A JP7607682 A JP 7607682A JP H0578058 B2 JPH0578058 B2 JP H0578058B2
Authority
JP
Japan
Prior art keywords
word
kana
words
dictionary
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57076076A
Other languages
Japanese (ja)
Other versions
JPS58192128A (en
Inventor
Yoshitoshi Yamauchi
Hirokawa Hayashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP57076076A priority Critical patent/JPS58192128A/en
Publication of JPS58192128A publication Critical patent/JPS58192128A/en
Publication of JPH0578058B2 publication Critical patent/JPH0578058B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

本発明は邦文ワードプロセツサ等に用いられる
カナ漢字変換処理装置に関し、特に同音異字語
(以下、「同音語」という。)がある場合に、文節
単位で同音語の学習を行う機能により、オペレー
タの負担を軽減しながら同音語の自動判別率を向
上させることを可能とするカナ漢字変換処理装置
に関する。 カナ漢字変換処理(以下、単に「変換処理」と
もいう。)装置としては、種々の方式によるもの
が提案されている。本出願人が先に特願昭56−
149737号「カナ漢字変換処理装置」として提案し
た装置もその1つである。この装置は、「日本語
文章をカナ文として入力する手段と、該入力手段
により入力された文字列を一時記憶する手段と、
単語辞書記憶手段および該単語辞書記憶手段を検
索して前記一時記憶手段の内容を漢字まじり文に
変換するカナ漢字変換制御回路を有するカナ漢字
変換処理装置において、前記単語辞書は同音異字
単語の出力順位情報を含むとともに、前記単語辞
書から抽出された単語を記憶する単語バツフアメ
モリと、該単語バツフアメモリの内容を前記出力
順位情報に従つて出力する手段と、該出力中から
選択されて出力された単語とその直前に出力され
た前記単語の同音異字語との出力順位情報を入替
える手段および該入替えられた出力順位情報を、
前記単語辞書の所定の場所に書込む手段を有する
ことを特徴とするカナ漢字変換処理装置」であ
り、単語(自立語)単位の学習機能を有するもの
と言うことができる。 しかしながら、例えば「火とは」という変換結
果を得ようとする場合、次のような問題が生ず
る。すなわち、「ひとは」の入力に対しては、第
1図に例を示した如き自立語辞書が用いられる結
果、最長一致法による変換候補の表示順序は、 「人は」→「一は」→「非とは」→「火とは」 となり、次候補キー(更新キー)を何度も押さな
ければならない。 本発明は上記事情に鑑みてなされたもので、そ
の目的とするところは、前述の装置における問題
を解消し、オペレータの負担を軽減しながら同音
語の自動判別率を向上させることの可能なカナ漢
字変換処理装置を提供することにある。 本発明の上述の目的は、日本語文章をカナ文と
して入力する手段と、該入力手段により入力され
た文字列を一時記憶する手段と、単語辞書を記憶
する手段と、該単語辞書記憶手段を検索して前記
一時記憶手段の内容を単語または辞の単位に分析
して漢字混じり文に変換するカナ漢字変換制御回
路と、該カナ漢字変換制御回路による変換結果を
表示する手段と、前記変換結果のうちの確定情報
を受ける手段を有するカナ漢字変換処理装置にお
いて、前記単語辞書を同音異字単語の学習情報を
含む如く構成するとともに、少なくとも、前記確
定情報により最初の変換結果とは異なる単語また
は辞の区切りで前記単語辞書に記述されている単
位を複数含むように確定された表記とその入力文
字列とを対応させて記憶する手段を設け、辞書検
索時に該記憶手段を優先して検索する如く構成し
たことを特徴とするカナ漢字変換処理装置によつ
て達成される。 以下、本発明の実施例を図面に基づいて詳細に
説明する。 第2図は本発明の一実施例を示すカナ漢字変換
処理装置のブロツク図である。本実施例装置は、
入力文を構成する日本語を自立語、接頭辞、接尾
辞および付属語に分類し、前記入力文を1個の自
立語を中心とする分かち書き単位に分解して仮名
文字で入力し、該入力された文字列を一時記憶手
段に記憶しておき、該記憶内容を、前記自立語、
接頭辞、接尾辞および付属語の各々を記憶してい
る辞書の内容と照合するようにしたカナ漢字変換
処理装置に本発明を適用した例を示すものであ
る。 なお、本実施例の説明において、分かち書き単
位(「文節」ともいう。)とは次のものを言う。 〔接頭辞〕(自立語)〔接尾辞〕〔付属語〕※ ここで、自立語は必らず1個存在するものと
し、〔 〕で囲んだものは無くても良く、付属語
(※印)は複数個連なつても良い。 第2図において、11は入力用鍵盤装置であ
り、12は入力された文字列を一時記憶する入力
文字バツフアレジスタ、13は制御回路、14は
出力編集器、15は表示装置、そして16はプリ
ンタである。17〜24は辞書類を示しており、
17は接続行列表、18は自立語辞書、19は接
頭辞表、20は接尾辞表、21は用言活用表、2
2は付属語表、そして23はカタ仮名ひら仮名対
応表である。これらの辞書類の内容については後
述する。 また、24は出力文レジスタ、25,27,2
9はそれぞれ自立語、接頭辞および接尾辞の出力
バツフアメモリ、26,28,30は順位制御器
である。31は同音文節バツフアメモリである。 以下、辞書、表の具体的内容について例を挙げ
て説明しておく。なお、辞書あるいは表の内容項
目は次の通りである。 ・ 読み仮名:入力文字列を照合する部分 ・ 表 記:特定の単語に確定した場合出力す
る文字 ・ 品詞、活用:各自立語の品詞、活用を通番で
記録してある ・ 出力順位:ある時点における同音異字単語の
使用頻度順位で、使用ごとに上位との入替
えが行われる (1) 自立語辞書18 第3図にその内容の一部を示した如く、自立語
の中で、名詞、サ変名詞(サ変動詞「する」の付
き得る名詞)、動詞、形容詞、形容動詞、連体詞、
副詞、感動詞等に属するものを記憶している。こ
れらのうち、用言は語幹のみであるが、1段活用
動詞は活用部の不変化部までを含み、サ変動詞
「する」とカ変動詞「来る」は活用形の全部を含
んでいる。 (2) 接頭辞表19 第4図にその内容の一部を示した如く、自立語
の名詞等につく接頭辞を記憶している。 (3) 接尾辞表20 第5図にその内容の一部を示す如く、自立語の
名詞等につく接尾辞を記憶している。 (4) 用言活用表21 第6図にその内容の一部を示す如く、動詞、形
容詞、形容動詞の品詞、活用形による分類ごとに
その活用語尾を記憶している。なお、動詞の五段
活用語尾を第7図に、一段活用語尾を第8図に、
また、形容詞、形容動詞の活用語尾をそれぞれ第
9図、第10図に示した。 (5) 付属語分類表22 大分類表22Aと小分類表22Bとで構成され
ており、大分類表22Aは第11図にその内容の
一部を示す如く、形式名詞、補助動詞(形式動
詞)、助動詞、助詞の各語の単位で分類したもの
で、小分類表22Bとは番号で対応させてある。
小分類表22Bは第12図にその内容の一部を示
した如く、形式名詞の各語、補助動詞、助動詞の
各語の活用形、助詞の各語の単位で分類したもの
である。 (6) 接続行列表17 自立語と付属語との文法的接続関係を、先行す
る語を行に、後続する語を列に配して表わした表
で、i行j列の要素cijを次のように定めるもので
ある。 (イ) cij=1の場合 第i行の語が第j列の語に接続可能 (ロ) Cij=0の場合 第i行の語が第j列の語に接続不可能 第13図に内容の一部を示した。なお、第13
図の列番号は4列ごとにまとめて16進数で示して
ある。 また、前記付属語の大分類表22Aの通番は、
上記列番号に対応している。 第14図に接続行列表17を用いて、付属語を
選択するステツプをモデル的に示した。 また、接続行列表17には終了可能性の項目を
設けてあり、これが“1”である場合には、前記
文節としての終了可能性があることを示してい
る。上述の如く構成された本実施例の動作につい
て、以下、説明する。 (1) 入力動作 入力は鍵盤装置11によつて行う。鍵盤装置1
1の文字配列の一例を第15図に示したが、これ
に限るものではない。 本鍵盤装置はシフトキーと○印または□印の特
殊キーとを組合わせて打鍵することにより、文節
区切り情報を出力する如く構成されている。シフ
トキー(以下「○シ」と表わす。)と、前記特殊キ
ーとの組合せにより、以下の如く変換態様を指示
することができる。 (イ) 漢字まじり文への変換処理を要する文節の直
後には、○シを打鍵し次いで○漢を打鍵する。 (例)打鍵順序 変換後出力 わたくしは○シ○漢→ 私は がつこうへ○シ○漢→ 学校へ (ロ) 入力文節をひら仮名、カタ仮名のまま出力さ
せる場合には、○シを打鍵し、次いで□平または□片
を打鍵する。 (例)打鍵順序 変換後出力 さびしい○シ□平→ さびしい すくーる・ばす○シ□片→スクール・バス (2) 変換処理動作 ここでは、「火とは何か。火とは人にとつて無
くてはならないもの。」という文章を作成する例
を示す。なお、以下の説明においては、前記○シ
○漢、○シ□平、○シ□片等を文節区切り記号○節で代
表させ
ることにする。 また、本発明の特徴とする同音文節バツフア3
1は、第16図にその一例を示す如く、同音語が
あつて通常の変換では表示順位が下位になるよう
な文節を、読み仮名と表記とを対応させて登録す
るものである。この同音文節バツフア31は、当
初は何も登録されておらず、上述の如き状況にお
いて、使用された文節を、必要により頻度をも含
めて登録するものである。 例文にもどつて、オペレータが鍵盤装置11か
ら、 ひとは○節なにか。ひとは○節ひとにとつて○節なく
ては○節ならないもの。 と入力すると、第1番目の文節「ひとは」が入力
され文節区切り情報が入力されると、まず、前記
同音文節バツフア31をサーチする。しかし、こ
の段階では、同音文節バツフア31には何も記憶
されていないので、通常の辞書検索に移り、通常
の辞書検索により前述の如く、「人は」と変換さ
れる。 これはオペレータの意図するものではないの
で、オペレータが更新キーを押すと、「一は」と
なり更に更新キーを押して「非とは」が表示さ
れ、その次に「火とは」が表示される。これはオ
ペレータの意図するものであるので、オペレータ
は次の文節の入力に移り、「なにか。」を入力す
る。この入力動作(厳密には「なにか。」の「な」
の入力動作)によつて、先に入力された「ひと
は」とその出力表示である「火とは」が前記同音
文節バツフア31に登録される。次いで「なに
か。」の入力終了に伴い、前記同音文節バツフア
31をサーチした後(同音文節バツフア31には
対応するものがない。)、通常の辞書検索により
「何か。」と変換される。 次に「ひとは」が入力され文節区切り情報が入
力されると、「ひとは」の文字列で前記同音文節
バツフア31をサーチする。これにより、先に記
憶された「火とは」を取出すことができる。更
に、「ひとにとつて○節」と入力すると「ひとにと
つて」の文字列で同音文節バツフア31をサーチ
した後、通常の辞書検索により「人とにとつて」
と出力表示する。 上述の如く、同音文節バツフア31を導入して
これを最初に参照するようにしたことにより、同
音語の自動判別率を向上させることができる。 なお、同様の例は、「帰る」を得たいときに
「蛙」が、「新会社(接頭辞+自立語)」を得たい
ときに「侵外者(自立語+接尾辞)」が先に表示
される等多々あるが、これらを第16図に示す如
く同音文節バツフア31に記憶させることにより
迅速な変換を行うことが可能となる。 上述の如く、文節内で同音語が発生し、第1候
補で正解が得られなかつたものを次々に同音文節
バツフア31に登録して行き、この同音文節バツ
フア31が一杯になつた場合には、すでに登録さ
れているものを消去して、そこへ最新の同音語を
登録するようにすると良い。消去する方法として
は、 (1) 一番古いものから消去する。 (2) ある登録順(例えば、登録文節数の半分)以
前のもので一番使用頻度の少ないものから消去
する。 等の方法が考えられるが、これに限るものではな
い。 なお、上記実施例においては、同音文節バツフ
ア31には、通常の変換処理では表示順位が下位
になるような文節を登録するうにしたが、これは
該バツフアの容量との関連において、第2候補以
下あるいは第3候補以下等、適宜決定することが
できる。 以上述べた如く、本発明によれば、日本語文章
をカナ文として入力する手段と、該入力手段によ
り入力された文字列を一時記憶する手段と、単語
辞書を記憶する手段と、該単語辞書記憶手段を検
索して前記一時記憶手段の内容を単語または辞の
単位に分析して漢字混じり文に変換するカナ漢字
変換制御回路と、該カナ漢字変換制御回路による
変換結果を表示する手段と、前記変換結果のうち
の確定情報を受ける手段を有するカナ漢字変換処
理装置において、前記単語辞書を同音異字単語の
学習情報を含む如く構成するとともに、少なくと
も、前記確定情報により最初の変換結果とは異な
る単語または辞の区切りで前記単語辞書に記述さ
れている単位を複数含むように確定された表記と
その入力文字列とを対応させて記憶する手段を設
け、辞書検索時に該記憶手段を優先して検索する
如く構成したので、オペレータの負担を軽減しな
がら同音語の自動判別率を向上させることが可能
となり、実用的なカナ漢字変換処理装置を実現で
きるという顕著な効果を奏するものである。
The present invention relates to a kana-kanji conversion processing device used in Japanese word processors, etc. In particular, when there are homophones and allographs (hereinafter referred to as "homonyms"), the present invention has a function for learning homophones in units of phrases, so that the operator can The present invention relates to a kana-kanji conversion processing device that can improve the automatic discrimination rate of homophones while reducing the burden on users. Various systems have been proposed as kana-kanji conversion processing (hereinafter also simply referred to as "conversion processing") devices. The present applicant first applied for a patent application in 1983-
The device proposed in No. 149737, ``Kana-Kanji Conversion Processing Device,'' is one such device. This device includes "a means for inputting a Japanese sentence as a kana sentence, a means for temporarily storing a character string inputted by the input means,
In a kana-kanji conversion processing device having a word dictionary storage means and a kana-kanji conversion control circuit that searches the word dictionary storage means and converts the contents of the temporary storage means into a sentence mixed with kanji, the word dictionary outputs homophone and allograph words. a word buffer memory containing ranking information and storing words extracted from the word dictionary; means for outputting the contents of the word buffer memory according to the output ranking information; and words selected from the output and output. and a homophone and allograph of the word that was output immediately before, and a means for replacing the output ranking information with the homophone and allograph of the word that was output immediately before, and the replaced output ranking information,
A kana-kanji conversion processing device characterized by having means for writing in a predetermined location of the word dictionary, and can be said to have a learning function on a word (independent word) basis. However, when trying to obtain a conversion result such as "What is fire?", the following problem arises. In other words, for the input of ``Hito wa'', an independent word dictionary such as the one shown in Figure 1 is used, and as a result, the display order of conversion candidates using the longest match method is ``Hito wa'' → ``Ichi wa''. → “What is fire” → “What is fire”, and the next candidate key (update key) must be pressed many times. The present invention has been made in view of the above circumstances, and its purpose is to solve the problems with the above-mentioned device and to provide a method that can improve the automatic discrimination rate of homophones while reducing the burden on the operator. An object of the present invention is to provide a kanji conversion processing device. The above object of the present invention is to provide means for inputting Japanese sentences as kana sentences, means for temporarily storing character strings input by the input means, means for storing a word dictionary, and means for storing the word dictionary. a kana-kanji conversion control circuit that searches and analyzes the contents of the temporary storage means in units of words or words and converts them into a sentence containing kanji; a means for displaying a conversion result by the kana-kanji conversion control circuit; and a means for displaying the conversion result. In the kana-kanji conversion processing device, the word dictionary is configured to include learning information of homophone and allograph words, and at least the word dictionary is configured to include learning information of homophone and allograph words, and at least the word dictionary is configured to include learning information of homophone and allograph words. A means is provided for storing the notation determined to include a plurality of units described in the word dictionary in correspondence with the input character string, and the storage means is given priority when searching the dictionary. This is achieved by a kana-kanji conversion processing device characterized by the following configuration. Embodiments of the present invention will be described in detail below with reference to the drawings. FIG. 2 is a block diagram of a kana-kanji conversion processing device showing one embodiment of the present invention. The device of this embodiment is
Classify the Japanese words that make up the input sentence into independent words, prefixes, suffixes, and adjunct words, break down the input sentence into division units centered on one independent word, input them in kana characters, and input the input sentences. The stored character string is stored in a temporary storage means, and the stored content is stored as the independent word,
This is an example in which the present invention is applied to a kana-kanji conversion processing device that compares each of prefixes, suffixes, and adjuncts with the contents of a dictionary that stores them. Note that in the description of this embodiment, a break-up unit (also referred to as a "bunsetsu") refers to the following. [Prefix] (Independent word) [Suffix] [Adjunct word] * Here, there must be one independent word, and the words enclosed in [ ] may be omitted; ) may be connected multiple times. In FIG. 2, 11 is an input keyboard device, 12 is an input character buffer register that temporarily stores input character strings, 13 is a control circuit, 14 is an output editor, 15 is a display device, and 16 is a It's a printer. 17 to 24 indicate dictionary documents,
17 is a connection matrix table, 18 is an independent word dictionary, 19 is a prefix table, 20 is a suffix table, 21 is a word conjugation table, 2
2 is an adjunct word table, and 23 is a katakana-hirakana correspondence table. The contents of these dictionaries will be described later. Also, 24 is an output statement register, 25, 27, 2
9 is an output buffer memory for independent words, prefixes, and suffixes, respectively; 26, 28, and 30 are rank controllers. 31 is a homophone phrase buffer memory. The specific contents of dictionaries and tables will be explained below using examples. The contents of the dictionary or table are as follows.・ Pronunciation: The part that matches the input string ・ Notation: Characters to be output when a specific word is determined ・ Part of speech, conjugation: The part of speech and conjugation of each independent word are recorded by number ・ Output order: At a certain point (1) Independent Word Dictionary 18 As shown in part of the contents in Figure 3, among independent words, nouns, Nouns (nouns that can be accompanied by the verb "suru"), verbs, adjectives, adjectives, adjectives,
Memorizes things that belong to adverbs, interjections, etc. Among these, the pragmatic word is only the stem, but the first-stage conjugated verb includes the inflexible part of the conjugated part, and the sa verb ``suru'' and the ka verb ``kuru'' include the entire conjugated form. (2) Prefix Table 19 As part of its contents is shown in Figure 4, it stores prefixes attached to independent word nouns, etc. (3) Suffix table 20 As part of its contents is shown in Figure 5, it stores suffixes attached to independent words, nouns, etc. (4) Word Conjugation Table 21 As part of its contents is shown in Figure 6, the verb, adjective, part of speech of the adjective verb, and conjugation ending are stored for each classification according to the conjugation form. Furthermore, the five-stage conjugation endings of verbs are shown in Figure 7, and the one-stage conjugation endings are shown in Figure 8.
In addition, the conjugation endings of adjectives and adjective verbs are shown in Figures 9 and 10, respectively. (5) Adjunct word classification table 22 It is composed of a major classification table 22A and a minor classification table 22B.The major classification table 22A, as part of its contents is shown in Figure 11, contains formal nouns, auxiliary verbs (formal verbs) ), auxiliary verbs, and particles, and correspond to the minor classification table 22B by number.
As part of the contents of the minor classification table 22B is shown in FIG. 12, the contents are classified by formal nouns, auxiliary verbs, conjugated forms of auxiliary verbs, and particles. (6) Connection matrix table 17 This table shows the grammatical connection relationship between independent words and adjunct words by arranging preceding words in rows and following words in columns, where element c ij in row i and column j is It is defined as follows. (b) When cij = 1, the word in the i-th row can be connected to the word in the j-th column. (b) When Cij = 0, the word in the i-th row cannot be connected to the word in the j-th column. The contents are shown in Figure 13. A part of it was shown. In addition, the 13th
The column numbers in the figure are shown in hexadecimal numbers in groups of four columns. In addition, the serial numbers in the major classification table 22A of the attached words are:
Corresponds to the column number above. FIG. 14 shows a model of the steps for selecting adjunct words using connection matrix table 17. Furthermore, the connection matrix table 17 has an item for termination possibility, and when this is "1", it indicates that there is a possibility of termination as the clause. The operation of this embodiment configured as described above will be described below. (1) Input operation Input is performed using the keyboard device 11. Keyboard device 1
An example of the character arrangement of No. 1 is shown in FIG. 15, but the arrangement is not limited to this. This keyboard device is configured to output phrase break information by pressing a combination of a shift key and a special key marked with ◯ or □. By combining the shift key (hereinafter referred to as "○shi") and the special key, it is possible to specify the conversion mode as follows. (b) Immediately after a phrase that requires conversion into a sentence containing kanji, press ○shi, then ○kan. (Example) Keystroke order Output after conversion I am ○shi○kan→ I am Gatsukohe○shi○kan→Go to school (b) If you want to output the input phrase as hiragana or katakana, press ○shi. Press the key, then press the □flat or □piece key. (Example) Keystroke order Output after conversion Lonely ○shi□flat → Lonely school/bus○shi□piece → school bus (2) Conversion processing operation Here, we will explain what fire is. An example of creating a sentence such as ``It's something I can't live without.'' is shown below. In the following explanation, the ○shi○kan, ○shi□hei, ○shi□hata, etc. will be represented by the clause delimiter ○clause. In addition, the homophonic phrase Batsuhua 3, which is a feature of the present invention,
1, as an example of which is shown in FIG. 16, is for registering phrases that have homophones and would be displayed at a lower order in normal conversion, with corresponding pronunciations and spellings. Initially, nothing is registered in this homophone phrase buffer 31, but in the above-mentioned situation, the phrases used are registered, including their frequency, if necessary. Returning to the example sentence, the operator uses the keyboard device 11, and the person is ○ something. For a person, there is no ○ section without ○ section. When the first phrase "Hitoha" is input and the phrase delimiter information is input, first, the homophone phrase buffer 31 is searched. However, at this stage, nothing is stored in the homophone phrase buffer 31, so the routine moves on to a normal dictionary search, and as described above, the word is converted to ``hito wa''. This is not what the operator intended, so when the operator presses the update key, ``ichiwa'' is displayed, and when the operator presses the update key again, ``non-towa'' is displayed, and then ``fire is'' is displayed. . Since this is what the operator intended, the operator moves on to input the next phrase and inputs "something." This input action (strictly speaking, "Na" in "Something.")
2), the previously input "Hitowa" and its output display "Fire" are registered in the homophone phrase buffer 31. Next, upon completion of the input of "Something.", after searching the homophone phrase buffer 31 (there is no corresponding homophone phrase buffer 31), it is converted into "Something." by a normal dictionary search. Next, when "Hitoha" is input and the phrase delimiter information is input, the same sound phrase buffer 31 is searched for the character string "Hitowa". As a result, the previously stored "What is Fire" can be retrieved. Furthermore, when you enter "Hito ni to te ○ clause", after searching for the homophone phrase Batsuhua 31 with the character string "Hito ni to te", you will find "Toto ni to te" by a normal dictionary search.
The output is displayed as follows. As described above, by introducing the homophone phrase buffer 31 and referring to it first, it is possible to improve the automatic discrimination rate of homophones. In addition, in a similar example, when you want to get ``return'', ``frog'' comes first, and when you want to get ``new company (prefix + independent word)'', ``invader (independent word + suffix)'' comes first. However, by storing these in the homophone phrase buffer 31 as shown in FIG. 16, it becomes possible to perform quick conversion. As mentioned above, homophones that occur in a phrase and for which the correct answer cannot be obtained with the first candidate are registered one after another in the homophone phrase buffer 31, and when this homophone phrase buffer 31 becomes full, , it is a good idea to delete the one that has already been registered and register the latest homophone there. How to delete: (1) Delete the oldest one first. (2) Delete phrases that are used least frequently before a certain registration order (for example, half the number of registered phrases). The following methods are possible, but are not limited to these methods. In the above embodiment, phrases that would be displayed in a lower order in normal conversion processing are registered in the homophone phrase buffer 31, but in relation to the capacity of the buffer, phrases are registered as second candidates. The following or the third candidate or lower can be determined as appropriate. As described above, according to the present invention, there are provided means for inputting Japanese sentences as kana sentences, means for temporarily storing character strings input by the input means, means for storing a word dictionary, and the word dictionary. a kana-kanji conversion control circuit that searches a storage means, analyzes the contents of the temporary storage means in units of words or words, and converts them into sentences containing kanji; and means for displaying the conversion results by the kana-kanji conversion control circuit; In the kana-kanji conversion processing device having means for receiving definite information of the conversion result, the word dictionary is configured to include learning information of homophone and allograph words, and at least the final conversion result differs from the initial conversion result due to the definite information. A means is provided for storing a notation determined to include a plurality of units described in the word dictionary at word or phrase divisions in correspondence with the input character string, and the storage means is given priority when searching the dictionary. Since it is configured to search, it is possible to improve the automatic discrimination rate of homophones while reducing the burden on the operator, and it has the remarkable effect of realizing a practical kana-kanji conversion processing device.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は自立語辞書の一部を示す図、第2図は
本発明の一実施例であるカナ漢字変換処理装置の
構成図、第3図〜第14図は辞書類の内容を示す
図、第15図は鍵盤装置の文字配置を示す図、第
16図は同音文節バツフアの内容を示す図であ
る。 11……鍵盤装置、12……入力文字バツフア
レジスタ、13……制御回路、14……出力編集
器、15……表示装置、16……プリンタ、17
……接続行列表、18……自立語辞書、19……
接頭辞表、20……接尾辞表、21……用言活用
表、22……付属語表、23……ひら仮名カタ仮
名対応表、24……出力文レジスタ、31……同
音文節バツフア。
Fig. 1 is a diagram showing a part of an independent word dictionary, Fig. 2 is a block diagram of a kana-kanji conversion processing device that is an embodiment of the present invention, and Figs. 3 to 14 are diagrams showing the contents of a dictionary document. , FIG. 15 is a diagram showing the character arrangement of the keyboard device, and FIG. 16 is a diagram showing the contents of the homophone phrase buffer. 11... Keyboard device, 12... Input character buffer register, 13... Control circuit, 14... Output editor, 15... Display device, 16... Printer, 17
... Connection matrix table, 18 ... Independent word dictionary, 19 ...
Prefix table, 20...Suffix table, 21...Word conjugation table, 22...Adjunct word list, 23...Hiragana-katakana correspondence table, 24...Output sentence register, 31...Homophone phrase batufua.

Claims (1)

【特許請求の範囲】[Claims] 1 日本語文章をカナ文として入力する手段と、
該入力手段により入力された文字列を一時記憶す
る手段と、単語辞書を記憶する手段と、該単語辞
書記憶手段を検索して前記一時記憶手段の内容を
単語または辞の単位に分析して漢字混じり文に変
換するカナ漢字変換制御回路と、該カナ漢字変換
制御回路による変換結果を表示する手段と、前記
変換結果のうちの確定情報を受ける手段を有する
カナ漢字変換処理装置において、前記単語辞書を
同音異字単語の学習情報を含む如く構成するとと
もに、少なくとも、前記確定情報により最初の変
換結果とは異なる単語または辞の区切りで前記単
語辞書に記述されている単位を複数含むように確
定された表記とその入力文字列とを対応させて記
憶する手段を設け、辞書検索時に該記憶手段を優
先して検索する如く構成したことを特徴とするカ
ナ漢字変換処理装置。
1. A means of inputting Japanese sentences as kana sentences,
Means for temporarily storing the character string inputted by the input means; means for storing a word dictionary; and means for searching the word dictionary storage means and analyzing the contents of the temporary storage means in units of words or words to obtain kanji. The kana-kanji conversion processing device includes a kana-kanji conversion control circuit for converting into a mixed sentence, a means for displaying a conversion result by the kana-kanji conversion control circuit, and a means for receiving confirmation information of the conversion result, the word dictionary is configured to include learning information for homophone and allograph words, and is determined to include at least a plurality of units described in the word dictionary at word or word divisions different from the initial conversion result based on the determination information. 1. A kana-kanji conversion processing device, comprising means for storing a notation and its input character string in correspondence with each other, and the storage means is configured to be searched preferentially when searching a dictionary.
JP57076076A 1982-05-06 1982-05-06 Kana(japanese syllabary)-kanji(chinese character) conversion processor Granted JPS58192128A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57076076A JPS58192128A (en) 1982-05-06 1982-05-06 Kana(japanese syllabary)-kanji(chinese character) conversion processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57076076A JPS58192128A (en) 1982-05-06 1982-05-06 Kana(japanese syllabary)-kanji(chinese character) conversion processor

Publications (2)

Publication Number Publication Date
JPS58192128A JPS58192128A (en) 1983-11-09
JPH0578058B2 true JPH0578058B2 (en) 1993-10-28

Family

ID=13594712

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57076076A Granted JPS58192128A (en) 1982-05-06 1982-05-06 Kana(japanese syllabary)-kanji(chinese character) conversion processor

Country Status (1)

Country Link
JP (1) JPS58192128A (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60235271A (en) * 1984-05-08 1985-11-21 Toshiba Corp Kana-kanji converting device
JP2592793B2 (en) * 1985-02-14 1997-03-19 キヤノン株式会社 Character processing method
JPH0740262B2 (en) * 1985-09-06 1995-05-01 松下電器産業株式会社 Kana-Kanji converter
JPH01116871A (en) * 1987-10-30 1989-05-09 Sharp Corp Chinese sentence input device
JPH04211864A (en) * 1991-03-08 1992-08-03 Hitachi Ltd Kana/kanji conversion device
JPH0850589A (en) * 1995-06-26 1996-02-20 Hitachi Ltd Method and device for kana/kanji conversion

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554663A (en) * 1978-06-27 1980-01-14 Fujitsu Ltd Character row conversion processor
JPS5556224A (en) * 1978-10-18 1980-04-24 Fujitsu Ltd Japanese input device
JPS5759273A (en) * 1980-09-29 1982-04-09 Casio Comput Co Ltd Input device of chinese character

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS554663A (en) * 1978-06-27 1980-01-14 Fujitsu Ltd Character row conversion processor
JPS5556224A (en) * 1978-10-18 1980-04-24 Fujitsu Ltd Japanese input device
JPS5759273A (en) * 1980-09-29 1982-04-09 Casio Comput Co Ltd Input device of chinese character

Also Published As

Publication number Publication date
JPS58192128A (en) 1983-11-09

Similar Documents

Publication Publication Date Title
JPH0578058B2 (en)
KR960038586A (en) Complex language transfer data processing system and character generation data processing method
JP2828692B2 (en) Information retrieval device
JPH039502B2 (en)
JPS59103136A (en) Kana (japanese syllabary)/kanji (chinese character) processor
JP3285149B2 (en) Foreign language electronic dictionary search method and apparatus
JPS5899828A (en) "kana" (japanese syllabary) - chinese character converting processor
JPS628259A (en) Kana (japanese syllabary)-kanji (chinese character) converting system
JP2802369B2 (en) Kana-Kanji conversion device
JPS59186030A (en) Kana-kanji conversion processing device
JPS6057425A (en) Kana (japanese syllabary)/kanji (chinese character) conversion processor
JPH0260022B2 (en)
JPS63173156A (en) Device for supplying language information
JPH0350668A (en) Character processor
JP2819766B2 (en) Foreign language electronic dictionary search method
JPS59186031A (en) Kana-kanji conversion processing device
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JPS58101326A (en) Kana(japanese syllabary)-kanji(chinese character) conversion processor
JPH04372047A (en) Kana/kanji converter
KR960018967A (en) Hierarchical Symbol Access Information Representation Method of Linguistic Morphological Analysis System
JPH0346865B2 (en)
JPH0414168A (en) Word processor
JPS5971529A (en) Kana(japanese syllabary)-kanji(chinese character) converting processor
JPS5851380A (en) Kana-kanji conversion processing system
JPH09160913A (en) Foreign language work retrieving device