JPH06223055A - Document input device - Google Patents

Document input device

Info

Publication number
JPH06223055A
JPH06223055A JP5008735A JP873593A JPH06223055A JP H06223055 A JPH06223055 A JP H06223055A JP 5008735 A JP5008735 A JP 5008735A JP 873593 A JP873593 A JP 873593A JP H06223055 A JPH06223055 A JP H06223055A
Authority
JP
Japan
Prior art keywords
word
character string
kanji
input
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5008735A
Other languages
Japanese (ja)
Inventor
Hiroshi Yamada
洋志 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5008735A priority Critical patent/JPH06223055A/en
Publication of JPH06223055A publication Critical patent/JPH06223055A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To convert an input which contains KANJI (Chinese character) partially from KANJI to KANA (Japanese syllabary) at the time of input by KANA-KANJI conversion and to prevent word dictionary capacity from increasing so much. CONSTITUTION:The document input device consists of an input device 1, a converting device 2 which converts an inputted character string, an output device 3 such as a display where a character string as a conversion result is displayed, and a controller 4 which controls the whole operation and the converting device 2 is equipped with a word dictionary 21 in which the reading, description, and part of speech of the inputted character string are registered, a word retrieval part 22 which retrieves words registered in a word dictionary 21 according to the inputted character string, a word storage part 23 which stores the words retrieved by the word retrieval part 22, a word confirmation part 24 which confirms whether or not the retrieved words match the input character string, and a word selection part 25 which selects proper words out of the retrieved word group.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は文章入力装置に関し、特
に漢字の混在する文字列を入力としてかな漢字変換を行
う文章入力装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a text input device, and more particularly to a text input device for converting a kana-kanji character by inputting a character string containing a mixture of kanji characters.

【0002】[0002]

【従来の技術】現在普及している文章入力装置として、
かなあるいはローマ字による入力を漢字かな混じりの文
字列に変換するかな漢字変換がある。これらの装置の入
力文字列としては、かなだけではなく漢字が直接入力さ
れる場合もある。例えば、ペンとタブレットを用いた手
書き文字認識による入力の場合は、漢字やかなを混ぜて
入力することができる。また、漢字コードによる入力方
式では、漢字コードの不明な漢字を入力するための補助
機能としてかな漢字変換機能を持つものがある。いずれ
の装置にも入力の一部あるいは全部を漢字で入力できる
かな漢字変換装置が利用されている。
2. Description of the Related Art As a popular text input device,
There is Kana-Kanji conversion that converts Kana or Romaji input into a character string containing Kanji and Kana. As input character strings for these devices, not only kana but also kanji may be directly input. For example, in the case of input by handwriting character recognition using a pen and a tablet, it is possible to mix and input kanji and kana. In addition, some kanji-kanji input methods have a kana-kanji conversion function as an auxiliary function for inputting kanji whose kanji code is unknown. A kana-kanji conversion device that can input part or all of the input in kanji is used in both devices.

【0003】従来の漢字の混在した文章を入力としてか
な漢字変換を行う文章入力装置の例が、『2ストロ−ク
入力のための仮名漢字変換』(塩見、喜多、河合、大
岩:情報処理学会論文誌、Vol.33,No.7,p
p.920−927,1992)、あるいは、『表記変
換つきの形態素解析プログラムとその応用』(金子、鳥
原、建石:情報処理学会第45回全国大会、4C−4,
1992)に記載されている。
An example of a conventional text input device for performing kana-kanji conversion by inputting a sentence containing mixed kanji is "Kana-kanji conversion for 2-stroke input" (Shiomi, Kita, Kawai, Oiwa: Information Processing Society of Japan Magazine, Vol.33, No.7, p
p. 920-927, 1992), or "A morphological analysis program with notation conversion and its application" (Kaneko, Torihara, Kenseki: IPSJ 45th National Convention, 4C-4,
1992).

【0004】いずれの論文に記載された文章入力装置で
も、漢字の混在した文章のかな漢字変換を行うために、
各単語の読みの一部あるいは全部を漢字にした単語を単
語辞書に登録している。例えば、読みが“どようび”で
表記が“土曜日”の単語について、後者の論文の方式で
は図2(a)に示す8通りを登録する。
In any of the text input devices described in any of the papers, in order to perform kana-kanji conversion of a text in which kanji are mixed,
Words in which some or all of the reading of each word is in Kanji are registered in the word dictionary. For example, with respect to the word whose reading is “Doyoubi” and whose notation is “Saturday”, eight ways shown in FIG. 2 (a) are registered in the method of the latter paper.

【0005】前記の従来の文章入力装置のかな漢字変換
過程は、入力文字列や単語辞書の読みに漢字を許すよう
にする以外はかなのみを入力文字列とする一般のかな漢
字変換装置と同様である。
The kana-kanji conversion process of the above-mentioned conventional text input device is the same as that of a general kana-kanji conversion device that uses only kana as an input character string except that kanji is allowed for reading an input character string or a word dictionary. .

【0006】以下では、従来の単語辞書の構成法の例を
挙げる。
An example of a conventional word dictionary construction method will be given below.

【0007】単純な方法としては、図2のように直接単
語情報を記述し、検索時のキーでソ−トしておいて二分
検索法などで検索する方法がある。
As a simple method, there is a method in which word information is directly described as shown in FIG. 2, sorted with a key at the time of search, and then searched by a binary search method or the like.

【0008】単語検索のためのキーの先頭の共通部分を
共有する方式(図7)では、共有した部分について容量
が削減できる。また、日本語処理でよく使われる、先頭
部分の文字が共通である単語の検索作業が容易である。
In the method of sharing the common part at the beginning of the key for word search (FIG. 7), the capacity of the shared part can be reduced. In addition, it is easy to search for a word that has a common first character, which is often used in Japanese processing.

【0009】さらに容量を圧縮するために、『二つのト
ライを用いた自然言語辞書検索技法』(森本、青江:情
報処理学会第45回全国大会、5F−4,1992)で
は単語末尾の共通部分を共有する方法が提案されている
(図8)。
In order to further reduce the capacity, in the "natural language dictionary search technique using two tries" (Morimoto, Aoe: 45th National Convention of Information Processing Society of Japan, 5F-4, 1992), the common part at the end of words Has been proposed (Fig. 8).

【0010】その他、各種の辞書構成法や検索法につい
ては、“The Art of Computer P
rogramming”(Knuth,1973)、
『連載講座:キー検索技法』(青江:情報処理,Vo
l.33,No.11,pp.1359−1366,1
992)などで参照できる。
For other various dictionary construction methods and search methods, see "The Art of Computer P".
programming ”(Knuth, 1973),
"Serial Series: Key Search Technique" (Aoe: Information Processing, Vo
l. 33, No. 11, pp. 1359-1366, 1
992) and the like.

【0011】[0011]

【発明が解決しようとする課題】前述した従来の文章入
力装置では、可能な混ぜ書き方法をすべて単語登録して
いる。しかし、この方法で単語をどのように混ぜ書きし
ても対応できるようにするためには、n文字の漢字を含
む単語では一般に2n 語を登録する必要があり、単語辞
書に登録する語数が非常に大きくなる。これらの混ぜ書
き単語は、あらゆる文字位置で共通な部分を持っている
ため、単語の先頭部・末尾部だけを共有した単語辞書を
備える従来の文章入力装置では、十分に辞書容量を圧縮
できないという課題がある。
In the above-mentioned conventional text input device, all possible mixed writing methods are registered as words. However, in order to be able to handle no matter how mixed words are written by this method, it is generally necessary to register 2 n words for words containing n kanji characters, and the number of words to be registered in the word dictionary is Grows very large. Since these mixed words have a common part at every character position, the conventional text input device equipped with a word dictionary sharing only the beginning and end of the word cannot sufficiently reduce the dictionary capacity. There are challenges.

【0012】本発明の目的は、上述の問題点を解決し、
読みに漢字が混在している単語を単語辞書に登録する際
に、対応するかな書き語と共通の部分を共有することに
より辞書容量の増加を少なくする文章入力装置を提供す
ることである。
The object of the present invention is to solve the above-mentioned problems,
It is an object of the present invention to provide a sentence input device that reduces the increase in the dictionary capacity by sharing a common part with a corresponding kana written word when registering a word in which kanji is mixed in reading into a word dictionary.

【0013】[0013]

【課題を解決するための手段】上述した問題点を解決す
るため、本発明の文章入力装置は、入力文字列を入力す
る入力装置と、各単語について置き換え前の第一の文字
列、置き換え後の第二の文字列及び品詞を登録する単語
辞書と、第一の文字列が前記入力文字列の一部分と一致
する単語を前記単語辞書から検索する単語検索部と、前
記単語検索部が検索した各単語について第一の文字列と
第二の文字列を比較して前記単語辞書に登録されていな
い単語を削除する単語確認と、前記単語確認による単語
の削除を行ったあとに残った単語から出力文字列を作成
する単語選択部と、該出力文字列を表示する出力装置と
を備え、前記単語辞書は、前記第一の文字列に漢字を含
む単語を登録する場合に、該単語と同一の前記第二の文
字列及び同一の品詞を持ち、前記第一の文字列に漢字を
含まない単語との間で前記第一の文字列の共通部分を共
有する。
In order to solve the above-mentioned problems, a sentence input device of the present invention comprises an input device for inputting an input character string, a first character string before replacement for each word, and a replacement after replacement. Of the second character string and part of speech, a word search unit for searching the word dictionary for a word in which the first character string matches a part of the input character string, and the word search unit. For each word, compare the first character string and the second character string to delete the word not registered in the word dictionary, and from the words remaining after deleting the word by the word confirmation. The word dictionary includes a word selection unit that creates an output character string, and an output device that displays the output character string, and the word dictionary is the same as the word when the word including Chinese characters is registered in the first character string. Said second character string and the same item The have to share a common portion of the first string between the words without the Chinese character in the first string.

【0014】[0014]

【実施例】次に、本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.

【0015】図1は、本発明の文章入力装置の一実施例
を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a text input device of the present invention.

【0016】図1において、本発明の実施例は、入力用
タブレットやキーボードなどの入力装置1と、入力した
文字列を変換する変換装置2と、変換結果の文字列を表
示するディスプレイなどの出力装置3と、全体の動作を
制御する制御装置4とから構成される。
In FIG. 1, the embodiment of the present invention is such that an input device 1 such as an input tablet or a keyboard, a conversion device 2 for converting an input character string, and an output such as a display for displaying the conversion result character string. It is composed of a device 3 and a control device 4 for controlling the overall operation.

【0017】変換装置2は、単語の読み・表記・品詞を
登録している単語辞書21と、入力した文字列から単語
辞書21に登録されている単語を検索する単語検索部2
2と、単語検索部22が検索した単語を格納しておく単
語格納部23と、検索された単語が入力文字列と一致す
るかどうかを確認する単語確認部24と、検索された単
語群から適切な単語を選択する単語選択部25とを備え
る。
The conversion device 2 includes a word dictionary 21 in which readings, notations, and parts of speech of words are registered, and a word search unit 2 for searching a word registered in the word dictionary 21 from an input character string.
2, a word storage unit 23 for storing the words retrieved by the word retrieval unit 22, a word confirmation unit 24 for confirming whether or not the retrieved word matches the input character string, and a retrieved word group. The word selection part 25 which selects a suitable word is provided.

【0018】単語辞書21は、単語の読みをもとに構成
される索引部と表記・品詞などのその他の情報からなっ
ている。なお、本発明の文章入力装置においては、読み
の一部または全部が漢字に置き替わっている場合も含め
て“読み”と呼んでいる。単語辞書21の索引部は、登
録する単語の読みのn文字目に現れる文字をn−1文字
目が同一である文字ごとに集めたテーブル(n文字目テ
ーブル)からなる木構造になっている。各n文字目テー
ブルは、n文字目の文字と、n文字目までで構成される
単語の情報へのポインタと、その文字に引き続いて現れ
るn+1文字目テーブルへのポインタの組み合わせから
なる。
The word dictionary 21 is composed of an index part formed based on the reading of words and other information such as notations and parts of speech. In the text input device of the present invention, the term "yomi" is used, including the case where part or all of the pronunciation is replaced with kanji. The index unit of the word dictionary 21 has a tree structure including a table (n-th character table) in which characters appearing at the n-th character in reading the registered word are collected for each character having the same n-1 character. . Each n-th character table is composed of a combination of an n-th character, a pointer to information on a word composed up to the n-th character, and a pointer to an (n + 1) -th character table that appears after the character.

【0019】例として、「上下(じょうげ)」、「上下
線(じょうげせん)」、「城下町(じょうかまち)」と
いう3単語を登録している単語辞書の索引部を図4に示
す。図4で41は、単語の読みの1文字目に現れる文字
(“じ”)を登録したテーブルである。1文字目に現れ
る文字から、2文字目に現れる文字(“ょ”)を登録し
た2文字目テーブル42へポインタ(図4では実線の矢
印で示した)が張られている。図4の例では4文字目に
現れる文字は“か”と“け”の2通りなので、4文字目
テーブル44は2つの文字を含んでいる。さらに、4文
字目テーブルの各文字に続く5文字目テーブルが45、
46である。
As an example, FIG. 4 shows an index portion of a word dictionary in which three words "upper and lower lines", "up and down lines" and "castle town" are registered. In FIG. 4, reference numeral 41 is a table in which the character (“ji”) appearing as the first character in reading the word is registered. A pointer (indicated by a solid arrow in FIG. 4) is provided from the character appearing as the first character to the second character table 42 in which the character appearing as the second character (“yo”) is registered. In the example of FIG. 4, the character that appears in the fourth character is "ka" or "ke", so the fourth character table 44 includes two characters. Furthermore, the fifth character table following each character of the fourth character table is 45,
46.

【0020】各単語の末尾からは、その単語の表記、品
詞などの情報あるいは情報の格納場所(図4では二重丸
で示した)をさすポインタ(図4では破線の矢印で示し
た)が登録されている。
From the end of each word, a pointer (indicated by a dashed arrow in FIG. 4) that points to information such as the notation and part of speech of the word or a storage location of the information (indicated by a double circle in FIG. 4) is displayed. It is registered.

【0021】単語辞書21は、混ぜ書き後が登録されて
いる場合は対応するかな書き語と共通部分を共有する。
例えば、“上下線”と“城下町”の混ぜ書き語(図2
(b))を登録する場合、従来の文章入力装置の単語辞
書では図7に示す構成の索引部が必要になる。一方、本
発明による文章入力装置の単語辞書21の索引部は図3
に示す構成になる。
The word dictionary 21 shares a common part with the corresponding kana writing word when the post-mix writing is registered.
For example, mixed words of "upper and lower lines" and "castle town" (Fig. 2
When registering (b)), the word dictionary of the conventional text input device requires the index unit having the configuration shown in FIG. On the other hand, the index part of the word dictionary 21 of the text input device according to the present invention is shown in FIG.
The configuration is shown in.

【0022】図3で、読みが“上げせん”の単語を登録
する場合、対応するかな書き語“じょうげせん”との共
通部分“げせん”を共有するため、1文字目テーブル3
1の“上”は、3文字目テーブル33の“う”と同じ4
文字目テーブル34へのポインタを持つ。また、読みが
“じょう下せん”の単語を登録する場合、共通部分“せ
ん”を共有するため、4文字目テーブル34の“下”
は、“げ”と同じ5文字目テーブル35へのポインタを
持つ。4文字目テーブル34の“下”は、“じょ下ま
ち”の検索にも使用されるので、“じょうかまち”の
“か”と同じ5文字目テーブル36へのポインタも持っ
ている。
In FIG. 3, when a word whose reading is "Asensen" is registered, since the common portion "Gensen" with the corresponding Kana writing word "Jogensen" is shared, the first character table 3
"Up" of 1 is the same as "u" of the third character table 33 4
It has a pointer to the character table 34. In addition, when registering a word whose reading is "josen", the common part "sen" is shared, so "bottom" of the fourth character table 34 is registered.
Has a pointer to the fifth character table 35, which is the same as "ge". Since “below” in the fourth character table 34 is also used to search for “joshitamachi”, it also has a pointer to the same fifth character table 36 as “ka” in “jokamachi”.

【0023】単語検索部22は、入力文字列の各文字位
置から単語辞書21の検索を行う。単語検索部22の動
作を図5を参照して説明する。以下の説明および図5で
は、入力文字列をs、入力文字列のj文字目をs[j]
と表現する。
The word search unit 22 searches the word dictionary 21 from each character position of the input character string. The operation of the word search unit 22 will be described with reference to FIG. In the following description and FIG. 5, the input character string is s, and the jth character of the input character string is s [j].
Express.

【0024】(a)i←1(sの1文字目以降と一致す
る単語から検索する)。(ステップ51) (b)sの文字すべてについて単語検索したなら終了。
(ステップ52) (c)j←1(単語辞書21の1文字目テーブルから検
索を始める)。(ステップ53) (d)i文字目テーブルにs[i]があるかどうかを調
べる。あれば、(e)に進み、なければ(h)に進む。
(ステップ54、ステップ55) (e)s[i],s[i+1],…s[i+j−1]と
いう読みに対応する単語があるかを調べ、あれば単語の
情報を単語格納部23に書き込む。(ステップ56) (f)j+1文字目テーブルへのポインタを調べる。複
数のポインタがある場合は一つを残し、他を、i,jの
値と共にスタックに保持する。(ステップ57)
(g)jを1増やして(d)へ進む。(ステップ58) (h)スタックに未処理のポインタがあるかを調べ、あ
れば(i)へ進み、なければ(j)へ進む。(ステップ
59) (i)スタックから未処理のポインタを取りだし(d)
へ進む。(ステップ510) (j)iを1増やして(b)へ進む。(ステップ51
1) 単語確認部24は単語格納部23に書き込まれている単
語のうち読みに漢字を含む単語について、検索に用いた
読みと検索された単語の表記が対応付けできるかどうか
を確認する。対応付けができなかった場合は、単語格納
部23から該単語を削除する。単語検索部22では、実
際に登録されていない単語についても検索が成功する場
合がある。例えば、“上下まち”という読みで図3の単
語辞書21を検索すると、“城下町”という単語の情報
(図3の37)が取り出される。しかし、“上下まち”
は、図3の単語辞書21に登録されている単語(図2
(b))ではない。そのため、単語格納部23の単語が
実際に単語辞書21に登録されているかどうかを単語確
認部24によって確かめる。単語確認部24は、検索に
用いた読み“上下まち”と、検索された単語の表記“城
下町”に含まれる漢字の種類と順序を比較し、一致しな
ければ単語格納部23から削除する。
(A) i ← 1 (search from the word that matches the first and subsequent characters of s). (Step 51) (b) When the word search is performed for all the characters s, the process ends.
(Step 52) (c) j ← 1 (search is started from the first character table of the word dictionary 21). (Step 53) (d) It is checked whether or not s [i] is in the i-th character table. If there is, proceed to (e), and if not, proceed to (h).
(Step 54, Step 55) (e) It is checked whether there is a word corresponding to the reading of s [i], s [i + 1], ..., S [i + j-1], and if there is, the word information is stored in the word storage unit 23. Write. (Step 56) (f) Check the pointer to the j + 1th character table. If there are multiple pointers, one is left and the other is held on the stack together with the values of i and j. (Step 57)
(G) Increase j by 1 and proceed to (d). (Step 58) (h) It is checked whether or not there is an unprocessed pointer on the stack. If there is an unprocessed pointer, the process proceeds to (i), and if not, the process proceeds to (j). (Step 59) (i) Take out an unprocessed pointer from the stack (d)
Go to. (Step 510) (j) Increase i by 1 and proceed to (b). (Step 51
1) The word confirming unit 24 confirms whether or not the reading used in the search and the notation of the searched word can be associated with each other among the words written in the word storage unit 23 that include Chinese characters in the reading. If the word cannot be associated, the word is deleted from the word storage unit 23. The word search unit 22 may successfully search for a word that is not actually registered. For example, if the word dictionary 21 of FIG. 3 is searched with the reading “upper and lower towns”, information (37 in FIG. 3) of the word “castle town” is retrieved. However, "upper and lower towns"
Is a word registered in the word dictionary 21 of FIG.
Not (b)). Therefore, the word checking unit 24 checks whether the word in the word storage unit 23 is actually registered in the word dictionary 21. The word confirmation unit 24 compares the reading “upper and lower towns” used in the search with the type and order of the kanji included in the searched word notation “castle town”, and if they do not match, deletes them from the word storage unit 23.

【0025】単語確認部24の動作例を図6を参照して
説明する。以下の説明および図5では、読みのi文字目
をy[i]、表記のj文字目をh[j]、読みの長さを
yと表記する。
An operation example of the word confirmation unit 24 will be described with reference to FIG. In the following description and FIG. 5, the i-th reading character is expressed as y [i], the j-th character writing is expressed as h [j], and the reading length is expressed as L y .

【0026】(a)i←1、j←1。(ステップ61) (b)i>Ly ならば対応付けに成功して終了。(ステ
ップ62) (c)y[i]以降で漢字を探す。見つからなければ対
応付けに成功して終了。見つかれば、p←見つかった文
字位置とする。(ステップ63,64) (d)h[j]以降でy[p]を探す。見つからなけれ
ば対応付けに失敗して終了。見つかれば、q←見つかっ
た文字位置とする。(ステップ65,66) (e)i←p+1、j←q+1、として(c)へ進む。
(ステップ67) 単語選択部25は、従来の文章入力装置で用いられてい
るものと同一である。例えば『べた書き文の仮名漢字変
換システムとその同音語処理』(牧野、木澤:情報処理
学会論文誌、Vol.22,No.1,pp.59−6
7(1981))に記載された方法で実現できる。
(A) i ← 1, j ← 1. (Step 61) (b) If i> L y , the association is successful and the process ends. (Step 62) (c) Search for kanji after y [i]. If not found, matching is successful and the process ends. If found, p ← let found character position. (Steps 63 and 64) (d) Search y [p] after h [j]. If not found, matching fails and ends. If found, set q ← found character position. (Steps 65 and 66) (e) As i ← p + 1 and j ← q + 1, proceed to (c).
(Step 67) The word selection unit 25 is the same as that used in the conventional text input device. For example, "Kana-to-Kana conversion system for solid writing and its homophone processing" (Makino, Kizawa: IPSJ Journal, Vol. 22, No. 1, pp. 59-6.
7 (1981)).

【0027】[0027]

【発明の効果】以上説明したように、本発明による文章
入力装置は、読みに漢字が混在している単語を単語辞書
に登録する際に、対応するかな書き語と共通の部分を共
有するため、辞書容量の増加が少ないという効果があ
る。
As described above, the text input device according to the present invention shares a common part with a corresponding kana written word when registering a word in which kanji is mixed in reading into a word dictionary. The effect is that the dictionary capacity does not increase much.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の文章入力装置の一実施例を示すブロッ
ク図。
FIG. 1 is a block diagram showing an embodiment of a text input device of the present invention.

【図2】単語の混ぜ書きの例を示すブロック図。FIG. 2 is a block diagram showing an example of mixed writing of words.

【図3】本発明の文章入力装置の単語辞書の概念図。FIG. 3 is a conceptual diagram of a word dictionary of the text input device of the present invention.

【図4】かな書き語だけを登録した単語辞書の概念図。FIG. 4 is a conceptual diagram of a word dictionary in which only kana written words are registered.

【図5】単語検索部の動作を示す流れ図。FIG. 5 is a flowchart showing the operation of the word search unit.

【図6】単語確認部の動作を示す流れ図。FIG. 6 is a flowchart showing the operation of the word confirmation unit.

【図7】従来の文章入力装置の単語辞書の概念図。FIG. 7 is a conceptual diagram of a word dictionary of a conventional text input device.

【図8】単語の先頭部と末尾部を共有した単語辞書の概
念図。
FIG. 8 is a conceptual diagram of a word dictionary in which the beginning and end of a word are shared.

【符号の説明】[Explanation of symbols]

1 入力装置 2 変換装置 3 出力装置 4 制御装置 21 単語辞書 22 単語検索部 23 単語格納部 24 単語確認部 25 単語選択部 1 Input Device 2 Conversion Device 3 Output Device 4 Control Device 21 Word Dictionary 22 Word Search Section 23 Word Storage Section 24 Word Confirmation Section 25 Word Selection Section

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 入力文字列を他の文字列に置き換えて出
力文字列とする文章入力装置において、前記入力文字列
を入力する入力装置と、各単語について置き換え前の第
一の文字列・置き換え後の第二の文字列及び品詞を登録
する単語辞書と、前記第一の文字列が前記入力文字列の
一部分と一致する単語を前記単語辞書から検索する単語
検索部と、前記単語検索部が検索した各単語について第
一の文字列と第二の文字列を比較して前記単語辞書に登
録されていない単語を削除する単語確認部と、前記単語
確認部による単語の削除を行ったあとに残った単語から
出力文字列を作成する単語選択部と、該出力文字列を表
示する出力装置とを備え、前記単語辞書は、前記第一の
文字列に漢字を含む単語を登録する場合に、該単語と同
一の前記第二の文字列及び同一の品詞を持ち、前記第一
の文字列に漢字を含まない単語との間で前記第一の文字
列の共通部分を共有することを特徴とする文章入力装
置。
1. A text input device for replacing an input character string with another character string to form an output character string, an input device for inputting the input character string, and a first character string / replacement before replacement for each word. A word dictionary for registering a subsequent second character string and a part of speech, a word search unit for searching the word dictionary for a word in which the first character string matches a part of the input character string, and the word search unit. For each word searched for, after comparing the first character string and the second character string and deleting the word not registered in the word dictionary, after deleting the word by the word confirmation unit A word selection unit that creates an output character string from the remaining words, and an output device that displays the output character string, and the word dictionary, when registering a word containing Kanji in the first character string, The second letter identical to the word A sentence input device, wherein a common part of the first character string is shared with a word having a column and the same part of speech, and the first character string does not include kanji.
JP5008735A 1993-01-22 1993-01-22 Document input device Pending JPH06223055A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5008735A JPH06223055A (en) 1993-01-22 1993-01-22 Document input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5008735A JPH06223055A (en) 1993-01-22 1993-01-22 Document input device

Publications (1)

Publication Number Publication Date
JPH06223055A true JPH06223055A (en) 1994-08-12

Family

ID=11701215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5008735A Pending JPH06223055A (en) 1993-01-22 1993-01-22 Document input device

Country Status (1)

Country Link
JP (1) JPH06223055A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011003146A (en) * 2009-06-22 2011-01-06 Casio Computer Co Ltd Dictionary data storage structure and dictionary searching method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60189565A (en) * 1984-03-09 1985-09-27 Hitachi Ltd Kana/kanji converter
JPS6337465A (en) * 1986-08-01 1988-02-18 Hitachi Ltd Kana/kanji converter
JPH01259448A (en) * 1988-04-08 1989-10-17 Matsushita Graphic Commun Syst Inc Kanji input system
JPH02112058A (en) * 1988-10-20 1990-04-24 Sharp Corp Character recognition input system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60189565A (en) * 1984-03-09 1985-09-27 Hitachi Ltd Kana/kanji converter
JPS6337465A (en) * 1986-08-01 1988-02-18 Hitachi Ltd Kana/kanji converter
JPH01259448A (en) * 1988-04-08 1989-10-17 Matsushita Graphic Commun Syst Inc Kanji input system
JPH02112058A (en) * 1988-10-20 1990-04-24 Sharp Corp Character recognition input system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011003146A (en) * 2009-06-22 2011-01-06 Casio Computer Co Ltd Dictionary data storage structure and dictionary searching method

Similar Documents

Publication Publication Date Title
JPH06223055A (en) Document input device
JP2765712B2 (en) Character recognition input device
JPH0612548B2 (en) Document processor
JPS6175952A (en) Document input processing system
JPS6246029B2 (en)
JP2634926B2 (en) Kana-Kanji conversion device
JPS58123125A (en) Documentation device
JP2744241B2 (en) Character processor
JP3774056B2 (en) Character processing device
JPH04211868A (en) Method for creating keyword for retrieval of cd-rom data
JPS60122463A (en) Character processing unit
JPH06325017A (en) Kana/kanji converting system
JPH0877160A (en) Method and device for kana/kanji conversion
JPH0830626A (en) Device for retrieving japanese electronic dictionary
JPS5991532A (en) Documentation device
JPH0773279A (en) Character converting device
JPS6198475A (en) Japanese sentence input device
JPH09218868A (en) Method for designating kanji and device therefor
JPS6162175A (en) Analyzer for japanese language
JPH09179858A (en) Document preparation device and display method
JPH1027173A (en) Personal name converter
JPS62287338A (en) Retrieving device
JPS60136863A (en) Shortening conversion system of "kana (japanese syllabary)/kanji (chinese character)" converter
JPH02289048A (en) Japanese word processor
JPH028956A (en) Document processor

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19950801