JPH07319864A - Kana-Kanji converter - Google Patents
Kana-Kanji converterInfo
- Publication number
- JPH07319864A JPH07319864A JP6110846A JP11084694A JPH07319864A JP H07319864 A JPH07319864 A JP H07319864A JP 6110846 A JP6110846 A JP 6110846A JP 11084694 A JP11084694 A JP 11084694A JP H07319864 A JPH07319864 A JP H07319864A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- long
- code
- character string
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】パーソナルコンピュータや日本語ワードプロセ
ッサ等に利用する、連文節変換方式のかな漢字変換装置
において、辞書記憶容量の増大や装置の複雑化、大型化
の必要なく、入力文字列の長音記号や区切り符号の有無
や位置の違いにかかわらずカタカナ語の変換が行われる
ようにし、しかも適切な位置に長音記号や区切り符号が
付与された変換結果を得られるようにする。
【構成】符号を含む文字列が入力されると符号削除手段
9によって符号が除かれた状態の文字列が辞書検索手段
10に送られて辞書検索が行われる。辞書記憶装置4は
その単語に含まれる場合の長音数と有無が不安定な長音
記号と中点の位置の情報を持ち、入力文字列の情報と一
致すれば、その情報に従って長音や中点が付与された変
換結果が出力される。
(57) [Abstract] [Purpose] In a kana-kanji conversion device for continuous sentence clause conversion, which is used for personal computers, Japanese word processors, etc., input character strings can be stored without increasing dictionary storage capacity, device complexity, or size. The conversion of Katakana is performed regardless of the presence or absence of the diacritical mark or the delimiter code and the position, and the conversion result in which the masonry mark or the delimiter code is added to an appropriate position can be obtained. When a character string containing a code is input, the character string with the code removed by the code deleting means 9 is sent to the dictionary searching means 10 and a dictionary search is performed. The dictionary storage device 4 has information on the number of long sounds contained in the word, the long sound symbol whose presence / absence is unstable, and the position of the midpoint, and if the information matches the information of the input character string, the long sound or the midpoint is detected according to the information. The assigned conversion result is output.
Description
【0001】[0001]
【産業上の利用分野】本発明はかな漢字変換装置、特に
パーソナルコンピュータや日本語ワードプロセッサ等に
利用する、カタカナ表記による外来語を含む連文節変換
方式のかな漢字変換装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion device for use in personal computers, Japanese word processors and the like, and more particularly to a kana-kanji conversion device of the continuous clause conversion method including foreign words in katakana notation.
【0002】[0002]
【従来の技術】一般にかな漢字変換装置は、入力装置か
ら入力したかな文字列を、辞書検索により得られた情報
をもとに漢字、ひらがな、カタカナなどの適切な日本語
表記に変換して出力装置に出力する装置である。日本語
表記に変換する方法には単文節変換と連文節変換とがあ
り、単文節変換が利用者が名詞や副詞などの自立語と助
詞や助動詞などの付属語、または自立語のみで構成され
る文節ごとに区切って入力しその都度辞書を検索し、入
力文字列と同じ読みをもつ単語に変換するに対し、連文
節変換は文節を意識せず連続して入力された長文の文字
列を一括変換するもので、あらかじめ自立語と付属語ま
たは付属語同士の接続規則などに基づいてアルゴリズム
が定められており、変換指示があると辞書検索で得られ
た単語情報をもとに、アルゴリズムに従って入力された
文字列を自動的に文節に区切り、区切りに従って辞書に
記憶されている漢字表記に変換するものであって、単文
節変換に比較して入力・変換の操作がスムーズであるた
め広く使われている。2. Description of the Related Art Generally, a kana-kanji conversion device converts a kana character string input from an input device into an appropriate Japanese notation such as kanji, hiragana, katakana, etc. based on information obtained by a dictionary search and outputs it. It is a device that outputs to. There are two types of methods for converting into Japanese notation, single phrase conversion and continuous phrase conversion. The single phrase conversion consists of an independent word such as a noun or adverb, an adjunct such as a particle or auxiliary verb, or an independent word. Separate each phrase and search the dictionary each time, and convert it to a word that has the same reading as the input character string, whereas continuous phrase conversion collectively converts long character strings that are continuously input without being aware of the phrase The algorithm is set in advance based on the rules for connecting independent words and adjunct words, or the connection between adjunct words, and if there is a conversion instruction, it is input according to the algorithm based on the word information obtained by the dictionary search. It automatically divides the character string into bunsetsu and converts it to the kanji notation stored in the dictionary according to the delimiter. It is widely used because the input / conversion operation is smoother than the single bunsetsu conversion. To have.
【0003】この従来のかな漢字変換装置は広く利用さ
れておりその基本形の機能ブロックを図4に示す。図4
において、入力装置1はキーボードであり、これから入
力された文字列が入力制御装置35に送られ、記憶され
る。辞書検索装置36は、入力制御装置35を通して入
力文字列が送られると、それに従って辞書37を検索す
る。辞書37にはその一例を図5に示すように、単語の
読みであり入力文字列とのマッチングに使われるカナ見
出し39、入力文字列とカナ見出しが一致した際に変換
結果として出力される表記40、さらに品詞情報13
の、単語に関する情報が記述されている。図5の場合
は、”がいらいご”という入力文字列に対しては、カナ
見出し39が「ガイライゴ」である表記40「外来語」
が変換結果として得られる。辞書検索により得られた表
記は辞書検索装置36から入力制御装置35に送られ、
入力制御装置35は表示装置5に表記を送って表示さ
せ、記憶装置38に表記を記憶させる。This conventional kana-kanji conversion device is widely used, and its basic functional block is shown in FIG. Figure 4
In, the input device 1 is a keyboard, and the character string input from this is sent to the input control device 35 and stored. When the input character string is sent through the input control device 35, the dictionary search device 36 searches the dictionary 37 accordingly. As shown in FIG. 5, an example of the dictionary 37 is a kana heading 39 which is a word reading and is used for matching with an input character string, and a notation output as a conversion result when the input character string and the kana heading match. 40, further part-of-speech information 13
The information about the word is described. In the case of FIG. 5, for the input character string "gairaigo", the notation 40 "foreign word" in which the kana heading 39 is "Guairaigo"
Is obtained as the conversion result. The notation obtained by the dictionary search is sent from the dictionary search device 36 to the input control device 35,
The input control device 35 sends and displays the notation on the display device 5, and stores the notation in the storage device 38.
【0004】しかしながらこのような従来のかな漢字変
換装置においては、入力した文字列に従って辞書を検索
するので、特に外来語などのカタカナ語において、例え
ば「トランジスタ/トランジスター」あるいは「フロッ
ピーディスク/フロッピー・ディスク」のように長音記
号(ー)や中点(・)の有無が不確定である場合には、
辞書に「トランジスター」あるいは「フロッピーディス
ク」しか登録されていない場合に「トランジスタ」ある
いは「フロッピー・ディスク」という文字列には対応で
きないなど、入力される文字列によっては変換すること
ができない場合があった。このような読みや表記のゆれ
に対する対策は、辞書に考えられるすべての読みや表記
を登録しておくことであるが、辞書容量に限界がある等
の問題がある。However, in such a conventional kana-kanji conversion device, since a dictionary is searched according to an input character string, especially in katakana words such as foreign words, for example, "transistor / transistor" or "floppy disk / floppy disk". If the presence or absence of a long-sound mark (-) or midpoint (・) is uncertain, as in
Depending on the input character string, it may not be possible to convert it, such as when the dictionary contains only "Transistor" or "Floppy disk", it cannot support the character string "Transistor" or "Floppy disk". It was A countermeasure against such fluctuations in readings and notations is to register all possible readings and notations in the dictionary, but there is a problem that the dictionary capacity is limited.
【0005】このため、特開平3−40060号公報、
特開平1−211069号公報が提案されている。以下
これらの方式について説明する。図6に前者(特開平3
−40060号)の機能ブロック図を示す。基本形と同
じキーボード1、入力制御装置41、辞書検索装置3
6、辞書37、表示装置5、記憶装置38に加え、入力
制御装置41に接続している長音検索装置42、長音検
索装置42と入力制御装置41に接続している長音付与
装置43がある。Therefore, Japanese Unexamined Patent Publication No. 3-40060,
Japanese Laid-Open Patent Publication No. 1-21069 has been proposed. These methods will be described below. FIG. 6 shows the former (Japanese Patent Laid-Open No.
40060) is a functional block diagram. The same keyboard 1, input control device 41, and dictionary search device 3 as in the basic form
In addition to 6, the dictionary 37, the display device 5, and the storage device 38, there are a long sound search device 42 connected to the input control device 41, a long sound search device 42, and a long sound addition device 43 connected to the input control device 41.
【0006】このかな漢字変換装置の動作はその実施例
の説明によれば以下のとおりである。キーボード1か
ら”とらんじすたー”とカタカナ表記語に変換する必要
がある文字列が入力された場合、入力制御装置41に送
られて記憶され、長音検索装置42で長音記号が含まれ
ているか調べられる。含まれている場合は長音記号を削
除した”とらんじすた”という文字列が入力制御装置4
1に送られるとともに、削除した長音記号の位置が長音
付与装置43に通知される。この場合は長音記号は7文
字目であることが通知される。次に辞書検索装置36に
長音記号を削除した文字列”とらんじすた”が送られる
と、それに従って辞書検索が行われる。辞書には、その
一例を図7に相関関係図に示すように、単語の読みと表
記が長音記号を省いた形で辞書の読み44、辞書の表記
45として登録されている。検索の結果、入力された読
み46である”とらんじすたー”から長音記号を削除し
た文字列に対応する辞書の読み44を持つ辞書の表記4
5は「トランジスタ」であるため「トランジスタ」が入
力制御装置41に送られる。送られた表記はさらに長音
付与装置43に転送され、長音付与装置43に通知され
ている削除された情報47に従って長音記号が付与さ
れ、長音付与した表記48「トランジスター」となって
入力制御装置41に送られる。入力制御装置41は「ト
ランジスター」を表示装置5と記憶装置38に送り、表
記の表示と記憶を行う。The operation of this kana-kanji conversion device is as follows according to the description of the embodiment. When a character string that needs to be converted into katakana notation is input from the keyboard 1, it is sent to and stored in the input control device 41, and a long sound symbol is included in the long sound search device 42. You can find out. If it is included, the character string "Tranj Star" with the long-sound mark deleted is input control device 4
1, and the position of the deleted long sound symbol is notified to the long sound providing device 43. In this case, it is notified that the long sound symbol is the seventh character. Next, when the character string "Tranj Star" in which the long-sound symbol is deleted is sent to the dictionary search device 36, the dictionary search is performed according to it. In the dictionary, as shown in the correlation diagram in FIG. 7, word reading and notation are registered as dictionary reading 44 and dictionary notation 45 in the form of omitting the long syllabary. As a result of the search, the notation 4 of the dictionary having the reading 44 of the dictionary corresponding to the character string in which the long sound mark is deleted from the input reading 46 "Tranj Star"
Since 5 is a “transistor”, the “transistor” is sent to the input control device 41. The sent notation is further transferred to the long sound imparting device 43, and a long sound symbol is added according to the deleted information 47 notified to the long sound imparting device 43, and becomes the long sound imparted notation 48 “transistor” and becomes the input control device 41. Sent to. The input control device 41 sends the “transistor” to the display device 5 and the storage device 38 to display and store the notation.
【0007】このようにすることにより長音検索装置と
長音付与装置の働きによって、辞書記憶容量を増大する
ことなく長音記号の有無が一定していないカタカナ語を
変換することができる。In this way, by the operations of the long sound retrieval device and the long sound adding device, it is possible to convert Katakana words with or without constant long sound symbols without increasing the dictionary storage capacity.
【0008】また後者(特開平1−211069号)
は、同公開公報にはその詳細構成は示されていないが、
図8に示すような辞書を使用し、中点やハイフン(−)
などの区切り符号を含むことのある外来語などを入力す
る場合、入力者が中点やハイフンを除いたかな文字列、
例えば”ふろっぴーでぃすく”を入力することにより、
一般に標準的に使用されている表記「フロッピー・ディ
スク」を表示し、中点以外の区切り符号を用いたい場合
あるいは区切り符号を省きたい場合は、特定のキー(例
えば中点キー)を1〜2回押すことにより、「フロッピ
ー−ディスク」あるいは「フロッピーディスク」という
変換結果を表示するようにしたもので、これも中点、ハ
イフンなどの区切り符号の有無にかかわらず、また辞書
記憶容量を増大することなく適切な変換結果が得られる
ように意図したものと考えられる。The latter (Japanese Patent Laid-Open No. 1-21069)
Although the detailed structure is not shown in the publication,
Use a dictionary such as the one shown in Figure 8, and use the midpoints and hyphens (-).
When inputting a foreign word that may contain delimiters such as, the input person's kana character string excluding the middle point and hyphen,
For example, by entering "Floppy Disk",
If you want to display the standard standard notation "floppy disk" and want to use a delimiter other than the midpoint or omit the delimiter, press a specific key (for example, the midpoint key) 1-2. By pressing the button twice, the conversion result of "floppy disk" or "floppy disk" is displayed. This also increases the storage capacity of the dictionary regardless of the presence of separators such as midpoint and hyphen. It is thought that it was intended to obtain an appropriate conversion result without any trouble.
【0009】[0009]
【発明が解決しようとする課題】前述の従来のかな漢字
変換装置においては、前者(特開平3−40060号公
報)の場合長音記号を含むカタカナ表記語の変換のため
辞書の登録語数を増加する必要がなく、これに対応した
変換が可能となったが、変換の過程でいったん削除した
長音記号を復元付与する際に入力文字列内での位置に基
づいて付与するため、連文節変換でこの方式を導入する
と、漢字表記語とカタカナ表記語が混在する文を処理す
る場合などには、入力文字列と変換結果の文字数が必ず
しも同じではないので入力文字列と同じ位置に長音記号
を付与できるとは限らず、利用者の意図する変換結果と
大きく異なる場合がある。また後者(特開平1−211
069号公報)においても、区切り符号を含むカタカナ
表記語の変換のため辞書の登録語数を増加する必要がな
く、それに対応した変換が可能となったが、利用者が区
切り符号を省かない形、例えば”ふろっぴー・でぃす
く”という文字列を入力した場合には、図8の辞書では
“ふろっぴー・でぃすく”とマッチする読み49は登録
されていないため、辞書検索が行われず変換処理ができ
ないという問題がある。In the above-mentioned conventional kana-kanji conversion device, in the former case (Japanese Patent Laid-Open No. 3-40060), it is necessary to increase the number of words registered in the dictionary for conversion of katakana notation words including long sound symbols. It became possible to perform conversion corresponding to this, but in order to add the long punctuation that was deleted once in the conversion process based on the position in the input character string, this method is used in the consecutive phrase conversion. When introduced, when processing a sentence in which Kanji and Katakana are mixed, the number of characters in the input character string and the conversion result are not necessarily the same, so it is not possible to add a long sound symbol at the same position as the input character string. Without being limited to this, the conversion result intended by the user may be significantly different. The latter (Japanese Patent Laid-Open No. 1-211)
No. 069 publication), it is not necessary to increase the number of registered words in the dictionary for conversion of katakana notation words including delimiter codes, and conversion corresponding to that is possible, but the user does not omit the delimiter codes. For example, when the character string "Floppy disk" is input, the dictionary search is performed because the reading 49 that matches "Floppy disk" is not registered in the dictionary of FIG. There is a problem that conversion processing cannot be performed without fail.
【0010】さらにこのようなカタカナ表記の外来語に
おいては、上記のような長音記号、区切り符号が混在し
ているため、これに対処するためには上記前者後者の両
方式を合わせ備えたものとする必要があり、装置の複雑
化、大型化を招く問題がある。Further, in such a foreign word in katakana notation, the above-mentioned long-sound symbols and delimiter codes are mixed, so in order to deal with this, both the former and latter expressions are combined. Therefore, there is a problem that the device becomes complicated and large.
【0011】そこで本発明の目的は以上の欠点を克服し
て、辞書記憶容量の増大、装置の複雑化、大型化の必要
なく、長音記号の有無あるいは区切り符号の有無に関係
なくカタカナ語が変換でき、しかも利用者の意図する位
置に長音記号や区切り符号が付与された変換結果が得ら
れるかな漢字変換装置を提供することにある。Therefore, the object of the present invention is to overcome the above drawbacks and to convert Katakana words regardless of the presence or absence of a long sound symbol or the presence or absence of a delimiter without increasing the dictionary storage capacity, complicating the apparatus, and increasing the size. Another object of the present invention is to provide a kana-kanji conversion device capable of obtaining a conversion result in which a long sound symbol or a delimiter code is added to a position intended by the user.
【0012】[0012]
【課題を解決するための手段】本発明のかな漢字変換装
置は、文字列を入力する入力装置と、文字列や変換結果
の転送などを行う入力制御装置と、辞書検索手段により
辞書を検索して文節候補を作成する変換処理装置と、変
換結果を出力する出力装置とを有し、入力制御装置は入
力装置からの情報を受け取ることと出力装置に情報を送
ることが可能であるとともに変換処理装置と接続し、変
換処理装置は入力制御装置と接続し辞書記憶装置にアク
セス可能であり、あらかじめ単語の読みから長音記号と
区切り符号を省いたカナ見出しと、不安定な長音記号と
区切り符号を省いた表記と、単語についての情報を記憶
しておく辞書記憶装置と、辞書検索手段とともに変換処
理装置を構成する符号検索手段と符号削除手段と符号付
与手段とを備え、符号検索手段は入力制御装置と、符号
付与手段と、符号削除手段と接続し、符号削除手段は符
号検索手段と辞書検索手段と接続し、符号付与手段は入
力制御装置と、符号検索手段と接続していることを特徴
としている。A kana-kanji conversion device of the present invention searches an dictionary by an input device for inputting a character string, an input control device for transferring a character string or a conversion result, and a dictionary search means. A conversion processing device that creates a phrase candidate and an output device that outputs a conversion result, and the input control device can receive information from the input device and send information to the output device, and the conversion processing device The conversion processing device is connected to the input control device and can access the dictionary storage device.The kana heading that omits the long sound symbol and the delimiter code from the reading of the words and the unstable long sound symbol and the delimiter code are omitted. A notation, a dictionary storage device that stores information about words, a code search device, a code deletion device, and a code addition device that constitute a conversion processing device together with a dictionary search device, The code search means is connected to the input control device, the code addition means and the code deletion means, the code deletion means is connected to the code search means and the dictionary search means, and the code addition means is connected to the input control device and the code search means. It is characterized by doing.
【0013】[0013]
【実施例】以下本発明の実施例について図面を参照して
詳細に説明する。Embodiments of the present invention will now be described in detail with reference to the drawings.
【0014】図1は本発明の一実施例を示す機能ブロッ
ク図である。図1において、本発明の一実施例はキーボ
ード等の入力装置1と、これに接続される入力制御装置
2と、この入力制御装置2に接続される変換処理装置3
と、この変換処理装置に接続される辞書記憶装置4と、
入力制御装置に接続される表示装置等の出力装置5とを
含む。変換処理装置3は符号検索手段6、符号付与手段
としての長音付与手段7と中点付与手段8、符号削除手
段9および辞書検索手段10から構成されている。入力
制御装置2は変換処理装置3の符号検索手段6、長音付
与手段7、中点付与手段8および辞書検索手段10とに
接続している。符号検索手段6は、長音付与手段7、中
点付与手段8、符号削除手段9と接続している。辞書検
索手段10は辞書記憶装置4と接続され、アクセス可能
である。FIG. 1 is a functional block diagram showing an embodiment of the present invention. In FIG. 1, an embodiment of the present invention includes an input device 1 such as a keyboard, an input control device 2 connected to the input device 1, and a conversion processing device 3 connected to the input control device 2.
And a dictionary storage device 4 connected to this conversion processing device,
And an output device 5 such as a display device connected to the input control device. The conversion processing device 3 is composed of a code searching means 6, a long sound adding means 7 as a code adding means, a midpoint adding means 8, a code deleting means 9 and a dictionary searching means 10. The input control device 2 is connected to the code retrieval means 6, the long sound imparting means 7, the midpoint imparting means 8 and the dictionary retrieval means 10 of the conversion processing device 3. The code retrieval means 6 is connected to the long sound imparting means 7, the midpoint imparting means 8, and the code deleting means 9. The dictionary search means 10 is connected to the dictionary storage device 4 and is accessible.
【0015】キーボード1、表示装置5は従来の技術で
説明したものと同一である。入力制御装置2は、キーボ
ード1から入力された文字列を記憶して符号検索手段6
に送り、辞書検索手段10から辞書検索の結果得られた
情報を受け取るとともに、長音付与手段7と中点付与手
段8にその情報を送り、長音記号や中点が付与された表
記を受け取って表示装置5に送って表示させる。The keyboard 1 and the display device 5 are the same as those described in the prior art. The input control device 2 stores the character string input from the keyboard 1 and stores it in the code search means 6
And receives the information obtained as a result of the dictionary search from the dictionary search means 10, and also sends the information to the long sound imparting means 7 and the midpoint adding means 8 to receive and display the notation with the long sound symbol and the midpoint. It is sent to the device 5 and displayed.
【0016】変換処理装置3のうち符号検索手段7は入
力制御装置2から送られてきた入力文字列を検索し、そ
こに長音記号が含まれている場合には、含まれる長音記
号の総数を長音付与手段7に通知し、中点が含まれる場
合は中点付与手段8に働きかけてフラグを立て、入力文
字列を符号削除手段9に送る。符号削除手段9は符号検
索手段6から送られた入力文字列から長音記号や中点を
削除した文字列を辞書検索手段10へ送る。長音付与手
段7は、長音検索手段6と入力制御装置2から送られた
情報をもとに、表記に長音記号を付与するものである。
中点付与手段8は、符号検索手段6から働きかけを受け
ると入力文字列に中点が含まれるということを示すフラ
グを立て、入力制御装置2から送られてきた情報をもと
に表記に中点を付与し、入力制御装置2へ送り返す。辞
書検索手段10は、辞書記憶装置4を検索し、符号削除
手段から送られてきた文字列とマッチするカナ見出しを
もつ単語の表記や単語の情報を入力制御装置2へ送る。The code retrieving means 7 of the conversion processing device 3 retrieves the input character string sent from the input control device 2, and if a long sound symbol is included therein, the total number of the long sound symbols included therein is calculated. The long sound imparting means 7 is notified, and when the midpoint is included, the midpoint imparting means 8 is operated to set a flag and the input character string is sent to the code deleting means 9. The code deleting means 9 sends to the dictionary searching means 10 a character string in which the long-sound symbols and midpoints have been deleted from the input character string sent from the code searching means 6. The long sound adding means 7 adds long sound symbols to the notation based on the information sent from the long sound searching means 6 and the input control device 2.
The midpoint assigning means 8 sets a flag indicating that the input character string includes the midpoint when the midpoint assigning means 8 receives an action from the code retrieving means 6, and based on the information sent from the input control device 2, the midpoint adding means 8 Points are given and sent back to the input control device 2. The dictionary search means 10 searches the dictionary storage device 4, and sends to the input control device 2 the notation and word information of a word having a kana heading that matches the character string sent from the code deletion means.
【0017】辞書記憶装置4には従来の技術で説明した
ものと同様に辞書が格納されているが、その内容は図2
の通りで、その単語の表記から長音記号と中点を削除し
た形のカナ見出し11、有無が安定した長音記号を含む
その単語の表記12、品詞情報13のほかに、その単語
に含まれうる長音の最大数を示す長音数14と、含まれ
うる長音記号のうちで有無が一定していない長音記号が
ある場合、その長音記号の表記内での位置を示す長音情
報15、さらに中点が含まれる場合の中点の表記内での
位置を示す中点情報16が記述されている。図2では
「キーボード」は不安定な長音記号や中点は含まれない
ため長音数は2、長音情報と中点情報は未定義である。
「コンピュータ」は「コンピューター」という表記もあ
ることを考えると含まれうる長音数の最大は2であるた
め長音数は2、また末尾の7文字目に入る長音記号の有
無が不安定なため長音情報は7となり、中点は含まれな
いため中点情報は未定義となる。「エレニーニョ現象」
は、不安定な長音記号はないため長音数1で長音情報は
未定義、中点については3文字目に中点が含まれる「エ
ル・ニーニョ現象」という表記も考えられるため中点情
報は3となる。A dictionary is stored in the dictionary storage device 4 in the same manner as that described in the prior art, the contents of which are shown in FIG.
In addition to the kana heading 11 in the form of removing the long sound mark and the midpoint from the notation of the word, the notation 12 of the word including the long sound symbol with stable presence / absence, the part-of-speech information 13, and may be included in the word. If the number of long-sounds that indicates the maximum number of long-sounds is 14 and long-sounds that may be included are not constant, the long-sounds information 15 that indicates the position in the notation of the long-sounds, and the midpoint is The midpoint information 16 indicating the position in the notation of the midpoint when included is described. In FIG. 2, since the “keyboard” does not include unstable long-sound symbols or midpoints, the number of long-sounds is 2, and long-sound information and midpoint information are undefined.
Considering that "computer" is also called "computer", the maximum number of long sounds that can be included is 2, so the number of long sounds is 2, and the presence or absence of the long sound symbol in the last 7th character is unstable. The information is 7, and since the midpoint is not included, the midpoint information is undefined. "Eleninho phenomenon"
, There is no unstable long-sound symbol, and the long-sound information is undefined, and the long-sound information is undefined, and the mid-point information is 3 because the notation "El Niño phenomenon" in which the mid-point is included in the third character is also considered. Becomes
【0018】次にこのかな漢字変換装置の動作を図3の
フローチャートをもとに説明する。例として”こんぴゅ
ーたー”という文字列が入力された場合を想定する。文
字列が入力されると(17)、入力制御装置2に送られ
て記憶され(18)、符号検索手段6へ送られる。符号
検索手段6は、送られてきた”こんぴゅーたー”に長音
記号や中点が含まれているかを調べ(20)、長音記号
が含まれていれば(21)長音付与手段7にその総数を
通知する(22)。この場合は2となる。中点が含まれ
ていれば(23)、中点付与手段8に働きかけてフラグ
を立てる(24)が、この場合は含まれないので処理は
行われない。以上の処理が終わると符号検索手段6は入
力文字列を符号削除手段9へ送り、そこで入力文字列か
ら長音記号や中点を削除し、文字列”こんぴゅた”を辞
書検索手段10へ送る(25)。辞書検索手段10では
文字列を受け取るとその文字列に従って辞書記憶装置4
に格納されている辞書を検索する(26)。この場合
「コンピュタ」というカナ見出しを持つ単語が登録され
ているので、その単語の表記「コンピュータ」、品詞情
報、さらに長音数と長音情報も読み出して、入力制御装
置2へ送る。入力制御装置2は情報を受け取ると長音付
与手段7に符号検索手段6から送られた入力文字列内の
長音総数の情報があるか調べ(27)、あれば長音付与
手段7に辞書検索手段10から受け取った情報を送る。
長音付与手段7は符号検索手段6からの入力文字列内の
長音総数と、入力制御装置2から送られてきた辞書に記
述されている長音数、入力文字列が複数の単語から成り
立つ場合にはそれらの単語の長音数の総和が一致するか
調べ(28)、この場合は一致するので長音情報があれ
ば(29)それに従って表記に長音記号を付与して「コ
ンピューター」という表記を入力制御装置2に送り返す
(30)。入力制御装置2は次に中点付与手段8にフラ
グが立っているかを調べ(31)フラグが立っていてか
つ辞書に中点情報が記述されていれば(32)中点情報
に従って中点が付与される(33)が、この場合はフラ
グが立っていないため中点付与は行われず、「コンピュ
ーター」という変換結果が表示装置5に送られて出力さ
れる(34)。第二の例として”こんぴゅーたのきーぼ
ーど”という文字列が入力された場合も同様の処理が行
われ、長音付与手段7で入力文字列内の長音総数と辞書
に記述されている長音数が比較されるが、この場合入力
文字列内の長音総数は3である。一方辞書検索の結果
「コンピュータ」と「キーボード」の2つの単語の情報
が読み出され、「コンピュータ」の長音数は2、「キー
ボード」の長音数は2であるため長音数の総和は4とな
り、入力文字列内の長音総数とは一致しない。そのため
長音付与は行われず、「コンピュータのキーボード」と
いう変換結果が出力される。Next, the operation of the kana-kanji conversion device will be described with reference to the flowchart of FIG. As an example, assume that the character string "konpyuta" is entered. When a character string is input (17), it is sent to the input control device 2 and stored (18), and sent to the code retrieval means 6. The code retrieving means 6 checks whether or not the sent "konpyu-ta" contains a long sound symbol or a midpoint (20), and if the long sound symbol is included (21), the total length is given to the long sound adding means 7. Notify (22). In this case, it becomes 2. If the midpoint is included (23), the midpoint assigning means 8 is operated to set a flag (24). However, in this case, the flag is not included, so the process is not performed. When the above processing is completed, the code searching means 6 sends the input character string to the code deleting means 9, deletes the long sound symbol and the midpoint from the input character string, and sends the character string "Konpyuta" to the dictionary searching means 10 ( 25). When the dictionary search means 10 receives a character string, the dictionary storage device 4 follows the character string.
The dictionary stored in is searched (26). In this case, since the word having the kana heading “Computer” is registered, the notation “computer” of the word, the part-of-speech information, the number of long sounds and the long sound information are also read and sent to the input control device 2. When the input control device 2 receives the information, it checks whether the long sound adding means 7 has information on the total number of long sounds in the input character string sent from the code searching means 6 (27). Send the information received from.
The long sound adding means 7 determines the total number of long sounds in the input character string from the code searching means 6, the number of long sounds written in the dictionary sent from the input control device 2, and when the input character string consists of a plurality of words. It is checked if the sum of the numbers of long sounds of those words is the same (28), and in this case, there is a match, so if there is long sound information (29), the long sound symbol is added to the notation and the notation "computer" is added to the input control device. Send it back to 2 (30). Next, the input control device 2 checks whether the flag is set in the midpoint assigning means 8 (31) If the flag is set and the midpoint information is described in the dictionary (32), the midpoint is set according to the midpoint information. However, since the flag is not set in this case, the midpoint is not given, and the conversion result "computer" is sent to the display device 5 and output (34). As a second example, the same processing is performed when the character string "konpyuta no kibodou" is input, and the long sound adding means 7 describes the total number of long sounds in the input character string and the dictionary. The numbers of long notes are compared, but in this case, the total number of long notes in the input character string is three. On the other hand, as a result of the dictionary search, the information of the two words “computer” and “keyboard” is read out, and the total number of long notes is 4 because the number of long notes of “computer” is 2 and the number of long notes of “keyboard” is 2. , Does not match the total number of long sounds in the input string. Therefore, the long sound is not added, and the conversion result of "computer keyboard" is output.
【0019】また、第三の例として”える・にーにょげ
んしょう”という文字列が入力された場合を想定する。
入力された文字列は(17)入力制御装置2に送られて
記憶され(18)、符号検索手段6で長音記号の総数と
中点の有無を検索される(20)。この場合、長音総数
は1(21)であるため、長音付与手段7に長音総数が
1であることを通知し(22)、中点も含まれるため
(23)中点付与手段8に働きかけてフラグを立てる
(24)。そして入力文字列は符号削除手段9へと送ら
れて長音記号および中点が削除され(24)、”えるに
にょげんしょう”という文字列が辞書検索手段10へ送
られ、辞書検索が行われ(26)結果が入力制御装置2
に送られる。入力制御装置2は長音付与手段7に入力文
字列内の長音総数が通知されていれば(27)検索結果
を長音付与手段7に送る。この場合長音総数と長音数は
一致するが(28)長音情報がないため(29)付与は
行われない。次に入力制御装置2は中点付与手段8にフ
ラグが立っているか調べ(31)、立っていれば中点付
与手段8に表記と中点情報を送る。中点付与手段8では
中点情報に従って表記に中点を付与する(33)。その
結果「エル・ニーニョ現象」という表記が入力制御装置
2に送り返され、変換結果として表示装置に出力される
(34)。このようにして、辞書記憶容量の増大、装置
の複雑化、大型化の必要なく、長音記号の有無あるいは
中点の有無に関係なくカタカナ語が変換でき、しかも利
用者の意図する位置に長音記号や中点が付与された変換
結果を得ることができる。As a third example, it is assumed that a character string "Er.
The input character string is sent (17) to the input control device 2 and stored (18), and the code search means 6 searches for the total number of long-sound symbols and the presence or absence of a midpoint (20). In this case, since the total number of long notes is 1 (21), the long note providing means 7 is notified that the total number of long notes is 1 (22), and since the midpoint is also included (23), the midpoint providing means 8 is operated. Set a flag (24). Then, the input character string is sent to the code deleting means 9 to delete the chords and midpoints (24), and the character string "Eni Niyongensho" is sent to the dictionary searching means 10 for dictionary search. (26) The result is the input control device 2
Sent to. If the total number of long sounds in the input character string is notified to the long sound providing unit 7, the input control device 2 sends the search result to the long sound providing unit 7 (27). In this case, the total number of long notes and the number of long notes match (28), but since there is no long note information (29), the addition is not performed. Next, the input control device 2 checks whether the flag is set in the midpoint giving means 8 (31), and if it is set, sends the notation and the midpoint information to the midpoint giving means 8. The midpoint giving means 8 gives a midpoint to the notation according to the midpoint information (33). As a result, the notation "El Niño phenomenon" is sent back to the input control device 2 and output as a conversion result to the display device (34). In this way, Katakana can be converted regardless of the presence or absence of a long sound symbol or the presence or absence of a midpoint without increasing the dictionary storage capacity, complicating the device, or increasing the size of the device. It is possible to obtain the conversion result to which the middle point is added.
【0020】以上の説明においては例として区切り符号
に中点を用いることとしたが、これに限られることはな
く、ハイフン(−)やスラッシュ(/)などその他の区
切り符号でも符号検索手段、符号付与手段をそれぞれの
区切り符号に対応できるようにすれば同様の効果が得ら
れ、本発明の目的を達成することができる。In the above description, the middle point is used as the delimiter code as an example, but the delimiter code is not limited to this, and other delimiter codes such as hyphen (-) and slash (/) can be used as the code search means and the code. The same effect can be obtained and the object of the present invention can be achieved by making the adding means compatible with each delimiter code.
【0021】[0021]
【発明の効果】以上の説明で明らかな如く、本発明のか
な漢字変換装置によれば、符号検索手段による符号の検
索と、符号削除手段による符号の削除を行うことにより
辞書記憶容量の増大、装置の複雑化、大型化の必要な
く、長音記号の有無あるいは区切り符号の有無に関係な
くカタカナ語が変換でき、しかも利用者の意図する位置
に長音記号や区切り符号が付与された変換結果が得られ
るという効果を得ることができる。As is apparent from the above description, the kana-kanji conversion device of the present invention increases the dictionary storage capacity by performing the code search by the code search means and the code deletion by the code deletion means. It is possible to convert Katakana words with or without long-sound symbols or with or without separators, and to obtain the conversion result with long-sound symbols or separators added at the user's intended position without the need for complicated or large size The effect can be obtained.
【図1】本発明の一実施例を示すブロック図FIG. 1 is a block diagram showing an embodiment of the present invention.
【図2】本発明の一実施例の辞書内容を示す図FIG. 2 is a diagram showing dictionary contents according to an embodiment of the present invention.
【図3】本発明の一実施例のフローチャートFIG. 3 is a flowchart of an embodiment of the present invention.
【図4】従来の技術の基本形の機能ブロック図FIG. 4 is a functional block diagram of a basic form of conventional technology.
【図5】従来の技術の基本形の辞書内容を示す図FIG. 5 is a diagram showing a dictionary content of a basic form of a conventional technique.
【図6】従来の技術の一例の機能ブロック図FIG. 6 is a functional block diagram of an example of a conventional technique.
【図7】従来の技術の一例の相関関係図FIG. 7 is a correlation diagram of an example of a conventional technique.
【図8】従来の技術の第二の例の辞書内容を示す図FIG. 8 is a diagram showing a dictionary content of a second example of the related art.
1 キーボード 2 入力制御装置 3 変換処理装置 4 辞書記憶装置 5 表示装置 6 符号検索手段 7 長音付与手段 8 中点付与手段 9 符号削除手段 10 辞書検索手段 11 辞書のカナ見出し 12 辞書の表記 13 辞書の品詞情報 14 辞書の長音数 15 辞書の長音情報 16 辞書の中点情報 DESCRIPTION OF SYMBOLS 1 keyboard 2 input control device 3 conversion processing device 4 dictionary storage device 5 display device 6 code search means 7 long sound adding means 8 midpoint adding means 9 code deleting means 10 dictionary searching means 11 dictionary kana index 12 dictionary notation 13 dictionary Part-of-speech information 14 Number of long sounds in dictionary 15 Information on long sounds in dictionary 16 Midpoint information of dictionary
Claims (1)
変換結果の転送などを行う入力制御装置と、辞書記憶装
置と、該辞書記憶装置にアクセス可能にし辞書を検索し
て文節候補を作成する変換処理装置と、変換結果を出力
する出力装置とを含み、入力制御装置は入力装置からの
情報を受け取ることと出力装置に情報を送ることが可能
であるとともに辞書記憶装置にアクセス可能であるかな
漢字変換装置において、あらかじめ単語の読みから長音
記号と区切り符号を省いたカナ見出しと、不安定な長音
記号と区切り符号を除いた表記と、単語についての情報
を記憶し、変換処理装置は辞書記憶装置を辞書検索手段
により検索すると共に符号検索手段と符号削除手段と長
音と中点等の符号付与手段とを備えていることを特徴と
するかな漢字変換装置。1. An input device for inputting a character string, an input control device for transferring a character string or a conversion result, a dictionary storage device, and making the dictionary storage device accessible so that a dictionary is searched to find phrase candidates. The input control device is capable of receiving information from the input device, sending information to the output device, and accessing the dictionary storage device. In a certain kana-to-kanji conversion device, a kana heading that omits long-sound symbols and delimiters from the reading of words in advance, a notation that excludes unstable long-sound symbols and delimiters, and information about words are stored. A kana-kanji conversion device characterized in that the storage device is searched by a dictionary search means, and is provided with a code search means, a code deletion means, and a code addition means for a long sound and a midpoint. Place
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6110846A JPH07319864A (en) | 1994-05-25 | 1994-05-25 | Kana-Kanji converter |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6110846A JPH07319864A (en) | 1994-05-25 | 1994-05-25 | Kana-Kanji converter |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07319864A true JPH07319864A (en) | 1995-12-08 |
Family
ID=14546153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6110846A Pending JPH07319864A (en) | 1994-05-25 | 1994-05-25 | Kana-Kanji converter |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07319864A (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0340060A (en) * | 1989-07-06 | 1991-02-20 | Matsushita Electric Ind Co Ltd | Kana (japanese syllabary) to kanji (chinese character) converter |
JPH03156663A (en) * | 1989-11-15 | 1991-07-04 | Toshiba Corp | Document preparing device |
JPH04148271A (en) * | 1990-10-08 | 1992-05-21 | Matsushita Electric Ind Co Ltd | Method and device for character input |
-
1994
- 1994-05-25 JP JP6110846A patent/JPH07319864A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0340060A (en) * | 1989-07-06 | 1991-02-20 | Matsushita Electric Ind Co Ltd | Kana (japanese syllabary) to kanji (chinese character) converter |
JPH03156663A (en) * | 1989-11-15 | 1991-07-04 | Toshiba Corp | Document preparing device |
JPH04148271A (en) * | 1990-10-08 | 1992-05-21 | Matsushita Electric Ind Co Ltd | Method and device for character input |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0378848A2 (en) | Method for use of morphological information to cross reference keywords used for information retrieval | |
JP2742115B2 (en) | Similar document search device | |
JP3689954B2 (en) | Heterogeneous code character string transcription device and electronic dictionary | |
JPH05113964A (en) | Electronic dictionary | |
JPH07319864A (en) | Kana-Kanji converter | |
JP2004318441A (en) | System, method, and processor for kana-kanji conversion | |
JPH08115330A (en) | Similar document retrieval method and apparatus | |
JP3498635B2 (en) | Information retrieval method and apparatus, and computer-readable recording medium | |
JP2004199282A (en) | Document retrieval device and documents registeration device | |
JPH0821031B2 (en) | Language analyzer | |
JPH08249341A (en) | Document storage and retrieval device for document data base | |
JPH03229367A (en) | Text base retrieving system | |
JPH0785040A (en) | Inconsistent notation detection method and kana-kanji conversion method | |
JP5454871B2 (en) | Dictionary evaluation support apparatus and program | |
JP3273778B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
JP2002049616A (en) | Device and method for kana-kanji conversion | |
JPS6198475A (en) | Japanese text input device | |
JPH0521264B2 (en) | ||
JPH0991304A (en) | Information retrieval method, information retrieval system, and information retrieval storage medium | |
JPH0721212A (en) | Word processor | |
JPH0727526B2 (en) | Kana-Kanji converter | |
JPH07319895A (en) | Device and method for retrieving document | |
JPH1091627A (en) | Automatic conversion method for kanji into equivalent kana and its system | |
JPH0462664A (en) | Data retrieving device | |
JPH1031672A (en) | Person name conversion device and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19990824 |