JPH08212210A - Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method - Google Patents

Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method

Info

Publication number
JPH08212210A
JPH08212210A JP7014491A JP1449195A JPH08212210A JP H08212210 A JPH08212210 A JP H08212210A JP 7014491 A JP7014491 A JP 7014491A JP 1449195 A JP1449195 A JP 1449195A JP H08212210 A JPH08212210 A JP H08212210A
Authority
JP
Japan
Prior art keywords
kanji
kana
conversion
character string
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7014491A
Other languages
Japanese (ja)
Inventor
Toshiya Tamura
俊哉 田村
Kenji Suzuki
謙二 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7014491A priority Critical patent/JPH08212210A/en
Publication of JPH08212210A publication Critical patent/JPH08212210A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE: To generate and output conversion candidates obtained by making a user to convert a part which is KATAKANA(square form of KANA)-inputted intending KANJI notation into KANJI and convert a part which is KANA-inputted intending KANA notation into KANA without increasing the capacity of a dictionary, and to improve the conversion efficiency of a KANA mixed with KANJI character string. CONSTITUTION: The dictionary 113 has information on the correspondence of KANJI of headwords and reading. Only words having the most KANJI notation parts in the same word different in notation are registered. A conversion part 108 retrieves the dictionary 113, obtains conversion candidate information on the character string where KATAKANA is converted into KANA and judges the connection of conversion candidate information. A character string generation part 111 substitutes the KATAKANA part of the inputted character string for KANJI or KATAKANA or the HIRAGANA part of the inputted character string for HIRAGANA from the headwords registered in the dictionary 113 of the conversion candidate whose connection judgement is permitted so as to output it.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、例えば手書き入力方式
により漢字混じりかな文字列を入力し、漢字混じりの文
書を作成する文書作成装置に係り、特に変換候補の作成
処理に特徴を有する文書作成装置及び漢字混じりかな漢
字変換方法と、この文書作成装置に用いられる辞書作成
装置及び辞書作成方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document creation device for creating a document containing kanji characters by inputting a kana-kanji character string by, for example, a handwriting input method, and more particularly to a document creation device characterized by conversion candidate creation processing. The present invention relates to a device and a kanji conversion method for mixing kanji, and a dictionary creating device and a dictionary creating method used in this document creating device.

【0002】[0002]

【従来の技術】従来、日本語ワードプロセッサ等の文書
作成装置には、例えば手書き入力方式により漢字混じり
かな文字列を入力し、漢字混じりの文書を作成するもの
がある。この種の文書作成装置において、かな漢字変換
に用いられる辞書には、見出しの各漢字と読みとの対応
付けに関する情報が格納されているが、例えば「鈴虫」
と「すず虫」というように、同じ語であっても表記が異
なるものはそれぞれ別々に辞書に登録されていた。
2. Description of the Related Art Conventionally, there is a document creating apparatus such as a Japanese word processor that creates a kanji mixed document by inputting a kana-mixed kana character string by, for example, a handwriting input method. In this type of document creation device, the dictionary used for kana-kanji conversion stores information about the correspondence between each kanji in the heading and the reading.
The same word but different notation, such as "Suzumushi", were registered separately in the dictionary.

【0003】また、変換にあっては、変換用辞書に登録
されている表記にしか変換することはできない。このた
め、1つの語に対して何通りかの表記の変換候補を得る
ためには、それぞれの表記ごとに辞書登録が必要であっ
た。
Further, in the conversion, only the notation registered in the conversion dictionary can be converted. Therefore, in order to obtain conversion candidates for several notations for one word, it is necessary to register the dictionary for each notation.

【0004】[0004]

【発明が解決しようとする課題】上記したように、従来
の文書作成装置では、漢字表記またはひらがな表記とい
うように、様々な利用者が意図する表記の変換候補を出
力するためには、それぞれの表記ごとに辞書への登録が
必要であった。このため、辞書の容量が膨大になってし
まうという欠点があった。
As described above, in the conventional document creating apparatus, in order to output the conversion candidates of the notation intended by various users such as the Kanji notation or the Hiragana notation, the respective candidates are output. It was necessary to register in the dictionary for each notation. For this reason, there is a drawback that the capacity of the dictionary becomes huge.

【0005】本発明は上記のような事情を考慮してなさ
れたもので、辞書の容量を増やすことなく、利用者が漢
字表記を意図してカタカナ入力した部分を漢字に、ひら
がな表記を意図してひらがな入力した部分をひらがなに
した変換候補を作成出力して、漢字混じりかな文字列の
変換効率を向上させることのできる文書作成装置及び漢
字混じりかな漢字変換方法と、この文書作成装置に用い
られる辞書作成装置及び辞書作成方法を提供することを
目的とする。
The present invention has been made in consideration of the above circumstances, and intends to use Hiragana notation in which the user inputs katakana in Kanji without increasing the capacity of the dictionary. A document creation device and a kanji-mixed kanji conversion method that can improve the conversion efficiency of kanji-mixed kana character strings by creating and outputting a conversion candidate in which the input hiragana is written in hiragana, and a dictionary used in this document creation device. An object is to provide a creating device and a dictionary creating method.

【0006】[0006]

【課題を解決するための手段】本発明は、漢字混じりか
な漢字変換機能を有する文書作成装置において、入力さ
れた漢字混じりかな文字列情報をその表記の状態で格納
する入力表記保存手段と、この入力表記保存手段に格納
された入力文字列情報にカタカナが含まれる場合に、そ
のカタカナをひらがなに変換する表記変換手段と、見出
しの各漢字と読みとの対応付けに関する情報を持ち、表
記の異なる同一語の中に漢字表記部分が最も多い語のみ
が登録されている漢字混じりかな漢字変換辞書と、この
漢字混じりかな漢字変換辞書を検索して、上記表記変換
手段によってカタカナをひらがなに直した文字列情報に
対する変換候補情報を得、その変換候補情報の接続判定
を行なう漢字混じりかな漢字変換手段と、この漢字混じ
りかな漢字変換手段によって接続判定が許可された変換
候補情報について、上記漢字混じりかな漢字変換辞書に
登録された見出しから入力文字列情報のカタカナ部分を
漢字またはカタカナに、あるいは入力文字列情報のひら
がな部分をひらがなに置き換えることにより、入力にお
ける変換指示に応じた表記の候補文字列情報を作成する
漢字カタカナ混じり候補文字列生成手段とを具備した構
成による(第1の構成)。
SUMMARY OF THE INVENTION According to the present invention, in a document creating apparatus having a kanji / kanji / kanji conversion function, input knot / kanji storage means for storing inputted kanji / kanji / kana character string information, and this input When the input character string information stored in the notation storage means includes katakana, it has notation conversion means for converting the katakana to hiragana and information on the correspondence between each kanji and heading of the heading, and the same notation Kanji-kana-kanji conversion dictionary in which only the words with the most kanji-writing parts are registered, and this kanji-kana kana-kanji conversion dictionary are searched for the character string information in which katakana is converted to hiragana by the above notation conversion means. A kanji-kana kana-kanji conversion device that obtains conversion candidate information and determines whether the conversion candidate information is connected, and a kanji-kana kana-kanji converter. For conversion candidate information for which connection determination is permitted by the above, replace the katakana part of the input character string information with kanji or katakana or the hiragana part of the input character string information from the heading registered in the Kanji-mixed kanji conversion dictionary. According to the configuration, a candidate character string generation unit including kanji and katakana that creates the candidate character string information of the notation according to the conversion instruction in the input is provided (first configuration).

【0007】また、見出しの各漢字と読みとの対応付け
に関する情報を持ち、表記の異なる同一語の中に漢字表
記部分が最も多い語のみが登録されており、登録されて
いる見出しのひらがな表記可能な漢字にマーカが付与さ
れている漢字混じりかな漢字変換辞書と、この漢字混じ
りかな漢字変換辞書を検索し、入力された漢字混じりか
な文字列情報に対する変換候補情報を得、その変換候補
情報の接続判定を行なう漢字混じりかな漢字変換手段
と、この漢字混じりかな漢字変換手段によって接続判定
が許可された変換候補情報について、上記漢字混じりか
な漢字変換辞書に登録された見出しから入力文字列情報
の漢字表記可能な部分をすべて漢字表記とし、さらに、
マーカ情報の付与されたひらがな表記可能な部分をひら
がな表記とした候補文字列情報を作成する漢字混じり候
補文字列生成手段とを具備した構成による(第2の構
成)。
[0007] In addition, there is information about the correspondence between each kanji of the heading and the reading, and only the word with the most kanji notation part is registered in the same word with different notation, and the hiragana notation of the registered heading is registered. Search the kanji-mixed kana-kanji conversion dictionary in which markers are added to possible kanji and this kanji-mixed kana-kanji conversion dictionary, obtain conversion candidate information for the input kanji-mixed kana character string information, and determine the connection of the conversion candidate information For Kanji-mixed kana-kanji conversion means for performing and conversion candidate information for which connection determination is permitted by this kanji-mixed kana-kanji conversion means, the part of the input character string information that can be written in kanji is registered from the headline registered in the kanji-mixed kana-kanji conversion dictionary. All in Kanji, and
According to a configuration including a kanji-blended candidate character string generation means for creating candidate character string information in which the hiragana notation portion provided with the marker information is written in hiragana (second configuration).

【0008】さらに、上記第1および第2の構成におい
て、入力文字列情報にカタカナが含まれているか否かに
よって上記漢字カタカナ混じり候補文字列手段または上
記漢字混じり候補文字列生成手段を用いるかを判定する
変換判定手段とを具備した構成による(第3の構成)。
Further, in the first and second configurations, depending on whether or not the input character string information includes katakana, whether the kanji / katakana mixed candidate character string means or the kanji mixed candidate character string generation means is used. A conversion determination means for determining is provided (third configuration).

【0009】本発明の辞書作成装置は、見出しの各漢字
と読みとの対応付けに関する情報を持つ漢字混じりかな
漢字変換辞書と、この漢字混じりかな漢字変換辞書から
表記の異なる同一語を検出する同一語検出手段と、この
同一語検出手段によって検出された表記の異なる同一語
の中で漢字表記部分の最も多い語について、他の表記の
語においてひらがな表記されている漢字にマーカ情報を
付与し、それ以外を削除する同一語併合手段とを具備
し、表記の異なる同一語の中で漢字表記部分の最も多い
語についてのみ登録した漢字混じりかな漢字変換辞書を
作成することを特徴とする。
The dictionary creating device of the present invention detects a same word with different kanji in a kanji-kana-kanji conversion dictionary and a kanji-kanji kana-kanji conversion dictionary having information relating to the correspondence between each kanji of a headline and reading. Means and marker information is added to the kanji written in hiragana in other notation words for the most common kanji notation part among the same notations detected by this same word detection means, and other than that. It is characterized by comprising a same word merging means for deleting, and creating a kanji-kanji conversion dictionary in which only kanji characters having the largest number of kanji characters are registered among the same words having different notations.

【0010】[0010]

【作用】上記第1の構成によれば、見出しの各漢字と読
みとの対応付けに関する情報を持ち、表記の異なる同一
語の中で漢字表記部分が最も多い語のみが登録されてい
る漢字混じりかな漢字変換辞書が用いられ、入力文字列
情報のカタカナ部分が漢字またはカタカナに、あるいは
入力文字列情報のひらがな部分がひらがなに置き換えら
て、入力における変換指示に応じた表記の候補文字列情
報が作成される。
According to the first configuration, a mixture of Kanji characters, which has information about the correspondence between each Kanji character in the heading and the reading, and in which only the words with the most Kanji notation part among the same words with different notations are registered. A kana-kanji conversion dictionary is used to replace the katakana part of the input character string information with kanji or katakana, or replace the hiragana part of the input character string information with hiragana to create candidate character string information that corresponds to the conversion instruction during input. To be done.

【0011】上記第2の構成によれば、見出しの各漢字
と読みとの対応付けに関する情報を持ち、表記の異なる
同一語の中で漢字表記部分が最も多い語のみが登録され
ており、登録された見出しのひらがな表記可能な漢字に
マーカ情報が付与されている漢字混じりかな漢字変換辞
書が用いられ、入力文字列情報の漢字表記可能な部分が
すべて漢字表記とし、さらに。マーカ情報が付与された
ひらがな表記可能な漢字部分がひらがな表記とした候補
文字列情報が作成される。
According to the above-mentioned second structure, since there is information on the correspondence between each kanji of the heading and the pronunciation, only the word having the most kanji notation part is registered among the same words having different notations. A kana-kanji conversion dictionary is used in which marker information is added to the kanji characters that can be written in hiragana in the specified heading, and all kanji-expressible parts of the input character string information are converted to kanji. The candidate character string information in which the kanji part that can be written in hiragana with the marker information is written in hiragana is created.

【0012】上記第3の構成によれば、入力文字列情報
にカタカナが含まれるか否かによって、入力文字列情報
にカタカナが含まれる場合には、上記漢字混じりかな漢
字変換辞書に登録された見出しから入力文字列情報のカ
タカナ部分を漢字またはカタカナに、あるいは入力文字
列情報のひらがな部分をひらがなに置き換えることによ
り、入力における変換指示に応じた表記の候補文字列情
報が変換候補として作成される。入力文字列情報にカタ
カナが含まれない場合には、上記漢字混じりかな漢字変
換辞書に登録された見出しから入力文字列情報の漢字表
記可能な部分を全て漢字表記とし、さらに、マーカ情報
が付与されたひらがな表記可能な漢字部分をひらがな表
記とした候補文字列情報が作成される。
According to the third configuration, depending on whether or not the input character string information includes katakana, when the input character string information includes katakana, the headline registered in the kanji-kana-kanji conversion dictionary. By replacing the katakana part of the input character string information with kanji or katakana or replacing the hiragana part of the input character string information with hiragana, the candidate character string information of the notation according to the conversion instruction at the input is created as a conversion candidate. If the input character string information does not include katakana, all the characters that can be written in kanji in the input character string information from the heading registered in the kanji / kanji conversion dictionary are written in kanji, and marker information is added. The candidate character string information in which the kanji part that can be written in hiragana is written in hiragana is created.

【0013】また、本発明の辞書作成装置にあっては、
見出しの各漢字と読みとの対応付けに関する情報を持つ
漢字混じりかな漢字変換辞書において、表記の異なる見
出しごとに複数登録されている語があれば、その登録さ
れたいずれかの見出しでひらがな表記されている漢字に
マーカ情報を付与し、最も漢字表記が多い語のみを残し
て他の異表記同一語を削除することにより、表記の異な
る同一語の中で漢字表記部分の最も多い語についてのみ
登録した漢字混じりかな漢字変換辞書が作成される。
Further, in the dictionary creating apparatus of the present invention,
If there are multiple registered words for each heading that has a different notation in the kanji-mixed kana-kanji conversion dictionary that has information about the correspondence between each kanji in the heading and the reading, the hiragana is written in one of the registered headings. Marker information is added to existing Kanji characters, and only words with the most Kanji characters are left and other words with different Kanji characters are deleted. A kanji conversion dictionary with mixed kanji is created.

【0014】[0014]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本発明の文書作成装置の一実施例を示し
たブロック図である。入力装置101は、手書きタブレ
ット等から得られる座標から手書き文字を認識すること
で漢字混じりかな文字列を入力することができ、入力情
報を文字コードとして出力する装置である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a document creating apparatus of the present invention. The input device 101 is a device that can input a kana-kanji character string by recognizing a handwritten character from coordinates obtained from a handwriting tablet or the like and outputs input information as a character code.

【0015】表示装置119は、CRT (Cathode Ray
Tube) 、LCD (Liquid Crystal Display) 等の画面表
示装置であり、利用者はこれらにより対話的に文書の作
成作業を進めることができる。
The display device 119 is a CRT (Cathode Ray).
It is a screen display device such as a Tube) or LCD (Liquid Crystal Display), and a user can interactively create a document by using these.

【0016】入力制御部102は、入力装置101から
入力される文字データを入力バッファ103に変換処理
待ちなどの間一旦バッファリングして漢字混じり文字列
を作り、それを表記変換部105に送る。
The input control unit 102 temporarily buffers the character data input from the input device 101 in the input buffer 103 while waiting for conversion processing, creates a character string mixed with Kanji, and sends it to the notation conversion unit 105.

【0017】表記変換部105は、入力表記保存部10
6に指示して入力文字列を入力表記保存バッファ107
に格納すると共に、入力文字列にカタカナが含まれる場
合には入力文字列中のカタカナをひらがなに置換して漢
字混じりかな漢字変換部108に送る。
The notation conversion unit 105 includes an input notation storage unit 10
6, input character string is entered and input notation saving buffer 107
In addition, when the input character string includes katakana, the katakana in the input character string is replaced with hiragana and sent to the kanji / kanji / kanji conversion unit 108.

【0018】漢字混じりかな漢字変換辞書113は、見
出しの各漢字と対応付けに関する情報を持ち、表記の異
なる同一語の中で漢字表記部分が最も多い語のみが登録
されており、ひらがな表記可能な漢字にマーカが付与さ
れている。
The kanji-mixed kana-kanji conversion dictionary 113 has information about the correspondence with each kanji of the headline, and only the words having the most kanji notation parts among the same words with different notations are registered, and kanji that can be written in hiragana. A marker is attached to.

【0019】漢字混じりかな漢字変換部108は、文字
列が単語あるいは文節等の適当な変換対象となる間で一
旦変換バッファ109に格納し、文字列が変換対象とな
った後に漢字混じりかな漢字変換辞書113を検索す
る。次に、検索に成功した各変換候補の接続判定を行な
い、接続可能な変換候補を変換判定部110に送る。
The kanji-mixed kana-kanji conversion dictionary 108 temporarily stores the character string in the conversion buffer 109 while the character string is an appropriate conversion target such as a word or a phrase, and after the character string is converted, the kanji-mixed kana-kanji conversion dictionary 113. To search. Next, the connection determination of each conversion candidate that has been successfully searched is performed, and the connectable conversion candidates are sent to the conversion determination unit 110.

【0020】変換判定部110は、入力表記保存バッフ
ァ107を参照して変換候補に対応する入力文字列にカ
タカナが含まれているかどうかを検査し、カタカナが含
まれる場合には漢字カタカナ混じり候補文字列生成部1
11に、カタカナが含まれない場合には漢字混じり候補
文字列生成部112にそれぞれ変換候補を送る。
The conversion determination unit 110 refers to the input notation storage buffer 107 to check whether or not the input character string corresponding to the conversion candidate includes katakana. If the input character string includes katakana, the candidate characters mixed with kanji and katakana are included. Column generator 1
If 11 does not include katakana, the conversion candidates are sent to the kanji mixed candidate character string generation unit 112.

【0021】漢字カタカナ混じり候補文字列生成部11
1は、漢字混じりかな漢字変換辞書113を参照してカ
タカナ入力された部分が漢字またはカタカナ表記可能
か、あるいはひらがな入力された部分がひらがな表記可
能かどうかを検査し、可能であればカタカナ入力された
部分が漢字またはカタカナに、ひらがな入力された部分
がひらがなになるように候補文字列を作成する。
Candidate character string generation unit 11 containing kanji and katakana
1 refers to the kana-mixed kana-kanji conversion dictionary 113, and checks whether the part input in katakana can be written in kanji or katakana, or the part input in hiragana can be written in hiragana. If possible, katakana was input. Create a candidate character string so that the part is kanji or katakana and the input part is hiragana.

【0022】漢字混じり候補文字列生成部112は、漢
字混じりかな漢字変換辞書113を参照して漢字表記可
能な部分を全て漢字表記とした候補文字列、また、ひら
がな表記可能であることを示すマーカが付与されている
部分があれば、その部分をひらがな表記とした候補文字
列を作成する。
The kanji-mixed candidate character string generation unit 112 refers to the kanji-mixed kana-kanji conversion dictionary 113 to indicate a candidate character string in which all kanji-expressible parts are written in kanji, and a marker indicating that hiragana can be written. If there is a given part, create a candidate character string with that part in hiragana notation.

【0023】漢字混じりかな漢字変換部108は、候補
文字列の作成が終了すると、変換候補を変換候補制御部
114に送り、候補バッファ115に格納する。変換候
補制御部114は、接続点数、頻度、学習状態等により
優先度を決定し、候補バッファ115に格納された変換
候補を優先度順に並べ変える。続いて、候補文字列を表
示して利用者に候補選択を促し、利用者により選択され
た候補文字列を文書バッファ116に格納する。
When the kanji-mixed kana-kanji conversion unit 108 finishes creating the candidate character string, it sends the conversion candidates to the conversion candidate control unit 114 and stores them in the candidate buffer 115. The conversion candidate control unit 114 determines the priority according to the number of connection points, the frequency, the learning state, etc., and rearranges the conversion candidates stored in the candidate buffer 115 in order of priority. Then, the candidate character string is displayed to prompt the user to select a candidate, and the candidate character string selected by the user is stored in the document buffer 116.

【0024】表示制御部117は、文書バッファ116
に格納されたデータを予め書式設定部104において設
定された書式に従って表示用バッファ118に展開し、
表示装置119に送る。
The display control unit 117 includes a document buffer 116.
Develops the data stored in the display buffer 118 in accordance with the format set in advance by the format setting unit 104,
It is sent to the display device 119.

【0025】なお、本発明の第1の構成では、変換判定
部110、漢字混じり候補文字列生成部112は不要で
あり、本発明の第2の構成では、表記変換部105、入
力表記保存部106、入力表記保存バッファ107、変
換判定部110、漢字カタカナ混じり候補文字列生成部
111は不要である。
In the first configuration of the present invention, the conversion determination unit 110 and the Chinese character mixture candidate character string generation unit 112 are unnecessary, and in the second configuration of the present invention, the notation conversion unit 105 and the input notation storage unit. 106, the input notation storage buffer 107, the conversion determination unit 110, and the Kanji / Katakana mixed candidate character string generation unit 111 are unnecessary.

【0026】次に、同実施例の動作を説明する。図2お
よび図3は本発明の文書作成装置の一実施例における文
字入力から変換候補の選択までの処理の流れを示したフ
ローチャートである。入力装置101から入力された文
字データは、入力制御部102から表記変換部105に
送られる。この入力データは、入力表記保存部106に
よって入力表記の状態で入力表記保存バッファ107に
格納される(ステップ210,201)。
Next, the operation of the embodiment will be described. 2 and 3 are flowcharts showing the flow of processing from character input to selection of conversion candidates in the embodiment of the document creation apparatus of the present invention. The character data input from the input device 101 is sent from the input control unit 102 to the notation conversion unit 105. This input data is stored in the input notation storage buffer 107 by the input notation storage unit 106 in the state of the input notation (steps 210 and 201).

【0027】また、表記変換部105によって、入力文
字のひらがなはそのままで、カタカナはひらがなに置き
換えられて変換バッファ109に格納される(ステップ
203〜205)。
Further, the notation conversion unit 105 replaces katakana with hiragana of the input character and stores it in the conversion buffer 109 (steps 203 to 205).

【0028】漢字混じりかな漢字変換部108は、変換
バッファ109を監視して、変換対象となるまで文字入
力から変換バッファ109の格納までの処理を繰り返す
(ステップ201〜206)。
The kana / kanji / kanji conversion unit 108 monitors the conversion buffer 109, and repeats the processes from the character input to the storage of the conversion buffer 109 until it becomes a conversion target (steps 201 to 206).

【0029】変換バッファ109に格納された文字列が
変換対象となると、漢字混じりかな漢字変換部108は
漢字混じりかな漢字変換辞書113から変換候補を検索
する(ステップ207)。辞書検索が終了すると、検索
に成功した全ての変換候補の接続判定を行なう(ステッ
プ208)。
When the character string stored in the conversion buffer 109 is to be converted, the kanji / kanji / kanji conversion unit 108 retrieves conversion candidates from the kanji / kanji / kanji conversion dictionary 113 (step 207). When the dictionary search is completed, connection determination of all conversion candidates that have been successfully searched is performed (step 208).

【0030】そして、接続判定が許可された変換候補に
ついて、変換判定部110は入力表記保存バッファ10
7を参照して変換候補に該当する入力文字列にカタカナ
が含まれているかどうかを検査する(ステップ20
9)。
Then, with respect to the conversion candidates for which the connection judgment is permitted, the conversion judgment unit 110 causes the input notation storage buffer
7, it is checked whether the input character string corresponding to the conversion candidate includes katakana (step 20).
9).

【0031】ここで、入力文字列にカタカナが含まれて
いる場合、漢字カタカナ混じり候補文字列生成部111
は変換候補に該当する辞書の見出しを検索し、カタカナ
入力された部分が漢字またはカタカナに、ひらがな入力
された部分がひらがなになるように候補文字列を作成で
きるかどうか検査する(ステップ210)。
Here, when the input character string includes katakana, the candidate character string generation unit 111 containing kanji and katakana is included.
Searches the heading of the dictionary corresponding to the conversion candidate, and checks whether or not a candidate character string can be created so that the katakana input part becomes kanji or katakana and the hiragana input part becomes hiragana (step 210).

【0032】その結果、作成可能であればカタカナ入力
された部分が漢字またはカタカナに、ひらがな入力され
た部分がひらがなになるように候補文字列を作成して、
候補バッファ115に格納する(ステップ211)。
As a result, if it can be created, a candidate character string is created so that the input part of katakana becomes kanji or katakana and the input part of hiragana becomes hiragana,
It is stored in the candidate buffer 115 (step 211).

【0033】一方、入力文字列にカタカナが含まれない
場合、漢字混じり候補文字列生成部112は変換候補に
該当する辞書の見出しを検索し、漢字表記可能な部分が
全て漢字表記となるように候補文字列を作成して候補バ
ッファ115に格納する(ステップ212)。さらに、
見出しにひらがな表記が可能であることを示すマーカが
付与されていないかどうかを検査し(ステップ21
3)、マーカが付与されている漢字があれば、その漢字
部分をひらがな表記とした文字列を作成して候補バッフ
ァ115に格納する(ステップ214)。
On the other hand, when the input character string does not include katakana, the kanji-blended candidate character string generation unit 112 searches the dictionary heading corresponding to the conversion candidate so that all the kanji-expressible parts are kanji-expressed. A candidate character string is created and stored in the candidate buffer 115 (step 212). further,
It is inspected whether or not a marker indicating that the headline can be written in Hiragana is attached (step 21).
3) If there is a Chinese character to which a marker is added, a character string in which the Chinese character portion is written in Hiragana is created and stored in the candidate buffer 115 (step 214).

【0034】これらの接続判定、入力文字のチェック、
候補文字列の作成、候補バッファへの格納の各処理を辞
書検索に成功した全ての変換候補に対して行なう(ステ
ップ208〜215)。
These connection judgments, input character checks,
Each process of creating a candidate character string and storing it in the candidate buffer is performed for all conversion candidates that have been successfully searched for in the dictionary (steps 208 to 215).

【0035】変換候補の候補バッファへの格納処理が終
了すると、変換候補制御部114は接続点数、頻度、学
習状態により候補バッファ115に格納された変換候補
を優先度順にソートし(ステップ216)、優先度の高
い順に候補文字列を表示して選択処理を待つ(ステップ
217)。
When the storage of the conversion candidates in the candidate buffer is completed, the conversion candidate control unit 114 sorts the conversion candidates stored in the candidate buffer 115 according to the number of connection points, the frequency and the learning state in order of priority (step 216). The candidate character strings are displayed in descending order of priority and the selection process is waited for (step 217).

【0036】利用者により選択された候補文字列は変換
候補制御部114により文書バッファ116に格納され
る(ステップ218)。文書バッファ116に格納され
た文字列は表示制御部117により書式設定部104に
おいて予め設定された書式に従って画面表示される(ス
テップ219)。さらに、次の入力・変換処理に備えて
入力表記保存バッファ107、変換バッファ109、候
補バッファ115が初期化される。
The candidate character string selected by the user is stored in the document buffer 116 by the conversion candidate controller 114 (step 218). The character string stored in the document buffer 116 is displayed on the screen by the display control unit 117 according to the format preset by the format setting unit 104 (step 219). Further, the input notation storage buffer 107, the conversion buffer 109, and the candidate buffer 115 are initialized in preparation for the next input / conversion processing.

【0037】なお、本発明の第1の構成においてはステ
ップ209、ステップ212〜214までの処理、第2
の構成においてはステップ209〜211までの処理は
行なわない。
In the first configuration of the present invention, step 209, steps 212 to 214, the second step
In the above configuration, the processes of steps 209 to 211 are not performed.

【0038】図4は本発明の文書作成装置の一実施例に
おいて、入力「すずムシ」を変換する際の各バッファの
格納例、及び辞書の構造を示したものである。図4
(a)は入力表記である。入力文字列にカタカナ表記が
含まれる場合、表記変換部105により同図(b)に示
すように文字列中のカタカナがひらがなに置換されて変
換バッファ109に格納されると同時に、同図(c)に
示すように入力表記がそのままの状態で入力表記保存バ
ッファ107に格納される。
FIG. 4 shows a storage example of each buffer and a dictionary structure when converting an input "tin bell" in an embodiment of the document creation apparatus of the present invention. FIG.
(A) is an input notation. When the input character string includes katakana notation, the notation conversion unit 105 replaces katakana in the character string with hiragana and stores it in the conversion buffer 109 as shown in FIG. As shown in (), the input notation is stored in the input notation storage buffer 107 as it is.

【0039】漢字混じりかな漢字変換部108におい
て、同図(b)に示すカタカナがひらがなに置換された
文字列を対象として、漢字混じりかな漢字変換辞書11
3から該当する変換候補が検索される。
In the kanji / kanji / kanji conversion section 108, a kanji / kanji / kanji conversion dictionary 11 for a character string in which katakana shown in FIG.
A corresponding conversion candidate is searched from 3.

【0040】辞書の見出しは、同図(e)に示すような
構造で格納されている。各リスト内の第1要素が登録語
のひらがな表記、第2要素の見出しである。各要素は
「/」により区切りが付加されており、同図(e)のよ
うに「鈴虫」については「すず」と「鈴」、「むし」と
「虫」のように見出しの各漢字の読みが対応付けられて
いる。
The dictionary headings are stored in a structure as shown in FIG. The first element in each list is the Hiragana notation of the registered word and the heading of the second element. Each element is delimited by "/". For "bellworm" as shown in Fig. (E), "tin" and "bell" and "mushi" and "insect" for each kanji in the heading Readings are associated.

【0041】また、見出しの「鈴」にはひらがな表記が
可能であることを示すマーカ「*」が付与されている。
次に、入力「すずムシ」にはカタカナが含まれているの
で、漢字カタカナ混じり候補文字列生成部111におい
て、検索された変換候補について候補文字列が作成され
る。
The heading "bell" is provided with a marker "*" indicating that hiragana can be written.
Next, since the input “Suzumushi” includes katakana, the candidate character string including the kanji and katakana candidate character string generation unit 111 creates a candidate character string for the found conversion candidate.

【0042】入力「すずムシ」にはカタカナ表記「ム
シ」が含まれる。そこで、辞書の見出しを参照すると、
ひらがな入力された部分「すず」がひらがな表記が可能
で、カタカナ入力された部分「ムシ」が漢字表記可能で
あるので、ひらがな入力された部分がひらがなに、カタ
カナ入力された部分が漢字になる候補文字列「すず虫」
が作成される。同図(d)は候補文字列が格納された候
補バッファ115を示したものである。
The input "tin bell" includes the katakana notation "pus". So, if you look up the dictionary heading,
Hiragana input part "Suzu" can be written in hiragana, and katakana input part "musi" can be written in kanji, so hiragana input part is hiragana and katakana input part is a candidate for kanji The string "Suzumushi"
Is created. FIG. 6D shows the candidate buffer 115 in which the candidate character strings are stored.

【0043】図5は本発明の文書作成装置の一実施例に
おいて、入力「すずむし」を変換する際の各バッファの
格納例、及び辞書の構造を示したものである。同図
(a)は入力表記、同図(b)は入力文字列を格納した
変換バッファ109を示したものである。また、同図
(d)は辞書の見出しの構造を示したものであり、これ
は図4(e)と全く同様である。
FIG. 5 shows a storage example of each buffer and a dictionary structure when converting the input "Suzumushi" in the embodiment of the document creating apparatus of the present invention. The figure (a) shows the input notation, and the figure (b) shows the conversion buffer 109 storing the input character string. FIG. 4D shows the structure of the dictionary headline, which is exactly the same as FIG. 4E.

【0044】漢字混じりかな漢字変換部108におい
て、辞書検索が行なわれる。この場合、入力「すずむ
し」にはカタカナが含まれていないので、漢字混じり候
補文字列生成部112において、検索された全ての変換
候補について候補文字列が作成される。
A dictionary search is carried out in the kanji / kanji conversion unit 108. In this case, since the input "Suzumushi" does not include katakana, the kanji-blended candidate character string generation unit 112 creates candidate character strings for all the searched conversion candidates.

【0045】入力「すずむし」については、まず、漢字
混じりかな漢字変換辞書113を参照して漢字表記が可
能な部分を全て漢字表記とした候補文字列「鈴虫」が作
成される。次に、同図(d)に示すように、漢字「鈴」
にひらがな表記が可能であることを示すマーカが付与さ
れているので、マーカが付与された漢字部分をひらがな
表記とした候補文字列「すず虫」が作成される。同図
(c)は作成された候補文字列が格納された候補バッフ
ァ115を示したものである。
For the input "Suzumushi", first, a candidate character string "Suzumushi" is created by referring to the Kanji / Kana-Kanji conversion dictionary 113, in which all the Kanji-expressible parts are Kanji-expressed. Next, as shown in FIG. 2 (d), the Chinese character "bell"
Since the marker indicating that the hiragana writing is possible is added to the character string, the candidate character string “Suzumushi” in which the kanji part to which the marker is added is used as the hiragana writing is created. FIG. 7C shows the candidate buffer 115 in which the created candidate character strings are stored.

【0046】次に、本発明の辞書作成装置について説明
する。図6は本発明の辞書作成装置の一実施例を示した
ブロック図である。入力部301は、指定された辞書フ
ァイルをオープンして入力バッファ302に読み出す。
この辞書ファイルは、通常の漢字混じりかな漢字変換辞
書であり、見出しの各漢字と読みとの対応付けに関する
情報を持つ。
Next, the dictionary creating apparatus of the present invention will be described. FIG. 6 is a block diagram showing an embodiment of the dictionary creating apparatus of the present invention. The input unit 301 opens the designated dictionary file and reads it into the input buffer 302.
This dictionary file is a normal kanji / kanji conversion dictionary containing kanji and has information on the correspondence between each kanji in the headline and the reading.

【0047】同一語検出部303は、入力バッファ30
2から逐次辞書の登録語を取り出して候補バッファ30
5に格納し、入力バッファ302を検査して取り出した
登録語の異表記同一語があれば候補バッファ305に格
納する。
The same word detection unit 303 has the input buffer 30.
Sequentially extracting the registered words of the dictionary from 2, and the candidate buffer 30
5, the input buffer 302 is inspected, and if there is a different word identical word of the registered word extracted, it is stored in the candidate buffer 305.

【0048】同一語併合部304は、候補バッファ30
5に複数登録語が格納されている場合に、候補バッファ
305から漢字表記部分の最も多い登録語を取り出し、
他の異表記同一語でひらがな表記されている漢字にマー
カを付与した後、それを出力バッファ306に格納す
る。出力部307は、出力バッファ306に格納された
データを辞書ファイルに書き込み、出力する。
The same word merging unit 304 uses the candidate buffer 30.
When a plurality of registered words are stored in 5, the registered word with the most Kanji writing part is retrieved from the candidate buffer 305,
After a marker is added to a Kanji written in Hiragana with another different notation same word, it is stored in the output buffer 306. The output unit 307 writes the data stored in the output buffer 306 in a dictionary file and outputs the dictionary file.

【0049】次に、同実施例の動作を説明する。図7は
本発明の辞書作成装置の一実施例における入力辞書ファ
イルの読出しから出力辞書ファイルの書き込みまでの処
理の流れを示したフローチャートである。まず、入力部
301において指定された入力辞書ファイルがオープン
され(ステップ401)、辞書データが入力バッファ3
02に読み出される(ステップ402)。
Next, the operation of the embodiment will be described. FIG. 7 is a flow chart showing the flow of processing from the reading of the input dictionary file to the writing of the output dictionary file in the embodiment of the dictionary creating apparatus of the present invention. First, the input dictionary file designated by the input unit 301 is opened (step 401), and the dictionary data is input to the input buffer 3
02 (step 402).

【0050】同一語検出部303は、入力バッファ30
2から登録語を取り出し、これを候補バッファ305に
格納する(ステップ403)。続いて、取り出した登録
語の異表記同一語が入力バッファ302に格納されてい
ないかどうかを検索し(ステップ404)、格納されて
いる場合には、それを入力バッファ302から取り出し
て候補バッファ305に格納する(ステップ405)。
The same word detection unit 303 has the input buffer 30.
The registered word is fetched from No. 2 and stored in the candidate buffer 305 (step 403). Then, it is searched whether the different-sentence same word of the fetched registered word is stored in the input buffer 302 (step 404). If it is stored, it is fetched from the input buffer 302 and the candidate buffer 305 is fetched. (Step 405).

【0051】ステップ404,405の処理が入力バッ
ファ302に異表記同一語がなくなるまで行われると、
同一語併合部304によって候補バッファ305に格納
された登録語の中で漢字表記部分の最も多い登録語t1
が取り出される(ステップ406)。
When the processes of steps 404 and 405 are performed until there are no different words in the input buffer 302,
Of the registered words stored in the candidate buffer 305 by the same word merging unit 304, the registered word t1 with the largest number of Kanji notation parts.
Are retrieved (step 406).

【0052】次に、同一語検出部303は、候補バッフ
ァ305に複数登録語が格納されていないかどうか検査
し(ステップ407)、複数格納されている場合には候
補バッファ305から他の異表記の登録語t2 を取り出
し(ステップ408)、登録語t2 においてひらがなが
表記されている登録語t1 の漢字にマーカを付加する
(ステップ409)。
Next, the same word detecting unit 303 checks whether or not a plurality of registered words are stored in the candidate buffer 305 (step 407), and if a plurality of registered words are stored, another candidate expression is changed from the candidate buffer 305. The registered word t2 of is registered (step 408), and a marker is added to the kanji of the registered word t1 in which hiragana is written in the registered word t2 (step 409).

【0053】これら登録語の取り出し、マーカ付加の処
理を候補バッファ305に格納されている登録語につい
て繰り返す(ステップ408〜409)。最後に、登録
語t1 を出力バッファ306に格納する(ステップ41
1)。
The process of extracting the registered words and adding the marker is repeated for the registered words stored in the candidate buffer 305 (steps 408 to 409). Finally, the registered word t1 is stored in the output buffer 306 (step 41).
1).

【0054】以上、異表記同一語の検出、異表記同一語
の併合処理を入力バッファ302に格納された全ての登
録語について繰り返す(ステップ403〜412)。出
力部307では、出力バッファ306に格納された登録
語を出力辞書ファイルに書き込み(ステップ413)、
辞書ファイルをクローズする(ステップ414)。
As described above, the process of detecting differently-identified same words and the process of merging differently-identified same words are repeated for all registered words stored in the input buffer 302 (steps 403 to 412). The output unit 307 writes the registered word stored in the output buffer 306 to the output dictionary file (step 413),
The dictionary file is closed (step 414).

【0055】図8は本発明の辞書作成装置の一実施例に
おける異表記同一語の併合の様子を示したものである。
図8(a)は入力バッファの内容であり、辞書の見出し
の構造については図4と全く同様である。
FIG. 8 shows a state of merging differently-identified same words in an embodiment of the dictionary creating apparatus of the present invention.
FIG. 8A shows the contents of the input buffer, and the structure of the dictionary headings is exactly the same as in FIG.

【0056】同一語検出部303において、入力バッフ
ァ302に格納された登録語の中から異表記同一語が検
索され、同図(b)に示すように候補バッファ305に
格納される。同一語併合部304では、候補バッファ3
05に格納された登録語の中で漢字表記部分の最も多い
登録語t1 が取り出され、その異表記同一語t2 が逐次
取り出され、それらを比較してマーカ付加が行なわれ
る。
In the same word detecting unit 303, the differently written same word is searched from the registered words stored in the input buffer 302, and is stored in the candidate buffer 305 as shown in FIG. In the same word merging unit 304, the candidate buffer 3
Of the registered words stored in 05, the registered word t1 having the largest number of Kanji notation parts is taken out, the different notation same word t2 is successively taken out, and they are compared to add a marker.

【0057】同図(c)はその際の登録語t1 、t2 を
示したものである。t1 の漢字「鈴」がt2 においてひ
らがな表記される。その結果、同図(d)のように漢字
「鈴」にマーカ「*」が付加されて、出力バッファ30
6に格納される。
FIG. 7C shows the registered words t1 and t2 at that time. The Chinese character "bell" of t1 is written in hiragana at t2. As a result, the marker “*” is added to the Chinese character “bell” as shown in FIG.
6 is stored.

【0058】[0058]

【発明の効果】以上のように本発明によれば、見出しの
各漢字と読みとの対応付けに関する情報を持ち、異なる
表記の同一語の中で漢字表記部分が最も多い語のみが登
録された漢字混じりかな漢字変換辞書を用いて、利用者
が漢字表記を意図してカタカナ入力した部分を漢字に、
ひらがな表記を意図してひらがな入力した部分をひらが
なにした候補候補を作成、出力することができる。
As described above, according to the present invention, only the word having the most Kanji notation part among the same words having different notations is registered, having the information on the correspondence between each Kanji of the heading and the reading. Using the kana-kanji conversion dictionary containing kanji, the part where the user inputs katakana with the intention of writing kanji is converted to kanji.
It is possible to create and output candidate candidates in which hiragana input is intended for hiragana notation and hiragana is entered.

【0059】これにより、辞書の容量を増やすことな
く、利用者の意図した表記の変換候補を得ることがで
き、その結果、漢字混じりかな文字列の変換効率を向上
させることができる。
As a result, the conversion candidates for the notation intended by the user can be obtained without increasing the capacity of the dictionary, and as a result, it is possible to improve the conversion efficiency of a character string containing kanji.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係る文書作成装置の構成を
示すブロック図。
FIG. 1 is a block diagram showing the configuration of a document creation device according to an embodiment of the present invention.

【図2】同実施例における文字入力から変換候補の選択
処理までの処理の流れを示すフローチャート。
FIG. 2 is a flowchart showing a processing flow from character input to conversion candidate selection processing in the embodiment.

【図3】同実施例における文字入力から変換候補の選択
処理までの処理の流れを示すフローチャート。
FIG. 3 is a flowchart showing a processing flow from character input to conversion candidate selection processing in the embodiment.

【図4】同実施例における入力文字列にカタカナ表記を
含む場合の各バッファの格納例と辞書の構造を示す図。
FIG. 4 is a diagram showing a storage example of each buffer and a dictionary structure when an input character string includes katakana notation in the same embodiment.

【図5】同実施例における入力文字列にカタカナ表記を
含まない場合の各バッファの格納例と辞書の構造を示す
図。
FIG. 5 is a diagram showing a storage example of each buffer and a dictionary structure when the input character string does not include katakana notation in the embodiment.

【図6】本発明の一実施例に係る辞書作成装置の構成を
示すブロック図。
FIG. 6 is a block diagram showing the configuration of a dictionary creating device according to an embodiment of the present invention.

【図7】同実施例における入力辞書ファイルの読み出し
から出力辞書ファイルの書き込みまでの処理の流れを示
すフローチャート。
FIG. 7 is a flowchart showing a processing flow from reading an input dictionary file to writing an output dictionary file in the embodiment.

【図8】同実施例における異表記同一語の併合の様子を
示す図。
FIG. 8 is a diagram showing a state of merging differently-identified same words in the embodiment.

【符号の説明】[Explanation of symbols]

101…入力装置、102…入力制御部、103…入力
バッファ、104…書式設定部、105…表記変換部、
106…入力表記保存部、107…入力表記保存バッフ
ァ、108…漢字混じりかな漢字変換部、109…変換
バッファ、110…変換判定部、111…漢字カタカナ
混じり候補文字列生成部、112…漢字混じり候補文字
列生成部、113…漢字混じりかな漢字変換辞書、11
4…変換候補制御部、115…候補バッファ、116…
文書バッファ、117…表示制御部、118…表示用バ
ッファ、119…表示装置、301…入力部、302…
入力バッファ、303…同一語検出部、304…同一語
併合部、305…候補バッファ、306…出力バッフ
ァ、307…出力部。
101 ... Input device, 102 ... Input control unit, 103 ... Input buffer, 104 ... Formatting unit, 105 ... Notation conversion unit,
106 ... Input notation storage unit, 107 ... Input notation storage buffer, 108 ... Kanji mixed kana / Kanji conversion unit, 109 ... Conversion buffer, 110 ... Conversion determination unit, 111 ... Kanji / Katakana mixed candidate character string generation unit, 112 ... Kanji mixed candidate character Column generation unit, 113 ... Kana-kanji conversion dictionary containing kanji, 11
4 ... Conversion candidate control unit, 115 ... Candidate buffer, 116 ...
Document buffer 117 ... Display control unit 118 ... Display buffer 119 ... Display device 301 ... Input unit 302 ...
Input buffer 303 ... Same word detection unit 304 ... Same word merging unit 305 ... Candidate buffer 306 ... Output buffer 307 ... Output unit.

Claims (8)

【特許請求の範囲】[Claims] 【請求項1】 漢字混じりかな文字列情報をかな漢字変
換して、その変換候補情報を得る文書作成装置であっ
て、 入力された漢字混じりかな文字列情報をその表記の状態
で格納する入力表記保存手段と、 この入力表記保存手段に格納された入力文字列情報にカ
タカナが含まれる場合に、そのカタカナをひらがなに変
換する表記変換手段と、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中に漢字表記部分が最も多い
語のみが登録されている漢字混じりかな漢字変換辞書
と、 この漢字混じりかな漢字変換辞書を検索して、上記表記
変換手段によってカタカナをひらがなに直した文字列情
報に対する変換候補情報を得、その変換候補情報の接続
判定を行なう漢字混じりかな漢字変換手段と、 この漢字混じりかな漢字変換手段によって接続判定が許
可された変換候補情報について、上記漢字混じりかな漢
字変換辞書に登録された見出しから入力文字列情報のカ
タカナ部分を漢字またはカタカナに、あるいは入力文字
列情報のひらがな部分をひらがなに置き換えることによ
り、入力における変換指示に応じた表記の候補文字列情
報を作成する漢字カタカナ混じり候補文字列生成手段と
を具備したことを特徴とする文書作成装置。
1. A document creation device for converting kana-kanji character string information into kana-kanji characters and obtaining conversion candidate information thereof, wherein the input notation storage stores the inputted kanji-mixed kana character string information in the notation state. And means for converting the katakana into hiragana when the input character string information stored in this input notation storage means contains hiragana and information about the correspondence between each kanji of the heading and the reading. , Kanji-mixed Kana-Kanji conversion dictionary in which only the words with the most Kanji-description parts are registered in the same word with different notation, and this Kanji-mixed Kana-Kanji conversion dictionary is searched, and the above-mentioned notation conversion means converts Katakana to Hiragana directly. Kana-mixed kana and kanji-mixed kana that obtains conversion candidate information for the selected character string information and determines the connection of the conversion candidate information. Regarding conversion candidate information for which connection determination is permitted by the character conversion means, the katakana part of the input character string information is converted to kanji or katakana or the hiragana part of the input character string information is hiragana from the heading registered in the kanji mixed kanji conversion dictionary. And a candidate character string generation unit for mixing kanji and katakana that creates the candidate character string information of the notation according to the conversion instruction in the input.
【請求項2】 漢字混じりかな文字列情報をかな漢字変
換して、その変換候補情報を得る文書作成装置の漢字混
じりかな漢字変換方法であって、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中で漢字表記部分が最も多い
語のみが登録されている漢字混じりかな漢字変換辞書を
用いて、 入力文字列情報のカタカナ部分を漢字またはカタカナ
に、あるいは入力文字列情報のひらがな部分をひらがな
に置き換えることにより、入力における変換指示に応じ
た表記の候補文字列情報を作成し、 この作成された候補文字列情報を変換候補情報として出
力することを特徴とする漢字混じりかな漢字変換方法。
2. A kanji-kana kana-kanji conversion method of a document creation device for converting kana-kanji kana-character string information into kana-kanji and obtaining conversion candidate information thereof, which has information on correspondence between each kanji of a heading and reading. , Using the Kana-Kana conversion dictionary in which only the words with the most Kanji notation in the same notation are registered, the Katakana part of the input character string information is converted to Kanji or Katakana, or the input character string information By replacing the hiragana part with hiragana, the candidate character string information of the notation according to the conversion instruction in the input is created, and the created candidate character string information is output as conversion candidate information. Method.
【請求項3】 漢字混じりかな文字列情報をかな漢字変
換して、その変換候補情報を得る文書作成装置であっ
て、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中で漢字表記部分が最も多い
語のみが登録されており、登録された見出しのひらがな
表記可能な漢字にマーカ情報が付与されている漢字混じ
りかな漢字変換辞書と、 この漢字混じりかな漢字変換辞書を検索し、入力された
漢字混じりかな文字列情報に対する変換候補情報を得、
その変換候補情報の接続判定を行なう漢字混じりかな漢
字変換手段と、 この漢字混じりかな漢字変換手段によって接続判定が許
可された変換候補情報について、上記漢字混じりかな漢
字変換辞書に登録された見出しから入力文字列情報の漢
字表記可能な部分をすべて漢字表記とし、さらに、マー
カ情報の付与されたひらがな表記可能な部分をひらがな
表記とした候補文字列情報を作成する漢字混じり候補文
字列生成手段とを具備したことを特徴とする文書作成装
置。
3. A document creation device for converting kana-kanji character string information into kana-kanji characters to obtain conversion candidate information thereof, which has information relating to correspondence between each kanji of a heading and reading and has the same word with different notation. Only the words with the most Kanji notation in the list are registered, and the Kanji-Kana-Kana conversion dictionary in which the Kanji-Kana-Kana-Kanji conversion dictionary in which the Kanji characters that can be written in Hiragana in the registered headings are provided with marker information and this Kanji-Kana-Kana conversion dictionary Then, the conversion candidate information for the input character string information containing mixed kanji is obtained,
Input character string information from the headline registered in the Kanji-Kana Kanji conversion dictionary for the Kanji-Kana Kanji conversion unit that determines the connection of the conversion candidate information and the conversion candidate information for which the connection determination is permitted by the Kanji-Kana Kanji conversion unit. All the parts that can be written in kanji are written in kanji, and further, a candidate character string generation means for mixing kanji that creates candidate character string information in which the part that can be written in hiragana with marker information is written in hiragana is provided. Characterized document creation device.
【請求項4】 漢字混じりかな文字列情報をかな漢字変
換して、その変換候補情報を得る文書作成装置の漢字混
じりかな漢字変換方法であって、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中で漢字表記部分が最も多い
語のみが登録されており、登録された見出しのひらがな
表記可能な漢字にマーカ情報が付与されている漢字混じ
りかな漢字変換辞書を用いて、 入力文字列情報の漢字表記可能な部分をすべて漢字表記
とし、さらに、マーカ情報が付与されたひらがな表記可
能な漢字部分をひらがな表記とした候補文字列情報を作
成し、 この作成された候補文字列情報を変換候補情報として出
力することを特徴とする漢字混じりかな漢字変換方法。
4. A kana-kana kana-kanji conversion method of a document creation device for converting kana-kanji kana-character string information into kana-kanji and obtaining conversion candidate information thereof, which has information on correspondence between each kanji of a heading and reading. , Among the same words with different notations, only the words that have the most kanji notation parts are registered, and using the kanji-mixed kana-kanji conversion dictionary where marker information is added to the kanji that can be written in hiragana in the registered headings, All the characters that can be written in Kanji in the input character string information are written in Kanji, and further, the candidate character string information in which the Kanji characters that can be written in Hiragana with marker information is written in Hiragana is created. A kana-kanji conversion method that mixes kanji and is characterized by outputting information as conversion candidate information.
【請求項5】 漢字混じりかな文字列情報にかな漢字変
換して、その変換候補情報を得る文書作成装置であっ
て、 入力された漢字混じりかな文字列情報をその表記の状態
で格納する入力表記保存手段と、 この入力表記保存手段に格納された入力文字列情報にカ
タカナが含まれる場合に、そのカタカナをひらがなに変
換する表記変換手段と、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中に漢字表記部分が最も多い
語のみが登録されており、登録された見出しのひらがな
表記可能な漢字にマーカ情報が付与されている漢字混じ
りかな漢字変換辞書と、 この漢字混じりかな漢字変換辞書を検索し、入力文字列
情報または上記表記変換手段によってカタカナをひらが
なに直した文字列情報に対する変換候補情報を得、その
変換候補情報の接続判定を行なう漢字混じりかな漢字変
換手段と、 入力文字列情報にカタカナが含まれる場合に、上記漢字
混じりかな漢字変換手段によって接続判定が許可された
変換候補情報について、上記漢字混じりかな漢字変換辞
書に登録された見出しから入力文字列情報のカタカナ部
分を漢字またはカタカナに、あるいは入力文字列情報の
ひらがな部分をひらがなに置き換えることにより、入力
における変換指示に応じた表記の候補文字列情報を作成
する漢字カタカナ混じり候補文字列生成手段と、 入力文字列情報にカタカナが含まれない場合に、上記漢
字混じりかな漢字変換手段によって接続判定が許可され
た変換候補情報について、上記漢字混じりかな漢字変換
辞書に登録された見出しから入力文字列情報の漢字表記
可能な部分をすべて漢字表記とし、さらに、マーカ情報
の付与されたひらなが表記可能な漢字部分をひらがな表
記とした候補文字列情報を作成する漢字混じり候補文字
列生成手段と、 入力文字列情報にカタカナが含まれているか否かによっ
て上記漢字カタカナ混じり候補文字列手段または上記漢
字混じり候補文字列生成手段を用いるかを判定する変換
判定手段とを具備したことを特徴とする文書作成装置。
5. A document creation device for converting kana-kanji into kana-mixed kana-character string information and obtaining conversion candidate information thereof, wherein the input notation storage stores the inputted kanji-mixed kana-character string information in the notation state. And means for converting the katakana into hiragana when the input character string information stored in this input notation storage means contains hiragana and information about the correspondence between each kanji of the heading and the reading. , Only the words with the most Kanji notation parts are registered in the same word with different notation, and the Kanji conversion Kana-Kanji conversion dictionary in which marker information is added to the Kanji that can be written in Hiragana in the registered heading Search the mixed kana-kanji conversion dictionary, and input candidate character string information or conversion candidate information for the character string information in which katakana is converted to hiragana by the above notation converting means. If the input character string information contains Katakana, the conversion candidate information for which the connection determination of the conversion candidate information is determined, and the conversion candidate information for which the connection determination is permitted by the Kanji mixing kana Kanji conversion means Candidate character strings that correspond to the conversion instruction in input by replacing the katakana part of the input character string information with kanji or katakana from the heading registered in the mixed kana-kanji conversion dictionary, or by replacing the hiragana part of the input character string information with hiragana The Kanji-Kana-Kana Kanji conversion is performed on the Kanji-Kana-Kana Kana-Kana Kanji conversion unit that creates the information and the conversion-Kanji-Kana-Kana Kanji conversion that the connection determination is permitted by the Kanji-Kana Kana-Kana conversion unit when the input character string information does not include Katakana. Kanji notation of input character string information is possible from the heading registered in the dictionary All the Kana characters are written in Kanji, and the candidate character string generation means that creates the candidate character string information in which the Hiragana notation that allows the writing of Hiragana with marker information is created and the input character string information A document creation apparatus, comprising: a conversion determination unit that determines whether to use the Kanji / Kana / Kana character mixture candidate character string unit or the Kanji / Kanji character mixture candidate character string generation unit depending on whether or not Katakana is included.
【請求項6】 漢字混じりかな文字列情報をかな漢字変
換して、その変換候補情報を得る文書作成装置の漢字混
じりかな漢字変換方法であって、 見出しの各漢字と読みとの対応付けに関する情報を持
ち、表記の異なる同一語の中で漢字表記部分が最も多い
語のみが登録されており、登録された見出しのひらがな
表記可能な漢字にマーカ情報が付与されている漢字混じ
りかな漢字変換辞書を用い、 入力文字列情報にカタカナが含まれるか否かを検査し、 入力文字列情報にカタカナが含まれる場合には、上記漢
字混じりかな漢字変換辞書に登録された見出しから入力
文字列情報のカタカナ部分を漢字またはカタカナに、あ
るいは入力文字列情報のひらがな部分をひらがなに置き
換えることにより、入力における変換指示に応じた表記
の候補文字列情報を作成し、 入力文字列情報にカタカナが含まれない場合には、上記
漢字混じりかな漢字変換辞書に登録された見出しから入
力文字列情報の漢字表記可能な部分を全て漢字表記と
し、さらに、マーカ情報が付与されたひらがな表記可能
な漢字部分をひらがな表記とした候補文字列情報を作成
し、 この作成された候補文字列情報を変換候補として出力す
ることを特徴とする漢字混じりかな漢字変換方法。
6. A kana-kana kana-kanji conversion method of a document creation device for converting kana-kanji kana-character string information into kana-kanji and obtaining conversion candidate information thereof, which has information on correspondence between each kanji of a heading and reading. , Among the same words with different notations, only the words with the most Kanji notation parts are registered, and marker information is added to the Hiragana notationable Kanji of the registered heading. It is checked whether or not the character string information includes katakana. If the input character string information includes katakana, the katakana part of the input character string information is converted to kanji or By using katakana or by replacing the hiragana part of the input character string information with hiragana, the candidate character string for the notation according to the conversion instruction in input When information is created and if the input character string information does not include katakana, all the kanji notation of the input character string information from the heading registered in the Kanji-mixed kana-kanji conversion dictionary is set to kanji and the marker A kana-kanji kana-kanji conversion method characterized by creating candidate character string information in which hiragana-expressible kanji parts provided with information are written in hiragana and outputting the created candidate character string information as conversion candidates.
【請求項7】 見出しの各漢字と読みとの対応付けに関
する情報を持つ漢字混じりかな漢字変換辞書と、 この漢字混じりかな漢字変換辞書から表記の異なる同一
語を検出する同一語検出手段と、 この同一語検出手段によって検出された表記の異なる同
一語の中で漢字表記部分の最も多い語について、他の表
記の語においてひらがな表記されている漢字にマーカ情
報を付与し、それ以外を削除する同一語併合手段とを具
備し、 表記の異なる同一語の中で漢字表記部分の最も多い語に
ついてのみ登録した漢字混じりかな漢字変換辞書を作成
することを特徴とする辞書作成装置。
7. A kanji-kana kana-kanji conversion dictionary having information on the correspondence between each kanji of a heading and a phonetic reading, a kanji-kana kana-kanji conversion dictionary for detecting the same word with different notations, and the same word Among the same words with different notations detected by the detection means, the most common word in kanji is given marker information to the kanji written in hiragana in other notations, and the rest is deleted. A dictionary creating device comprising: a means for creating a kanji conversion dictionary containing kanji mixed with only the word having the most kanji notation part among the same words having different notations.
【請求項8】 見出しの各漢字と読みとの対応付けに関
する情報を持つ漢字混じりかな漢字変換辞書において、 表記の異なる見出しごとに複数登録されている語があれ
ば、その登録されたいずれかの見出しでひらがな表記さ
れている漢字にマーカ情報を付与し、最も漢字表記が多
い語のみを残して他の異表記同一語を削除することによ
り、 表記の異なる同一語の中で漢字表記部分の最も多い語に
ついてのみ登録した漢字混じりかな漢字変換辞書を作成
することを特徴とする辞書作成方法。
8. A kanji-kana-kanji conversion dictionary having information on the correspondence between each kanji of a heading and its reading, if there are multiple words registered for each heading with a different notation, one of the registered headings Marker information is added to the kanji written in Hiragana, and only the word with the most kanji is left, and other words with different kanji are deleted. A dictionary creation method characterized by creating a kana-kanji conversion dictionary in which only kanji is registered.
JP7014491A 1995-01-31 1995-01-31 Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method Pending JPH08212210A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7014491A JPH08212210A (en) 1995-01-31 1995-01-31 Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7014491A JPH08212210A (en) 1995-01-31 1995-01-31 Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method

Publications (1)

Publication Number Publication Date
JPH08212210A true JPH08212210A (en) 1996-08-20

Family

ID=11862529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7014491A Pending JPH08212210A (en) 1995-01-31 1995-01-31 Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method

Country Status (1)

Country Link
JP (1) JPH08212210A (en)

Similar Documents

Publication Publication Date Title
JPH0256053A (en) Document preparing device
JPH08212210A (en) Document generation device, kana(japanese syllabary) mixed with kanji(chinese character)/kanji conversion method and dictionary generation device and its method
JP2621999B2 (en) Document processing device
JP3035061B2 (en) Kana-Kanji conversion device with schedule function
JPH0380363A (en) Document processor
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JPH08137863A (en) Method for chinese character mixed japanese syllabary and chinese character conversion and method and device for document preparation
JPH08339366A (en) Method and device for documentation
JPH1011433A (en) Method and device for homonym selection of japanese syllabary-chinese character conversion system
JPH08212212A (en) Documentation device and candidate output control method
JPH0922411A (en) Document processing method and its device
JPH08335217A (en) Reading converting method and document preparation device
JPH0394367A (en) Japanese input system
JPH0267676A (en) Chinese numeral conversion processor
JPH08194701A (en) Character processor
JPH0895971A (en) Document preparation device and kana/kanji conversion method
JPH10187700A (en) Document processor
JPH043243A (en) Kana to kanji converter
JPS62168263A (en) Kana-kanji mutual converter
JPH09179858A (en) Document preparation device and display method
JPS60138669A (en) Japanese document producer
JPH0335349A (en) Document processor with example display function
JPH028956A (en) Document processor
JPH03212762A (en) 'kana'/'kanji' converting device
JPH0468466A (en) Kana / kanji converting device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees