JPH05342194A - Continued kana/kanji clause conversion system - Google Patents

Continued kana/kanji clause conversion system

Info

Publication number
JPH05342194A
JPH05342194A JP4177511A JP17751192A JPH05342194A JP H05342194 A JPH05342194 A JP H05342194A JP 4177511 A JP4177511 A JP 4177511A JP 17751192 A JP17751192 A JP 17751192A JP H05342194 A JPH05342194 A JP H05342194A
Authority
JP
Japan
Prior art keywords
clause
kana
word
kanji
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4177511A
Other languages
Japanese (ja)
Inventor
Masaru Yokomori
優 横森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP4177511A priority Critical patent/JPH05342194A/en
Publication of JPH05342194A publication Critical patent/JPH05342194A/en
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To smoothly input Japanese by improving accuracy for the converted result of Japanese syllabary (KANA)/Chinese character (KANJI) conversion. CONSTITUTION:Word information corresponding to KANA character strings inputted from a data input part 1 through an index input part 2 is read from a dictionary file 8 and outputted to a clause extraction part 4 by a dictionary word read part 3. Based on the word information from the dictionary word read part 3, the clause extraction part 4 prepares 'clause' candidates and outputs the 'clause' candidates to a priority evaluation part 5. The priority evaluation part 5 evaluates the priority of the 'clause' candidates from the clause extraction part 4 by using the use frequency information of 'independent words' among those 'clause candidates' and the 'clause' candidate having the highest point is decided and outputted to a converted result output part 6. The converted result output part 6 displays the 'clause' candidate from the priority evaluation part 5 through a data output part 7 onto a screen.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】本発明は連文節かな漢字変換システムに関
し、特に連文節かな漢字変換システムにおける文節の区
切り処理に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a continuous sentence kana-kanji conversion system, and more particularly, to segment break processing in a continuous sentence kana-kanji conversion system.

【0002】[0002]

【従来技術】従来、連文節かな漢字変換システムにおい
ては、検索した「自立語」とこの自立語に付属する「付
属語」とから構成される『文節』の長さをプライオリテ
ィ評価の対象としている。
2. Description of the Related Art Conventionally, in a bunsetsu kana-kanji conversion system, the length of a "bunsetsu" composed of a retrieved "independent word" and an "adjunct word" attached to this independent word is targeted for priority evaluation.

【0003】日本語入力システムで提供される辞書は一
般向けに構成されているため、広範囲な種類の単語が格
納されている。したがって、辞書には個々のユーザにと
って必要のない単語や使用頻度の低い単語も数多く格納
されている。その結果、検索された「自立語」が的はず
れなものであることも多い。
Since the dictionary provided by the Japanese input system is constructed for the general public, a wide variety of words are stored. Therefore, the dictionary stores a large number of words that are not needed by individual users or that are rarely used. As a result, the retrieved "independent word" is often irrelevant.

【0004】しかしながら、プライオリティ評価を「自
立語」と「付属語」とから構成される『文節』の長さだ
けで行うと、検索された「自立語」の妥当性を直接評価
することができないため、誤った『文節』が作成されて
誤変換の原因となる。
However, if priority evaluation is performed only by the length of the "bunsetsu" composed of "independent word" and "adjunct word", the validity of the retrieved "independent word" cannot be directly evaluated. Therefore, an incorrect “bunsetsu” is created, which causes erroneous conversion.

【0005】また、『文節』を長く設定すればするほ
ど、プライオリティ評価において優位となるので、「付
属語」をむやみやたらに接続させる結果となり、この場
合も誤変換の原因となっている。
Further, the longer the "bunsetsu" is set, the more advantageous it is in priority evaluation. Therefore, the "adjunct word" is unnecessarily connected, which is a cause of erroneous conversion.

【0006】[0006]

【発明の目的】本発明は上記のような従来のものの問題
点を除去すべくなされたもので、かな漢字変換の変換結
果の精度を向上させることができ、日本語入力を円滑に
することができる連文節かな漢字変換システムの提供を
目的とする。
SUMMARY OF THE INVENTION The present invention has been made to eliminate the above-mentioned problems of the conventional ones, and can improve the accuracy of the conversion result of the kana-kanji conversion and facilitate the Japanese input. The purpose is to provide a kanji-kana-kanji conversion system.

【0007】[0007]

【発明の構成】本発明による連文節かな漢字変換システ
ムは、連文節で入力されたひらがな文字列を漢字かな交
じり文字列に変換する連文節かな漢字変換システムであ
って、単語各々の使用回数を示す使用頻度情報を前記単
語各々に対応して格納する格納手段と、前記格納手段に
格納された前記使用頻度情報に基づいて前記ひらがな文
字列に対する文節の区切りを決定するための評価情報を
作成する作成手段と、前記作成手段で作成された評価情
報を基に前記ひらがな文字列に対する前記文節の区切り
を行う手段とを設けたことを特徴とする。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The continuous sentence-kana-kanji conversion system according to the present invention is a continuous sentence-kana-kanji conversion system for converting a hiragana character string input in a continuous sentence clause into a kanji-kana kanji mixed character string. Storage means for storing each of the words, and creation means for creating evaluation information for determining a segment break for the hiragana character string based on the usage frequency information stored in the storage means; Means for separating the bunsetsu from the hiragana character string based on the evaluation information created by the creating means.

【0008】[0008]

【実施例】次に、本発明の一実施例について図面を参照
して説明する。
An embodiment of the present invention will be described with reference to the drawings.

【0009】図1は本発明の一実施例の構成を示すブロ
ック図である。図において、データ入力部1からひらが
な文字列が入力されると、該ひらがな文字列は見出し入
力部2を介して辞書単語読出し部3に出力される。ここ
で、データ入力部1からひらがな文字列がローマ字入力
あるいはカナ入力で入力されると、見出し入力部2はロ
ーマ字入力あるいはカナ入力で入力された文字列をひら
がな表記に変換する。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention. In the figure, when a Hiragana character string is input from the data input unit 1, the Hiragana character string is output to the dictionary word reading unit 3 via the index input unit 2. Here, when the hiragana character string is input from the data input unit 1 by roman character input or kana input, the headline input part 2 converts the character string input by roman character input or kana input into hiragana notation.

【0010】辞書単語読出し部3は見出し入力部2から
受取ったひらがな表記の文字列(以下見出しとする)に
対応する単語情報を辞書ファイル8から読出して文節抽
出部4に出力する。ここで、辞書ファイル8には「自立
語」に関する単語情報が格納されているので、辞書単語
読出し部3は見出し入力部2から受取った見出しによっ
て辞書ファイル8から読出すことができるすべての「自
立語」を検索する。
The dictionary word reading unit 3 reads word information corresponding to the character string in hiragana notation (hereinafter referred to as a headline) received from the headline input unit 2 from the dictionary file 8 and outputs it to the phrase extracting unit 4. Here, since the dictionary file 8 stores word information regarding “independent words”, the dictionary word reading unit 3 can read all “independent words” that can be read from the dictionary file 8 by the headline received from the headline input unit 2. Search for "word".

【0011】文節抽出部4は辞書単語読出し部3から受
取った単語情報を基に『文節』候補を作成する。すなわ
ち、文節抽出部4は辞書単語読出し部3で検索された
「自立語」に対して直後の文字が接続される得るか否
か、つまり直後の文字が「付属語」になり得るか否かを
チェックし、そのチェック結果を基に作成した『文節』
候補をプライオリティ評価部5に出力する。
The phrase extracting unit 4 creates "bunsetsu" candidates based on the word information received from the dictionary word reading unit 3. That is, the phrase extracting unit 4 determines whether or not the next character can be connected to the “independent word” searched by the dictionary word reading unit 3, that is, whether or not the next character can be an “adjunct”. Is checked and "bunsetsu" created based on the check result
The candidates are output to the priority evaluation unit 5.

【0012】プライオリティ評価部5は文節抽出部4か
ら受取った『文節』候補のプライオリティ評価を、その
『文節』候補内の「自立語」の使用頻度情報を用いて行
う。プライオリティ評価部5は個々の単語の使用頻度情
報から得られるポイントが最も高くなるような組合せを
選択することで採用する『文節』候補を決定し、その
『文節』候補を変換結果出力部6に出力する。変換結果
出力部6はプライオリティ評価部5から受取った『文
節』候補をデータ出力部7を介して図示せぬ画面上に表
示する。
The priority evaluation unit 5 evaluates the priority of the "bunsetsu" candidate received from the phrase extraction unit 4 by using the usage frequency information of the "independent word" in the "bunsetsu" candidate. The priority evaluation unit 5 determines a “bunsetsu” candidate to be adopted by selecting a combination that gives the highest points obtained from the usage frequency information of each word, and outputs the “bunsetsu” candidate to the conversion result output unit 6. Output. The conversion result output unit 6 displays the “bunsetsu” candidates received from the priority evaluation unit 5 on a screen (not shown) via the data output unit 7.

【0013】図2は図1のデータ入力部1からのローマ
字入力例を示す図であり、図3は図1のデータ入力部1
からのカナ入力例を示す図である。これらの図において
は、「今日宮崎まで行く」という文章を、ローマ字入力
すると「KYOUMIYAZAKIMADEIKU」と
なり、カナ字入力すると「キョウミヤサ゛キマテ゛イ
ク」となることを示している。
FIG. 2 is a diagram showing an example of Roman character input from the data input unit 1 of FIG. 1, and FIG. 3 is a data input unit 1 of FIG.
It is a figure which shows the example of kana input from. In these figures, the text "Go to Miyazaki today" is shown as "KYOUMIYAZAKI MADEIKU" in romaji, and "Kyoumiyazaki" as kana.

【0014】図4は図1の見出し入力部2によるひらが
な表記例を示す図である。図において、見出し入力部2
はデータ入力部1からの「KYOUMIYAZAKIM
ADEIKU」や「キョウミヤサ゛キマテ゛イク」を、
「きょうみやざきまでいく」とひらがな表記に変換す
る。
FIG. 4 is a diagram showing an example of Hiragana notation by the index input unit 2 of FIG. In the figure, the headline input unit 2
From the data input section 1 "KYOUMIYAZAKI M
"ADEIKU" and "Kyomiyazaki Made"
Convert to Hiragana notation such as "Go to Kyomi and Zaki".

【0015】図5は図1の辞書単語読出し部3および文
節抽出部4による処理例を示す図である。図5(a)は
図4のひらがな表記を基に辞書単語読出し部3が検索し
て得た単語情報例を示している。図5(b)は図5
(a)の単語情報例を基に文節抽出部4が作成した『文
節』候補例を示している。
FIG. 5 is a diagram showing an example of processing by the dictionary word reading unit 3 and the phrase extracting unit 4 of FIG. FIG. 5A shows an example of word information obtained by the dictionary word reading unit 3 based on the Hiragana notation of FIG. 5 (b) is shown in FIG.
An example of "bunsetsu" candidates created by the phrase extraction unit 4 based on the word information example of (a) is shown.

【0016】図5(a)においては、図4のひらがな表
記「きょうみやざきまでいく」を、「き」、「きょ」、
「きょう」、「きょうみ」、「う」、「うみ」、
「み」、「みや」、「みやざき」、「や」、「やざ
き」、「ざ」、「ま」、「まで」、「で」、「い」、
「く」という見出し情報に区切って検索した場合を示し
ている。この検索にしたがって、上記の見出し情報各々
に対応する単語表記情報と使用頻度情報とが辞書単語読
出し部3によって辞書ファイル8から読出され、文節抽
出部4に出力される。
In FIG. 5 (a), the hiragana notation "Kyomi and Zakigo Iku" in FIG. 4 is replaced with "ki", "kyo",
"Today", "Today", "U", "Umi",
"Mi", "Miya", "Miyazaki", "Ya", "Yazaki", "Za", "Ma", "To", "De", "I",
It shows a case where the search is performed by dividing the heading information into "ku". According to this search, the word notation information and the usage frequency information corresponding to each of the above-mentioned headline information are read from the dictionary file 8 by the dictionary word reading unit 3 and output to the phrase extracting unit 4.

【0017】図5(b)においては、図5(a)の単語
表記情報で示される「自立語」のみで、あるいは「自立
語」に直後の文字を接続して作成した『文節』候補を示
している。これら『文節』候補は夫々対応する「自立
語」および使用頻度情報とともにプライオリティ評価部
5に出力される。
In FIG. 5 (b), "bunsetsu" candidates created by only the "independent word" indicated by the word notation information in FIG. 5 (a) or by connecting the immediately following character to the "independent word" are selected. Shows. These "bunsetsu" candidates are output to the priority evaluation unit 5 together with the corresponding "independent words" and usage frequency information.

【0018】図6〜図11は図1のプライオリティ評価
部5によるプライオリティ評価の結果の例を示してい
る。これらの図においては、図4のひらがな表記「きょ
うみやざきまでいく」をどのように区切っているかを示
す見出し情報と、それに対応する『文節』候補および使
用頻度情報と、その使用頻度情報を累算して得た合計ポ
イントと、ひらがな表記をいくつに区切ったかを示す文
節数と、「合計ポイント÷文節数」で得た使用頻度の平
均値からなるプライオリティとが示されている。
FIGS. 6 to 11 show examples of the results of priority evaluation by the priority evaluation unit 5 of FIG. In these figures, the heading information indicating how the hiragana notation “Kyomi and Zakigo Iku” in FIG. 4 is divided, corresponding “bunsetsu” candidates and usage frequency information, and the usage frequency information are accumulated. The total points thus obtained, the number of clauses indicating how many hiragana notations are divided, and the priority consisting of the average value of the usage frequencies obtained by “total points / number of clauses” are shown.

【0019】図6においては、図4のひらがな表記「き
ょうみやざきまでいく」を「き」、「ょ」、「う」、
「み」、「や」、「ざ」、「き」、「ま」、「で」、
「い」、「く」と細かく区切った場合を示している。こ
の場合、『文節』候補各々に対応する使用頻度情報を累
算して得た合計ポイントが「47」、文節数が「11」
となるので、プライオリティは47÷11=4.3とな
る。
In FIG. 6, the hiragana notation “go to Kyomi and Zaki” in FIG. 4 is replaced with “ki”, “yo”, “u”,
"Mi", "ya", "za", "ki", "ma", "de",
It shows the case where it is divided into "i" and "ku". In this case, the total points obtained by accumulating the usage frequency information corresponding to each “bunsetsu” candidate is “47”, and the number of phrases is “11”.
Therefore, the priority is 47/11 = 4.3.

【0020】図7においては、図4のひらがな表記「き
ょうみやざきまでいく」を「きょう」、「みやざき」、
「まで」、「いく」と区切った場合を示している。この
場合、合計ポイントが「33」、文節数が「4」となる
ので、プライオリティは33÷4=8.3となる。
In FIG. 7, the hiragana notation “go to Kyomi and Zaki” in FIG. 4 is replaced with “Kyo”, “Miyazaki”,
It shows the case where it is divided into “up” and “go”. In this case, since the total points are “33” and the number of phrases is “4”, the priority is 33/4 = 8.3.

【0021】図8においては、図4のひらがな表記「き
ょうみやざきまでいく」を「きょう」、「みやざきま
で」、「いく」と区切った場合を示している。この場
合、合計ポイントが「28」、文節数が「3」となるの
で、プライオリティは28÷3=9.3となる。
FIG. 8 shows a case where the hiragana notation “Kyomi and Zaki to go” in FIG. 4 is divided into “Kyo”, “to Miyazaki” and “Iku”. In this case, since the total points are “28” and the number of phrases is “3”, the priority is 28/3 = 9.3.

【0022】図9においては、図4のひらがな表記「き
ょうみやざきまでいく」を「きょう」、「みやざきま
で」、「いく」と区切った場合を示している。この場
合、「きょう」という見出し情報に対して図8で選択さ
れた「今日」よりも使用頻度の低い「京」が選択されて
いるので、合計ポイントが「21」、文節数が「3」と
なり、プライオリティは21÷3=7となる。
FIG. 9 shows a case where the hiragana notation “Kyomi and Zaki to go” in FIG. 4 is divided into “Kyo”, “to Miyazaki” and “Iku”. In this case, “Kyo” which is used less frequently than “Today” selected in FIG. 8 is selected for the heading information “Kyo”, so the total points are “21” and the number of phrases is “3”. And the priority is 21/3 = 7.

【0023】図10においては、図4のひらがな表記
「きょうみやざきまでいく」を「きょうみ」、「やざき
まで」、「いく」と区切った場合を示している。この場
合、「興味」の使用頻度は高いが、「矢崎」の使用頻度
が低いため、合計ポイントが「25」、文節数が「3」
となり、プライオリティは25÷3=8.3となる。
尚、この図10に示すパターンが従来の連文節かな漢字
変換で多く見られる出力パターンである。
FIG. 10 shows a case where the hiragana notation “Kyomi and Zaki to Iku” in FIG. 4 is divided into “Kyomi”, “Yazaki to”, and “Iku”. In this case, the frequency of use of "interest" is high, but the frequency of use of "Yazaki" is low, so the total points are "25" and the number of phrases is "3".
And the priority is 25/3 = 8.3.
The pattern shown in FIG. 10 is an output pattern often seen in the conventional kanji-kana-kanji conversion.

【0024】図11においては、図4のひらがな表記
「きょうみやざきまでいく」を「きょうみや」、
「ざ」、「き」、「まで」、「いく」と区切って場合を
示している。この場合、第一文節をできるだけ長くとっ
ているが、「ざき」が辞書ファイル8に存在しないため
に第二文節以降をうまく区切ることができず、使用頻度
の低い単語を選択せざるを得なくなっている。したがっ
て、合計ポイントが「39」、文節数が「5」となるの
で、プライオリティは39÷5=7.8となる。
In FIG. 11, the hiragana notation “Kyomi and Zaki go to” in FIG. 4 is replaced with “Kyomiya”,
The case is divided into "za", "ki", "up", and "iku". In this case, the first phrase is taken as long as possible, but since "Zaki" does not exist in the dictionary file 8, the second and subsequent phrases cannot be well separated, and a word with a low frequency of use must be selected. ing. Therefore, since the total points are "39" and the number of phrases is "5", the priority is 39/5 = 7.8.

【0025】上記の図6〜図11に示す処理結果におい
ては、図8に示す区切り方のプライオリティが最も高く
なるので、図8に示す『文節』候補が変換結果出力部6
からデータ出力部7を介して画面上に表示される。
In the processing results shown in FIGS. 6 to 11, since the priority of the delimiter shown in FIG. 8 is the highest, the “bunsetsu” candidate shown in FIG.
Is displayed on the screen via the data output unit 7.

【0026】このように、単語情報各々に対応して辞書
ファイル8に格納された使用頻度情報を用いてプライオ
リティ評価部5で文節の区切りを決定することによっ
て、使用頻度の高い単語を優先的に使用することが可能
となる。よって、かな漢字変換の変換結果の精度を向上
させることができ、日本語入力を円滑にすることができ
る。
As described above, the priority evaluation unit 5 determines the segment breaks by using the usage frequency information stored in the dictionary file 8 corresponding to each word information, thereby giving priority to words with high usage frequency. Can be used. Therefore, the accuracy of the conversion result of the Kana-Kanji conversion can be improved, and Japanese input can be smoothly performed.

【0027】[0027]

【発明の効果】以上説明したように本発明によれば、単
語各々の使用回数を示す使用頻度情報を格納しておき、
この格納された使用頻度情報に基づいてひらがな文字列
に対する文節の区切りを決定するための評価情報を作成
し、その作成された評価情報を基にひらがな文字列に対
する文節の区切りを行うようにすることによって、かな
漢字変換の変換結果の精度を向上させることができ、日
本語入力を円滑にすることができるという効果がある。
As described above, according to the present invention, use frequency information indicating the number of times each word is used is stored,
Based on this stored usage frequency information, create evaluation information for determining the punctuation of the hiragana character string, and perform the punctuation of the hiragana character string based on the created evaluation information. With this, it is possible to improve the accuracy of the conversion result of the kana-kanji conversion, and it is possible to smoothly input Japanese.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing a configuration of an exemplary embodiment of the present invention.

【図2】図1のデータ入力部からのローマ字入力例を示
す図である。
FIG. 2 is a diagram showing an example of Roman character input from a data input unit in FIG.

【図3】図1のデータ入力部からのカナ入力例を示す図
である。
3 is a diagram showing an example of kana input from the data input unit of FIG.

【図4】図1の見出し入力部によるひらがな表記例を示
す図である。
FIG. 4 is a diagram showing an example of Hiragana notation written by the index input unit of FIG. 1.

【図5】図1の辞書単語読出し部および文節抽出部によ
る処理例を示す図である。
5 is a diagram showing a processing example by a dictionary word reading unit and a phrase extracting unit of FIG. 1;

【図6】図1のプライオリティ評価部によるプライオリ
ティ評価の結果の例を示している。
6 shows an example of a result of priority evaluation by a priority evaluation unit of FIG.

【図7】図1のプライオリティ評価部によるプライオリ
ティ評価の結果の例を示している。
FIG. 7 shows an example of the result of priority evaluation by the priority evaluation unit of FIG.

【図8】図1のプライオリティ評価部によるプライオリ
ティ評価の結果の例を示している。
8 shows an example of a result of priority evaluation by the priority evaluation section of FIG.

【図9】図1のプライオリティ評価部によるプライオリ
ティ評価の結果の例を示している。
9 shows an example of a result of priority evaluation by a priority evaluation unit of FIG.

【図10】図1のプライオリティ評価部によるプライオ
リティ評価の結果の例を示している。
10 shows an example of a result of priority evaluation by the priority evaluation unit of FIG.

【図11】図1のプライオリティ評価部によるプライオ
リティ評価の結果の例を示している。
11 shows an example of a result of priority evaluation by the priority evaluation section of FIG.

【符号の説明】[Explanation of symbols]

2 見出し入力部 3 辞書単語読出し部 4 文節抽出部 5 プライオリティ評価部 8 辞書ファイル 2 heading input part 3 dictionary word reading part 4 phrase extraction part 5 priority evaluation part 8 dictionary file

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 連文節で入力されたひらがな文字列を漢
字かな交じり文字列に変換する連文節かな漢字変換シス
テムであって、単語各々の使用回数を示す使用頻度情報
を前記単語各々に対応して格納する格納手段と、前記格
納手段に格納された前記使用頻度情報に基づいて前記ひ
らがな文字列に対する文節の区切りを決定するための評
価情報を作成する作成手段と、前記作成手段で作成され
た評価情報を基に前記ひらがな文字列に対する前記文節
の区切りを行う手段とを設けたことを特徴とする連文節
かな漢字変換システム。
1. A continuous sentence kana-kanji conversion system for converting a hiragana character string input in a continuous sentence clause into a kanji kana kanji mixture character string, wherein usage frequency information indicating the number of times each word is used is stored in correspondence with each word. Storing means, creating means for creating evaluation information for determining a punctuation of the hiragana character string based on the use frequency information stored in the storing means; and evaluation information created by the creating means. And a means for separating the bunsetsu from the hiragana character string on the basis thereof.
【請求項2】 前記作成手段に、前記格納手段の前記使
用頻度情報を基に前記文節の区切り毎の使用頻度を抽出
する抽出手段と、前記抽出手段によって抽出された前記
文節の区切り毎の使用頻度を累算する累算手段と、前記
累算手段の累算結果から前記ひらがな文字列における前
記文節の区切り毎の平均値を算出する算出手段とを設
け、前記算出手段で算出された前記平均値を前記評価情
報としたことを特徴とする請求項1記載の連文節かな漢
字変換システム。
2. The extracting means for extracting, in the creating means, a usage frequency for each break of the phrase based on the usage frequency information of the storage means, and a use for each break of the phrase extracted by the extracting means. An accumulating means for accumulating frequencies and a calculating means for calculating an average value for each segment of the phrase in the hiragana character string from the accumulation result of the accumulating means are provided, and the average calculated by the calculating means The continuous sentence kana-kanji conversion system according to claim 1, wherein a value is used as the evaluation information.
JP4177511A 1992-06-11 1992-06-11 Continued kana/kanji clause conversion system Pending JPH05342194A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4177511A JPH05342194A (en) 1992-06-11 1992-06-11 Continued kana/kanji clause conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4177511A JPH05342194A (en) 1992-06-11 1992-06-11 Continued kana/kanji clause conversion system

Publications (1)

Publication Number Publication Date
JPH05342194A true JPH05342194A (en) 1993-12-24

Family

ID=16032187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4177511A Pending JPH05342194A (en) 1992-06-11 1992-06-11 Continued kana/kanji clause conversion system

Country Status (1)

Country Link
JP (1) JPH05342194A (en)

Similar Documents

Publication Publication Date Title
KR100552085B1 (en) Reduced keyboard disambiguating system
EP0394633A2 (en) Method for language-independent text tokenization using a character categorization
JPH10326275A (en) Method and device for morpheme analysis and method and device for japanese morpheme analysis
JP2007042146A (en) Method and system of creating and using chinese data and user-corrected data
JP2011008784A (en) System and method for automatically recommending japanese word by using roman alphabet conversion
JPH11312046A (en) Input system for generating input sequence of voice kana character
JPH05342194A (en) Continued kana/kanji clause conversion system
JP2017156890A (en) Synonym detecting device, synonym detecting method and synonym detection computer program
KR101777141B1 (en) Apparatus and method for inputting chinese and foreign languages based on hun min jeong eum using korean input keyboard
JP4047895B2 (en) Document proofing apparatus and program storage medium
KR20050062356A (en) High-speed input apparatus for korean address string and its method
JPH08115330A (en) Method for retrieving similar document and device therefor
JP4047894B2 (en) Document proofing apparatus and program storage medium
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
EP1691298B1 (en) Method and system of creating and using Chinese language data and user-corrected data
JPS60207948A (en) "kana"/"kanji" conversion processor
JPH0785040A (en) Inscription nonuniformity detecting method and kana/ kanji converting method
JP2837010B2 (en) Kana-Kanji conversion processor
JPH0728800A (en) Method and device for character processing
JPH05282290A (en) Sentence preparation supporting device
KR960015316A (en) Korean-English automatic switching method
JPH0610804B2 (en) Kana-Kanji converter
JPH03229353A (en) Kana/kanji converter
JPH01128157A (en) Japanese word document producer
JPH05174018A (en) Kana/kanji converter