JPH0683807A - Document preparing device - Google Patents

Document preparing device

Info

Publication number
JPH0683807A
JPH0683807A JP4232403A JP23240392A JPH0683807A JP H0683807 A JPH0683807 A JP H0683807A JP 4232403 A JP4232403 A JP 4232403A JP 23240392 A JP23240392 A JP 23240392A JP H0683807 A JPH0683807 A JP H0683807A
Authority
JP
Japan
Prior art keywords
phrase
clause
conversion
kana
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4232403A
Other languages
Japanese (ja)
Inventor
Yukihiro Karasaki
幸弘 唐崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4232403A priority Critical patent/JPH0683807A/en
Publication of JPH0683807A publication Critical patent/JPH0683807A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

PURPOSE:To improve operability by reducing the generation of clause segmenting error and improving the probability of conversion to a sentence desirable for a user by learning clause segmenting information. CONSTITUTION:When a character string is inputted from an input part 11 and KANA (Japanese syllabary)/KANJI (Chinese character) conversion is instructed, a KANA/KANJI conversion control part 13 performs KANA/KANJI conversion processing to the inputted character string, stores the result in a candidate memory 17 and displays the preferential converted system at a display part 23. When the segmentation of the clause is instructed at such a time, the segmentation control of the clause is performed under the control of a clause segmentation control part 14. A clause learning control part 18 refers to a clause learning dictionary 19, prepares the converted system according to the segmented clause and outputs the preferential system. When the converted system is fixed after the clause is segmented, the clause learning dictionary 19 stores clause cut information composed of one part, part of speech and connection information, etc., of reading on the front side rather than the designated segmentation and the reading of the following clause as learning information.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文節切り直し機能を備
えた文書作成装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a document preparation device having a phrase recutting function.

【0002】[0002]

【従来の技術】文書作成装置において、複数の文節を含
む文字列を一括してかな漢字変換する場合、例えば「か
ぞくとはなれてくらす」という文字列の場合には、 (a)「かぞくとは/なれて/くらす」 (b)「かぞくと/はなれて/くらす」 の文節切断例が考えられる。
2. Description of the Related Art In a document creation apparatus, when a character string including a plurality of clauses is converted into Kana-Kanji characters at once, for example, in the case of a character string "Kazoku hanare kurashi", (a) A possible example is the phrase cutting "Kutaku / Hanare / Living" (b) "Kakuzoku / Harelet / Living".

【0003】文書作成装置は、内部に辞書として記憶し
ている単語情報、助詞などの付属語の情報、用言の活用
の情報などの情報に従って、例えば最長一致法等の方法
で(a)か(b)のいずれかの文節切断を行なって変換
系列を作成する。従って、例えば、(b)の文節切断を
期待して文字列の入力を行なったにも拘らず、(a)の
切断が行なわれてしまう場合がある。
According to information such as word information stored in a dictionary as an internal dictionary, information about auxiliary words such as particles, and information on usage of adjectives, the document creation apparatus uses, for example, the longest matching method (a). A conversion sequence is created by performing any clause break of (b). Therefore, for example, even if the character string is input in the expectation of the phrase breakage of (b), the disconnection of (a) may be performed.

【0004】このような対策として従来の文書作成装置
では、文節切断の位置の違いにより正しいかな漢字変換
が行なわれなかった場合に、ユーザーの望むかな漢字変
換がなされるように、文節を切り直す機能を備えてい
る。
As a countermeasure against this, the conventional document creating apparatus has a function of re-cutting the clauses so that the Kana-Kanji conversion desired by the user is performed when the correct Kana-Kanji conversion is not performed due to the difference in the position of the clause break. I have it.

【0005】例えば「かぞくとはなれてくらす」と文字
列を入力して、「家族とは慣れて暮らす」と変換された
場合、これを「家族と離れて暮らす」の文にするには、
最初の文節である「かぞくと」の部分を指定して文節切
り直しを指示する。これにより「かぞくと」の部分と
「はなれてくらす」の部分がそれぞれ再度かな漢字変換
され、「家族と離れて暮らす」の文とすることができ
る。
[0005] For example, when a character string "Kazoku is far away" is entered and converted to "Living with a family," it becomes a sentence "Living with a family." ,
Specify the first phrase, "kazokuto," to instruct the phrase to be recut. As a result, the "kazokuto" part and the "haarete kurusu" part are converted into kana-kanji characters again, and the sentence becomes "living away from family".

【0006】[0006]

【発明が解決しようとする課題】従来の文書作成装置
は、文節切り直しを行なった場合は、切り直された最初
の、つまり、前の文節を1つの単語とみなして辞書をサ
ーチするようにしており、従って、複合語を含んで文節
切り直しを行なった場合は、該当漢字をサーチできず、
正しいかな漢字変換が行なわれない。
In the conventional document creating apparatus, when the phrase is re-cut, the first re-cutting, that is, the previous phrase is regarded as one word and the dictionary is searched. Therefore, if you perform a phrase recut including a compound word, the corresponding kanji cannot be searched,
Correct Kana-Kanji conversion is not performed.

【0007】例えば「えもじのにゅうりょく」と文字列
を入力して、「絵も字の入力」と変換された場合、これ
を「絵文字の入力」にするには、最初の文節である
「え」の部分を指定して文節切り直しを指示する。これ
により「え」の部分と「もじのにゅうりょく」の部分が
それぞれ再度かな漢字変換され、「絵文字の入力」とす
ることができる。しかし、「えもじの」を指定して文節
切り直しを行なうと、正しく変換されない。これは
「え」と「もじの」のそれぞれが文節であり、「えもじ
の」では2文節となって切り直し位置より前の部分、つ
まり「えもじの」の部分が漢字に変換されないためであ
る。
For example, when a character string "Emoji no Nyuryoku" is input and converted into "Emoji input", this can be changed to "Emoji input" by the first clause. Specify a certain "e" part to instruct the phrase recutting. As a result, the “e” part and the “moji no nikyuryuku” part are converted into kana-kanji characters again and can be used as “input of pictographs”. However, if the phrase is shuffled by specifying "Emoji no", it will not be converted correctly. This is because each of "E" and "Momoji" is a bunsetsu, and in "Emoji no", there are two bunsetsu, so the part before the recut position, that is, "Emoji no", is not converted to Kanji. Is.

【0008】また、接頭語や接尾語も1文節とみなされ
るため、次のような例も発生する。例えば「こうせいの
うひんのかいはつ」と文字列を入力して、「構成納品の
開発」と変換された場合、これを「高性能品の開発」に
したい場合は、「こう」で指定して文節切り直しを指示
する。これにより「こう」の部分と「せいのうひんのか
いはつ」の部分がそれぞれ再度かな漢字変換され、「高
性能品の開発」とすることができる。しかし、「こうせ
いのう」を指定して文節切り直しを行なうと、複合語を
含む2文節の指定となり、切り直し指定した「こうせい
のう」の部分が漢字に変換されない。
Further, since the prefix and the suffix are also regarded as one clause, the following example also occurs. For example, if you enter a character string such as "Kousei no Uhin no Kaihatsu" and it is converted to "Development of component delivery", if you want to change it to "Development of high performance product", specify with "Kou" And instruct to re-cut the phrase. As a result, the "Kou" and "Seino Uhin no Kaihatsu" parts are converted into kana-kanji characters again, and "high-performance product development" can be achieved. However, if the phrase is re-chosen by specifying "Koseinou", two phrases including a compound word are designated, and the "Kosei-inou" part designated by recutting is not converted into Kanji.

【0009】上記のように従来の文書作成装置では、最
初の1文節を単位指定して文節切り直しを指示しなけれ
ばならず、複合語を含んだ文節を指定して文節切り直し
を指示した場合は、切り直し指定した前側の部分が漢字
に変換されず、かな漢字変換が確実に行なわれないとい
う問題があった。
As described above, in the conventional document creating apparatus, the first one phrase must be designated as a unit to instruct the phrase reshuffling, and the phrase including the compound word must be designated to instruct the phrase reshuffling. In this case, there was a problem that the front part specified to be re-cut was not converted to kanji and kana-kanji conversion was not performed reliably.

【0010】本発明は上記の問題を解決するためになさ
れたもので、複合語を含んで文節の切り直しを行なった
場合でも、その学習によってユーザーの望むかな漢字変
換を確実に行なうことができる文書作成装置を提供する
ことを目的とする。
The present invention has been made in order to solve the above problem, and even if a phrase is re-cut including a compound word, the learning can surely perform the kana-kanji conversion that the user desires. An object is to provide a producing device.

【0011】[0011]

【課題を解決するための手段】本発明に係る文書作成装
置は、複数の文節を含む読みの文字列を切断可能な文節
の候補に切って漢字混じり文の変換系列を作成するかな
漢字変換手段と、複合語を含む前側の読みとこれに続く
後の文節の読みの一部、品詞、接続情報等からなる文節
切断情報を記憶した文節学習辞書と、この文節学習辞書
を参照し、上記かな漢字変換手段により変換された変換
系列の中から優先すべき系列を選択して出力する手段
と、この手段より出力される変換系列に対し切れ目を指
定して文節切り直しを指示する手段と、この手段により
指定された切れ目により上記文節学習辞書を参照して文
節を切り直す文節切り直し手段と、この手段による文節
切り直し後、上記指定された切れ目より前側の読みと、
これに続く後の文節の読みの一部、品詞、接続情報等か
らなる文節切断情報により上記文節学習辞書の記憶内容
を更新する学習手段とを備えたことを特徴とする。
A document creating apparatus according to the present invention is a kana-kanji converting means for creating a conversion sequence of kanji-mixed sentences by cutting a reading character string including a plurality of phrases into severable bunsetsu candidates. , Kana-Kanji conversion by referring to this phrase learning dictionary and the phrase learning dictionary that stores the phrase reading information that contains the compound reading and the following part of the reading of the following phrase, part of speech, connection information, etc. Means for selecting and outputting a sequence to be prioritized from the conversion sequences converted by the means, means for designating a break in the conversion sequence output by this means and instructing the phrase re-sizing, and this means A phrase re-slicing means for re-slicing a phrase by referring to the phrase learning dictionary according to a specified break, and a re-segmentation by this means, and a reading before the specified break,
It is characterized by further comprising learning means for updating the stored contents of the phrase learning dictionary according to the phrase cutting information including part of the subsequent phrase reading, part of speech, connection information, and the like.

【0012】[0012]

【作用】入力部より文字列を入力し、かな漢字変換を指
示すると、かな漢字変換手段は、入力された文字列を切
断可能な文節の候補に切って漢字混じり文の変換系列を
作成する。そして、この変換系列の中から優先すべき系
列を文節学習辞書を参照して選択し表示部に表示する。
このとき文節が誤って切られて望む変換文が得られない
ときは、切れ目を指定して文節の切り直しを指示する。
この文節の切り直しが指示されると、文節学習辞書を参
照し、指定された切れ目より前側に複合語を含む新たな
変換系列を作成する。そして、この新たな変換系列が確
定すると、上記指定された切れ目より前側の読みと、こ
れに続く後の文節の読みの一部と、その品詞及び接続情
報等からなる文節切断情報により上記文節学習辞書の記
憶内容を更新する。
When a character string is input from the input unit and a kana-kanji conversion instruction is given, the kana-kanji conversion means cuts the input character string into severable phrase candidates and creates a conversion sequence of kanji-mixed sentences. Then, a sequence to be prioritized is selected from the converted sequences by referring to the phrase learning dictionary and displayed on the display unit.
At this time, if the phrase is accidentally cut and the desired conversion sentence cannot be obtained, a break is specified and the phrase is recut.
When this bunsetsu reshuffle is instructed, the bunsetsu learning dictionary is referenced, and a new conversion sequence including a compound word is created before the specified break. Then, when this new conversion sequence is confirmed, the phrase learning is performed based on the reading before the specified break, a part of the reading of the succeeding phrase that follows the break, and the phrase cutting information including the part of speech and connection information. Update the memory contents of the dictionary.

【0013】そして、新たに読みの文字列が入力された
ときに、上記文節学習辞書を参照して文節の切断が行な
われるので、文節の切り誤りの発生が非常に少なくな
り、ユーザーの望む文への変換確率を高くでき、操作性
を著しく改善することができる。
When a new reading character string is input, the bunsetsu learning dictionary is referenced to cut the bunsetsu, so that the occurrence of bunsetsu error is extremely reduced, and the sentence desired by the user is reduced. The conversion probability can be increased, and the operability can be significantly improved.

【0014】[0014]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

【0015】図1は本発明の一実施例に係る文書作成装
置の構成を示すブロック図である。図1において、入力
部11は文書作成に必要な各種の情報を入力するための
キーボードである。この入力部11には、「文字」キ
ー、「数値」キー等の他、「変換/次候補」キー、「選
択/実行」キー、「文節切り直し」キー等の各種ファン
クションキーが設けられている。上記入力部11からの
各種入力情報は、入力制御部12を介してかな漢字変換
制御部13に入力される。上記入力制御部12及びかな
漢字変換制御部13には、文節切り直し制御部14が接
続される。これらの入力制御部12、漢字変換制御部1
3及び文節切り直し制御部14には、RAM15が接続
される。このRAM15には、例えば文節切り直し位置
を一時的に記憶するエリア15a,作成された文書情報
を記憶する文書情報エリア15b等の各種のエリアが設
けられる。
FIG. 1 is a block diagram showing the arrangement of a document creating apparatus according to an embodiment of the present invention. In FIG. 1, an input unit 11 is a keyboard for inputting various kinds of information necessary for creating a document. The input unit 11 is provided with various function keys such as a "conversion / next candidate" key, a "select / execute" key, and a "phrase recut" key in addition to the "character" key, the "numerical value" key, and the like. There is. Various input information from the input unit 11 is input to the Kana-Kanji conversion control unit 13 via the input control unit 12. A phrase recutting control unit 14 is connected to the input control unit 12 and the Kana-Kanji conversion control unit 13. These input control unit 12, Kanji conversion control unit 1
The RAM 15 is connected to the 3 and the phrase recut control section 14. The RAM 15 is provided with various areas such as an area 15a for temporarily storing a phrase recutting position and a document information area 15b for storing created document information.

【0016】上記かな漢字変換制御部13は、かな漢字
変換辞書16を参照してかな漢字変換を行ない、作成し
た文をRAM15の文書情報エリア15bに記憶する。
かな漢字変換辞書16には、読み、その読みに対応する
単語(変換語)、その単語の文法情報の他、例えば単語
がどのような意味を持つのかを示す意味情報が記憶され
ている。上記文節切り直し制御部14は、文節の切り直
し指示が与えられた場合に、文節の切り直し制御を行な
う。
The kana-kanji conversion control unit 13 refers to the kana-kanji conversion dictionary 16 to perform kana-kanji conversion, and stores the created sentence in the document information area 15b of the RAM 15.
The kana-kanji conversion dictionary 16 stores reading, a word (converted word) corresponding to the reading, grammatical information of the word, and semantic information indicating, for example, what the word means. The bunsetsu recutting control unit 14 performs bunsetsu recutting control when a bunsetsu recutting instruction is given.

【0017】また、上記かな漢字変換制御部13には、
候補メモリ17、文節学習制御部18が接続される。候
補メモリ17は、入力文字列に対する文節候補及びこの
文節候補を関連性の高い順に連結した変換系列を記憶す
る。文節学習制御部18は、文節学習辞書19を参照し
て入力文字列に対する優先すべき文節を判断して複数の
変換系列を作成すると共に、文節学習辞書19に学習す
べき文節切断情報の登録を行なう。
Further, the Kana-Kanji conversion control unit 13 includes:
The candidate memory 17 and the phrase learning control unit 18 are connected. The candidate memory 17 stores a phrase candidate for the input character string and a conversion sequence in which the phrase candidates are connected in descending order of relevance. The bunsetsu learning control unit 18 refers to the bunsetsu learning dictionary 19 to determine a bunsetsu to be prioritized for the input character string, creates a plurality of conversion sequences, and registers the bunsetsu cutting information to be learned in the bunsetsu learning dictionary 19. To do.

【0018】上記かな漢字変換制御部13は、文書情報
エリア15bに記憶した文書情報を表示制御部21に出
力する。表示制御部21は、かな漢字変換制御部13か
ら送られてくる文書情報等を表示用メモリ22に描画
し、その画像データをバックライト付きLCDパネル等
の表示部23に表示する。
The kana-kanji conversion control unit 13 outputs the document information stored in the document information area 15b to the display control unit 21. The display control unit 21 draws the document information and the like sent from the Kana-Kanji conversion control unit 13 in the display memory 22, and displays the image data on the display unit 23 such as a backlit LCD panel.

【0019】文節学習辞書19には、図2に示すように
前側の複合語を含む文節と後の文節との区切りを示す文
節切断情報として、前側の複合語を含む文節の読みと、
後の文節の読みの一部例えば語幹の読み、品詞、接続情
報、その他の情報が登録されている。図2では、前側の
読みが「えもじの」、後の文節の読みが「にゅうりょ
く」の場合等を例として示している。
As shown in FIG. 2, the bunsetsu learning dictionary 19 reads the bunsetsu including the compound word on the front side as bunsetsu cutting information indicating a break between the bunsetsu containing the compound word on the front side and the bunsetsu word on the back side.
A part of the reading of the later clause, for example, reading of the stem, part of speech, connection information, and other information is registered. In FIG. 2, the case where the reading on the front side is “Emoji” and the reading of the subsequent clause is “Nyuryoku” is shown as an example.

【0020】上記のように前側の読みを複合語を含む文
節の読みとするのは、これにより1つのまとまった部分
を文節切断の指定対象にでき、切り誤りが発生し難くな
ると共に、文節を切り直した際に、切れ目より前側の文
字列が複合語を含む文節であってもかな漢字変換を確実
に行なわせるためである。
As described above, the reading on the front side is the reading of a phrase containing a compound word. This allows one aggregated portion to be designated as a target for phrase cutting, which makes it less likely that a cutting error will occur and that the phrase will be This is to ensure that the kana-kanji conversion will be performed even if the character string before the break is a bunsetsu containing a compound word when recut.

【0021】また、前側の読みと後の文節までを登録の
対象としているのは、文節の切断は後の文節との絡みで
決定されるのが一般的であり、前側の読みだけの登録で
は、後の文節がどんな場合も画一的になってしまう不具
合が生じるためである。
[0021] Further, the reason why the reading of the front side and the succeeding phrase are registered is that the cutting of the phrase is generally determined by the entanglement with the succeeding phrase, and the registration of only the reading of the front side is performed. , This is because there is a problem that the subsequent clauses become uniform in any case.

【0022】更に、後の文節の読みの一部、例えば語幹
のみを記憶するのは、語幹に続く助詞、又は活用語尾が
様々に変化するので、後の文節の全体の読みを覚えてし
まうと極めて狭い学習となってしまうからである。更に
又、後の文節の語幹の品詞を覚えるのは、全く意味の異
なる場合が生じるからである。次に上記実施例の動作を
説明する。図3のフローチャートに示すように、入力部
11より変換対象となる文字列、例えば「こうせいのう
ひんのかいはつ」
Further, a part of the reading of the subsequent phrase, for example, only the stem of the word is memorized, because the particle following the stem or the inflection ending changes variously, and if the entire reading of the succeeding phrase is remembered. This is because the learning is extremely narrow. Furthermore, the part of speech of the stem of the later bunsetsu is remembered because it may have a completely different meaning. Next, the operation of the above embodiment will be described. As shown in the flow chart of FIG. 3, a character string to be converted from the input unit 11, for example, “Kousei no Uhin no Kaihatsu”

【0023】という文字列を入力し(ステップA1 )、
「変換/次候補」キーによりかな漢字変換を指示すると
(ステップA2 )、その入力情報は入力制御部12を介
してかな漢字変換制御部13に入力される。これによ
り、かな漢字変換制御部13は、文節を区切りながら、
かな漢字変換処理を行なう。即ち、かな漢字変換制御部
13は、かな漢字変換辞書16を参照して各文節のどこ
までが語幹で、どこからが付属語または活用語尾なのか
などの文法解析を行ない、その結果得られる全ての文節
候補を候補メモリ17に格納する(ステップA3 ,A4
)。
Input the character string (step A1),
When kana-kanji conversion is instructed by the "conversion / next candidate" key (step A2), the input information is input to the kana-kanji conversion control unit 13 via the input control unit 12. As a result, the kana-kanji conversion control unit 13 separates the clauses,
Performs Kana-Kanji conversion processing. That is, the kana-kanji conversion control unit 13 refers to the kana-kanji conversion dictionary 16 and performs a grammatical analysis such as to which part of each bunsetsu is the stem and where is the attached word or the inflection ending, and all bunsetsu candidates obtained as a result are analyzed. Store in candidate memory 17 (steps A3, A4
).

【0024】ここで、文節学習制御部18は、図2に示
す文節学習辞書19を参照して候補メモリ17に格納さ
れた文節候補の中で関連性の高い優先すべき文節を判断
し(ステップA5 ,A6 )、変換系列を作成する(ステ
ップA7 )。
Here, the phrase learning control section 18 refers to the phrase learning dictionary 19 shown in FIG. 2 to judge which of the phrase candidates stored in the candidate memory 17 is highly relevant and should be prioritized (step A5, A6) and a conversion sequence are created (step A7).

【0025】次いで、文節学習制御部18は、文節学習
辞書19を参照して候補メモリ17に格納された変換系
列の中で優先的に出力すべき系列を判断し(ステップA
8 )、最優先のものを変換結果として表示制御部21に
出力し、表示部23に表示して文節切り直し等のキー入
力待ちの状態となる(ステップA9 ,A10)。
Next, the phrase learning control unit 18 refers to the phrase learning dictionary 19 to determine which of the conversion sequences stored in the candidate memory 17 should be output preferentially (step A).
8), the highest priority one is output to the display control unit 21 as the conversion result, displayed on the display unit 23 and waits for key input such as phrase recutting (steps A9, A10).

【0026】この状態で文節切り直し指示の有無を判断
し(ステップA11)、文節切り直しの指示がなく、確定
キーが操作されれば、そのまま処理を終了する。しか
し、文節切り直しが指示されれば、その指示に基づいて
文節切り直し制御部14の制御により文節切り直し処理
を実行する。今、例えば「こうせいのうひんのかいは
つ」という文字列を入力して、「こうせい/のうひんの
/かいはつ」と文節切断されて「構成納品の開発」と変
換されたものとする。この変換文字に対して、ユーザー
が「こう/せいのう/ひんの/かいはつ」の文節切断に
より「高性能品の開発」
In this state, it is judged whether or not there is an instruction to re-phrase the phrase (step A11). If there is no instruction to re-phrase the phrase and the confirm key is operated, the process is terminated. However, if the phrase recutting is instructed, the phrase recutting process is executed under the control of the phrase recutting control unit 14 based on the instruction. Now, for example, when the character string "Kousei no Hinhin Kaihatsu" is entered, the phrase "Kosei / Nouhinno / Kaihatsu" is cut and converted to "Development of component delivery". To do. For this conversion character, the user can "develop a high-performance product" by cutting the phrase "Kou / Seinou / Hinno / Kaihatsu".

【0027】のかな漢字変換を行ないたい場合には、
「こう」または「こうせいのう」の文字列を指定して文
節切り直しを指示する。この文節切り直しの位置指定
は、例えば「機能1」キーとカーソルキー「←」,
「→」の組み合わせ操作により、文節切断の位置を指定
し、「選択/実行」キーの操作により文節切り直しの実
行を指示する。上記文節切り直しの位置は、例えば表示
文字の反転によって示される。この文節切り直しの位置
情報は、RAM15の文節切り直し位置記憶エリア15
aに一時的に記憶される。
If you want to convert the kana to kana characters,
Specify the character string "Kou" or "Kousei Nou" to instruct the phrase recutting. This phrase re-positioning is specified by, for example, the "function 1" key and the cursor key "←",
The position of the phrase break is specified by the combination operation of "→", and the execution of the phrase recut is instructed by the operation of the "select / execute" key. The position of the phrase recutting is indicated by, for example, inversion of the displayed character. The position information of the phrase re-cutting is stored in the phrase re-cutting position storage area 15 of the RAM 15.
It is temporarily stored in a.

【0028】上記文節の切り直しが指示されると、文節
切り直し制御部14の制御により、文節の切り直しが行
なわれる。即ち、かな漢字変換制御部13は、文節切り
直しの位置情報及びかな漢字変換辞書16を参照し(ス
テップA12)、文法解析を行なって文節候補を作成する
(ステップA13)。ここで、文節学習制御部18は、文
節学習辞書19を参照して候補メモリ17に格納された
文節候補の中で優先的に出力すべき文節を判断し(ステ
ップA14,A15)、変換系列を作成すると共に、切り直
し位置で切れている系列のみを有効とする(ステップA
16)。この場合、切り直しされた前側の文字列は、複合
語を含む読みであってもかな漢字変換処理を行なう。例
えば「こうせいのう」の複合語を含む文字列を対象とし
て切り直した場合でも、「高性能」等の等の変換文字を
有効とし、「高性能品の開発」を含む複数の変換系列を
有効な系列であると判断する。
When the phrase recutting is instructed, the phrase recut control unit 14 controls the phrase recut. That is, the kana-kanji conversion control unit 13 refers to the position information for phrase re-cutting and the kana-kanji conversion dictionary 16 (step A12) and performs grammatical analysis to create a phrase candidate (step A13). Here, the bunsetsu learning control unit 18 refers to the bunsetsu learning dictionary 19 to determine the bunsetsu to be preferentially output among the bunsetsu candidates stored in the candidate memory 17 (steps A14 and A15), and determines the conversion sequence. Create and validate only the series that is cut at the shuffle position (step A
16). In this case, the re-cut front character string is subjected to kana-kanji conversion processing even in reading including a compound word. For example, even if a character string containing a compound word such as "Kousei Nou" is shuffled, conversion characters such as "high performance" are validated, and multiple conversion series including "development of high performance products" are performed. Judge as a valid series.

【0029】更に文節学習制御部18は、上記変換系列
に対し、切り直しされた前側の変換文字が2文節以上あ
る系列を無効とする(ステップA17)。例えば「えもじ
の」の文字列を入力した場合、複合語の「絵文字の」に
変換される他、「絵も字の」等の2文節を含む変換が行
なわれるので、切り直しされた前側の変換文字が2文節
以上ある「絵も字の」等の系列を無効として変換精度を
向上する。
Further, the phrase learning control unit 18 invalidates a sequence in which the reconverted front side conversion character has two or more phrases for the above conversion sequence (step A17). For example, when a character string of "Emoji no" is input, it is converted to the compound word "Emoji no", and conversion including two phrases such as "Emomo no No" is performed. The conversion accuracy is improved by invalidating the series such as "picture also character" in which the conversion character of 2 is two or more clauses.

【0030】次いで、文節学習制御部18は、文節学習
辞書19を参照して候補メモリ17に格納された変換系
列の中で優先すべき系列を判断し(ステップA18)、最
優先のもの例えば「高性能品の開発」を変換結果として
表示制御部21に出力し表示部23に表示する(ステッ
プA19)。この状態で確定操作が行なわれたか否かを判
断する(ステップA20)。
Next, the phrase learning control unit 18 refers to the phrase learning dictionary 19 to determine the sequence to be prioritized among the conversion sequences stored in the candidate memory 17 (step A18), and the highest priority one, for example, ""Development of high-performance product" is output to the display control unit 21 as the conversion result and displayed on the display unit 23 (step A19). In this state, it is determined whether or not the confirmation operation has been performed (step A20).

【0031】上記表示部23に表示された結果がユーザ
ーの望むものでなかった場合は、対象とする文節位置に
カーソルを移動して「変換/次候補」キーを操作する。
このキー操作により、候補メモリ17から次に優先度の
高い文節候補が読出され、表示部23に表示される。ま
た、「同音語一括表示」を指定することによって、候補
メモリ17の格納されている「同音語」の文節候補を全
て読出して表示部23の編集エリアに一括して表示し、
その中から所望の文節候補を選択指定するようにしても
よい。また、再度切り直し操作を行なった場合は、ステ
ップA11を経てステップA12に戻り、上記と同様の操作
を繰り返し実行する。
When the result displayed on the display section 23 is not what the user desires, the cursor is moved to the target clause position and the "conversion / next candidate" key is operated.
By this key operation, the phrase candidate having the next highest priority is read from the candidate memory 17 and displayed on the display unit 23. Further, by designating “between homophones”, all the phrase candidates of the “homophone” stored in the candidate memory 17 are read out and displayed collectively in the editing area of the display unit 23.
A desired phrase candidate may be selected and designated from among them. When the recut operation is performed again, the process returns to step A12 via step A11, and the same operation as described above is repeatedly executed.

【0032】上記のようにしてユーザーの望むかな漢字
が行なわれた場合、「選択/実行」キーを操作すること
によって変換された文が確定する。また、この確定操作
を行なうことにより、RAM15の文節切り直し位置記
憶エリア15aの記憶内容がクリアされると共に、文節
切り直しに伴う新しい文節切断情報が文節学習辞書19
に登録される(ステップA21)。即ち、文節切断の実行
の際に、文字列でかな漢字変換辞書16を検索し、単語
の抽出と品詞のチェック、接続関係のチェック等の文法
チェックが行なわれるが、この過程で、新しい文節切断
情報が得られるので、この文節切断情報が文節学習辞書
19に登録される。例えば文節切り直しの過程で、「こ
うせいのうひんのかいはつ」の文字列に対し、 (1)「こうせいのう」の「う」で文節を切断 (2)「こう」及び「せいのう」は、辞書に単語として
登録あり。 (3)「ひんのかいはつ」で辞書検索。 (4)「ひん」:辞書に名詞の単語としてあり。 (5)「の」:辞書に助詞として登録あり、かつ、「か
いはつ」(名詞)との接続可能。 (6)「かいはつ」:名詞として辞書に登録あり。
When the kana-kanji desired by the user is performed as described above, the converted sentence is confirmed by operating the "select / execute" key. Further, by performing this confirming operation, the content stored in the phrase re-positioning area storage area 15a of the RAM 15 is cleared, and new phrase cutting information associated with the phrase re-cutting is added to the phrase learning dictionary 19.
Is registered (step A21). That is, when the phrase is cut, the kana-kanji conversion dictionary 16 is searched for the character string, and grammatical checks such as word extraction, part-of-speech check, and connection relation check are performed. Therefore, the phrase cutting information is registered in the phrase learning dictionary 19. For example, in the process of re-phrasing a phrase, for the character string of "Koseinou Hinno Kaihatsu", (1) Cut the phrase with "U" of "Koseinou" (2) "Kou" and "Seino""U" is registered as a word in the dictionary. (3) Search the dictionary with "Hinno Kaihatsu". (4) "Hin": There is a noun word in the dictionary. (5) "No": Registered as a particle in the dictionary and connectable with "Kaihatsu" (noun). (6) "Kaihats": Registered as a noun in the dictionary.

【0033】という動作が行なわれており、この過程で
得られた切り直し位置より前側の読み、後ろの文節の読
みの一部例えば語幹の読み、長さ、品詞、接続情報、そ
の他の情報が文節学習辞書19に登録される。この文節
学習辞書19の登録内容は、新たに読みの文字列が入力
されたときに、この文字列によって検索され、この文字
列の読みに対応した文節切断情報が登録されているとき
に、その文節切断情報に従って文節切断が行なわれる。
これによりユーザーの望むかな漢字変換が行なわれるよ
うになる。
The above-mentioned operation is carried out, and a part of the reading of the front side and the reading of the succeeding bunsetsu, such as the reading of the stem, the length, the part of speech, the connection information, and other information obtained in this process, It is registered in the phrase learning dictionary 19. The registered content of the phrase learning dictionary 19 is searched when a new reading character string is input, and when the phrase cutting information corresponding to the reading of this character string is registered, Phrase break is performed according to the phrase break information.
As a result, the Kana-to-Kanji conversion desired by the user will be performed.

【0034】なお、上記実施例では、図3のステップA
17において、切り直しされた前側の変換文字が複合語の
系列のみ有効とし、複数文節からなるものは無効とする
ようにしたが、この処理を行なわずに、切り直しされた
前側の変換文字が2文節以上を含んでいても、有効であ
ると判断するようにしても良い。このようにした場合に
は、切り直しされた前側の読みが複合語を含んでいて
も、また、2文節以上を含んでいても、かな漢字変換を
行なうことができる。従って、この場合には、切り直し
された前側の変換文字に複合語を含む系列、及び2文節
以上を含む系列が作成されるので、表示された変換文が
ユーザーの望む文でない場合でも、文節切り直しを再度
行なうことなく、候補文の中から選択指定することがで
きる。
In the above embodiment, step A in FIG.
In 17, the re-converted front side conversion character is valid only for the series of compound words, and the one consisting of multiple clauses is invalid, but without performing this process, the re-converted front side conversion character is Even if two or more clauses are included, it may be determined to be valid. In this case, kana-kanji conversion can be performed even if the re-read front reading includes a compound word or two or more phrases. Therefore, in this case, since the sequence including the compound word and the sequence including two or more phrases in the reconverted conversion character on the front side are created, even if the displayed conversion sentence is not the sentence desired by the user, the phrase It is possible to select and specify from the candidate sentences without performing re-cutting again.

【0035】[0035]

【発明の効果】以上詳記したように本発明によれば、文
節学習辞書に複合語を含む前側の読みと、これに続く後
の文節の読みの一部、品詞、接続情報、その他の情報か
らなる文節切断情報を登録すると共に、文節切り直しに
よって上記文節切断情報を学習するようにしたので、1
つのまとまった部分を文節切断の対象とすることがで
き、複数語を含んで文節の切り直しを指示した場合で
も、文節の切り誤りの発生が非常に少なくなり、この結
果、ユーザーの望む文への変換確率を高くでき、操作性
を著しく改善することができる。
As described above in detail, according to the present invention, the reading of the front side including the compound word in the phrase learning dictionary and a part of the reading of the succeeding phrase, the part of speech, the connection information, and other information. The phrase break information consisting of 1 is registered, and the phrase break information is learned by re-cutting the phrase.
It is possible to target bunsetsu breaks to one grouped part, and even when instructing re-cuts of bunsetsu including multiple words, the occurrence of bunsetsu error is very small, and as a result, the sentence that the user wants The conversion probability of can be increased, and the operability can be significantly improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係る文書作成装置の構成を
示すブロック図。
FIG. 1 is a block diagram showing the configuration of a document creation device according to an embodiment of the present invention.

【図2】同実施例における文節学習辞書の構成を示す
図。
FIG. 2 is a diagram showing a configuration of a phrase learning dictionary in the embodiment.

【図3】同実施例の動作を示すフローチャート。FIG. 3 is a flowchart showing the operation of the embodiment.

【符号の説明】[Explanation of symbols]

11…入力部、 12…入力制御部、 13…かな
漢字変換制御部、14…文節切り直し制御部、 15
…RAM、 16…かな漢字変換辞書、17…候補
メモリ、 18…文節学習制御部、 19…文節学
習辞書、21…表示制御部、 22…表示用メモリ、
23…表示部。
11 ... Input unit, 12 ... Input control unit, 13 ... Kana-Kanji conversion control unit, 14 ... Phrase recutting control unit, 15
... RAM, 16 ... Kana-Kanji conversion dictionary, 17 ... Candidate memory, 18 ... Phrase learning control unit, 19 ... Phrase learning dictionary, 21 ... Display control unit, 22 ... Display memory,
23 ... Display section.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 複数の文節を含む読みの文字列を切断可
能な文節の候補に切って漢字混じり文の変換系列を作成
するかな漢字変換手段と、複合語を含む前側の読みとこ
れに続く後の文節の読みの一部、品詞、接続情報等から
なる文節切断情報を記憶した文節学習辞書と、この文節
学習辞書を参照し、上記かな漢字変換手段により変換さ
れた変換系列の中から優先すべき系列を選択して出力す
る手段と、この手段より出力される変換系列に対し切れ
目を指定して文節切り直しを指示する手段と、この手段
により指定された切れ目により上記文節学習辞書を参照
して文節を切り直す文節切り直し手段と、この手段によ
る文節切り直し後、上記指定された切れ目より前側の読
みと、これに続く後の文節の読みの一部、品詞、接続情
報等からなる文節切断情報により上記文節学習辞書の記
憶内容を更新する学習手段とを具備したことを特徴とす
る文書作成装置。
1. A kana-kanji conversion means for creating a conversion sequence of kanji-mixed sentences by cutting a reading character string including a plurality of phrases into severable bunsetsu candidates, and a front-side reading including a compound word and a subsequent reading. Refer to this phrase learning dictionary and the phrase learning dictionary that stores the phrase disconnection information consisting of part of the reading of the phrase, part of speech, connection information, etc., and refer to this phrase learning dictionary, and give priority to the conversion sequence converted by the above Kana-Kanji conversion means. A means for selecting and outputting a sequence, a means for designating a break in the conversion sequence output from this means and instructing the phrase reshuffling, and referring to the above phrase learning dictionary by the break specified by this means The phrase re-slicing means, and the phrase re-slicing by this means, the segmental part consisting of the part of the segmental part of speech, the part of the segment of the segmental part of the segmental part of the segmental part of the segmental part of the segmental part of the segmental part which is read before the break specified above A document creating apparatus comprising: learning means for updating the stored contents of the phrase learning dictionary according to disconnection information.
JP4232403A 1992-08-31 1992-08-31 Document preparing device Pending JPH0683807A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4232403A JPH0683807A (en) 1992-08-31 1992-08-31 Document preparing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4232403A JPH0683807A (en) 1992-08-31 1992-08-31 Document preparing device

Publications (1)

Publication Number Publication Date
JPH0683807A true JPH0683807A (en) 1994-03-25

Family

ID=16938702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4232403A Pending JPH0683807A (en) 1992-08-31 1992-08-31 Document preparing device

Country Status (1)

Country Link
JP (1) JPH0683807A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007514998A (en) * 2003-11-21 2007-06-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Text segmentation and labeling using user interaction with topic-specific language model and topic-specific label statistics
US7958443B2 (en) 2003-02-28 2011-06-07 Dictaphone Corporation System and method for structuring speech recognized text into a pre-selected document format

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7958443B2 (en) 2003-02-28 2011-06-07 Dictaphone Corporation System and method for structuring speech recognized text into a pre-selected document format
US8356243B2 (en) 2003-02-28 2013-01-15 Nuance Communications, Inc. System and method for structuring speech recognized text into a pre-selected document format
US9396166B2 (en) 2003-02-28 2016-07-19 Nuance Communications, Inc. System and method for structuring speech recognized text into a pre-selected document format
JP2007514998A (en) * 2003-11-21 2007-06-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Text segmentation and labeling using user interaction with topic-specific language model and topic-specific label statistics
JP2011204249A (en) * 2003-11-21 2011-10-13 Nuance Communications Austria Gmbh Text segmentation and label assignment with user interaction by topic specific language model and topic specific label statistics
JP4808160B2 (en) * 2003-11-21 2011-11-02 ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー Text segmentation and labeling using user interaction with topic-specific language model and topic-specific label statistics
JP2012009046A (en) * 2003-11-21 2012-01-12 Nuance Communications Austria Gmbh Topic singular language model and text segment division and labeling using user dialog based on topic singular label statistic
US8200487B2 (en) 2003-11-21 2012-06-12 Nuance Communications Austria Gmbh Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics
US8332221B2 (en) 2003-11-21 2012-12-11 Nuance Communications Austria Gmbh Text segmentation and label assignment with user interaction by means of topic specific language models and topic-specific label statistics

Similar Documents

Publication Publication Date Title
EP0370774B1 (en) Machine translation system
JPH07114568A (en) Data retrieval device
JPH11328166A (en) Character input device and computer-readable recording medium where character input processing program is recorded
JPH0683807A (en) Document preparing device
JP2621999B2 (en) Document processing device
JPH0683805A (en) Document preparing device
JPH0683806A (en) Document preparing device
JPS62163174A (en) Mechanical translating device
JPH08272780A (en) Processor and method for chinese input processing, and processor and method for language processing
JPH08241315A (en) Word registering mechanism for document processor
JP2000148747A (en) Conversion candidate display method, record medium for program for japanese syllabary-to-chinese character conversion by same method, and japanese syllbary-to- chinese character conversion device
JPH06149790A (en) Document processor
JPH0414168A (en) Word processor
JPH07105219A (en) Machine translating device
JPS62180465A (en) Kana-kanji converting system
JPH05266009A (en) Method and device for production of document
JPH01197876A (en) Electronic dictionary
JPH10187705A (en) Method and device for document processing
JPH0520303A (en) Japanese-language document processing device
JPH0232460A (en) Document processor
JPS6349929A (en) Key word extracting device
JPS6244872A (en) Machine translator
JPH05189413A (en) Kana/kanji converting device
JPH03136161A (en) Document preparing device
JPH0610804B2 (en) Kana-Kanji converter