JPH04195253A - Continuous clause japanese-syllabary chinese-character conversion method and device - Google Patents

Continuous clause japanese-syllabary chinese-character conversion method and device

Info

Publication number
JPH04195253A
JPH04195253A JP2323431A JP32343190A JPH04195253A JP H04195253 A JPH04195253 A JP H04195253A JP 2323431 A JP2323431 A JP 2323431A JP 32343190 A JP32343190 A JP 32343190A JP H04195253 A JPH04195253 A JP H04195253A
Authority
JP
Japan
Prior art keywords
kana
kana character
kanji
clause
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2323431A
Other languages
Japanese (ja)
Other versions
JPH0748213B2 (en
Inventor
Hiroshi Kaneko
宏 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2323431A priority Critical patent/JPH0748213B2/en
Publication of JPH04195253A publication Critical patent/JPH04195253A/en
Publication of JPH0748213B2 publication Critical patent/JPH0748213B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE: To efficiently segment a clause by using any arbitrary independent word indication when an independent word contained in the clause at the time of clause segmentation error including a proper clause boundary is equal with an independent word contained in the clause at the time of proper description just before the proper clause boundary. CONSTITUTION: While referring to a dictionary 2, a Japanese syllabary(KANA)/Chinese character(KANJI) converting part 1 finds converted result candidates more than one. A clause resegmenting part 6 preserves the converted result OUT before clause resegmentation due to an operator in a non-corrected converted result buffer 7, clause segment designation data are prepared and stored in a buffer 5, the converting part 1 is called, and the converted result is corrected. Further, the converted result OUT after clause resegmentation is preserved in a corrected converted result buffer 8 and a learning part 9 is called. The learning part 9 compares the buffer 7 with the buffer 8, decides the kind of clause resegmentation and updates a 1st type resegmentation learning dictionary 3 or a 2nd type resegmentation learning dictionary 4. Namely, when the independent words contained in clauses before and after correction are equal, the clause is registered in the dictionary 3 but when they are not equal, it is registered in the dictionary 4.

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明は連文節仮名漢字変換方法および装置に関し、
とくに文節切りの学習を効率良く行えるようにするもの
である。
[Detailed Description of the Invention] A. Field of Industrial Application This invention relates to a method and device for converting kana to kanji in connected clauses;
In particular, it allows for efficient learning of bunsetsu segmentation.

B、従来の技術 複数の文節について入力仮名文字列を漢字仮名混じり文
に変換する連文節仮名漢字変換方法では、入力仮名文字
列を所定のアルゴリズムで文節候補の単位で分割しく文
節切り)、文節候補の各々に対応する仮名漢字混じりの
文字列を生成して連結し、変換結果としている。そして
この文節切りが誤ったものである場合には正しい文節切
りを学習させ、以降同一の文節切り誤りが生じないよう
にすることも行われつつある。
B. Conventional technology In the continuous clause kana-kanji conversion method, which converts an input kana character string into a sentence containing kanji and kana for multiple clauses, the input kana character string is divided into clause candidates using a predetermined algorithm. A string of characters mixed with kana and kanji corresponding to each is generated and concatenated to form the conversion result. If this bunsetsu cut is incorrect, the correct bunsetsu cut is learned, so that the same bunsetsu cut error will not occur in the future.

たとえば「埼玉系では県財政を立て直す」という正書に
対して「さいたまけんではけんざいせいをたてなおす」
という仮名文字列を入力した場合に、[埼玉系で派遣財
政を立て直す」と誤って変換することがある。これは「
埼玉系では7県」と文節切りを行うべきところ、誤って
「埼玉県テ/派遣」と文節切りを行った結果である。こ
のような文節切り誤りに対処するために学習を行う場合
には「埼玉系では7県」に修正するときに、以降は正し
く文節切りが行われるコうに文節切り情報を記憶してお
く。
For example, in contrast to the official text that says ``Saitama-kei will rebuild its prefectural finances,'' it says ``Saitama Kenzai will rebuild its prefectural finances.''
If you enter the kana character string, it may be incorrectly converted to ``Rebuild the dispatch finances in the Saitama system.'' this is"
This is the result of incorrectly cutting off the sentence as ``Saitama Prefecture Te/Dispatch'' when the phrase should have been ``7 prefectures in Saitama.'' When performing learning to deal with such bunsetsu cutting errors, when correcting to ``7 prefectures in the Saitama system,'' the bunsetsu cutting information is stored so that the bunsetsu cutting will be performed correctly thereafter.

ところで従来の学習用の文節切り情報は、当該文節切り
誤りのあった入力文字列固有のものであり、たとえば「
さいたまけんではけん」という読みは「埼玉系では県J
という正書に対するものであった。このため類似の誤り
についても個別に学習する必要があった。上述の「埼玉
系では県」を学習したのちに、「ちばけんではけん・・
」を入力したときには依然として「千葉系で派遣」とい
うように文節誤りが起こるおそれがあり、その場合個別
に学習する必要がある。
By the way, conventional bunsetsu cutting information for learning is specific to the input character string in which the bunsetsu cutting error occurred, for example, "
``Saitama Ken de Haken'' is pronounced ``Saitama Prefecture J.
It was against the official text. Therefore, it was necessary to learn about similar errors individually. After studying the above-mentioned ``Saitama-kei prefecture'', ``Chibaken dehaken...''
”, there is still a risk that a phrase error will occur, such as ``Dispatched in Chiba,'' and in that case, it will be necessary to study it individually.

なおこの発明に関連する先行技術としては特開昭61−
147365号公報および特開昭61−147368公
報所載のものがある。
The prior art related to this invention is JP-A-61-
There are those published in Japanese Patent Application Laid-open No. 147365 and Japanese Patent Application Laid-open No. 147368/1983.

特開昭81−147365号公報の先行技術は正しい境
界を含む文節切り直し前の付属語と、その付属語の先頭
から正しい境界に至る仮名文字列とを記憶し、文節切り
の学習を行う。たとえばr今の日本は」 (上書)に対
する「いまのにはんば」という入力が誤って「今のに本
は」に変換されたときには、学習に−り「のに」と「の
」とを記憶し、以降「のに」が入力されたら「の」の後
に文節境界を置く。しかしこの先行技術では文節切りが
付属語の文字列中で起こる場合しか対処できない。たと
えば「今日は医者に」 (上書)が「今日歯医者に」に
誤変換されたときには、誤変換の「今臼歯−医者」 (
−印は正しい文節境界を示す)において正しい文節境界
を含む付属語がないのでこの先行技術は適用できない。
The prior art disclosed in Japanese Unexamined Patent Publication No. 147365/1981 stores an adjunct word including the correct boundary before bunsetsu cutting, and a kana character string from the beginning of the adjunct word to the correct boundary, and learns bunsetsu cutting. For example, when the input ``Ima no Nihanba'' for ``Today's Japan'' (overwritten) is mistakenly converted to ``Today's hon wa'', learning can be done using ``noni'' and ``no''. From then on, when ``no'' is input, a clause boundary is placed after ``no''. However, this prior art can only deal with cases in which segmentation occurs within a character string of an adjunct word. For example, when "I'm going to the doctor today" (overwritten) is incorrectly converted to "I'm going to the dentist today", the incorrect translation "I'm going to the doctor today" (
This prior art cannot be applied because there is no attached word that includes a correct clause boundary (- indicates a correct clause boundary).

またこのJうな文節切りの学習には弊害(副作用)も多
い。
Additionally, there are many negative effects (side effects) to learning J Una Bunseki Kiri.

付属語の「のにjが現れたら一律に「の」で文節切りを
行うのでは付属語の「のに」を付属語辞書に登録してい
る意味がなくなってしまう。
If the adjunct word ``nonij'' were to be used to cut the sentence with ``no'', there would be no meaning in registering the adjunct word ``noni'' in the adjunct word dictionary.

特開昭61−147366号公報の先行技術は正しい境
界を含む文節切りなおし前の文節の付属語、その文節に
続く自立語を含む文の情報を記憶して文節切りの学習を
行う。たとえば「表示し内容に注意し」 (上書)に対
する「ひようじしないようにちゆういし」という入力が
誤って「表示しないように注意し」に変換されたときに
、学習にJす、「しない町うにちゅうい」と「シ」とを
記憶し、以降「しないようにちゅうい」が入力されたら
「シ」の後に文節境界を置く。この先行技術でも特開昭
61−147365号公報の場合と同様な問題が生じる
。ただし弊害については、先の例で「ちゆうい」まで考
慮していることがら理解できるまうに若干改善される。
The prior art disclosed in Japanese Unexamined Patent Application Publication No. 147366/1983 learns bunsetsu cutting by storing information on sentences including the adjunct word of the clause before bunsetsu cutting, including the correct boundary, and the independent word following the clause. For example, when the input ``Please be careful not to display the content'' (overwrite) is incorrectly converted to ``Please be careful not to display the contents'', the input ``Please be careful not to display the content'' (overwrite) is incorrectly converted to ``Please be careful not to display the contents''. It memorizes ``nai ni ni uni chui'' and ``shi'', and from now on, when ``nai ni ni ni chui'' is input, a clause boundary is placed after ``shi''. This prior art also causes the same problem as that of Japanese Patent Application Laid-Open No. 61-147365. However, the negative effects can be improved slightly, as can be understood by considering the ``chiyuui'' in the previous example.

しかし弊害が改善される反面、学習が有効な文節切り誤
りの範囲は狭くなっている。先の例で「注意Jに代えて
「留意」、「考慮」、「反映」等が来ると適用できない
However, while the negative effects have been improved, the range of phrase-cutting errors for which learning is effective is narrowing. In the previous example, if ``note'', ``consider'', ``reflect'', etc. come in place of ``Caution J'', it cannot be applied.

C0発明が解決しまうとする課題 この発明は以上の事情を考慮してなされたものであり、
−回の文節切り情報の学習にまり、当該入力文字固有の
文節切りのみでなく、その入力文字に代表される類型的
な文節切りまで学習でき、効率的な文節切りの学習が可
能であり、しかもそのまうな類型的な学習による弊害を
極力抑えることができる連文節文節変換手法を提供する
ことを目的としている。
Problems to be solved by the C0 invention This invention was made in consideration of the above circumstances,
- It is possible to learn bunsetsu cut information of times, and not only the bunsetsu cut specific to the input character, but also the typical bunsetsu cut represented by that input character, and efficient bunsetsu cut learning is possible. Furthermore, the purpose of this invention is to provide a continuous phrase phrase conversion method that can minimize the negative effects of such typical learning.

91課題を解決するための手段 この発明では以上の目的を達成するために、文節切りを
学習するときに、正しい文節境界を包含する文節切り誤
り時の文節に含まれる自立語が、正しい文節境界の直前
の正書時の文節に含まれる自立語と同じときに、当該文
節の自立語に変えて任意の自立語表示を用いて学習を行
うようにしている。このまうにして包括的な文節切りの
学習が可能となる。他方、正しい文節境界を包含する文
節切り誤り時の文節に含まれる自立語が、正しい文節境
界の直前の正書時の文節に含まれる自立語と異なるとき
には、当該文節の自立語自体を用いて、包括的な学習を
止め、包括的な学習に止る弊害が生じない町うにしてい
る。
91 Means for Solving the Problems In order to achieve the above object, in this invention, when learning bunsetsu cutting, an independent word included in the bunsetsu at the time of bunsetsu cutting error that includes the correct bunsetsu boundary is When the independent word is the same as the independent word included in the orthographic clause immediately before , learning is performed using an arbitrary independent word display instead of the independent word of the clause. In this way, comprehensive learning of bunsetsu cutting becomes possible. On the other hand, if the independent word included in the clause at the time of bunsetsu cut error that includes the correct clause boundary is different from the independent word included in the orthographic clause immediately before the correct clause boundary, the independent word itself of the clause is used. , we are trying to avoid comprehensive learning and avoid the negative effects of comprehensive learning.

なおここで自立語等の定義について触れておく。上述の
とおり連文節仮名漢字変換ではまず文節切りを行う。そ
してこの文節切りは第1の辞書くまたは辞書の部分)に
登録されている詔と、第2の辞書(濾たは辞書の部分ン
に登録されている語(空の文字列も含む、後述例)とを
接続して文節を構成し、これを入力文字列に突き合わせ
て行う。ここでは第1の辞書に登録されている語を自立
語といい、第2の辞書に登録されている語を付属語とい
う。たとえば前の「埼玉県では県」は「埼玉(自立語)
−空文字列(付属語)−県(自立語)−では(付属語)
−県(自立語)Jがら構成されている。
Here, I would like to touch on the definition of independent words. As mentioned above, in the continuous clause kana-kanji conversion, the first step is to cut the clauses. This bunseki-kiri is the edict registered in the first dictionary (or part of the dictionary), and the word (including empty strings, which will be explained later) registered in the second dictionary (filter or part of the dictionary). Example) are connected to form a clause, and this is matched against the input character string.Here, the words registered in the first dictionary are called independent words, and the words registered in the second dictionary are called independent words. are called attached words.For example, the previous word ``Saitama prefecture'' means ``Saitama (independent word)''.
−Empty string (adjunct word) −Prefecture (independent word) −De (adjunct word)
-Prefecture (independent word) It is composed of J.

E、l!ii!施例 以下この発明の一実施例について説明する。E, l! ii! Example An embodiment of this invention will be described below.

第1図はこの実施例を全体として示すものである。なお
、第1図では機能ブロックを用いてハードウェアの実現
態様を示しているが、ソフトウェアで実現できることは
もちろんである。第1図において、仮名漢字変換部1は
仮名入力INを受け取って辞書2を参照しながら連文節
仮名漢字変換を行う。この仮名漢字変換部1はまず辞書
(自立語辞書部および付属語辞書部を含む)2を参照し
て1以上の変換結果候補を求める。この処理自体は通常
のものなのでこの点の詳細な説明は省略する(動忰につ
いてはのちに例を挙げる)。つぎに仮名漢字変換部1は
所定の規則(たとえばそれぞれの語の得点またはペナル
ティと語の閏の接続の得点またはペナルティとの総和の
大小に応じて変換結果を決定する)に加えて第1種切り
なおし学習辞書3、第2種切りなおし学習辞書4および
文節切り指定データーバッファ5を参照して変換結果を
決定をする。
FIG. 1 shows this embodiment as a whole. Although FIG. 1 shows a hardware implementation using functional blocks, it is of course possible to implement the system using software. In FIG. 1, a kana-kanji conversion unit 1 receives a kana input IN and performs continuous clause kana-kanji conversion while referring to a dictionary 2. The kana-kanji conversion section 1 first refers to a dictionary (including an independent word dictionary section and an attached word dictionary section) 2 to obtain one or more conversion result candidates. Since this process itself is normal, a detailed explanation of this point will be omitted (an example will be given later regarding the movement). Next, the kana-kanji conversion unit 1 determines the conversion result according to predetermined rules (for example, depending on the size of the sum of the score or penalty of each word and the score or penalty of the connection of the word). The conversion result is determined by referring to the recutting learning dictionary 3, the second type recutting learning dictionary 4, and the bunsetsu cutting specification data buffer 5.

文節切りなおし部6は、オペレータが文節切り誤りを指
示したときの処理を行う部分である。すなわちオペレー
タによる文節切りなおしの前の変換結果OUTを修正前
変換結果バッファ7に保存し、文節切り指定データを作
成して(バッファ5にストア)仮名漢字変換部1を呼び
出し、変換結果を修正させる。さらに文節切りなおしの
後の変換結果OUTを修正後変換結果バ・ンファ8に保
存して学習部9を呼び出す。なお文節切りなおしは、た
とえば誤変換結果を元の仮名文字に直したのち所望の文
節のみを反転表示等で変換領域としてマークして再変換
して行うことができる。
The phrase re-cutting section 6 is a section that performs processing when the operator instructs an error in phrase cutting. That is, the conversion result OUT before the bunsetsu re-cutting by the operator is saved in the uncorrected conversion result buffer 7, the bunsetsu-cutting specification data is created (stored in the buffer 5), and the kana-kanji conversion unit 1 is called to correct the conversion result. . Furthermore, the conversion result OUT after the phrase re-cutting is stored in the modified conversion result buffer 8, and the learning section 9 is called. Note that phrase re-cutting can be performed by, for example, converting the erroneous conversion result into the original kana characters, and then marking only the desired phrase as a conversion area by highlighting it, etc., and converting it again.

学習部9は、修正前変換結果バッファ7と修正後変換結
果バッファ8とを比較して文節切りなおしの種類を判定
し、第1種切りなおし学習辞書3または第2種切りなお
し学習辞書4を更新する。
The learning unit 9 compares the pre-correction conversion result buffer 7 and the post-correction conversion result buffer 8 to determine the type of phrase re-cutting, and uses the first type re-cut learning dictionary 3 or the second type re-cut learning dictionary 4. Update.

すなわちのちに例を挙げて示すように正しい境界を含む
修正前の文節に含まれる自立語と正しい境界の直前の修
正後の文節に含まれる自立語とが同一のときに第1種切
りなおし辞書3に登録を行い、同一でないときに第2切
りなおし辞書4に登録を行う。
In other words, as will be shown later with an example, when the independent word included in the uncorrected clause that includes the correct boundary is the same as the independent word included in the corrected clause immediately before the correct boundary, the Type 1 reshuffle dictionary is used. 3, and if they are not the same, they are registered in the second re-cutting dictionary 4.

つぎに、「しつけんのないよう」という入力仮名文字列
等を例に挙げて仮名漢字変換、文節切りなおしおよび再
変換の過程を示す。
Next, the process of kana-kanji conversion, phrase re-cutting, and re-conversion will be explained using an input kana character string such as ``Shitsuken no Naiyo'' as an example.

文節切りなおし学習前の変換を韮ず説明する。A detailed explanation of the conversion before learning bunsetsu segmentation.

第2図において、自立語検索(ステップSl)では第5
図に示すような自立語を自立語バッファJBに格納する
。付属語検索(ステップS2>では第6図に示すような
付属語を付属語バッファFBに格納する。文節構成処理
(ステップS3)では以上の2つのバッファを参照して
第7図に示す町うな文法的に正しい文節を文節バッファ
BBに格納する。候補構成処理(ステップS4)では文
節バッファBBを参照して第8図に示すような候補を候
補バッファCBに格納する。以降、上記の自立語検索、
付属語検索、文節構成および候補構成のすべての処理を
一括して「候補生成」と呼ぶ。
In Figure 2, in the independent word search (step Sl), the fifth
An independent word as shown in the figure is stored in an independent word buffer JB. In the adjunct word search (step S2>, the adjunct words shown in FIG. 6 are stored in the adjunct word buffer FB. In the clause composition process (step S3), the above two buffers are referred to and the town name shown in FIG. 7 is stored. A grammatically correct clause is stored in the clause buffer BB. In the candidate composition process (step S4), the clause buffer BB is referred to and candidates as shown in FIG. 8 are stored in the candidate buffer CB. search,
All the processes of adjunct word search, clause construction, and candidate construction are collectively referred to as "candidate generation."

変換結果決定(ステップS5)は修正前変換結果バッフ
ァ7、修正後変換結果バッファ8および文節切り指定デ
ータ・バッファ5を参照して候補バッファCBに格納さ
れた候補より1を選択し変換結果OUTを更新する。こ
の場合には上述の2種の切りなおし学習辞書3.4にデ
ータが存在せず、また文節切り指定データもないので「
実験のないよう」が変換結果となる(第8図の上から下
の順に候補が選ばれるように得点などが与えられている
ものとする)。
Conversion result determination (step S5) refers to the pre-correction conversion result buffer 7, the post-correction conversion result buffer 8, and the bunsetsu cut designation data buffer 5, selects 1 from the candidates stored in the candidate buffer CB, and selects the conversion result OUT. Update. In this case, there is no data in the above-mentioned two types of re-cutting learning dictionaries 3.4, and there is no phrase-cutting specification data, so
``There is no experiment'' is the conversion result (scores etc. are given so that candidates are selected in order from top to bottom in Figure 8).

ついで、オペレータが文節切りなおしを行ってr実験の
ないよう」を「実験の内容」に修正する過程を説明する
。第3図において、まずステップSllで修正前変換結
果の保存が行われる。すなわち修正前変換結果バッファ
7に漢字「実験のない町う」および仮名「じつけんのな
いよう」を格納する。オペレータによる文節切りの指定
(ステップ512)はたとえば第5文字「な」が文節先
頭であることを指定し、これにまり文節切り指定データ
・バッファ5に「5」を格納する。こののち仮名漢字変
換の指示(ステップ513)に−り仮名漢字変換部1を
呼び出す。
Next, we will explain the process by which the operator rearranges the phrases to change the phrase ``avoid an experiment'' to ``the content of the experiment.'' In FIG. 3, first, in step Sll, the uncorrected conversion result is saved. That is, the kanji character ``Jikken no Nai Machiu'' and the kana character ``Jitsuken no Naiyo'' are stored in the pre-correction conversion result buffer 7. The operator specifies the phrase cut (step 512) by specifying that the fifth character "na" is the beginning of the phrase, and stores "5" in the phrase cut designation data buffer 5 accordingly. Thereafter, the kana-kanji conversion unit 1 is called in response to an instruction for kana-kanji conversion (step 513).

仮名漢字変換の指示(ステップ513)でにまって呼び
出された変換でも候補生成の過程は上記と同一である。
The candidate generation process is the same as described above even in the case of a conversion called inadvertently in response to an instruction for kana-kanji conversion (step 513).

変換結果決定(ステップ514)では文節切り指定デー
タ「5」を参照して、第5文字「な」が文節先頭となる
町うな候補すなわち「実験の内容」を選択する(第8図
)。
In the conversion result determination (step 514), the clause cut designation data "5" is referred to and a town una candidate in which the fifth character "na" is the beginning of the clause, ie, "experiment content" is selected (FIG. 8).

修正後変換結果OUTの保存(ステップ514)では修
正後変換結果バッファ8に漢字「実験の内容」および仮
名「しつけんの−ないよう」(「−」は文節境界を表す
)を格納する。こののち学習の指示(ステップ515)
においては学習部5が呼び出される。
In saving the modified conversion result OUT (step 514), the kanji ``content of the experiment'' and the kana ``shitsuken no -naiyo''(``-'' represents a bunsetsu boundary) are stored in the modified conversion result buffer 8. Instructions for learning later (step 515)
In this case, the learning section 5 is called.

文節境界の学習は第4図に示すJうに行われる。第4図
において、区切りの直前の自立語比較が行われる(ステ
ップ521)。すなわち修正前変換結果バッファ7の第
1自立語と修正後変換結果バッファ8の第1自立語とを
比較する。この場合には、共に「実験」であるので、−
散出力となり、第1種学習(ステップ522)に制御を
渡す。第1種学習では修正後変換結果バッファ8に格納
されている仮名「じつけんの−ないよう」から一致した
自立語「しつけん」を削除し「の−ない町う」を第1種
切りなおし学習辞書3に付加する(第12図)。
Learning of bunsetsu boundaries is performed as shown in FIG. In FIG. 4, an independent word comparison immediately before a break is performed (step 521). That is, the first independent word in the unmodified conversion result buffer 7 and the first independent word in the post-modified conversion result buffer 8 are compared. In this case, since both are "experiments", −
It becomes a scattered output, and control is passed to type 1 learning (step 522). In type 1 learning, the matching independent word ``shitsuken'' is deleted from the kana ``jitsuken no-naiyo'' stored in the corrected conversion result buffer 8, and ``no-nai machiu'' is recut to type 1. Add it to learning dictionary 3 (Figure 12).

このJうに学習したのち、オペレータが再び仮名「しつ
けんのないよう」を変換しようとすると、仮名漢字変換
部1が呼び出され、第2図の処理が行われる。候補生成
の過程は上記と同一である。変換結果決定(ステップS
5)では第1種切りなおし学習辞書3のデータ「の−な
いまう」と整合する候補「実験の内容」を変換結果とし
て選択する。
After learning this way, when the operator tries to convert the kana ``Shitsuken no Naiyo'' again, the kana-kanji converter 1 is called and the process shown in FIG. 2 is performed. The candidate generation process is the same as above. Conversion result determination (step S
In 5), the candidate "experiment content" that matches the data "no-naimau" in the first type recut learning dictionary 3 is selected as the conversion result.

また以上の文節切りなおしおよび学習が実行された後に
、上述の「しつけんのないよう」と類似の誤変換を伴う
「ちょうさのないよう」なる入力仮名文字列に対する変
換の過程を考える。「シラけんのないよう」なる入力仮
名文字列に対する変換と同様にして、第9図に示すよう
な候補を候補バッファCBに格納する。変換結果決定(
ステップS5)では第1種切りなおし学習辞書3のデー
タ「の−ないよう」と整合する候補「調査の内容」を変
換結果として選択する。この場合には「調査のないよう
」という誤変換が回避される。
Also, consider the process of converting the input kana character string ``chosa no naiyo'' which involves a similar erroneous conversion to the above-mentioned ``shitsuke ken no naiyo'' after the above bunsetsu re-cutting and learning have been performed. Similar to the conversion of the input kana character string "Shiraken no Naiyo", candidates as shown in FIG. 9 are stored in the candidate buffer CB. Conversion result determination (
In step S5), the candidate "contents of investigation" that matches the data "no-naiyo" in the first type recut learning dictionary 3 is selected as the conversion result. In this case, the erroneous translation of "no investigation" is avoided.

つぎに、「ごかんせい」なる入力仮名文字列に対する変
換、文節切りなおし及び再変換の過程を示す。
Next, the process of converting, re-splitting, and re-converting the input kana character string "Gokansei" will be described.

候補生成の過程は「しつけんのないよう」なる入力仮名
文字列に対する変換と同様であり、図10図に示すよう
な候補を候補バッファCBに格納する。文節切りなおし
学習前の変換では、変換結果決定(ステップS5、第2
図)は「御完成」を変換結果として選択する。
The process of generating candidates is similar to the conversion of the input kana character string ``Shitsuken no Naiyo'', and candidates as shown in FIG. 10 are stored in the candidate buffer CB. In the conversion before bunsetsu re-learning, the conversion result is determined (step S5, second
(Figure) selects "Completion" as the conversion result.

ついで、オペレータが文節切りなおしを行って「御完成
」を「互換性」に修正する過程において、修正前変換結
果の保存(S11、第3図)は修正前変換結果バッファ
7に漢字rIII完戒」および仮名「ご−かんせい」を
格納する。オペレータによる文節切りの指定(312)
は文節切り指定データ・バッファ5に「4」を格納する
(ごがん−せい)。仮名漢字変換の指示(S13)によ
って仮名漢字変換部1が呼び出される。変換結果決定(
SS、第2図)は文節切り指定データ「4」を参照して
、第10図に示す候補の中から第4文字「せ」が文節先
頭となるような候補「互換性」を選択する。修正後変換
結果の保存(S14、第3図)は修正後変換結果バッフ
ァ8に漢字「互換性」および仮名「どかん−せい」を格
納する。学習の指示(815)は学習部5を呼び出す。
Then, in the process where the operator re-cuts the phrases and corrects ``gosakusen'' to ``compatibility,'' the pre-correction conversion result is saved (S11, Figure 3) in the pre-correction conversion result buffer 7 as kanji rIII Kanji. ” and the kana “Go-kansei” are stored. Specifying bunsetsu cut by operator (312)
stores "4" in the bunsetsu cut designation data buffer 5 (gogan-sei). The kana-kanji conversion unit 1 is called by the instruction for kana-kanji conversion (S13). Conversion result determination (
SS (FIG. 2) refers to the clause cut designation data "4" and selects the candidate "compatibility" in which the fourth character "se" is the beginning of the clause from among the candidates shown in FIG. To save the modified conversion result (S14, FIG. 3), the kanji character "compatibility" and the kana "dokan-sei" are stored in the modified conversion result buffer 8. The learning instruction (815) calls the learning section 5.

区切りの直前の自立語比較では(ステップS21、第4
図)修正前変換結果バッファ7の第1自立語と修正後変
換結果バッファ8の第1自立語とを比較する。この場合
には、「御」と「互換」であるので、不一致出力となり
、第2種学習S23に制御を渡す。第2種学習23では
修正後変換結果バッファ8に格納されている仮名「ごが
ん−せい」を第2種切りなおし学習辞書4に付加する(
第13図)。
In the independent word comparison immediately before the break (step S21, the fourth
Figure) The first independent word in the conversion result buffer 7 before correction and the first independent word in the conversion result buffer 8 after correction are compared. In this case, since it is "compatible" with "go", a mismatch output occurs and control is passed to the second type learning S23. In the second type learning 23, the kana "Gogan-sei" stored in the modified conversion result buffer 8 is added to the second type recutting learning dictionary 4 (
Figure 13).

こののちオペレータが再び仮名「どかんせい」を変換し
ようとすると、仮名漢字変換部1が呼び出される。候補
生成の過程は上記と同一である。
After this, when the operator attempts to convert the kana "Dokansei" again, the kana-kanji conversion unit 1 is called. The candidate generation process is the same as above.

変換結果決定(S5)は第2種切りなおし学習辞書4の
データ「ごがん−せい」と整合する候補「互換性」を変
換結果として選択する。
In the conversion result determination (S5), the candidate "compatibility" that matches the data "gogan-sei" in the second type recut learning dictionary 4 is selected as the conversion result.

つぎに、以上の文節切りなおしおよび学習が実行された
のちに、「ごかん竺と」と類似する「ききこう翌」なる
入力仮名文字列に対する変換の過程を示す。第11図に
示すような候補が候補バッファCB(第2図)に格納さ
れる。変換結果決定(S5〉は、第1種切りなおし学習
辞書3および第2種切りなおし学習辞書6の中に整合す
る候補が存在しないので、何も学習されていない場合と
同じ候補「機器構成」を変換結果として選択する。
Next, the process of converting the input kana character string ``Kikiko next'', which is similar to ``Gokanjikuto'', after the above-mentioned bunsetsu re-cutting and learning is performed, will be described. Candidates as shown in FIG. 11 are stored in the candidate buffer CB (FIG. 2). Conversion result determination (S5) determines the same candidate "equipment configuration" as if nothing has been learned, since there is no matching candidate in the first type recutting learning dictionary 3 and the second type recutting learning dictionary 6. Select as the conversion result.

なおこの例で、互換性(「ごかん−せい」)の文i境界
の学習時に「(任意の自立語)−せい」〈第1付属語は
空文字列)が第1種切りなおし辞書3に登録されている
と、「機器甲性」が誤って変換出力されるが(第11図
の3番目の候補)、この実施例のまうに第1自立語の判
定によってこのような文節境界については一括的な学習
を行わず、個別の学習を行えば、以上のJうな問題がな
い。
In addition, in this example, when learning the sentence i boundary of compatibility (“gokan-sei”), “(any independent word)-sei” (the first attached word is an empty string) is entered in the first type reshuffling dictionary 3. If it is registered, "Device-K" will be erroneously converted and output (the third candidate in Fig. 11), but in this example, by determining the first independent word, such clause boundaries can be detected. If you do individual learning instead of all at once, you won't have any of the above problems.

この実施例の効果を確かめるために954文節からなる
文章(日本学術会議第14期活動計画、昭和63年11
月)を仮名漢宇変換してみた。この場合この実施例の学
習を行わないと第14図に示すように21個の境界誤り
があった。そして実施例に詰る学習の下ではそのうちの
7個を防止できた。境界誤りEO2の包括的な学習にま
りE07およびE15が回避され、EO5によりEO9
が回避され、EllによりE16が回避され、E18に
よりE19、E20およびE21が回避される。
In order to confirm the effectiveness of this example, a text consisting of 954 clauses (Science Council of Japan, 14th term activity plan, November 1988)
I tried converting the month) into kana and kanyu. In this case, if learning according to this embodiment was not performed, there would be 21 boundary errors as shown in FIG. Seven of them were able to be prevented by learning through practical examples. Due to comprehensive learning of boundary error EO2, E07 and E15 are avoided, and EO5 causes EO9
is avoided, E16 is avoided by Ell, and E19, E20, and E21 are avoided by E18.

F6発明の詳細 な説明したJうに、この発明では、文節切りを学習する
ときに、正しい文節境界を包含する文節切り誤り時の文
節に含まれる自立語が、正しい文節境界の直前の正置時
の文節に含まれる自立語と同じときに、当該文節の自立
語に変えて任意の自立語表示を用いて学習を行うように
している。
F6 As described in the detailed explanation of the invention, in this invention, when learning bunsetsu cutting, an independent word included in the bunsetsu-cutting error clause that includes the correct bunsetsu boundary is placed directly before the correct bunsetsu boundary. When the word is the same as an independent word included in a clause, learning is performed using an arbitrary independent word display instead of the independent word of the clause.

このJうにして包括的な文節切りの学習が可能となる。In this way, comprehensive learning of bunsetsu cuts becomes possible.

他方、正しい文節境界を包含する文節切り誤り時の文節
に含まれる自立語が、正しい文節境界の直前の正置時の
文節に含まれる自立語と異なるときには、当該文節の自
立語自体を用いて、包括的な学習を止め、包括的な学習
による弊害が生じないまうにしている。
On the other hand, if the independent word included in the clause at the time of bunsetsu cut error that includes the correct clause boundary is different from the independent word included in the clause at the time of correct positioning immediately before the correct clause boundary, the independent word itself of the clause is used. , they stop comprehensive learning and prevent the negative effects of comprehensive learning from occurring.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はこの発明の1実施例の構成を示すブロック図、
第2図は第1図の実施例の仮名漢字変換部1の動作を説
明するフローチャート、第3図は同実施例の文節切りな
おし部6の動作を説明するフローチャート、第4図は同
実施例の学習部9の動作を説明するフローチャート、第
5図ないし第13rI!Jは同実施例の動作に供する図
、第14図は同実施例の効果の説明に供する図である。 1・・・仮名漢字変換部、2・・・辞書、3−・・第1
種切りなおし学習辞書、4−・・第2種切りなおし学習
辞書、5・・・文節切り指定データ・バッファ、6・・
・文節切りなおし部、7・・・修正前変換結果バッファ
、8・・・修正誤変換結果バッファ、9・・・学習部。 出願人 インターナショナル・ビジネス・マシーンズ・
コーポレーション 復代理人  弁理士  澤 1)俊 夫1  ’   
            、BB#2換部の流れ図 第2図 UT 1          、  −5i4文節バッファ 第7図
FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention;
FIG. 2 is a flowchart explaining the operation of the kana-kanji converter 1 in the embodiment shown in FIG. 1, FIG. 3 is a flowchart explaining the operation of the phrase cutting unit 6 in the embodiment, and FIG. 4 is the embodiment Flowcharts illustrating the operation of the learning section 9 of FIGS. 5 to 13 rI! J is a diagram for explaining the operation of the same embodiment, and FIG. 14 is a diagram for explaining the effects of the same embodiment. 1...Kana-kanji conversion section, 2...Dictionary, 3-...1st
Seed cutting learning dictionary, 4-... Second type cutting learning dictionary, 5... Bunsetsu cutting specification data buffer, 6...
- Phrase re-cutting unit, 7... uncorrected conversion result buffer, 8... corrected erroneous conversion result buffer, 9... learning unit. Applicant International Business Machines
Corporation sub-agent Patent attorney Sawa 1) Toshio 1'
, BB#2 exchange section flowchart Fig. 2 UT 1 , -5i4 clause buffer Fig. 7

Claims (7)

【特許請求の範囲】[Claims] (1)入力仮名文字列を仮名漢字混じり文に変換するた
めに、第1辞書部に登録されている第1群の語のうちの
1つに続けて第2辞書部に登録されている第2群の語の
うちの1つまたは空文字列を結合してなる文節単位を順
次生成し、上記入力仮名文字列に適合する文節単位の連
鎖を1または複数構成し、上記1の連鎖、または上記複
数の連鎖のうち所定の規則にしたがって選定したものを
仮名漢字混じり文として出力する連文節仮名漢字変換方
法において、 文節単位の境界の修正情報を受け取るステップと、 文節単位の境界の修正情報に適合するように上記連鎖の
1つを選定しなおして仮名漢字混じり文として再度出力
するステップと、 修正後の境界を包含する修正前の文節単位に含まれる上
記第1群の語を、上記再出力された仮名漢字混じり文に
含まれる上記修正された境界の直前の上記第1群の語に
比較するステップと、上記比較結果が不一致を示すとき
に、上記再出力された仮名漢字混じり文に含まれる、上
記修正後の境界の前の文節単位に相当する仮名文字列、
および上記再出力された仮名漢字混じり文に含まれる、
上記修正後の境界の後の文節単位のうちの少なくとも上
記第1群の語に相当する仮名文字列を第1の一連の仮名
文字列として登録し、かつ上記第1の一連の仮名文字列
における修正後の境界位置を指示する情報を登録するス
テップと、上記比較結果が一致を示すときに、上記再出
力された仮名漢字混じり文に含まれる、上記修正後の境
界の前の文節単位のうちの上記第1群の語を除いた部分
に相当する仮名文字列、および上記再出力された仮名漢
字混じり文に含まれる、上記修正後の境界の後の文節単
位のうちの少なくとも上記第1群の語に相当する仮名文
字列を第2の一連の仮名文字列として登録し、かつ上記
第2の一連の仮名文字列における上記修正後の境界位置
を指示する情報を登録するステップと、 上記第1の一連の仮名文字列が入力されたときに、また
は任意の上記第1群の語に続いて上記第2の一連の仮名
文字列が入力されたときに、上記登録された修正後の境
界位置で強制的に文節単位を分割するステップとを有す
ることを特徴とする連文節仮名漢字変換方法。
(1) In order to convert an input kana character string into a sentence containing kana and kanji, one of the words in the first group registered in the first dictionary part is followed by a word in the second group registered in the second dictionary part. Sequentially generate phrase units formed by combining one of the two groups of words or an empty string, and construct one or more chains of phrase units that match the input kana character string, and create the chain of 1 above or the above. In a continuous clause kana-kanji conversion method that outputs a kana-kanji-mixed sentence selected from a plurality of chains according to a predetermined rule, the method includes a step of receiving correction information on boundaries of bunsetsu units, and a step of receiving correction information on boundaries of bunsetsu units. re-selecting one of the above chains and re-outputting it as a kana-kanji-mixed sentence; The step of comparing the word of the first group immediately before the corrected boundary included in the kana-kanji mixed sentence contained in the re-outputted kana-kanji mixed sentence when the comparison result shows a mismatch. , the kana character string corresponding to the bunsetsu unit before the boundary after the above correction,
and included in the above re-outputted sentence containing kana and kanji,
A kana character string corresponding to at least a word of the first group among the bunsetsu units after the modified boundary is registered as a first series of kana character strings, and a kana character string in the first series of kana character strings A step of registering information indicative of the post-correction boundary position, and when the above comparison result indicates a match, one of the bunsetsu units before the post-correction boundary included in the re-output kana-kanji mixed sentence. Kana character string corresponding to the part excluding the first group of words, and at least the first group of clause units after the corrected boundary included in the re-outputted kana-kanji mixed sentence. registering a kana character string corresponding to the word as a second series of kana character strings, and registering information indicating the modified boundary position in the second series of kana character strings; When the first series of kana character strings is input, or when the second series of kana character strings is input following any of the first group of words, the registered modified boundary 1. A continuous clause kana-kanji conversion method comprising the step of forcibly dividing a clause unit by position.
(2)上記再出力された仮名漢字混じり文に含まれる、
上記修正後の境界の前の文節単位のうちの上記第1群の
語を除いた部分に相当する仮名文字列の1つに、空の仮
名文字列も含まれる請求項1記載の連文節仮名漢字変換
方法。
(2) Included in the above re-outputted sentence containing kana and kanji,
2. The continuous clause kana-kanji according to claim 1, wherein one of the kana character strings corresponding to the part of the clause unit before the modified boundary excluding the words of the first group includes an empty kana character string. Conversion method.
(3)入力仮名文字列を仮名漢字混じり文に変換するた
めに、1の自立語語に続けて1の付属語または空文字列
を結合して文節を順次生成し、上記入力仮名文字列に適
合する文節の連鎖を1または複数構成し、上記1の連鎖
、または上記複数の連鎖のうち所定の規則にしたがって
選定したものを仮名漢字混じり文として出力する連文節
仮名漢字変換方法において、 文節の境界の修正情報を受け取るステップと、文節の境
界の修正情報に適合するように上記連鎖の1つを選定し
なおして仮名漢字混じり文として再度出力するステップ
と、 修正後の境界を包含する修正前の文節に含まれる自立語
を、上記再出力された仮名漢字混じり文に含まれる上記
修正された境界の直前の自立語に比較するステップと、 上記比較結果が不一致を示すときに、上記再出力された
仮名漢字混じり文に含まれる、上記修正後の境界の前の
文節に相当する仮名文字列、および上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の後の文
節のうちの少なくとも自立語に相当する仮名文字列を第
1の一連の仮名文字列として登録し、かつ上記第1の一
連の仮名文字列における修正後の境界位置を指示する情
報を登録するステップと、 上記比較結果が一致を示すときに、上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の前の文
節単位のうちの自立語を除いた部分に相当する仮名文字
列、および上記再出力された仮名漢字混じり文に含まれ
る、上記修正後の境界の後の文節のうちの少なくとも自
立語に相当する仮名文字列を第2の一連の仮名文字列と
して登録し、かつ上記第2の一連の仮名文字列における
上記修正後の境界位置を指示する情報を登録するステッ
プと、 上記第1の一連の仮名文字列が入力されたときに、また
は任意の自立語に続いて上記第2の一連の仮名文字列が
入力されたときに、上記登録された修正後の境界位置で
文節切りを強制的に行うステップとを有することを特徴
とする連文節仮名漢字変換方法。
(3) In order to convert the input kana character string into a sentence containing kana and kanji, create clauses in sequence by combining 1 independent word followed by 1 attached word or empty string, and match the above input kana character string. In the continuous clause kana-kanji conversion method, which configures one or more chains of clauses, and outputs the above chain 1 or the chain selected according to a predetermined rule as a kana-kanji mixed sentence, a step of receiving correction information; a step of reselecting one of the above-mentioned chains to match the correction information of the bunsetsu boundary and outputting it again as a sentence containing kana and kanji; The step of comparing the independent words contained in The kana character string that is included in the kana-kanji mixed sentence and corresponds to the clause before the above-mentioned corrected boundary, and the clause that is included in the above-mentioned re-output kana-kanji mixed sentence after the above-mentioned corrected boundary. registering at least a kana character string corresponding to an independent word as a first series of kana character strings, and registering information indicating a modified boundary position in the first series of kana character strings; When the result shows a match, the kana character string corresponding to the part of the bunsetsu unit before the boundary after the above correction, excluding the independent word, included in the above re-outputted kana-kanji mixed sentence, and the above re-outputted kana character string A kana character string corresponding to at least an independent word among the clauses after the corrected boundary included in the outputted kana-kanji mixed sentence is registered as a second series of kana character strings, and registering information indicating the modified boundary position in the series of kana character strings; and when the first series of kana character strings is input or following any independent word, 1. A continuous phrase kana-kanji conversion method comprising the step of forcibly cutting phrases at the registered boundary position after correction when a series of kana character strings is input.
(4)入力仮名文字列を仮名漢字混じり文に変換するた
めに、第1辞書部に登録されている第1群の語のうちの
1つに続けて第2辞書部に登録されている第2群の語の
うちの1つまたは空文字列を結合してなる文節単位を順
次生成し、上記入力仮名文字列に適合する文節単位の連
鎖を1または複数構成し、上記1の連鎖、または上記複
数の連鎖のうち所定の規則にしたがって選定したものを
仮名漢字混じり文として出力する連文節仮名漢字変換装
置において、 文節単位の境界の修正情報を受け取る手段と、文節単位
の境界の修正情報に適合するように上記連鎖の1つを選
定しなおして仮名漢字混じり文として再度出力する手段
ヒ、 修正後の境界を包含する修正前の文節単位に含まれる上
記第1群の語を、上記再出力された仮名漢字混じり文に
含まれる上記修正された境界の直前の上記第1群の語に
比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
仮名漢字混じり文に含まれる、上記修正後の境界の前の
文節単位に相当する仮名文字列、および上記再出力され
た仮名漢字混じり文に含まれる、上記修正後の境界の後
の文節単位のうちの少なくとも上記第1群の語に相当す
る仮名文字列を第1の一連の仮名文字列として登録し、
かつ上記第1の一連の仮名文字列における修正後の境界
位置を指示する情報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の前の文
節単位のうちの上記第1群の語を除いた部分に相当する
仮名文字列、および上記再出力された仮名漢字混じり文
に含まれる、上記修正後の境界の後の文節単位のうちの
少なくとも上記第1群の語に相当する仮名文字列を第2
の一連の仮名文字列として登録し、かつ上記第2の一連
の仮名文字列における上記修正後の境界位置を指示する
情報を登録する第2の記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
記第1の一連の仮名文字列が入力されたことまたは上記
第2の一連の仮名文字列が入力されたことを判別する手
段と、 上記判別する手段の判別結果に応答して、上記第1の一
連の仮名文字列が入力されたときに、または任意の上記
第1群の語に続いて上記第2の一連の仮名文字列が入力
されたときに、上記登録された修正後の境界位置で強制
的に文節単位を分割する手段とを有することを特徴とす
る連文節仮名漢字変換装置。
(4) In order to convert the input kana character string into a sentence containing kana and kanji, one of the words in the first group registered in the first dictionary part is followed by a word in the second group registered in the second dictionary part. Sequentially generate phrase units formed by combining one of the two groups of words or an empty string, and construct one or more chains of phrase units that match the input kana character string, and create the chain of 1 above or the above. In a continuous clause kana-kanji conversion device that outputs a kana-kanji mixed sentence selected from a plurality of chains according to a predetermined rule, there is provided a means for receiving correction information on the boundaries of bunsetsu units, and a method adapted to the correction information on the boundaries of bunsetsu units. A means of re-selecting one of the above chains and re-outputting it as a sentence containing kana-kanji; a means of comparing the word of the first group immediately before the corrected boundary included in the kana-kanji mixed sentence, and when the comparison result shows a mismatch, the word included in the re-outputted kana-kanji mixed sentence. , the kana character string corresponding to the bunsetsu unit before the modified boundary, and at least the first group of clause units after the modified boundary included in the re-outputted kana-kanji mixed sentence. registering a kana character string corresponding to the word as a first series of kana character strings,
and a first storage means for registering information indicating the corrected boundary position in the first series of kana character strings; The kana character string that corresponds to the part of the bunsetsu unit before the boundary after the above correction excluding the words of the first group, and the above correction included in the re-outputted sentence containing kana and kanji. The kana character string corresponding to at least the first group of words in the clause units after the boundary of
a second storage means for registering information indicating the corrected boundary position in the second series of kana character strings; means for determining that the first series of kana character strings or the second series of kana character strings has been input by referring to the storage means; In response, said registration occurs when said first series of kana character strings is input, or when said second series of kana character strings is input following any said first group of words. and means for forcibly dividing a bunsetsu unit at the corrected boundary position.
(5)上記比較結果が一致を示すときに、上記再出力さ
れた仮名漢字混じり文に含まれる、上記修正後の境界の
前の文節単位のうちの上記第1群の語を除いた部分に相
当する仮名文字列の1つに、空の仮名文字列も含まれる
請求項4記載の連文節仮名漢字変換装置。
(5) When the above comparison result indicates a match, the part of the bunsetsu unit before the above-mentioned corrected boundary excluding the words of the first group included in the above-mentioned re-outputted kana-kanji mixed sentence 5. The continuous clause kana-kanji conversion device according to claim 4, wherein one of the corresponding kana character strings also includes an empty kana character string.
(6)入力仮名文字列を仮名漢字混じり文に変換するた
めに、1の自立語語に続けて1の付属語または空文字列
を結合して文節を順次生成し、上記入力仮名文字列に適
合する文節の連鎖を1または複数構成し、上記1の連鎖
、または上記複数の連鎖のうち所定の規則にしたがって
選定したものを仮名漢字混じり文として出力する連文節
仮名漢字変換装置において、 文節の境界の修正情報を受け取る手段と、 文節の境界の修正情報に適合するように上記連鎖の1つ
を選定しなおして仮名漢字混じり文として再度出力する
手段と、 修正後の境界を包含する修正前の文節に含まれる自立語
を、上記再出力された仮名漢字混じり文に含まれる上記
修正された境界の直前の自立語に比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
仮名漢字混じり文に含まれる、上記修正後の境界の前の
文節に相当する仮名文字列、および上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の後の文
節のうちの少なくとも自立語に相当する仮名文字列を第
1の一連の仮名文字列として登録し、かつ上記第1の一
連の仮名文字列における修正後の境界位置を指示する情
報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の前の文
節単位のうちの自立語を除いた部分に相当する仮名文字
列、および上記再出力された仮名漢字混じり文に含まれ
る、上記修正後の境界の後の文節のうちの少なくとも自
立語に相当する仮名文字列を第2の一連の仮名文字列と
して登録し、かつ上記第2の一連の仮名文字列における
上記修正後の境界位置を指示する情報を登録する第2の
記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
記第1の一連の仮名文字列が入力されたことまたは上記
第2の一連の仮名文字列が入力されたことを判別する手
段と、 上記判別する手段の判別結果に応答して、上記第1の一
連の仮名文字列が入力されたときに、または任意の自立
語に続いて上記第2の一連の仮名文字列が入力されたと
きに、上記登録された修正後の境界位置で文節切りを強
制的に行う手段とを有することを特徴とする連文節仮名
漢字変換装置。
(6) In order to convert the input kana character string into a sentence containing kana and kanji, sequentially generate clauses by combining 1 independent word followed by 1 attached word or empty string, and match the above input kana character string. In a continuous clause kana-kanji conversion device that configures one or more chains of clauses, and outputs the above chain 1 or the chain selected according to a predetermined rule as a kana-kanji mixed sentence, means for receiving correction information; means for reselecting one of the above chains to match the correction information for the boundary of the bunsetsu and re-outputting it as a sentence containing kana and kanji; and the clause before correction that includes the border after correction means to compare the independent word included in the above re-outputted sentence with the independent word immediately before the above-mentioned corrected boundary included in the above-mentioned re-outputted kana-kanji mixed sentence, and when the above-mentioned comparison result shows a mismatch, the above-mentioned re-output The kana character string that is included in the kana-kanji mixed sentence and corresponds to the clause before the above-mentioned corrected boundary, and the clause that is included in the above-mentioned re-output kana-kanji mixed sentence after the above-mentioned corrected boundary. A first storage means for registering at least a kana character string corresponding to an independent word as a first series of kana character strings, and for registering information indicating a modified boundary position in the first series of kana character strings. and, when the above comparison result indicates a match, the kana character string corresponding to the part of the bunsetsu unit before the above-mentioned corrected boundary excluding independent words, included in the above-mentioned re-outputted kana-kanji mixed sentence. , and registering a kana character string corresponding to at least an independent word among the clauses after the corrected boundary included in the re-outputted kana-kanji mixed sentence as a second series of kana character strings, and a second storage means for registering information indicating the corrected boundary position in the second series of kana character strings; means for determining that a series of kana character strings has been input or that the second series of kana character strings has been input; When a character string is input, or when the second series of kana character strings is input following any independent word, bunsetsu cutting is forcibly performed at the registered boundary position after correction. 1. A continuous clause kana-kanji conversion device characterized by having means.
(7)中央処理装置、記憶装置、表示装置および文字入
力装置を有してデータ処理行うとともに、入力仮名文字
列を仮名漢字混じり文に変換するために、第1辞書部に
登録されている第1群の語のうちの1つに続けて第2辞
書部に登録されている第2群の語のうちの1つまたは空
文字列を結合してなる文節単位を順次生成し、上記入力
仮名文字列に適合する文節単位の連鎖を1または複数構
成し、上記1の連鎖、または上記複数の連鎖のうち所定
の規則にしたがって選定したものを仮名漢字混じり文と
して出力するデータ処理装置において、 文節単位の境界の修正情報を受け取る手段と、文節単位
の境界の修正情報に適合するように上記連鎖の1つを選
定しなおして仮名漢字混じり文として再度出力する手段
と、 修正後の境界を包含する修正前の文節単位に含まれる上
記第1群の語を、上記再出力された仮名漢字混じり文に
含まれる上記修正された境界の直前の上記第1群の語に
比較する手段と、 上記比較結果が不一致を示すときに、上記再出力された
仮名漢字混じり文に含まれる、上記修正後の境界の前の
文節単位に相当する仮名文字列、および上記再出力され
た仮名漢字混じり文に含まれる、上記修正後の境界の後
の文節単位のうちの少なくとも上記第1群の語に相当す
る仮名文字列を第1の一連の仮名文字列として登録し、
かつ上記第1の一連の仮名文字列における修正後の境界
位置を指示する情報を登録する第1の記憶手段と、 上記比較結果が一致を示すときに、上記再出力された仮
名漢字混じり文に含まれる、上記修正後の境界の前の文
節単位のうちの上記第1群の語を除いた部分に相当する
仮名文字列、および上記再出力された仮名漢字混じり文
に含まれる、上記修正後の境界の後の文節単位のうちの
少なくとも上記第1群の語に相当する仮名文字列を第2
の一連の仮名文字列として登録し、かつ上記第2の一連
の仮名文字列における上記修正後の境界位置を指示する
情報を登録する第2の記憶手段と、 上記第1の記憶手段および第2の記憶手段を参照して上
記第1の一連の仮名文字列が入力されたことまたは上記
第2の一連の仮名文字列が入力されたことを判別する手
段と、 上記判別する手段の判別結果に応答して、上記第1の一
連の仮名文字列が入力されたときに、または任意の上記
第1群の語に続いて上記第2の一連の仮名文字列が入力
されたときに、上記登録された修正後の境界位置で強制
的に文節単位を分割する手段とを有することを特徴とす
るデータ処理装置。
(7) It has a central processing unit, a storage device, a display device, and a character input device to perform data processing and to convert an input kana character string into a sentence containing kana and kanji. One of the words of the first group is successively combined with one of the words of the second group registered in the second dictionary section or an empty string to generate phrase units, and the above-mentioned input kana characters are generated. In a data processing device that configures one or more chains of clause units that match a column and outputs the above chain 1 or the chain selected according to a predetermined rule from the above plural chains as a kana-kanji mixed sentence, a means for receiving correction information on the boundaries of the sentence; a means for reselecting one of the above chains so as to match the correction information on the boundaries of each bunsetsu unit and outputting it again as a sentence containing kana and kanji; means for comparing the first group of words included in the bunsetsu unit before correction with the first group of words immediately before the corrected boundary included in the re-outputted kana-kanji mixed sentence; When the result shows a mismatch, the kana string corresponding to the bunsetsu unit before the boundary after the above correction, which is included in the re-outputted kana-kanji mixed sentence, and the kana character string included in the above-mentioned re-outputted kana-kanji mixed sentence registering, as a first series of kana character strings, kana character strings that correspond to at least the first group of words among the clause units after the modified boundary;
and a first storage means for registering information indicating the corrected boundary position in the first series of kana character strings; The kana character string that corresponds to the part of the bunsetsu unit before the boundary after the above correction excluding the words of the first group, and the above correction included in the re-outputted sentence containing kana and kanji. The kana character string corresponding to at least the first group of words in the clause units after the boundary of
a second storage means for registering information indicating the corrected boundary position in the second series of kana character strings; means for determining that the first series of kana character strings or the second series of kana character strings has been input by referring to the storage means; In response, said registration occurs when said first series of kana character strings is input, or when said second series of kana character strings is input following any said first group of words. and means for forcibly dividing a bunsetsu unit at the corrected boundary position.
JP2323431A 1990-11-28 1990-11-28 Renbun-kana kana-kanji conversion method and device Expired - Fee Related JPH0748213B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2323431A JPH0748213B2 (en) 1990-11-28 1990-11-28 Renbun-kana kana-kanji conversion method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2323431A JPH0748213B2 (en) 1990-11-28 1990-11-28 Renbun-kana kana-kanji conversion method and device

Publications (2)

Publication Number Publication Date
JPH04195253A true JPH04195253A (en) 1992-07-15
JPH0748213B2 JPH0748213B2 (en) 1995-05-24

Family

ID=18154603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2323431A Expired - Fee Related JPH0748213B2 (en) 1990-11-28 1990-11-28 Renbun-kana kana-kanji conversion method and device

Country Status (1)

Country Link
JP (1) JPH0748213B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442685A (en) * 2019-08-14 2019-11-12 杭州品茗安控信息技术股份有限公司 Data extending method, apparatus, equipment and the storage medium of architectural discipline dictionary

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61147366A (en) * 1984-12-20 1986-07-05 Matsushita Electric Ind Co Ltd Japanese sentence generator
JPS63308665A (en) * 1987-06-10 1988-12-16 Seiko Epson Corp Kana/kanji converting device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61147366A (en) * 1984-12-20 1986-07-05 Matsushita Electric Ind Co Ltd Japanese sentence generator
JPS63308665A (en) * 1987-06-10 1988-12-16 Seiko Epson Corp Kana/kanji converting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442685A (en) * 2019-08-14 2019-11-12 杭州品茗安控信息技术股份有限公司 Data extending method, apparatus, equipment and the storage medium of architectural discipline dictionary

Also Published As

Publication number Publication date
JPH0748213B2 (en) 1995-05-24

Similar Documents

Publication Publication Date Title
US5148367A (en) European language processing machine with a spelling correction function
EP0222572A2 (en) Stenographic translation systems and methods
JPS60189565A (en) Kana/kanji converter
JPH04195253A (en) Continuous clause japanese-syllabary chinese-character conversion method and device
JPH0351022B2 (en)
JP2000123116A (en) Character recognition result correction method
JPH0484261A (en) Error notation retrieval system
JPS605318A (en) Input device of sentence composed of kana and kanji
JPH05135098A (en) Method by which error in sentence composed of natural language is corrected with computer system and apparatus suitable for executing this method
JP2936761B2 (en) Proofreading device for Japanese documents
JPH0267684A (en) Calibration supporting system and dictionary retrieving system
JPS59127150A (en) Sentence reading and checking device
JPH0721171A (en) Key input correcting device
Lang et al. Information storage and retrieval: a dictionary project
JPH0433058A (en) Machine translation device
JPH09293074A (en) Document preparation device and misinput correcting method
JPH03202951A (en) Japanese sentence processor
Szanser Automatic error-correction in natural languages
JPH0546344A (en) Japanese language input device
JPH0630100B2 (en) Kana-Kanji conversion method
JPH10154141A (en) Kana-to-kanji (japanese syllabary-to-chinese character) conversion device
JPS62100859A (en) Sentence input device
JPH0289191A (en) Recognized result correcting system
JPH0235564A (en) Japanese input device
JPH02136956A (en) Extracting method for layout information

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees