JPH02255935A - Kana/kanji conversion system - Google Patents

Kana/kanji conversion system

Info

Publication number
JPH02255935A
JPH02255935A JP1015061A JP1506189A JPH02255935A JP H02255935 A JPH02255935 A JP H02255935A JP 1015061 A JP1015061 A JP 1015061A JP 1506189 A JP1506189 A JP 1506189A JP H02255935 A JPH02255935 A JP H02255935A
Authority
JP
Japan
Prior art keywords
kana
kanji
conversion
proper
kanji conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1015061A
Other languages
Japanese (ja)
Inventor
Katsuya Kono
河野 勝也
Teiko Miyazaki
宮崎 弟子
Masao Sasaki
正夫 佐々木
Keijiro Hori
堀 桂二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP1015061A priority Critical patent/JPH02255935A/en
Publication of JPH02255935A publication Critical patent/JPH02255935A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To produce the KANJI (Chinese character)-KANA (Japanese syllabary) sentences with no mistake by performing the KANA-KANJI conversion for each paragraph and correcting automatically the improper result of conversion if detected by a prescribed number of times into another proper form. CONSTITUTION:A user inputs an unconverted KANA character string to an unconverted character string buffer 1, and this input character string is converted by a KANA/KANJI conversion system 2 and stored in a converted character string buffer 3. If the user is not satisfied with the result of conversion, the converted character string is corrected by a human intervention corrector 4 and the final corrected character string is obtained at a final character string buffer 5. A proper noun adoption/rejection controller 7 decides a case where the value is set with a parameter instruction of the user or with a manual setting operation or a case where the value is set by a proper noun learning computing element 6 with the use of a preference information setter 8. Then the controller 7 controls the system 2 to instructs the adoption or rejection of proper nouns. The element 6 analyzes systematically the information on the buffer 5 and controls the adoption/rejection of the subsequent proper nouns in terms of learning.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は1日本語のカナ漢字変換方式に係り、特に、固
有名詞を含むカナ読み文を誤りなく漢字カナ混じり文に
変換するカナ漢字変換方式に関する。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a Japanese kana-kanji conversion method, and in particular, to a kana-kanji conversion method that converts kana reading sentences containing proper nouns into sentences containing kanji and kana without errors. Regarding the method.

[従来の技術] 一般に、ワークステーションやワードプロセッサ等での
複文節のカナ漢字変換処理方式においては、ひらがなよ
みに対する漢字の変換情報を格納する用語辞書を備え、
入力されるひらがなよみ文に対して、アルゴリズムによ
り、該用語辞書に収録された用語と一致する用語単位を
文節とみなす自動文節認定処理を行っている。この種の
カナ漢字変換処理方式において、姓名用語や、地名用語
や、企業法人用語等の固有名詞の変換を行なうために、
用語辞書中にこれらの固有名詞を追加登録する必要があ
る。なお、入力されたカナ表記の日本文中の固有名詞の
接続関係の妥当性を判別して、固有名詞を漢字に変換す
る従来技術について、例えば特開昭55−43627号
公報がある。
[Prior Art] Generally, in a kana-kanji conversion processing method for complex phrases on a workstation or word processor, a terminology dictionary is provided that stores conversion information of kanji for hiragana reading.
An algorithm performs automatic clause recognition processing on input Hiragana reading sentences, in which term units that match terms recorded in the term dictionary are regarded as clauses. In this type of kana-kanji conversion processing method, in order to convert proper nouns such as name terms, place name terms, and corporate corporation terms,
It is necessary to additionally register these proper nouns in the term dictionary. Note that Japanese Patent Laid-Open No. 55-43627, for example, discloses a prior art technique for determining the validity of connections between proper nouns in an input Japanese sentence written in kana and converting the proper nouns into kanji.

[発明が解決しようとする課題] 上記従来技術では、固有名詞を用語辞書に追加すればす
る程、汎用性を増すことができるが、反面、これらの固
有名詞が普通品詞からなる文節と認定されたり、あるい
は逆に、本来の普通品詞と助詞からなる文節が誤って固
有名詞と認定されたりして1文章のカナ漢字変換処理に
好ましくない影響を与え、性能の低下をもたらしていた
[Problems to be Solved by the Invention] In the above-mentioned conventional technology, the more proper nouns are added to the terminology dictionary, the more versatile it can be. Or, conversely, a clause consisting of a normal part of speech and a particle may be mistakenly recognized as a proper noun, which has an undesirable effect on the kana-kanji conversion process for a single sentence, resulting in a drop in performance.

例えば、通常の文章のカナ漢字変換処理方式では、前記
の文節の認定処理において、最長−教法により文節を認
定する手法が用いられる。この手法は、同じ発音(かな
よみ)に対して漢字数の長いものと短いものとが用語辞
書に登録されていた場合に、漢字数の最も長いものを採
用する方法であり、固有名詞はその語長(漢字数)が長
いために、あるかなよみに対して固有名詞が優先的に採
用される可能性が高く、性能低下の要因となっている。
For example, in a normal Kana-Kanji conversion processing method for sentences, a method of recognizing phrases using the longest-teaching method is used in the phrase recognition process described above. This method is a method in which when the same pronunciation (Kanayomi) has long and short kanji characters registered in the terminology dictionary, the one with the longest number of kanji characters is adopted, and the proper noun is the one with the longest number of kanji characters. Due to the long word length (number of kanji characters), there is a high possibility that proper nouns will be preferentially adopted over certain kana readings, which is a factor in the performance decline.

第4図は、従来の通常のカナ漢字変換処理方式の一例を
示す、11ほかな読みの入力日本文、12は該入力日本
文を、アルゴリズムによる文節設定によりカナ漢字変換
するカナ漢字変換部で、該変換部12では、ひらがな人
力「うえの」に対する登録文字「上野」と「上の」のう
ち、最長−教法により「上野」が選択される。したがっ
て、変換後の文字列33には、誤って固有名詞「上野」
が採択される。そこで、ユーザは、人手による補正介入
14を行なって、正しい漢字カナ混じり文15を得る必
要がある。
Figure 4 shows an example of the conventional normal kana-kanji conversion processing method. 11 is an input Japanese sentence with other readings, and 12 is a kana-kanji conversion unit that converts the input Japanese sentence into kana-kanji by setting phrases using an algorithm. , the conversion unit 12 selects "Ueno" from among the registered characters "Ueno" and "Kami" for the hiragana human power "Ueno" according to the longest-teaching method. Therefore, the character string 33 after conversion incorrectly contains the proper noun "Ueno".
is adopted. Therefore, the user needs to perform manual correction intervention 14 to obtain a correct sentence 15 containing kanji and kana.

一方、ワークステーションやワードプロセッサ等のカナ
漢字変換処理において、用途によっては通常のカナ漢字
変換処理よりも多くの姓名、地名や企業性人名等の固有
名詞が必要になることがある0例えば1人名簿や企業名
簿を作成する場合などがある。その場合には、用語辞書
に相当の分量の固有名詞を登録するようになる。このよ
うな形式のカナ漢字変換処理では、同じかなよみに対し
て普通品詞を採用するよりも固有名詞を採用した方が、
誤りとなる確率は低くなる。
On the other hand, in the kana-kanji conversion process of workstations, word processors, etc., depending on the application, more proper nouns such as surnames, place names, and company names may be required than in normal kana-kanji conversion processes. In some cases, a company directory may be created. In that case, a considerable number of proper nouns will be registered in the term dictionary. In this type of kana-kanji conversion process, it is better to use proper nouns than to use common parts of speech for the same kana reading.
The probability of making an error is lower.

そこで、カナ漢字変換処理を2つの型、すなわち、同一
のかな読み入力に対して、用語辞書中の固有名詞を優先
して採用する形式の「固有名詞優先型」と、用語辞書中
の普通品詞、普通名称等(助詞の組合せを含む)を優先
して採用する形式の「普通品詞優先型」とに分け、用途
や対象など状況に応じて、そのいずれかの型を切換えて
採用することが考えられる。しかし、このような固定し
た型の1つを予め選択してから変換処理を実行する方式
では、処理の途中で(例えば、ユーザが期待する漢字カ
ナ混り文の中に、固有名詞が不適切に混入するなど)そ
の適合性がよくないことがわかったとき、別の型に変更
して処理をやり直さなければならず面倒である。
Therefore, there are two types of kana-kanji conversion processing: a ``proper noun priority type,'' which prioritizes proper nouns in the terminology dictionary for the same kana-yomi input, and a ``proper noun priority type,'' which prioritizes proper nouns in the terminology dictionary. It is divided into the ``ordinary part-of-speech priority type,'' which prioritizes ordinary names, etc. (including combinations of particles), and it is possible to switch and adopt one of these types depending on the situation such as usage and target. Conceivable. However, with this method of selecting one of these fixed types in advance and then executing the conversion process, sometime during the process (for example, if a proper noun is inappropriately used in a sentence containing kanji and kana that the user expects) When it is found that the compatibility is not good (e.g. mixed with other types), the process must be repeated by changing to a different type, which is cumbersome.

そこで、カナ漢字変換処理を行ないながら、いくつかの
文節のカナ漢字変換に不適切が見出されたならば、その
都度文節認定処理を別の型に動的に変えるようにすれば
、適切な変換が容易に行なわれると考えられる。
Therefore, if it is found that the kana-kanji conversion of some phrases is inappropriate while performing the kana-kanji conversion process, it is possible to dynamically change the phrase recognition process to a different type each time. It is believed that the conversion is easily performed.

従って、本発明の目的は、上記従来技術の問題点を解消
し、カナ漢字変換後の文において、本来固有名詞とすべ
き個所には固有名詞が得られるようにすると共に1本来
普通品詞等が来るべき一個所に固有名詞が不適切に混入
するのを防止し、更に、アルゴリズムによる自動文節認
定処理を行ないながら、いくつもの文節の不適切なカナ
漢字変換が行なわれたときには、学習的に以後の変換を
適切な形式のものに動的に変更することのできるカナ漢
字変換方式を提供することにある。
Therefore, an object of the present invention is to solve the above-mentioned problems of the prior art, and to make it possible to obtain proper nouns in places that should originally be proper nouns in sentences after kana-kanji conversion, and to make it possible to obtain proper nouns in places where proper nouns should originally be used. In addition to preventing proper nouns from being inappropriately mixed into a single location, the algorithm also performs automatic phrase recognition processing, and when inappropriate kana-kanji conversion is performed for multiple phrases, it can be learned from the next step. The purpose of this invention is to provide a kana-kanji conversion method that can dynamically change the conversion of ``kana'' to an appropriate format.

[課題を解決するための手段] 上記目的を達成するため1本発明のカナ漢字変換方式は
、基本思想として、自動文節認定処理によるカナ漢字変
換を行ないながら、不適切なカナ漢字変換処理(各文節
の処理)が所定回数行なわれたときには、より適切な型
式のカナ漢字変換手法に動的に変更する手段を設けたこ
とを特徴とする。
[Means for Solving the Problems] In order to achieve the above object, the basic concept of the kana-kanji conversion method of the present invention is to perform kana-kanji conversion by automatic phrase recognition processing, while also performing inappropriate kana-kanji conversion processing (each The present invention is characterized in that it is provided with means for dynamically changing to a more appropriate type of kana-kanji conversion method when the process (processing of clauses) has been performed a predetermined number of times.

具体的には、不適切な文節カナ漢字変換処理が発見され
る毎に、人手介入によりこれを適切な漢字カナ混り文に
補正すると共に、この人手介入が所定回数(例えば2回
)続くときには、以後の文節カナ漢字変換処理では適切
な品詞を優先的に採用するように、その採用基準を自動
的に改める。
Specifically, each time an inappropriate bunsetsu kana-kanji conversion process is discovered, it is manually corrected to an appropriate kanji-kana-mixed sentence, and when this manual intervention continues a predetermined number of times (for example, twice), , the selection criteria will be automatically revised so that appropriate parts of speech are preferentially adopted in the subsequent bunsetsu kana-kanji conversion process.

例えば、用語辞書の固有名詞を優先採用する固有名詞型
を適用していて、その採用結果が適切であれば、そのま
ま固有名詞型が続行されるが(固有名詞を、カナ漢字変
換における文節の候補として採用されるが)、その採用
結果が2回続けて不適切であれば、以後は普通品詞を優
先採用する普通品詞型に改められる。また、逆に、普通
品詞型が適用されていて、その採用結果が適切である場
合や不適切である場合にも、同様に、その形式をそのま
ま続行するかまたは適切な型に改められる。
For example, if you are applying a proper noun type that preferentially adopts proper nouns from a terminology dictionary, and the results are appropriate, the proper noun type will continue as is (if a proper noun is used as a candidate for a clause in kana-kanji conversion). However, if the result of the selection is inappropriate twice in a row, it will be changed to the common part-of-speech type, which gives priority to the common part of speech. Conversely, if the common part-of-speech type is applied and the adoption result is appropriate or inappropriate, the form can be continued as is or changed to an appropriate type.

更に、カナ漢字変換における文節の候補として、固有名
詞と普通品詞のいずれを採用しあるいは不採用とするか
を制御する制御手段(固有名詞採否制御器)を備える。
Furthermore, a control means (a proper noun acceptance/rejection controller) is provided for controlling whether a proper noun or a common part of speech is adopted or rejected as a clause candidate in kana-kanji conversion.

この制御手段は、ユーザによるパラメータ指示またはマ
ニュアル設定を可能にすると共に、上記の動的な学習法
、すなわち、ユーザによる補正介入を含むカナ漢字変換
の結果により得られた最終的な漢字カナ混り文を分析し
This control means allows for parameter indication or manual setting by the user, and the final Kanji-kana mixture obtained by the dynamic learning method described above, i.e., the result of kana-kanji conversion including corrective intervention by the user. Analyze the sentence.

統計的に見た固有名詞の使われ方により、学習的にその
採否を制御することを可能にする。
It makes it possible to control the adoption or rejection of proper nouns based on the way proper nouns are used from a statistical perspective.

[作用] 上記構成に基づく作用を説明する。[Effect] The operation based on the above configuration will be explained.

カナ漢字変換処理において、不適切な処理が所定回数行
なわれたときには、学習機能により、適切な型式の変換
手法に動的に変更されるので、姓名用語、地名用語、企
業法人名用語等の固有名詞が、変換された漢字カナ混り
文中に不適切に混入することがなく、変換機能の低下が
防止される。
In the kana-kanji conversion process, when inappropriate processing is performed a predetermined number of times, the learning function dynamically changes to the appropriate conversion method, so the uniqueness of name terms, place name terms, corporate corporation name terms, etc. A noun is not inappropriately mixed into a converted sentence containing kanji and kana, and a deterioration of the conversion function is prevented.

また、アルゴリズムによる自動文節認定処理において、
固有名詞の採否を制御する固有名詞採否制御器を設定す
ることにより、固有名詞が主体の場合は固有名詞を採用
し、そうでない場合は固有名詞を不採用にするという柔
軟性に富んだ動的処理が可能になる。
In addition, in the automatic clause recognition process using the algorithm,
By setting a proper noun acceptance/rejection controller that controls the acceptance or rejection of proper nouns, it is possible to adopt a proper noun when the subject is a proper noun, and to discard a proper noun otherwise. processing becomes possible.

この制御器の値は、外部(ユーザ)から与えられる優先
的なパラメータやマニュアル設定による場合と、実際に
ユーザが最終決定を下した漢字カナ混じり文の中におけ
る固有名詞の存在状態を統計的に分析した学習情報によ
り設定される場合とがある。すなわち、ユーザの指示に
よりある業務においては姓名用語等の固有名詞を優先的
に採用することもあるいは不採用にすることも可能にな
る。
The value of this control can be determined either by preferential parameters given from the outside (user) or by manual settings, or by statistically determining the state of existence of proper nouns in sentences containing kanji and kana, which are actually the final decision made by the user. It may be set based on analyzed learning information. In other words, it becomes possible to preferentially adopt or reject proper nouns such as surnames and terms in certain tasks based on instructions from the user.

また、これらの固有名詞の採否の指示が無い場合には、
アルゴリズムによるカナ漢字変換の結果に対するユーザ
の補正介入により最終的に認定された漢字カナ混じり文
を、新しく設けた固有名詞採否学習演算器により分析し
て、統計的に固有名詞の採用が多い傾向を示す場合は、
前記の固有名詞用語の採否を決定する制御器の値を採用
状態に設定し、そうでない場合は、不採用状態に設定す
る学習機能を設ける。これにより、制御値がフィードバ
ック的に設定され、いちいち、ユーザが状態を設定しな
くても通常にカナ漢字変換を使って自分が望んでいる文
章を作成していくことで自動的に固有名詞の採否を最適
な状態に設定することが可能になる。
In addition, if there is no instruction to adopt or reject these proper nouns,
A newly installed proper noun acceptance/rejection learning calculator analyzes the sentences containing kanji and kana, which are finally certified through the user's correction intervention on the results of kana-kanji conversion by the algorithm, and statistically shows the tendency for proper nouns to be adopted more frequently. If indicated,
A learning function is provided to set the value of the controller that determines whether the proper noun term is adopted or not to be adopted, and otherwise set it to be rejected. As a result, the control value is set in a feedback manner, and the user can automatically create the desired sentence using kana-kanji conversion without having to set the state one by one. It becomes possible to set acceptance/rejection in an optimal state.

[実施例] 以下1本発明の一実施例を図面により詳細に説明する。[Example] An embodiment of the present invention will be described below in detail with reference to the drawings.

第1図は、本発明の一実施例の構成を示すブロック図で
ある。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

同図において、1は変換前文字列バッファ、2はカナ漢
字変換器システム、3は変換後文字列バッファ、4は人
手介入補正器、5は最終文字列バッファ、6は固有名詞
採否学習演算器、7は固有名詞採否制御器、8は優先情
報設定器、9はイニシャライザである。
In the figure, 1 is a character string buffer before conversion, 2 is a kana-kanji converter system, 3 is a character string buffer after conversion, 4 is a human intervention corrector, 5 is a final character string buffer, and 6 is a proper noun acceptance/rejection learning calculator. , 7 is a proper noun adoption/rejection controller, 8 is a priority information setter, and 9 is an initializer.

ユーザは、変換前文字列バッファ1に変換前のカナ文字
列を入れ、カナ漢字変換システム2により変換後文字列
バッファ3に変換後文字列を得るが、この変換結果にユ
ーザが不満の場合は人手介入補正器4により補正して最
終文字列バッファ5に最終文字列を得る。固有名詞採否
制御器7は優先情報設定器8によりユーザのパラメータ
指示あるいはマニュアル設定により値がセットされる場
合と、固有名詞学習演算器6により値がセットされる場
合とあり、カナ漢字変換システム2を制御し、固有名詞
の採否を指示する。固有名詞採否学習演算器6は、最終
文字列バッファ5の情報を統計的に分析して、以降の固
有名詞の採否を学習的に制御する。9は6および7のイ
ニシャライザである。
The user inputs the pre-converted kana character string into the pre-conversion character string buffer 1, and obtains the converted character string in the post-conversion character string buffer 3 by the kana-kanji conversion system 2, but if the user is dissatisfied with this conversion result, A final character string is obtained in a final character string buffer 5 through correction by a manual intervention corrector 4. The proper noun acceptance/rejection controller 7 has a value set by the user's parameter instruction or manual setting by the priority information setting device 8, and a value is set by the proper noun learning calculator 6, and the kana-kanji conversion system 2 and instructs whether or not to use proper nouns. The proper noun acceptance/rejection learning calculator 6 statistically analyzes the information in the final character string buffer 5 and controls the acceptance/rejection of subsequent proper nouns in a learning manner. 9 is the initializer for 6 and 7.

第2図は、本発明の一実施例に用いられる固有名詞学習
演算器6の内部における、固有名詞の採否の学習機能を
説明するためのフローチャートである。
FIG. 2 is a flowchart for explaining the proper noun learning function within the proper noun learning calculator 6 used in one embodiment of the present invention.

同図において、61は、固有名詞学習演算器6の主要部
をなす固有名詞学習採否レジスタ(カウンタ)であり、
2″〜2″のnビットから成っている。同図の左側の各
位置におけるレジスタ61の数値記号t、〜t5等は、
右側のフローの対応する各ステップにおける値を示して
いる。
In the figure, 61 is a proper noun learning acceptance/rejection register (counter) which forms the main part of the proper noun learning calculator 6;
It consists of n bits from 2'' to 2''. The numerical symbols t, ~t5, etc. of the register 61 at each position on the left side of the figure are as follows:
The values at each corresponding step of the flow on the right are shown.

同図において、最初に、レジスタ61のt、〜t、には
初期値としてすべてOを設定する。同音異義語選択、再
変換などの補正操作がなかったときは(ステップ21)
、これはユーザの希望通りの変換結果が得られたときで
あるから、変換結果をそのまま採用して出力として取出
すと共に、直ぐに固有名詞採否制御器7へ動作を移す。
In the figure, first, t and t of the register 61 are all set to O as initial values. If there is no correction operation such as homophone selection or reconversion (step 21)
Since this is when the conversion result desired by the user has been obtained, the conversion result is adopted as is and taken out as an output, and the operation is immediately transferred to the proper noun acceptance/rejection controller 7.

ステップ21で、ユーザの人手介入により(人手介入補
正器により)同音異義語選択、再変換など補正操作が行
なわれたときは、補正結果を出力として取出すと共に、
該補正のあった文節が、補正の前または後で固有名詞を
含む文節であるか否かチエツクする(ステップ22)、
チエツクにより、固有名詞を含む文節ではないと判定さ
れたときは直ちに次の文節処理(ステップ26)に移る
が、固有名詞を含む文節であると判定されたときには、
レジスタ61を1ビツト左ヘシフトすると共に、それに
よって空いた右端ビットに0を設定する(ステップ23
)1次に、補正結果が固有名詞として採用されるものか
チエツクしくステップ24)、固有名詞としての採用で
ない場合はレジスタ61の値は変更されないが、固有名
詞として採用される場合はレジスタ61の右端ビットに
1を設定(Oからlに変更)する(ステップ25)6つ
まり、レジスタ61のビット値は、固有名詞採用時にI
I I II、固有名詞不採用時にit Onが設定さ
れる。
In step 21, when correction operations such as homophone selection and reconversion are performed by the user's manual intervention (by the manual intervention corrector), the correction results are extracted as output, and
Check whether the corrected clause is a clause that includes a proper noun before or after the correction (step 22);
If it is determined by the check that the phrase does not include a proper noun, the process immediately moves to the next phrase (step 26), but if it is determined that the phrase does include a proper noun,
The register 61 is shifted to the left by 1 bit, and the free rightmost bit is set to 0 (step 23).
)1 Next, check whether the correction result is adopted as a proper noun (step 24).If it is not adopted as a proper noun, the value of register 61 is not changed, but if it is adopted as a proper noun, the value of register 61 is changed. Set the rightmost bit to 1 (change from O to l) (step 25) 6 In other words, the bit value of register 61 is set to I when a proper noun is adopted.
I I II, it On is set when a proper noun is not adopted.

一方、固有名詞採否制御器7では、まず、固有名詞を第
1候補として当該文節中に含むかチエツクしくステップ
31)、含まなければ次の処理へ移り(ステップ36)
、含むときには、現在の型が固有名詞優先採用型である
かどうかをチエツクする(ステップ32)、なお、最初
に制御器7を固有名詞優先採用型とそうでない型のいず
れに設定するかは任意であり、この設定は、ユーザが優
先情報設定器8を参照することにより行なうことができ
る。最初はいずれの型に設定されても、学習を繰返して
行くことにより、対象とされる文章の用途、分野に適応
した型が取り入れられて、適切なカナ漢字変換処理が行
なわれるようになって行く。ステップ32で固有名詞型
が採用されている場合は、直ちに固有名詞を選択するこ
とになるが(ステップ34)、固有名詞型が採用されて
いない場合は、レジスタ61を調べ(ステップ33)、
その2°桁目と21桁目が共にオン(ビットJjj)で
あれば、固有名詞を選択する(ステップ34)。
On the other hand, the proper noun adoption/rejection controller 7 first checks whether a proper noun is included in the clause as the first candidate (step 31), and if it is not included, moves to the next process (step 36).
, when it is included, it is checked whether the current type is the proper noun preferential adoption type (step 32).It is optional whether the controller 7 is first set to the proper noun preferential adoption type or the other type. This setting can be made by the user by referring to the priority information setting unit 8. No matter which type is initially set, through repeated learning, the type adapted to the purpose and field of the target text will be adopted, and appropriate kana-kanji conversion processing will be performed. go. If the proper noun type is adopted in step 32, a proper noun is selected immediately (step 34), but if the proper noun type is not adopted, the register 61 is checked (step 33),
If both the 2nd and 21st digits are on (bit Jjj), a proper noun is selected (step 34).

つまり、一般に、固有名詞の採用、不採用の人手介入が
i回連続した場合に、以降のカナ漢字変換における採用
、不採用モードがどちらかに学習的に変わる。i=2と
すれば、2’ 、2@ビツトが状態モードを記憶し、i
=3とすれば、22.212fiビツトが状態モードを
記憶する。第2図の実施例では、i=2として、連続し
て2回人手介入があり固有名詞を採用した場合(ステッ
プ24で)には、それ以降、固有名詞を選択することと
する(ステップ34)、ステップ33で、ビット212
°が共にオンでなければ、第2候補以降(固有名詞以外
)でカナ漢字変換が行なわれる(35)。
In other words, in general, when manual intervention for adoption or rejection of a proper noun occurs i times in a row, the acceptance or rejection mode in the subsequent kana-kanji conversion changes in a learning manner. If i=2, 2', 2@bits store the state mode, and i
=3, then 22.212 fi bits store the state mode. In the embodiment shown in FIG. 2, if i=2 and a proper noun is adopted due to two consecutive manual interventions (at step 24), a proper noun will be selected from then on (step 34). ), step 33, bit 212
If both ° are not on, kana-kanji conversion is performed for the second and subsequent candidates (other than proper nouns) (35).

第3図は、本発明による固有名詞採否の制御によって、
望ましいカナ漢字変換が実施される場合の、全体のフロ
ーチャートを示す、同図において、ステップ41で、認
定する文節候補(入力「うえの」に対し、固有名詞であ
る「上野」、または普通名詞と助詞の組合せr上の」)
が抽出され、ステップ42で、抽出された文節候補中に
固有名詞があるかチエツクされ、固有名詞がなければ直
ちにステップ45の最長−教法による文節の設定に移る
が、固有名詞があればステップ43に移る。
FIG. 3 shows that by controlling the adoption or rejection of proper nouns according to the present invention,
In the same figure, which shows the overall flowchart when the desired kana-kanji conversion is performed, in step 41, the phrase candidates to be recognized (for the input "Ueno", the proper noun "Ueno" or the common noun on the particle combination r)
is extracted, and in step 42, it is checked whether there is a proper noun in the extracted clause candidate. If there is no proper noun, the process immediately moves to step 45, where the longest clause is set using the teaching method, but if there is a proper noun, step Moving on to 43.

ステップ43では、固有名詞不採用型かどうかチエツク
され、NOであれば直ちにステップ45に移るが、YE
Sであれば固有名詞「上野」を文節候補から取りはずし
、普通名詞と助詞の組合せr上の」を採用すべきものと
する(ステップ44)。
In step 43, it is checked whether the proper noun is not adopted, and if NO, the process immediately moves to step 45;
If S, the proper noun "Ueno" is removed from the clause candidates, and the common noun/particle combination "on r" is to be adopted (step 44).

なお、上記第2図の実施例では、i=2として連続して
2回の人手介入により固有名詞を採用する補正があった
場合を示したが、iを2以上の適当な値に設定するよう
にしてもよい。i=1としたのでは、1回毎に型が切換
って、システムが振動してしまって動作が安定しなくな
るおそれがあるので、適当でない。
In addition, in the example shown in FIG. 2 above, a case was shown in which i = 2 and correction was made to adopt a proper noun through two consecutive manual interventions, but i may be set to an appropriate value of 2 or more. You can do it like this. Setting i=1 is not appropriate because the molds are changed every time and the system may vibrate and the operation may become unstable.

また、上記実施例では、固有名詞優先型と固有名詞非優
先型の2つの型式を用いた場合であり、−旦、ある固有
名詞(例えば「上野」)について優先採用がきまれば、
型の変更がない限り他の固有名詞(例えば「中野」)も
優先採用されることになる。
Furthermore, in the above embodiment, two formats are used: a proper noun priority type and a proper noun non-priority type.
Unless there is a change in the type, other proper nouns (for example, ``Nakano'') will also be given priority.

優先情報設定器8による制御器7の値の設定は、ユーザ
が随時行なうことができ、この値は、パラメータやマニ
ュアル設定によりユーザの意志で固定することができる
ので1例えば姓名のカナ漢字変換を主体とする名簿作成
などの用途では、常に固有名詞である姓名用語を優先的
に採用し、通常の文章を作成する場合は固有名詞の混入
を排除する機能を持たせることもできる。
The user can set the value of the controller 7 using the priority information setting device 8 at any time, and this value can be fixed at the user's will by parameters or manual settings. For purposes such as creating a directory, it is possible to always preferentially use first and last names, which are proper nouns, and to eliminate the inclusion of proper nouns when creating regular sentences.

[発明の効果] 以上詳しく述べたように、本発明のカナ漢字変換方式に
よれば、ある型により文章の各文節についてカナ漢字変
換を行なって不適切な変換結果が所定回数発見されたと
きには、これをより適切な別の型に自動的に改めて以後
のカナ漢字変換処理を行なう学習機能が働くので、入力
日本文の用途分野、種類にすばやくかつ柔軟に対応して
、常に適切なカナ漢字変換が行なわれて、誤りのない漢
字カナ混り文を生成することができるという効果を奏す
る。特に、用語辞書の汎用性を向上するために採録され
た姓名用語、地名用語、企業法人名用語等の固有名詞情
報を採用するかどうかは、優先的な指定、または、変換
処理結果の漢字カナ混り文の分析や統計的な学習機能に
より決定されるものであって、人名簿のような固有名詞
情報を多く必要とする入力日本文に対しては固有名詞優
先型とし、普通の日本文に対しては固有名詞非優先ない
し固有名詞排除型とすることで、出力漢字カナ混り文中
に誤って固有名詞が混入するのを防止できる効果を奏す
る。
[Effects of the Invention] As described in detail above, according to the kana-kanji conversion method of the present invention, when an inappropriate conversion result is found a predetermined number of times when each clause of a sentence is converted into kana-kanji using a certain type, There is a learning function that automatically changes this to another more appropriate type and performs the subsequent kana-kanji conversion process, so it can quickly and flexibly respond to the usage field and type of input Japanese text, and always perform appropriate kana-kanji conversion. This has the effect of generating error-free sentences containing kanji and kana. In particular, whether or not to adopt proper noun information such as surname terms, place name terms, corporate and corporate name terms, etc. that have been adopted in order to improve the versatility of the terminology dictionary is determined by preferential designation or by the kanji-kana characters that are the result of the conversion process. This is determined by analysis of mixed sentences and statistical learning functions, and for input Japanese sentences that require a lot of proper noun information such as a list of people, proper nouns are given priority, and normal Japanese sentences are prioritized. By adopting a proper noun non-priority or proper noun exclusion type for , it is possible to prevent proper nouns from being accidentally mixed into output sentences containing kanji and kana.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の構成を示すブロック図、第
2図は本発明の実施例に用いられる固有名詞学習演算器
の内部での固有名詞採否動作を説明するためのフローチ
ャート、第3図は本発明の一実施例によるカナ漢字変換
状態を示すフローチャート、第4図は従来のカナ漢字変
換処理方式の一例を示す図である。 1・・・・・・変換前文字列バッファ、2・・・・・・
カナ漢字変換システム、3・・・・・・変換後文字列バ
ッファ、4・・・・・・人手介入補正器、5・・・・・
・最終文字列バッファ。 6・・・・・・固有名詞採否学習演算器、7・・・・・
・固有名詞採否制御器、8・・・・・・優先情報設定器
、9・・・・・・イ二第 第 図 図 第 図
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention, and FIG. FIG. 3 is a flowchart showing the state of kana-kanji conversion according to an embodiment of the present invention, and FIG. 4 is a diagram showing an example of a conventional kana-kanji conversion processing method. 1...Character string buffer before conversion, 2...
Kana-kanji conversion system, 3... Post-conversion character string buffer, 4... Manual intervention corrector, 5...
- Final string buffer. 6... Proper noun acceptance/rejection learning calculator, 7...
・Proper noun adoption/rejection controller, 8...Priority information setting device, 9...A2 Diagram Diagram Diagram

Claims (1)

【特許請求の範囲】 1、日本文の読みを入力する手段と、読みと漢字の変換
情報を保持する用語辞書を有し、入力された日本文の読
みを漢字カナ混り文に変換するカナ漢字変換手段とを備
えたカナ漢字変換方式において、ある型式で文節設定処
理によるカナ漢字変換を行なつて、所定回数の不適切な
カナ漢字変換があつたときには、別の適切な形式のカナ
漢字変換に変更することを特徴とするカナ漢字変換方式
。 2、日本文の読みを入力する手段と、読みと漢字の変換
情報を保持する用語辞書を有し、入力された日本文の読
みを漢字カナ混り文に変換するカナ漢字変換手段とを備
えたカナ漢字変換方式において、前記カナ漢字変換手段
による固有名詞の採否を制御する制御器を設け、誤制御
器は、固有名詞を主体とする日本文が入力される場合は
固有名詞採用型の制御形式で制御を行ない、固有名詞を
主体としない日本文が入力される場合は固有名詞不採用
型の制御形式で制御を行なうように構成し、更に、前記
制御器の制御形式を統計的学習的に設定する演算器を設
け、該演算器は、補正介入により最終的に確定された漢
字カナ混じり文を統計的に分析してその分析結果に基き
該確定漢字カナ混じり文に適合する制御形式を選定する
ように構成したことを特徴とするカナ漢字変換方式。 3、前記演算器のほかに、更に、前記制御器の制御形式
を、外部から与えるパラメータまたはマニュアルにより
設定する手段を設けたことを特徴とする請求項2記載の
カナ漢字変換方式。
[Scope of Claims] 1. A kana device that has a means for inputting the reading of a Japanese sentence and a term dictionary that holds conversion information between the reading and kanji, and converts the input reading of the Japanese sentence into a sentence containing kanji and kana. In a kana-kanji conversion method that is equipped with a kana-kanji conversion means, if a certain format performs kana-kanji conversion by clause setting processing and a predetermined number of inappropriate kana-kanji conversions occur, another appropriate format of kana-kanji is converted. A kana-kanji conversion method characterized by changing to conversion. 2. It has a means for inputting the pronunciation of a Japanese sentence, a term dictionary that holds conversion information between the pronunciation and kanji, and a kana-kanji conversion means for converting the input pronunciation of the Japanese sentence into a sentence containing kanji and kana. In the kana-kanji conversion method, a controller is provided to control whether or not proper nouns are adopted by the kana-kanji conversion means, and the error controller is a proper noun adoption type control when a Japanese sentence mainly consisting of proper nouns is input. When a Japanese sentence that does not consist of proper nouns is input, control is performed using a control format that does not include proper nouns, and furthermore, the control format of the controller is controlled using statistical learning. A computing device is provided which statistically analyzes a sentence containing kanji and kana that has been finally determined through correction intervention, and based on the analysis result, determines a control format that is suitable for the final sentence containing kanji and kana. A kana-kanji conversion method characterized by being configured to select. 3. The kana-kanji conversion system according to claim 2, further comprising means for setting the control format of the controller using externally given parameters or manually, in addition to the arithmetic unit.
JP1015061A 1989-01-26 1989-01-26 Kana/kanji conversion system Pending JPH02255935A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1015061A JPH02255935A (en) 1989-01-26 1989-01-26 Kana/kanji conversion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1015061A JPH02255935A (en) 1989-01-26 1989-01-26 Kana/kanji conversion system

Publications (1)

Publication Number Publication Date
JPH02255935A true JPH02255935A (en) 1990-10-16

Family

ID=11878325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1015061A Pending JPH02255935A (en) 1989-01-26 1989-01-26 Kana/kanji conversion system

Country Status (1)

Country Link
JP (1) JPH02255935A (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60225972A (en) * 1984-04-25 1985-11-11 Seiko Epson Corp Switching device of clause inputting level
JPS61145677A (en) * 1984-12-19 1986-07-03 Nec Corp Kana (japanese syllabary) / kanji (chinese character) converting system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60225972A (en) * 1984-04-25 1985-11-11 Seiko Epson Corp Switching device of clause inputting level
JPS61145677A (en) * 1984-12-19 1986-07-03 Nec Corp Kana (japanese syllabary) / kanji (chinese character) converting system

Similar Documents

Publication Publication Date Title
JPS58114225A (en) "kana" (japanese syllabary) and chinese character convert-inputting system
JPS6037509B2 (en) Spelling error processing method in English text processing equipment
JPH0365757A (en) Sentence processor
JPH02255935A (en) Kana/kanji conversion system
JPH0331981A (en) Character recognizing device
JPH0441399Y2 (en)
JP3466761B2 (en) Document processing apparatus and control method thereof
JP3032399B2 (en) Kana-Kanji conversion device
JPH02224064A (en) Machine translation system
JPS62237565A (en) Sentence input device
JPH0431966A (en) Translation supporting device
JPS62143173A (en) Method for correcting spelling of character string
JPH096772A (en) Character processor
JPS62256069A (en) Document processor
JPH06119325A (en) Word correcting device
JPH01111263A (en) Japanese/foreign language using kanji processor
JPH0291762A (en) Kana/kanji converter
JPS6339075A (en) Japanese word input processing system for question-answer system
JPS6365564A (en) Japanese language input processing system for question-answer system
JPS62249273A (en) Document processor
JPH0969093A (en) Device and method for document preparation
JPH0215364A (en) Document processor
JPH03185582A (en) Dictionary correction system for character recognizing device
JPH0353664B2 (en)
JPH04218863A (en) Kana/kanji conversion system