JPH10124498A - Japanese syllabary/chinese character converting device - Google Patents

Japanese syllabary/chinese character converting device

Info

Publication number
JPH10124498A
JPH10124498A JP8281970A JP28197096A JPH10124498A JP H10124498 A JPH10124498 A JP H10124498A JP 8281970 A JP8281970 A JP 8281970A JP 28197096 A JP28197096 A JP 28197096A JP H10124498 A JPH10124498 A JP H10124498A
Authority
JP
Japan
Prior art keywords
occurrence data
data
conversion
occurrence
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8281970A
Other languages
Japanese (ja)
Inventor
Masako Yoshimura
雅子 吉村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8281970A priority Critical patent/JPH10124498A/en
Publication of JPH10124498A publication Critical patent/JPH10124498A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a device in which conversion precision is improved by increasing the number of co-occurrence data used at the time of conversion by referring to co-occurrence data by plural methods concerning a word for which the co-occurrence data can not be obtained at the time of initial reference. SOLUTION: A Japanese syllabary/Chinese character conversion controlling part 8 designates a word for which co-occurrence data should be refereed to for a co-occurrence data referring part 4. The co-occurrence data referring part 4 refers to data related with the designated word from a co-occurrence data dictionary 7, changes a method for collating data when the objective data can not be obtained, and refers to the co-occurrence data again. Thus, it is possible to refer to the co-occurrence data which can not be obtailed at the time of initial reference. For example, 'SANNIN FUKUSHIMAHO SEN (Japanese syllabary)' is converted into 'SANIN FUKUSHIMA HOSEN (Chinese character)' in a conventional Japanese syllabary/Chinese character converter using a first candidate, and it is converted into 'SANIN FUKUSHIMA HOSEN (Shinese character)' in this device by using co-occurrence data, 'SANIN' and 'HOSEN'.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、入力されたかなデ
ータを、漢字データに変換するかな漢字変換装置に関す
るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion device for converting input kana data into kanji data.

【0002】[0002]

【従来の技術】従来、かな漢字変換装置においては、入
力されたかなデータを漢字データに変更する際、複数あ
る変換候補からあるデータを選択して表示し、その候補
が正しくない場合、ユーザが複数の変換候補から正しい
漢字データを選択することで、変換結果を修正する構成
をとっている。
2. Description of the Related Art Conventionally, in a kana-kanji conversion device, when changing input kana data to kanji data, a certain data is selected and displayed from a plurality of conversion candidates. The conversion result is corrected by selecting the correct kanji data from the conversion candidates.

【0003】第一候補の正解率(変換精度)を向上させ
ることが、かな漢字変換装置における重要な課題の一つ
であり、そのために、複数の語の共起関係を表す共起デ
ータを用いた変換も行われている。
[0003] Improving the correct answer rate (conversion accuracy) of the first candidate is one of the important issues in the kana-kanji conversion apparatus. For that purpose, co-occurrence data representing the co-occurrence relation of a plurality of words is used. Conversion has also been performed.

【0004】[0004]

【発明が解決しようとする課題】共起データを用いた変
換では、該当する共起データがいくつ存在するかによっ
て変換精度が左右され、用意する共起データの量が多け
れば、それだけ変換精度が向上する。
In the conversion using the co-occurrence data, the conversion accuracy depends on the number of the corresponding co-occurrence data. If the amount of the co-occurrence data to be prepared is large, the conversion accuracy is increased accordingly. improves.

【0005】しかしながら、メモリなど記憶手段の容量
は有限であり、日本語において無数に存在する、複数の
名詞を連続した表現や、様々な言語現象の共起関係を、
全て共起データとして登録することは不可能である。
However, the capacity of a storage means such as a memory is limited, and a continuous expression of a plurality of nouns and a co-occurrence relationship of various linguistic phenomena, which are innumerably present in Japanese, are required.
It is impossible to register all as co-occurrence data.

【0006】そこで本発明は、共起データの参照要領を
工夫することにより、変換時に使用する共起データの数
を増加し、変換精度を高めたかな漢字変換装置を提供す
ることを目的とする。
Accordingly, it is an object of the present invention to provide a kana-kanji conversion apparatus in which the number of co-occurrence data used at the time of conversion is increased by devising a reference procedure for co-occurrence data and conversion accuracy is improved.

【0007】[0007]

【課題を解決するための手段】本発明のかな漢字変換装
置は、日本語単語の読み、漢字表記、品詞情報及び意味
分類情報を格納した変換辞書と、指定された語について
変換辞書を検索する辞書検索部と、語と語の共起関係を
示した共起データを格納した共起データ辞書と、指定さ
れた語に関して共起データの照合を行い、共起データが
得られなかった場合には、かな漢字変換制御部の制御に
基づき、再度、データの照合方法を変更して照合を行う
共起データ参照部と、辞書検索部、共起データ参照部お
よびデータの流れを制御するかな漢字変換制御部とを有
する。
A kana-kanji conversion apparatus according to the present invention comprises a conversion dictionary storing reading of Japanese words, kanji notation, part of speech information and semantic classification information, and a dictionary for searching a conversion dictionary for a specified word. When the search unit and the co-occurrence data dictionary that stores the co-occurrence data indicating the co-occurrence relationship between words and the specified words are collated, if the co-occurrence data is not obtained, A co-occurrence data reference unit that changes the data collation method again for collation based on the control of the kana-kanji conversion control unit, a dictionary search unit, a co-occurrence data reference unit, and a kana-kanji conversion control unit that controls the data flow And

【0008】これにより、初期参照で共起データを得ら
れなかった語に関して、複数の方法によって共起データ
を参照することで、より多くの共起データを参照するこ
とが可能となり、変換精度を高めることができる。
[0008] With this, for a word for which co-occurrence data could not be obtained by the initial reference, more co-occurrence data can be referred to by referring to the co-occurrence data by a plurality of methods, and conversion accuracy can be improved. Can be enhanced.

【0009】[0009]

【発明の実施の形態】本発明の請求項1に記載の発明
は、かな文字列の入力や変換候補の選択指示を行う入力
手段と、入力されたかな文字列、変換候補、変換された
かな漢字文字列を記憶する変換データ記憶部と、日本語
単語の読み、漢字表記、品詞情報及び意味分類情報を格
納した変換辞書と、指定された語について変換辞書を検
索する辞書検索部と、語と語の共起関係を示した共起デ
ータを格納した共起データ辞書と、指定された語に関し
て、共起データの照合を行う共起データ参照部と、入力
文字列、変換候補、変換結果を表示する表示手段と、辞
書検索部、共起データ参照部および変換データ記憶部に
格納されたデータの流れを制御するかな漢字変換制御部
とを有し、共起データ参照部において、指定された語の
共起データが得られなかった場合に、データの照合方法
を変更し、再度共起データの参照を行うこととした。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention according to claim 1 of the present invention provides an input means for inputting a kana character string and selecting a conversion candidate, an input kana character string, a conversion candidate, and a converted kana-kanji character. A conversion data storage unit that stores a character string, a conversion dictionary that stores reading of Japanese words, kanji notation, part of speech information, and semantic classification information; a dictionary search unit that searches a conversion dictionary for a specified word; A co-occurrence data dictionary that stores co-occurrence data indicating the co-occurrence relationship of words, a co-occurrence data reference unit that performs collation of co-occurrence data for a specified word, an input character string, conversion candidates, and conversion results Display means for displaying, and a kana-kanji conversion control section for controlling the flow of data stored in the dictionary search section, the co-occurrence data reference section, and the conversion data storage section, and in the co-occurrence data reference section, Co-occurrence data If you did, by changing the method of collating data, it was decided to carry out a reference again co-occurrence data.

【0010】したがって、かな漢字変換制御部が共起デ
ータ参照部に対し共起データを参照する語を指定し、共
起データ参照部では、共起データ辞書を対象に、指定さ
れた語に関するデータを参照し、対象となるデータが得
られなかった場合は、データの照合方法を変更し、再
度、共起データの参照を行うことにより、初期参照では
得られなかった共起データを参照可能にできる。
Therefore, the kana-kanji conversion control unit specifies a word that refers to the co-occurrence data to the co-occurrence data reference unit, and the co-occurrence data reference unit uses the co-occurrence data dictionary to store data relating to the specified word. If the reference data is not obtained, the collation method of the data is changed, and the co-occurrence data that cannot be obtained by the initial reference can be referred to by referring to the co-occurrence data again. .

【0011】本発明の請求項2に記載の発明は、共起デ
ータ参照部において、複数の名詞からなる名詞連続の語
についての共起データが得られなかった場合に、名詞連
続を構成する名詞のいくつかの組合せを対象として再度
共起データを参照することとした。
[0011] According to a second aspect of the present invention, when the co-occurrence data reference unit does not obtain co-occurrence data for a series of noun words consisting of a plurality of nouns, the nouns forming the noun series We decided to refer to the co-occurrence data again for some combinations of.

【0012】したがって、共起データ参照部において、
複数の名詞からなる名詞連続の語についての共起データ
が得られなかった場合に、名詞連続を構成する名詞のい
くつかの組合せを対象として共起データを参照すること
により、初期参照では参照できなかった名詞連続に関す
る共起データを参照可能にすることができる。
Therefore, in the co-occurrence data reference section,
If co-occurrence data for a series of nouns consisting of multiple nouns is not available, referencing the co-occurrence data for some combinations of the nouns that make up the noun continuation allows for initial reference. The co-occurrence data relating to the missing noun sequence can be referred to.

【0013】本発明の請求項3に記載の発明は、共起デ
ータ参照部において、指定された語の共起データが得ら
れなかった場合に、意味分類情報を参照し、再度、意味
分類が同じ語の共起データを参照することとしている。
したがって、共起データ参照部において共起データが得
られなかった場合に、意味分類情報を参照して、再度共
起データを参照することにより、意味分類が同じ、関連
する語に関する共起データを参照することができる。
According to a third aspect of the present invention, when co-occurrence data of a specified word is not obtained in the co-occurrence data reference section, the co-occurrence data is referred to and the semantic classification is performed again. It refers to the co-occurrence data of the same word.
Therefore, when co-occurrence data is not obtained in the co-occurrence data reference unit, by referring to the semantic classification information and referring to the co-occurrence data again, the co-occurrence data for the related words having the same semantic classification can be obtained. Can be referenced.

【0014】本発明の請求項4に記載の発明は、共起デ
ータ参照部において、「AをBする」型の入力に対する
共起データが得られなかった場合に、「A」及び「B」
の連続による語「AB」を対象に、再度共起データを参
照することとしている。したがって、共起データ参照部
において「AをBする」型の入力に対する共起データが
得られなかった場合に、「A」及び「B」の連続による
語「AB」を対象に再度共起データを参照することによ
り、初期参照では参照できなかった、動作を表す語に関
する共起データを参照可能にできる。
According to a fourth aspect of the present invention, when co-occurrence data for an input of "A to B" type is not obtained in the co-occurrence data reference section, "A" and "B"
The co-occurrence data is referred to again for the word "AB" which is a sequence of "." Therefore, if the co-occurrence data reference unit does not obtain the co-occurrence data for the input of “A to B” type, the co-occurrence data is re-targeted to the word “AB” that is a series of “A” and “B”. , It is possible to refer to the co-occurrence data related to the word representing the operation, which could not be referred to by the initial reference.

【0015】以下、本発明の実施の形態について図面を
参照しながら説明を行う。図1は、本発明の一実施の形
態におけるかな漢字変換装置の機能ブロック図である。
An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a functional block diagram of a kana-kanji conversion device according to an embodiment of the present invention.

【0016】図1において、1は、かな文字列の入力
や、変換候補の選択指示を行う入力手段、2は、入力さ
れたかな文字列、変換候補、変換されたかな漢字文字列
を記憶する変換データ記憶部、3は、指定された語につ
いて変換辞書6を検索する辞書検索部、4は、指定され
た語に関して、共起データの照合を行う共起データ参照
部、5は、入力文字列、変換候補、変換結果等を表示す
る表示手段、6は、日本語単語の読み、漢字表記、品詞
情報及び意味分類情報等を格納した変換辞書、7は、語
と語の共起関係を示した共起データを格納した共起デー
タ辞書、8は、辞書検索部3、共起データ参照部4の各
機能の動作および変換データ記憶部2に格納されたデー
タの流れを制御するかな漢字変換制御部である。
In FIG. 1, reference numeral 1 denotes an input means for inputting a kana character string and an instruction for selecting a conversion candidate; and 2, a conversion means for storing an input kana character string, a conversion candidate, and a converted kana kanji character string. A data storage unit 3 is a dictionary search unit that searches the conversion dictionary 6 for a specified word. 4 is a co-occurrence data reference unit that performs collation of co-occurrence data on a specified word. , Conversion candidates, and conversion means for displaying conversion results, etc., 6 is a conversion dictionary storing reading of Japanese words, kanji notation, part of speech information, semantic classification information, etc., and 7 shows a co-occurrence relationship between words. A co-occurrence data dictionary storing the co-occurrence data, a kana-kanji conversion control for controlling the operation of each function of the dictionary search section 3 and the co-occurrence data reference section 4 and the flow of data stored in the conversion data storage section 2 Department.

【0017】図2に示す回路ブロック図において、9は
キーボード、10はCPU(中央処理装置)、11はC
RT(陰極線管ディスプレイ)、12はROM(リード
オンリーメモリ)、13はRAM(ランダムアクセスメ
モリ)である。
In the circuit block diagram shown in FIG. 2, 9 is a keyboard, 10 is a CPU (Central Processing Unit), and 11 is C
RT (Cathode Ray Tube Display), 12 is a ROM (Read Only Memory), and 13 is a RAM (Random Access Memory).

【0018】図1に示した入力手段1はキーボード9に
より、変換データ記憶部2はRAM13により、変換辞
書6、共起データ辞書7はROM12により、辞書検索
部3、共起データ参照部4、かな漢字変換制御部8は、
CPU10が、ROM12およびRAM13とデータの
やりとりを行いながらROM12に記憶された動作プロ
グラムを実行することにより、表示手段5はCRT11
により、それぞれ実現されている。
The input means 1 shown in FIG. 1 is operated by the keyboard 9, the converted data storage unit 2 is operated by the RAM 13, the conversion dictionary 6, the co-occurrence data dictionary 7 is operated by the ROM 12, the dictionary search unit 3, the co-occurrence data reference unit 4, The kana-kanji conversion control unit 8
When the CPU 10 executes the operation program stored in the ROM 12 while exchanging data with the ROM 12 and the RAM 13, the display unit 5 displays the CRT 11.
, Respectively.

【0019】上記のように構成された本実施の形態のか
な漢字変換装置におけるかな漢字変換の処理ついて、以
下、その動作の説明を行う。
The operation of kana-kanji conversion in the kana-kanji conversion apparatus of the present embodiment configured as described above will be described below.

【0020】入力手段1によって入力されたかな文字列
は、ユーザによる変換の指示に従い、かな漢字変換制御
部8によって変換データ記憶部2に格納される。
The kana character string input by the input unit 1 is stored in the conversion data storage unit 2 by the kana-kanji conversion control unit 8 in accordance with a user's conversion instruction.

【0021】かな漢字変換制御部8は、辞書検索部3に
よって、変換データ記憶部2に格納されたかな文字列中
の部分文字列を対象に、変換辞書6を対象に辞書検索を
行い、検索結果を変換データ記憶部2に格納する。
The kana-kanji conversion control unit 8 performs a dictionary search on the conversion dictionary 6 by the dictionary search unit 3 on a partial character string in the kana character string stored in the conversion data storage unit 2 and obtains a search result. Is stored in the conversion data storage unit 2.

【0022】次に、かな漢字変換制御部8は、辞書検索
部3による検索結果に基づき、入力かな文字列の語の分
割を決定する。分割された個々の語において、辞書検索
部3による検索結果で複数の同音語が変換候補となる場
合、かな漢字変換制御部8は、共起データ参照部4を制
御して共起データ辞書7を参照し、該当データを基に、
第一変換候補の決定を行う。
Next, the kana-kanji conversion control unit 8 determines the division of the words of the input kana character string based on the search result by the dictionary search unit 3. When a plurality of homophone words are conversion candidates in the search result of the dictionary search unit 3 in each of the divided words, the kana-kanji conversion control unit 8 controls the co-occurrence data reference unit 4 to store the co-occurrence data dictionary 7 Refer to and, based on the relevant data,
The first conversion candidate is determined.

【0023】かな漢字変換制御部8は、決定したかな漢
字文字列を、表示手段5によって表示し、ユーザの指示
に従って、変換候補の表示、変更、確定を行う。
The kana-kanji conversion control section 8 displays the determined kana-kanji character string on the display means 5, and displays, changes and confirms conversion candidates in accordance with a user's instruction.

【0024】かな漢字変換制御部8の制御に基づき、共
起データ参照部4によって行う共起データの参照につい
て、以下、その動作を図3のフローチャートに基づいて
説明する。
The operation of referring to co-occurrence data performed by the co-occurrence data reference section 4 under the control of the kana-kanji conversion control section 8 will be described below with reference to the flowchart of FIG.

【0025】まず、ステップS1で、かな漢字変換制御
部8は、共起データ参照部4へ、変換データ記憶部2に
格納された変換対象文中の、データ参照を行う語のかな
文字列を渡す。ステップS2で、共起データ参照部4
は、共起データ辞書7に格納された共起データから、指
定された読みで始まるデータを選出する。
First, in step S 1, the kana-kanji conversion control unit 8 passes a kana character string of a word to be referred to in the conversion target sentence stored in the conversion data storage unit 2 to the co-occurrence data reference unit 4. In step S2, the co-occurrence data reference unit 4
Selects data beginning with the specified reading from the co-occurrence data stored in the co-occurrence data dictionary 7.

【0026】ステップS3で、共起データ参照部4は、
ステップS1で指定された語が確定語かどうかの情報を
確認し、確定語の場合、ステップS4に進む。ステップ
S4では、ステップS2で選出した共起データにおい
て、読みで指定した先頭の語の漢字表記が、既にその語
の変換候補として確定している確定語と異なるものを削
除し、ステップS5に進む。ステップS3で、指定語が
確定語でない場合、そのままステップS5に進む。ステ
ップS5で、かな漢字変換制御部8により、先頭の語が
一致する共起データを、候補共起データとして変換デー
タ記憶部2に格納する。
In step S3, the co-occurrence data reference unit 4
In step S1, information as to whether or not the specified word is a definite word is confirmed. If the word is a definite word, the process proceeds to step S4. In step S4, in the co-occurrence data selected in step S2, a word whose kanji notation of the first word specified by reading is different from a fixed word already determined as a conversion candidate of the word is deleted, and the process proceeds to step S5. . If it is determined in step S3 that the designated word is not a definite word, the process directly proceeds to step S5. In step S5, the kana-kanji conversion control unit 8 stores the co-occurrence data whose head words match each other as candidate co-occurrence data in the conversion data storage unit 2.

【0027】ステップS6では、変換データ記憶部2に
格納した各共起データに対し、共起データの読みにおけ
る指定語の後続文字列と、変換データ記憶部2に格納さ
れた変換対象文字列における指定語の後続文字列とを比
較する。ステップS7では、ステップS6の比較におけ
る、2つのかな文字列が一致するデータの有無を確認す
る。一致するデータがない場合、ステップS9で、再
度、データの照合方法を変更し、データの参照を行う。
一致するデータがある場合、ステップS8で、この共起
データを該当データとして変換データ記憶部2に格納
し、処理を終了する。
In step S 6, for each of the co-occurrence data stored in the conversion data storage unit 2, the character string following the specified word in reading the co-occurrence data and the conversion target character string stored in the conversion data storage unit 2 Compares the character string following the specified word. In step S7, it is confirmed whether there is data in which the two kana character strings match in the comparison in step S6. If there is no matching data, in step S9, the data collation method is changed again, and the data is referenced.
If there is matching data, the co-occurrence data is stored as the corresponding data in the converted data storage unit 2 in step S8, and the process ends.

【0028】ステップS9で行うデータ参照の3つの実
施の形態について、以下、その動作を、各々、図4、図
5、図6のフローチャートに基づいて説明する。
The operation of the three embodiments of data reference performed in step S9 will be described below with reference to the flowcharts of FIGS. 4, 5, and 6, respectively.

【0029】(実施の形態1)まず、ステップ9A−1
で、指定された語が名詞になり得る語か否かを判断す
る。指定された語が名詞になり得ない場合、このデータ
参照方法は適用されないため、処理を終了する。指定さ
れた語が名詞になり得る場合、ステップ9A−2で、指
定された語を先頭として構成し得る名詞連続の個数(以
下この個数をNとする)を得る。
(Embodiment 1) First, Step 9A-1
It is determined whether or not the designated word is a word that can be a noun. If the specified word cannot be a noun, the processing ends because this data reference method is not applied. If the specified word can be a noun, in step 9A-2, the number of consecutive nouns that can be formed starting from the specified word (hereinafter, this number is referred to as N) is obtained.

【0030】例えば、入力かな文字列が「さんいん/ふ
くしま/ほせん」で、「さんいん」が指定語の場合、ス
テップ9A−1で、指定された語「さんいん」が名詞と
なり得るため、ステップ9A−2に進む。また、「さん
いん」「ふくしま」「ほせん」の各々も、名詞となり得
るため、ステップ9A−2で名詞連続の個数N=3を得
る。
For example, if the input kana character string is "sanin / fukushima / hosen" and "sanin" is a designated word, the specified word "sanin" can be a noun in step 9A-1. , And proceed to Step 9A-2. In addition, since each of “sanin”, “Fukushima”, and “hosen” can be nouns, the number N of consecutive nouns is obtained in step 9A-2.

【0031】ステップ9A−3で、N<3の場合、現在
と構成要素の異なる名詞連続は生成不可能なので処理を
終了する。N≧3の場合、ステップ9A−4に進む。
At step 9A-3, if N <3, the processing is terminated because noun continuations having different constituent elements from the current one cannot be generated. If N ≧ 3, the process proceeds to step 9A-4.

【0032】ステップ9A−4からステップ9A−12
で、参照対象となる名詞連続を生成する。ステップ9A
−4では先頭からの名詞の個数を規定する変数s=1と
する。ステップ9A−5でs≦N−2の場合、ステップ
9A−6に進み、先頭s個に接続する名詞が、先頭から
いくつ目の名詞かを表す変数tをt=s+1に初期化す
る。
Steps 9A-4 to 9A-12
Generates a noun sequence to be referred to. Step 9A
At -4, a variable s = 1 that defines the number of nouns from the beginning is set. If s ≦ N−2 in step 9A-5, the process proceeds to step 9A-6, in which a variable t representing the number of nouns connected to the first s is set to t = s + 1.

【0033】ステップ9A−7でt>Nの場合、対応す
る名詞が存在しないため、ステップ9A−13に進む。
ステップ9A−13では、先頭からの名詞の個数sを1
つ増やし、ステップ9A−5に戻る。ステップ9A−7
でt≦Nの場合は、ステップ9A−8に進み、先頭s個
の名詞と、先頭からt番目の名詞の接続により名詞連続
を生成する。
If t> N in step 9A-7, there is no corresponding noun, so the process proceeds to step 9A-13.
In step 9A-13, the number s of nouns from the beginning is set to 1
And returns to step 9A-5. Step 9A-7
If t ≦ N, the process proceeds to step 9A-8, where a series of nouns is generated by connecting the first s nouns and the t-th noun from the top.

【0034】例えば、上記「さんいん/ふくしま/ほせ
ん」の例においては、s=1、t=s+1=2の場合、
「さんいんふくしま」を生成する。
For example, in the above example of "sanin / fukushima / hosen", when s = 1 and t = s + 1 = 2,
Generate "Sanfu Fukushima".

【0035】ステップ9A−9では、ステップS5にお
いて変換データ記憶部2に格納した候補共起データを対
象に、ステップ9A−8で生成した語の照合を行う。ス
テップ9A−10では、ステップ9A−9での共起デー
タの照合における該当データの有無を調査し、該当デー
タが無い場合、ステップ9A−12に進む。一致するデ
ータがある場合、ステップ9A−11で、この共起デー
タを該当データとして変換データ記憶部2に格納する。
In step 9A-9, the words generated in step 9A-8 are collated with the candidate co-occurrence data stored in the conversion data storage unit 2 in step S5. In step 9A-10, the presence or absence of the corresponding data in the collation of the co-occurrence data in step 9A-9 is checked. If there is no such data, the process proceeds to step 9A-12. If there is matching data, the co-occurrence data is stored in the converted data storage unit 2 as corresponding data in step 9A-11.

【0036】ステップ9A−12では、後接する名詞が
先頭から何個目の名詞かを示すtを1つ増やし、ステッ
プ9A−7に戻る。
In step 9A-12, t indicating the number of the next noun from the beginning is incremented by one, and the process returns to step 9A-7.

【0037】例えば、上記「さんいん/ふくしま/ほせ
ん」の例においては、ステップ9A−7で、t(=3)
≦N(=3)なので、ステップ9A−8に進み、s=
1、t=3から、「さんいんほせん」を生成する。
For example, in the above example of "sanin / fukushima / hosen", in step 9A-7, t (= 3)
Since ≦ N (= 3), the process proceeds to step 9A-8, where s =
1. From “t = 3”, “saninhosen” is generated.

【0038】ステップ9A−5でs>N−2の場合、参
照対象となる名詞連続の生成が全て終ったことになり、
処理を終了する。
If s> N-2 in step 9A-5, generation of the noun sequence to be referred to has been completed.
The process ends.

【0039】例えば、「さんいん/ふくしま/ほせん」
の例においては、N=3となり、s=1、t=2で「さ
んいんふくしま」を、s=1、t=3で「さんいんほせ
ん」を、生成する。s=2の場合、「さんいんふくしま
ほせん」と最初の語と同じ語を生成することになる。よ
って、ステップ9A−5でs(=2)>N−2(=1)
の場合、処理を終了する。
For example, "sanin / fukushima / hosen"
In the example of (1), N = 3, and “samfukushima” is generated at s = 1 and t = 2, and “small book” is generated at s = 1 and t = 3. In the case of s = 2, the same word as the first word "saninfukushimahosen" will be generated. Therefore, s (= 2)> N−2 (= 1) in step 9A-5.
If, the process ends.

【0040】この共起データ照合ステップを用い、ステ
ップ9A−9において、「さんいんほせん」の照合に成
功した場合、共起データ「さんいんほせん(参院補
選)」を得る。これにより、「さんいんふくしまほせ
ん」において、第一候補を用いる従来のかな漢字変換装
置では、「山陰福島保線」等に変換していたのに対し、
「さんいん」と「ほせん」に共起データを使用し、本実
施の形態のかな漢字変換装置では「参院福島補選」と変
換することが可能となる。
Using this co-occurrence data collation step, in step 9A-9, if collation of "saninhosen" is successful, co-occurrence data "saninhosen (secondary election of the Upper House)" is obtained. As a result, in the conventional Kana-Kanji conversion device using the first candidate in "Sanfu Fukushima Hosen", it was converted to "San-in Fukushima Yasen" etc.
By using co-occurrence data for “sanin” and “hosen”, the kana-kanji conversion device of the present embodiment can convert the data to “Sanin Fukushima Supplementary Selection”.

【0041】(実施の形態2)次に、図5により、共起
データを参照する第2の手法を説明する。
(Embodiment 2) Next, a second method for referring to co-occurrence data will be described with reference to FIG.

【0042】まずステップ9B−1で、ステップS5に
おいて変換データ記憶部2に格納した候補共起データを
取り出す。ステップ9B−2において、ステップ9B−
1で取り出した候補共起データを一つ得る。ステップ9
B−3で、ステップ9B−2で得た候補共起データにお
ける、指定語の次の語の意味分類情報を得る。ステップ
9B−4で、変換データ記憶部2に格納した、指定語の
次の語の変換候補の意味分類情報を得る。
First, in step 9B-1, the candidate co-occurrence data stored in the converted data storage unit 2 in step S5 is extracted. In Step 9B-2, Step 9B-
One candidate co-occurrence data extracted in step 1 is obtained. Step 9
In B-3, the semantic classification information of the word next to the designated word in the candidate co-occurrence data obtained in step 9B-2 is obtained. In step 9B-4, the semantic classification information of the conversion candidate of the word next to the designated word stored in the conversion data storage unit 2 is obtained.

【0043】ステップ9B−5で、ステップ9B−3で
得た共起データの意味分類情報と、ステップ9B−4で
得た変換候補の意味分類情報とを比較し、意味分類情報
が等しい場合、ステップ9B−6に進む。ステップ9B
−6では、ステップ9B−5で比較対象とした共起デー
タにおいて、意味分類情報を参照した語を、意味分類情
報が一致する変換候補に変更したデータを、該当共起デ
ータとして変換データ記憶部2に格納する。
In step 9B-5, the semantic classification information of the co-occurrence data obtained in step 9B-3 is compared with the semantic classification information of the conversion candidate obtained in step 9B-4. Proceed to step 9B-6. Step 9B
In -6, in the co-occurrence data to be compared in step 9B-5, the data in which the word referring to the semantic classification information is changed to a conversion candidate whose semantic classification information matches is converted as the corresponding co-occurrence data in the conversion data storage unit. 2 is stored.

【0044】ステップ9B−5で、意味分類情報が等し
くない場合、ステップ9B−2に戻り次の候補共起デー
タを得る。ステップ9B−2で、次の候補共起データが
得られなかった場合、全てのデータに対する照合が終了
しており、処理を終了する。
If the semantic classification information is not equal in step 9B-5, the process returns to step 9B-2 to obtain the next candidate co-occurrence data. If the next candidate co-occurrence data is not obtained in step 9B-2, the collation for all the data has been completed, and the process ends.

【0045】例えば、入力かな文字列が「きょうか/き
かん」で、「きょうか」が指定語の場合、ステップ9B
−1で、変換データ記憶部2に格納した候補共起デー
タ、「きょうか/れんしゅう(強化/練習):5/1
3」、「きょうか/かくだい(強化/拡大)5/2
2」、「きょうか/げっかん(強化/月間)5/1
8」、…を取り出す。
For example, if the input character string is "Kyoka / Kikan" and "Kyoka" is a designated word, step 9B
-1, the candidate co-occurrence data stored in the conversion data storage unit 2, "Kyoka / renshu (enhancement / practice): 5/1
3 ”,“ Today / Kaidai (enhancement / enlargement) 5/2
2 ”,“ Kyoka / Gekkan (enhanced / monthly) 5/1
8 ", ... are taken out.

【0046】ステップ9B−2で、最初の候補共起デー
タ「きょうか/れんしゅう(強化/練習):5/13」
を得る。意味分類情報が、共起データの漢字表記の後ろ
に付与されている場合、ステップ9B−3で、指定語
「きょうか」の次の語「れんしゅう」の意味分類情報1
3を得る。
In step 9B-2, the first candidate co-occurrence data "Kyouka / renshu (enhancement / practice): 5/13"
Get. If the semantic classification information is added after the kanji notation of the co-occurrence data, in step 9B-3, the semantic classification information 1 of the word “renshu” following the designated word “kyoka”
Get 3.

【0047】ステップ9B−4で、変換データ記憶部2
に格納した、指定語の次の語「きかん」の変換候補、機
関(10)、期間(18)、季刊(34)…の意味分類
情報を得る。ステップ9B−5で、共起データの意味分
類情報(13)と、変換候補の意味分類情報(10、1
8、34)とを比較する。
In step 9B-4, the conversion data storage unit 2
, The conversion candidate of the next word “Kikan” after the designated word, the institution (10), the period (18), the quarterly (34)... In step 9B-5, the semantic classification information (13) of the co-occurrence data and the semantic classification information (10, 1,
8, 34).

【0048】全ての候補共起データに対して、同様の処
理を行うと、候補共起データ「きょうか/げっかん(強
化/月間)5/18」の参照において、ステップ9B−
5で、共起データの意味分類情報(18)と、変換候補
「期間」の意味分類情報(18)が一致する。
When the same processing is performed for all the candidate co-occurrence data, the reference to the candidate co-occurrence data “Kyoka / Gekikan (enhanced / monthly) 5/18” refers to Step 9B-
In 5, the semantic classification information (18) of the co-occurrence data matches the semantic classification information (18) of the conversion candidate “period”.

【0049】「きょうか」と「げっかん」の共起データ
が存在する場合、「月間」と「期間」が同一の意味分類
情報を持つことから、該当共起データ「きょうか/きか
ん(強化/期間)5/18」を得る。これにより、入力
かな文字列「きょうかきかん」において、第一候補を用
いる従来のかな漢字変換では、「強化機関」等に変換し
ていたのに対し、「きょうか」と「きかん」に共起デー
タを使用し、本実施の形態のかな漢字変換装置では「強
化期間」と変換することが可能となる。
When co-occurrence data of “Kyoka” and “Gekkan” exist, “Month” and “Period” have the same semantic classification information. Period) 5/18 "is obtained. As a result, in the input kana character string "Kyokakikan", the conventional kana-kanji conversion using the first candidate was converted to "Strengthening institution", etc., but co-occurred in "Kyouka" and "Kikan" Using the data, the kana-kanji conversion apparatus according to the present embodiment can convert the data into the “enhancement period”.

【0050】(実施の形態3)次に、図6により、共起
データを参照する第3の手法を説明する。
(Embodiment 3) Next, a third method for referring to co-occurrence data will be described with reference to FIG.

【0051】まず、ステップ9C−1で、変換データ記
憶部2に格納された変換対象文のうち、指定語からの文
字列が「A(名詞)をB(名詞)する」か否かを判断
し、対応しない場合、このデータ参照方法は適用されな
いため、処理を終了する。このデータ参照方法が適用さ
れると判断された場合、ステップ9C−2に進む。ステ
ップ9C−2では、変換データ格納部に格納された「A
をBする」型の入力文字列から、文字列「AB」を生成
する。
First, in step 9C-1, it is determined whether the character string from the designated word in the conversion target sentence stored in the conversion data storage unit 2 is "A (noun) to B (noun)". If not, the data reference method is not applied, and the process ends. When it is determined that this data reference method is applied, the process proceeds to step 9C-2. In step 9C-2, “A” stored in the conversion data storage
A character string “AB” is generated from an input character string of the “do B” type.

【0052】ステップ9C−3で、ステップS5におい
て変換データ記憶部2に格納した候補共起データを対象
に、ステップ9C−2で生成した語の照合を行う。ステ
ップ9C−4では、ステップ9C−3での共起データの
照合における該当データの有無を調査し、該当データが
あれば、ステップ9C−5で、この共起データを該当デ
ータとして変換データ記憶部2に格納し、処理を終了す
る。
In step 9C-3, the word generated in step 9C-2 is collated with the candidate co-occurrence data stored in the conversion data storage unit 2 in step S5. In step 9C-4, the presence or absence of the corresponding data in the collation of the co-occurrence data in step 9C-3 is checked, and if there is such data, in step 9C-5, the co-occurrence data is used as the corresponding data in the conversion data storage unit. 2 and the process ends.

【0053】例えば、入力かな文字列「せいかくをちょ
うさする」は、「A(せいかく)をB(ちょうさ)す
る」型なので、ステップ9C−1で、ステップ9C−2
に進む。ステップ9C−2では、「せいかくをちょうさ
する」から「せいかくちょうさ」を生成する。
For example, the input kana character string "Choose Seikaku" is of the type "A (Sekaiku) to B (choice)", so that step 9C-1 and step 9C-2
Proceed to. In step 9C-2, “Squareness” is generated from “Squareness”.

【0054】ステップ9C−3で、ステップS5におい
て変換データ記憶部2に格納した候補共起データを対象
に、ステップ9C−2で生成した語「せいかくちょう
さ」の照合を行う。ステップ9C−3で共起データ「性
格調査」が照合された場合、ステップ9C−5で、この
共起データを該当データとして変換データ記憶部2に格
納し、処理を終了する。
In step 9C-3, the word "seikakuchosa" generated in step 9C-2 is collated with the candidate co-occurrence data stored in the converted data storage unit 2 in step S5. If the co-occurrence data “character search” is collated in step 9C-3, the co-occurrence data is stored as the corresponding data in the converted data storage unit 2 in step 9C-5, and the process ends.

【0055】これにより、入力かな文字列「せいかくを
ちょうさする」において、第一候補を用いる従来のかな
漢字変換装置では「正確を調査する」等に変換していた
のに対し、「せいかく」と「ちょうさ」に共起データを
使用し、本実施の形態のかな漢字変換装置では「性格を
調査する」と変換することが可能となる。
As a result, in the input kana character string "Sho-ku-se-ku-sakuru", the conventional kana-kanji conversion device using the first candidate converts the character string to "Check for accuracy" or the like. By using the co-occurrence data for “chosa”, the kana-kanji conversion device of the present embodiment can be converted to “investigate personality”.

【0056】なお、本実施の形態においては、複数のデ
ータ参照方法を、各々別々の実施の形態に分けて説明を
行ったが、実施の形態としては、複数のデータ参照方法
を同時に用いても差支えない。
In the present embodiment, a plurality of data reference methods have been described separately in different embodiments. However, in the embodiment, a plurality of data reference methods may be used simultaneously. No problem.

【0057】[0057]

【発明の効果】本発明によれば、最初の共起データ参照
では参照されなかったデータを、共起データとして得る
ことが可能となるため、変換候補の決定に使用すること
ができ、変換精度を向上することができる。
According to the present invention, data that has not been referred to in the first co-occurrence data reference can be obtained as co-occurrence data. Can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施の形態におけるかな漢字変換装
置の機能ブロック図
FIG. 1 is a functional block diagram of a kana-kanji conversion device according to an embodiment of the present invention.

【図2】本発明の一実施の形態におけるかな漢字変換装
置の回路ブロック図
FIG. 2 is a circuit block diagram of a kana-kanji conversion device according to an embodiment of the present invention.

【図3】本発明の一実施の形態の共起データ参照の動作
を表すフローチャート
FIG. 3 is a flowchart illustrating an operation of referring to co-occurrence data according to an embodiment of the present invention;

【図4】本発明の実施の形態1におけるデータ参照の動
作を表すフローチャート
FIG. 4 is a flowchart showing a data reference operation according to the first embodiment of the present invention;

【図5】本発明の実施の形態2におけるデータ参照の動
作を表すフローチャート
FIG. 5 is a flowchart showing a data reference operation according to the second embodiment of the present invention;

【図6】本発明の実施の形態3におけるデータ参照の動
作を表すフローチャート
FIG. 6 is a flowchart illustrating a data reference operation according to the third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 入力手段 2 変換データ記憶部 3 辞書検索部 4 共起データ参照部 5 表示手段 6 変換辞書 7 共起データ辞書 8 かな漢字変換制御部 DESCRIPTION OF SYMBOLS 1 Input means 2 Conversion data storage part 3 Dictionary search part 4 Co-occurrence data reference part 5 Display means 6 Conversion dictionary 7 Co-occurrence data dictionary 8 Kana-kanji conversion control part

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】かな文字列の入力や変換候補の選択指示を
行う入力手段と、入力されたかな文字列、変換候補、変
換されたかな漢字文字列を記憶する変換データ記憶部
と、日本語単語の読み、漢字表記、品詞情報及び意味分
類情報を格納した変換辞書と、指定された語について前
記変換辞書を検索する辞書検索部と、語と語の共起関係
を示した共起データを格納した共起データ辞書と、指定
された語に関して、共起データの照合を行う共起データ
参照部と、入力文字列、変換候補、変換結果を表示する
表示手段と、前記辞書検索部、前記共起データ参照部お
よび前記変換データ記憶部に格納されたデータの流れを
制御するかな漢字変換制御部とを有し、前記共起データ
参照部において、指定された語の共起データが得られな
かった場合に、データの照合方法を変更し、再度共起デ
ータの参照を行うことを特徴とするかな漢字変換装置。
An input means for inputting a kana character string and selecting a conversion candidate, a conversion data storage unit for storing an input kana character string, a conversion candidate, and a converted kana-kanji character string, and a Japanese word , A conversion dictionary that stores kanji notation, part-of-speech information, and semantic classification information, a dictionary search unit that searches the conversion dictionary for a specified word, and co-occurrence data indicating the co-occurrence relationship between words. A co-occurrence data dictionary, a co-occurrence data reference unit for collating co-occurrence data with respect to a specified word, display means for displaying an input character string, a conversion candidate, and a conversion result; And a kana-kanji conversion control unit for controlling the flow of data stored in the conversion data storage unit. In the co-occurrence data reference unit, co-occurrence data of a specified word could not be obtained. If the date Kana-kanji conversion apparatus of collation method to change the, and performs reference again co-occurrence data.
【請求項2】前記共起データ参照部において、複数の名
詞からなる名詞連続の語についての共起データが得られ
なかった場合に、名詞連続を構成する名詞のいくつかの
組合せを対象として再度共起データを参照することを特
徴とする請求項1記載のかな漢字変換装置。
2. If the co-occurrence data reference unit does not obtain co-occurrence data for a series of nouns consisting of a plurality of nouns, the co-occurrence data reference unit re-selects some combinations of nouns forming the noun series. The kana-kanji conversion device according to claim 1, wherein the co-occurrence data is referred to.
【請求項3】前記共起データ参照部において、指定され
た語の共起データが得られなかった場合に、意味分類情
報を参照し、再度、意味分類が同じ語の共起データを参
照することを特徴とする請求項1又は2記載のかな漢字
変換装置。
3. If the co-occurrence data reference unit does not obtain co-occurrence data of a specified word, the co-occurrence data is referred to, and the co-occurrence data of the word having the same semantic classification is referred to again. The kana-kanji conversion device according to claim 1 or 2, wherein:
【請求項4】前記共起データ参照部において、「AをB
する」型の入力に対する共起データが得られなかった場
合に、「A」及び「B」の連続による語「AB」を対象
に、再度共起データを参照することを特徴とする請求項
1、2又は3記載のかな漢字変換装置。
4. In the co-occurrence data reference section, "A
2. The co-occurrence data is referred to again for a word "AB" formed by a continuation of "A" and "B" when co-occurrence data for an "type" input is not obtained. 2. The kana-kanji conversion device according to claim 2 or 3.
JP8281970A 1996-10-24 1996-10-24 Japanese syllabary/chinese character converting device Pending JPH10124498A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8281970A JPH10124498A (en) 1996-10-24 1996-10-24 Japanese syllabary/chinese character converting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8281970A JPH10124498A (en) 1996-10-24 1996-10-24 Japanese syllabary/chinese character converting device

Publications (1)

Publication Number Publication Date
JPH10124498A true JPH10124498A (en) 1998-05-15

Family

ID=17646444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8281970A Pending JPH10124498A (en) 1996-10-24 1996-10-24 Japanese syllabary/chinese character converting device

Country Status (1)

Country Link
JP (1) JPH10124498A (en)

Similar Documents

Publication Publication Date Title
JP2832988B2 (en) Data retrieval system
JPH10124498A (en) Japanese syllabary/chinese character converting device
JPH05113964A (en) Electronic dictionary
JPS60176169A (en) Sentence processor
JP2000057134A (en) Documentation device
JPH0969104A (en) Device and method for kana-kanji conversion
JP3548372B2 (en) Character recognition device
JPS59100941A (en) Kana (japanese syllabary)-kanji (chinese character) converter
JPH09305716A (en) Input character string estimating and recognizing device
JP3608253B2 (en) Image search device
JP3847801B2 (en) Character processing apparatus and processing method thereof
JPH0512257A (en) Document preparation device
JPH04290158A (en) Document creation device
JP3342026B2 (en) Kana-Kanji conversion device
JPH10154141A (en) Kana-to-kanji (japanese syllabary-to-chinese character) conversion device
JPH0623973B2 (en) Character processor frequency change method
JP2004086922A (en) Device and method for kana-kanji conversion
JPH0267676A (en) Chinese numeral conversion processor
JPS6278673A (en) Kana/kanji (chinese character) converter
JPS62251962A (en) Word processor
JPH0581262A (en) &#39;kana&#39;/&#39;kanji&#39; converter
JPH0573540A (en) Kana/kanji conversion device
JPH07225757A (en) Document input device
JPS6243769A (en) Kana-to-kanji converting device
JPH0816573A (en) Japanese input device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050307

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050726