JPS5918730B2 - Kana/Kanji conversion device - Google Patents

Kana/Kanji conversion device

Info

Publication number
JPS5918730B2
JPS5918730B2 JP54170076A JP17007679A JPS5918730B2 JP S5918730 B2 JPS5918730 B2 JP S5918730B2 JP 54170076 A JP54170076 A JP 54170076A JP 17007679 A JP17007679 A JP 17007679A JP S5918730 B2 JPS5918730 B2 JP S5918730B2
Authority
JP
Japan
Prior art keywords
word
dictionary
grammar
information
grammatical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP54170076A
Other languages
Japanese (ja)
Other versions
JPS5692674A (en
Inventor
多喜子 富士
弘 林
清 大井
貞雄 深津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP54170076A priority Critical patent/JPS5918730B2/en
Publication of JPS5692674A publication Critical patent/JPS5692674A/en
Publication of JPS5918730B2 publication Critical patent/JPS5918730B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 本発明は、仮名・漢字変換装置、特にいわゆる最長一致
法と前後の単語間の接続関係を示す情報である文法情報
とを利用して仮名・漢字変換を行なうと共に入力データ
中に単語間の区切りを指示する空白を挿入する仮名・漢
字変換装置において、上記空白に続く次の単語が空白前
の単語に対して文法情報に関して接続関係が得られない
場合に、当該文法端報を破棄して上記次の単語を選択す
るようにした仮名・漢字変換装置に関するものである。
[Detailed Description of the Invention] The present invention utilizes a kana/kanji conversion device, particularly the so-called longest match method, and grammatical information, which is information indicating connection relationships between preceding and following words, to perform kana/kanji conversion and input. In a kana/kanji conversion device that inserts a space to indicate a break between words in data, if the next word following the space does not have a connection relation in terms of grammatical information with the word before the space, the corresponding grammatical The present invention relates to a kana/kanji conversion device that discards a short message and selects the next word.

一般に、例えば仮名文を入力してゆき漢字まじり文に変
換する仮名・漢字変換装置においては、単語辞書に記憶
されている単語と入力されて変換されてゆく仮名の読み
とが最も字数の大きい状態で一致するものを正しい単語
として選ぶ最長一致法が広く採用されている。
Generally, in a kana/kanji conversion device that inputs a kana sentence and converts it into a sentence mixed with kanji, the words stored in the word dictionary and the reading of the input kana that is converted have the largest number of characters. The longest match method, which selects the word that matches as the correct word, is widely used.

そして一方、選択された前の単語と次に選択されようと
する次の単語との間の文法的な接続関係をチェックし、
正しい接続関係が得られることを条件として次の単語を
選択してゆくようにされる。一般に上記の如く変換され
てゆくものであるが、上記変換処理を効率よく行なわせ
るために、オペレータが入力する際に単語間に区切りを
指示する空白を与えることも行なわれる。
On the other hand, check the grammatical connection between the previous word selected and the next word to be selected,
The next word is selected on the condition that the correct connection relationship is obtained. Generally, words are converted as described above, but in order to make the above conversion process more efficient, when the operator inputs words, a space is also given to indicate a break between words.

この空白が与えられた場合には、その空白位置で1つの
単語が終つているものとされる。この空白を挿入する方
式の場合、空白を詰めて入力するよりは良い結果が得ら
れるものであるが、一方空白の直前に決定された文法情
報は空白の後に続く次の単語を選択するに当つて絶対的
なものとなり、これが誤変換であつたとすると空白の直
後の単語に対する変換に悪影響をおよぼし、次々と誤変
換される可能性をもつている。これは、上記空白によつ
て1つの単語が終つていることが絶対的に正しいものと
され、この条件を満足するように選ばれた前の単語は正
しいものとされるからである。本発明はこの点を解決す
ることを目的としており、本発明の仮名・漢字変換装置
は、読みに対応する単語辞書と選択された単語の少なく
とも後に連らなる単語に対する文法条件を格納する文法
辞書とをそなえると共に、読みをもつて入力されかつ入
力される単語相互間に空白を与えられて入力される入力
データについて上記空白を区切りとして上記単語辞書と
上記文法辞書とを索引する辞書検索装置をそなえ、上記
入力された入力データを最長一致法と直前の選択された
単語に対する文法情報とにもとづいて漢字まじり文に変
換する仮名・漢字変換装置において、上記空白を区切り
として選択された単語とそれに続く次の単語との間の文
法情報をチエツクする文法情報チエツク部をそなえ、該
文法情報チエツク部は、上記文法情報が上記次の単語に
対して所定の条件を満足し得ないことを検出した場合に
、上記辞書検索装置に対して上記当該文法情報を破棄し
て上記次の単語が文章の句点または読点に続く単語であ
るとみなして当該次の単語を選択する指示を行うよう構
成されてなり、上記辞書検索装置は当該指示に対応した
検索を行なうよう構成したことを特徴としている。
If this blank space is given, it is assumed that one word ends at that blank position. This method of inserting spaces gives better results than filling in spaces, but on the other hand, the grammatical information determined just before the space is used to select the next word following the space. If this is an erroneous conversion, it will have an adverse effect on the conversion of the word immediately after the blank, and there is a possibility that it will be erroneously converted one after another. This is because it is considered absolutely correct that one word ends with the space, and the previous word selected to satisfy this condition is considered correct. The present invention aims to solve this problem, and the kana/kanji conversion device of the present invention includes a word dictionary corresponding to readings and a grammar dictionary storing grammatical conditions for words that follow at least the selected word. and a dictionary search device for indexing the word dictionary and the grammar dictionary using the blanks as delimiters for input data input with readings and with spaces between the input words. The kana/kanji conversion device converts the above input data into a sentence containing kanji based on the longest match method and the grammatical information for the previous selected word. A grammatical information check unit is provided to check grammatical information between the next word and the grammatical information check unit detects that the grammatical information cannot satisfy a predetermined condition for the next word. In this case, the dictionary search device is configured to instruct the dictionary search device to discard the grammatical information and select the next word by assuming that the next word is a word following a period or comma of the sentence. The dictionary search device is characterized in that it is configured to perform a search corresponding to the instruction.

以下図面を参照しつつ説明する。第1図A,B,Cは本
発明の前提問題を説明する説明図、第2図は単語辞書の
記憶内容を表わす一実施例、第3図は文法辞書の記憶内
容を表わす一実施例、第4図は本発明の一実施例構成を
示す。
This will be explained below with reference to the drawings. FIGS. 1A, B, and C are explanatory diagrams for explaining the prerequisite problems of the present invention, FIG. 2 is an embodiment showing the storage contents of a word dictionary, and FIG. 3 is an embodiment showing the storage contents of the grammar dictionary. FIG. 4 shows the configuration of an embodiment of the present invention.

今第1図C図示の如き文字列1を得るために第1図A図
示の如き仮名文字列2を入力したものと考える。この場
合、変換処理を効率よく行なうために、単語の区切りな
どに空白3が挿入されている。しかし、第1図A図示の
仮名文2を入力して変換処理を行なつた場合に、第1図
B図示の文字列4の如く途中から変換処理が出来なくな
ることがある。これは、空白3の前の単語「ダ」(図示
A)が第2図図示の単語辞書5において終止形の「ダ」
であると選択されたことに起因している。このような選
択は、終止形の「ダ」と連体形の「ダ」との発生頻度に
もとづく優先度によつて生じぬと共に、上記空白3を挿
入する方式の場合この選ばれた終止形の「ダ」が空白の
存在のために絶対的なものとみなされ易いことから生じ
る。このように終止形の「ダ」が選択された場合にはそ
の選択結果が原因となつて、文法辞書6の文法情報から
、次の単語として名詞が接続され得ないもの(第3図中
×印)となり、次の単語である「システム]が接続不能
となり、以下変換不能状態が続くこととなる。なお、こ
の上記の場合、単語辞書中の単語「ダ」の見出しを1つ
に絞つて当該「ダ」の文法情報として終止形と連体形と
のいずれでも可とするように例えば「終止形」と[連体
形」と[連体・終止形」との如き形で3つの情報を連記
した単語辞書を作成すればよい。
It is now assumed that a kana character string 2 as shown in FIG. 1A is input in order to obtain a character string 1 as shown in FIG. 1C. In this case, spaces 3 are inserted between words, etc., in order to efficiently perform the conversion process. However, when the kana sentence 2 shown in FIG. 1A is input and the conversion process is performed, the conversion process may become impossible at some point, as in character string 4 shown in FIG. 1B. This means that the word "da" (illustrated A) before the blank 3 is the final form "da" in the word dictionary 5 illustrated in Figure 2.
This is due to the fact that it was selected. Such selection does not occur based on the priority based on the frequency of occurrence of the final form "da" and the adjunctive form "da", and in the case of the method of inserting blank 3, this selected final form This arises from the fact that ``da'' is easily regarded as absolute due to the existence of a blank space. When the final form "da" is selected in this way, the result of the selection is such that, from the grammatical information in the grammar dictionary 6, nouns cannot be connected as the next word (× in Figure 3). mark), and the next word "system" cannot be connected, and the unconvertible state continues.In addition, in the above case, narrow down the heading of the word "da" in the word dictionary to one. The grammatical information for "da" can be either the final form or the adnominal form, so for example, three pieces of information are written in the form of "final form", [adjunctive form], and [adjunctive/final form]. Just create a word dictionary.

しかし、このように単語辞書5を作成すると、当該単語
辞書5中に格納する文法情報格納領域が大となり、すべ
ての単語について同じ大きさの領域を予め用意すること
となつて単語辞書が大きくなつて好ましくない。また変
換に当つては例えば上記連記してある3つの文法情報の
1つを如何に選ぶかの選択処理を正しく行なわせたこと
が必須のものとなり、個別に見出しをもうけて単一の文
法情報を用意する態様にくらべて、場合によつては誤変
換の可能性が増大することになる。このために、本発明
の場合、上記の如く終止形の[ダ]が選択された結果に
おいて次の単語「システム」が変換不能となつた場合に
、当該「ダ」の文法情報即ち終止形である旨の情報を破
棄し、文章中の句点または読点が前の単語であつたもの
として処理するようにする。
However, when the word dictionary 5 is created in this way, the grammar information storage area to be stored in the word dictionary 5 becomes large, and the word dictionary becomes large because an area of the same size must be prepared in advance for all words. I don't like it. Also, when converting, it is essential to correctly select one of the three pieces of grammatical information listed above. In some cases, the possibility of erroneous conversion increases compared to the method in which . For this reason, in the case of the present invention, if the next word "system" becomes unconvertible as a result of selecting the final form [da] as described above, the grammatical information of the said "da", that is, the final form. To discard information to the effect that there is a certain point and to process it as if the period or comma in the sentence was the previous word.

即ち句点(ピリオド)または読点(コンマ)の文法情報
を文法辞書6から読出して、次の単語「システム」との
接続関係を調べ、単語「システム」を変換してゆくよう
にする。第3図図示文法辞書6においては、コンマに対
して名詞が接続可能(図示○印)であり、単語「システ
ム」が正しく変換され、第1図C図示の文字列1の如く
変換される。なお、上述の変換不能となる如き状態は、
上記終止形と連体形との場合に限られるものではなく、
例えば次の如き場合にも生じる。即ち「美しい 動く
馬」と入力された如き場合において、形容詞(この場合
には「美しい」)が動詞の連体形(この場合には「動く
」)と連結することを認めない辞書が用いられる場合な
どにも生じる。第44図は本発明の一実施例構成を示し
、図中の符号5,6は第2図および第3図に対応し、7
は文字列入力装置(第1図A図示文字列2を入力するも
の)、8はバツフア・レジスタであつて例えば上記空白
3までの文字列がセツトされて変換処理の対象とされる
もの、9は辞書部、10は辞書検索装置、11は句点ま
たは読点文法情報読出しアドレス部、12は文法情報チ
エツク部、13は出力フアイルを表わしている。
That is, the grammatical information of a period or a comma is read from the grammar dictionary 6, the connection relationship with the next word "system" is checked, and the word "system" is converted. In the illustrated grammar dictionary 6 in FIG. 3, a noun can be connected to a comma (indicated by a circle in the figure), and the word "system" is correctly converted, as in character string 1 shown in FIG. 1C. In addition, the above-mentioned situation where conversion becomes impossible is as follows.
It is not limited to the above-mentioned final form and continuous form,
For example, this may occur in the following cases. In other words, “beautiful moving
This also occurs when a dictionary is used that does not allow an adjective (in this case, ``beautiful'') to be connected with the adnominal form of a verb (in this case, ``moves''), such as when inputting ``horse''. . FIG. 44 shows the configuration of an embodiment of the present invention, where numerals 5 and 6 correspond to FIGS. 2 and 3, and 7
1 is a character string input device (for inputting the character string 2 shown in FIG. 1A); 8 is a buffer register in which, for example, the character string up to the blank 3 is set and subjected to conversion processing; 9 10 is a dictionary section, 10 is a dictionary search device, 11 is a period or comma grammar information reading address section, 12 is a grammar information check section, and 13 is an output file.

今文字列「クミコンダ」がレジスタ8にセツトされたと
すると、辞書検索装置10は文字夕旺ク」、「クミ」、
「クミコ」、 「クミコン」、 「クミコンダ]の夫
々について順に単語辞書5を索引し、最長一致法のもと
で「クミコ(組込)」を選択し、出力フアイル13側に
転送する。
If the character string ``Kumikonda'' is now set in the register 8, the dictionary search device 10 will search for the characters ``Yuo Ku'', ``Kumi'',
The word dictionary 5 is indexed in order for each of "Kumiko", "Kumikon", and "Kumikonda", and "Kumiko (incorporated)" is selected based on the longest match method and transferred to the output file 13 side.

この場合、前の単語「オ」に対する文法情報からみた接
続が正しいものであるとすると、文法情報チエツク部1
2は0K信号を出力フアイル13に送り、上記「組込」
が決定される。次に辞書検索装置10は「ン」を決定し
、また次の「ダ」を終止形の「ダ」と決定したとする。
次いでバツフア・レジスタ8にセツトされた文字列「シ
ステム」について単語辞書5が索引され、一方先に決定
した[ダ」から得られている終止形にもとづいて文法辞
書6が索引される。この場合、文字列「システム」が1
つの単語として索引されるが、当該単語が名詞であるこ
とから、文法情報チエツク部12はNO信号を辞書検索
装置10に戻す。辞書検索装置10は文字列「システ」
、[シス」、「シ]などについて調べてゆくが、文法情
報と「ム」の次に空白が存在することから、正しい変換
が得られないこととなる。この場合に、本発明において
は、上記[ダ」の文法情報(終止形)を破棄して、アド
レス11の内容にもとづいて文法辞書6をアクセスし、
次の単語として名詞がつながり得ることを知る。この結
果、次の単語が「システム」であるとされて出カフアイ
ル13に転送され、文法情報チエツク回路12は0K信
号を出力フアイル13に与え、単語「システム」が選択
される。以上説明した如く、本発明によれば、空白を挿
入する方式の利点を享受しかつ単語辞書の容量を増大さ
せることなく、空白の前の単語の誤まつた選択に起因す
る以後の誤変換を防止することが可能となる。
In this case, assuming that the connection to the previous word "o" is correct from the perspective of grammatical information, the grammatical information check section 1
2 sends the 0K signal to the output file 13 and performs the above "incorporation"
is determined. Next, it is assumed that the dictionary search device 10 determines "n" and also determines the next "da" as the final form "da".
Next, the word dictionary 5 is indexed for the character string "SYSTEM" set in the buffer register 8, and the grammar dictionary 6 is indexed based on the final form obtained from the previously determined [da]. In this case, the string "system" is 1
However, since the word is a noun, the grammar information check unit 12 returns a NO signal to the dictionary search device 10. The dictionary search device 10 reads the character string “SYSTE”
, [sis], "shi", etc., but due to the grammatical information and the presence of a blank space after "mu", the correct conversion cannot be obtained. In this case, in the present invention, the grammar information (final form) for [da] is discarded, and the grammar dictionary 6 is accessed based on the contents of the address 11,
Learn that nouns can be connected as the next word. As a result, the next word is determined to be "system" and is transferred to the output file 13, and the grammar information check circuit 12 gives a 0K signal to the output file 13, so that the word "system" is selected. As explained above, according to the present invention, while enjoying the advantages of the method of inserting spaces and without increasing the capacity of the word dictionary, subsequent erroneous conversions caused by incorrect selection of the word before the space can be avoided. It becomes possible to prevent this.

【図面の簡単な説明】[Brief explanation of drawings]

第1図A,B,Cは本発明の前提問題を説明する説明図
、第2図は単語辞書の記憶内容を表わす一実施例、第3
図は文法辞書の記憶内容を表わす一実施例、第4図は本
発明の一実施例構成を表わす。 図中、1,2,4は文字列、3は空白、5は単語辞書、
6は文法辞書、7は文字列入力装置、8はバツフア・レ
ジスタ、9は辞書部、10は辞書検索装置、12は文法
情報チエツク部、13は出カフアイルを表わす。
Figures 1A, B, and C are explanatory diagrams explaining the prerequisite problems of the present invention, Figure 2 is an example showing the memory contents of a word dictionary, and Figure 3
The figure shows an example of the storage contents of a grammar dictionary, and FIG. 4 shows the configuration of an example of the present invention. In the figure, 1, 2, 4 are character strings, 3 is a blank, 5 is a word dictionary,
6 is a grammar dictionary, 7 is a character string input device, 8 is a buffer register, 9 is a dictionary section, 10 is a dictionary search device, 12 is a grammar information check section, and 13 is an output file.

Claims (1)

【特許請求の範囲】[Claims] 1 読みに対応する単語辞書と選択された単語の少なく
とも後に連らなる単語に対する文法条件を格納する文法
辞書とをそなえると共に、読みをもつて入力されかつ入
力される単語相互間に空白を与えられて入力される入力
データについて上記空白を区切りとして上記単語辞書と
上記文法辞書とを索引する辞書検索装置をそなえ、上記
入力された入力データを最長一致法と直前の選択された
単語に対する文法情報とにもとづいて漢字まじり文に変
換する仮名・漢字変換装置において、上記空白を区切り
として選択された単語とそれに続く次の単語との間の文
法情報をチェックする文法情報チェック部をそなえ、該
文法情報チェック部は、上記文法情報が上記次の単語に
対して所定の条件を満足し得ないことを検出した場合に
、上記辞書検索装置に対して上記当該文法情報を破棄し
て上記次の単語が文章の句点または読点に続く単語であ
るとみなして当該次の単語を選択する指示を行うよう構
成されてなり、上記辞書検索装置は当該指示に対応した
検索を行なうよう構成したことを特徴とする仮名・漢字
変換装置。
1 A word dictionary corresponding to the reading and a grammar dictionary storing grammatical conditions for at least the words following the selected word are provided, and the word dictionary is input with the reading and a space is provided between the input words. A dictionary search device is provided that indexes the word dictionary and the grammar dictionary using the blank space as a delimiter, and searches the input data using the longest match method and grammatical information for the previous selected word. A kana/kanji conversion device that converts a sentence mixed with kanji based on the above-mentioned blank space is provided with a grammar information check unit that checks the grammar information between the word selected as a delimiter and the next word that follows, and the grammar information When the checking unit detects that the grammatical information does not satisfy a predetermined condition for the next word, the checking unit discards the grammatical information and instructs the dictionary search device to discard the grammatical information so that the next word becomes The dictionary search device is configured to issue an instruction to select the next word by assuming that the word follows a period or comma in a sentence, and the dictionary search device is configured to perform a search corresponding to the instruction. Kana/kanji conversion device.
JP54170076A 1979-12-26 1979-12-26 Kana/Kanji conversion device Expired JPS5918730B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP54170076A JPS5918730B2 (en) 1979-12-26 1979-12-26 Kana/Kanji conversion device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP54170076A JPS5918730B2 (en) 1979-12-26 1979-12-26 Kana/Kanji conversion device

Publications (2)

Publication Number Publication Date
JPS5692674A JPS5692674A (en) 1981-07-27
JPS5918730B2 true JPS5918730B2 (en) 1984-04-28

Family

ID=15898187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54170076A Expired JPS5918730B2 (en) 1979-12-26 1979-12-26 Kana/Kanji conversion device

Country Status (1)

Country Link
JP (1) JPS5918730B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60195664A (en) * 1984-03-15 1985-10-04 Comput Basic Mach Technol Res Assoc Kana-to-kanji-converting system
JPS6232563A (en) * 1985-08-05 1987-02-12 Nec Corp Japanese-language input system
JPH0635522B2 (en) * 1985-08-05 1994-05-11 日本合成化学工業株式会社 Molding resin composition

Also Published As

Publication number Publication date
JPS5692674A (en) 1981-07-27

Similar Documents

Publication Publication Date Title
KR100238189B1 (en) Multi-language tts device and method
EP0403660A1 (en) Machine translation system
US4799188A (en) Electronic dictionary system having improved memory efficiency for storage of common suffix words
GB2131582A (en) Electronic translator
US4630235A (en) Key-word retrieval electronic translator
WO1989009455A1 (en) Natural language parsing software system
JPH0724055B2 (en) Word division processing method
US4613944A (en) Electronic translator having removable data memory and controller both connectable to any one of terminals
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
EP0054658A1 (en) Automatic spelling checking and correction process in a text processing system
EP0538617B1 (en) System for text translation
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPS5918730B2 (en) Kana/Kanji conversion device
JPS6033665A (en) Automatic extracting system of keyword
EP0145202B1 (en) Word spelling checking system
US4873628A (en) Command translating computer
EP0539965B1 (en) An electronic dictionary including a pointer file and a word information correction file
JPS5965342A (en) Kanji (chinese character)/kana (japanese syllabary) converting system
JPS5832418B2 (en) Kanji-mixed sentence input device
JPS5727366A (en) Electronic translator
JPS6389976A (en) Language analyzer
JPS59103136A (en) Kana (japanese syllabary)/kanji (chinese character) processor
JPH0290364A (en) Method and system for mechanical translation
JPH0695330B2 (en) Document creation device
JPH035875A (en) Electronic dictionary dealing with regular description and different description