JP3253311B2 - Language processing apparatus and language processing method - Google Patents

Language processing apparatus and language processing method

Info

Publication number
JP3253311B2
JP3253311B2 JP04346491A JP4346491A JP3253311B2 JP 3253311 B2 JP3253311 B2 JP 3253311B2 JP 04346491 A JP04346491 A JP 04346491A JP 4346491 A JP4346491 A JP 4346491A JP 3253311 B2 JP3253311 B2 JP 3253311B2
Authority
JP
Japan
Prior art keywords
japanese
word
kana
notation
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04346491A
Other languages
Japanese (ja)
Other versions
JPH04280370A (en
Inventor
信治 徳永
忍 塩谷
直子 篠崎
まり 戸子田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP04346491A priority Critical patent/JP3253311B2/en
Publication of JPH04280370A publication Critical patent/JPH04280370A/en
Application granted granted Critical
Publication of JP3253311B2 publication Critical patent/JP3253311B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、機械翻訳装置,日本
語要約機およびコンピュータやロボット制御装置の自然
言語インターフェース等に用いられる言語処理装置およ
び言語処理方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a language processing apparatus and a language processing method used for a machine translator, a Japanese summarization machine, a natural language interface of a computer or a robot controller, and the like.

【0002】[0002]

【従来の技術】日本語文字には漢字と仮名がある。上記
漢字は表意文字であって読みの他に意味をも表してい
る。これに対して上記仮名は表音文字であり、読みだけ
を表す。したがって、入力された日本語文を解析したり
理解したりする場合には、仮名書きの箇所についてはそ
のままでは意味を特定できない。これは、表音文字であ
る仮名によって表記された単語よりも、表意文字である
漢字によって表記された単語の方の意味が狭いからであ
る。すなわち、例えば次の3つの単語、 (A) 上げる (B) 挙げる (C) 揚げる を仮名書きすると総て「あげる」である。したがって、「 私はてんぷらをあげた。」 と言う日本語文が入力された場合、単語「あげた」の意味
として、 (a) 上にあげた (b) 人にあげた (c) フライにした の、少なくとも3種類の意味が考えられる。そのため
に、上記仮名書きされた単語「あげた」の意味を特定でき
ないのである。したがって、通常このような場合には、
格パターンを用いた意味解析によって入力された日本文
の仮名書き単語の意味を特定するのである。上記格パタ
ーンとは、ある用言が取り得る格(格助詞「が」等が付く
主格,格助詞「を」等が付く対象格,格助詞「に」等が付く目
標格,…,)とその格スロットを埋める体言に関する意味
素性とを関連付けたものである。 例えば、用言「買う」の格パターンは 《人》《もの》 買う であり、用言「与える」の格パターンは 《人》《もの》《人》 与える である。
2. Description of the Related Art Japanese characters include kanji and kana. The above-mentioned kanji is an ideographic character and represents meaning in addition to reading. On the other hand, the kana is a phonetic character and represents only reading. Therefore, when analyzing or understanding the input Japanese sentence, the meaning of the kana written portion cannot be specified as it is. This is because a word represented by a kanji character that is an ideographic character has a narrower meaning than a word represented by a kana character that is a phonetic character. That is, for example, the following three words, (A) raise (B) raise (C) raise, are all given as kana. Therefore, when a Japanese sentence saying "I gave tempura" was input, the meaning of the word "given" was (a) given above (b) given to a person (c) fried Can have at least three different meanings. For this reason, the meaning of the word "given" written in the pseudonym cannot be specified. Therefore, usually in such a case,
It specifies the meaning of the kana written word of the Japanese sentence that was input by the semantic analysis using the case pattern. The above-mentioned case pattern is the case that a certain verb can take (the nominative case with the case particle "ga", etc., the target case with the case particle "wo", etc., the target case with the case particle "ni", etc., ...). It is associated with a semantic feature related to the nominative that fills the case slot. For example, rated pattern of the verb "buy" is to buy a "person" is "things", rated pattern of the verb "give" is given to the "people" is "things" to "people".

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記格
パターンを用いる方法によって仮名書き単語の意味を特
定する場合には次のような問題がある。すなわち、例え
ば当該仮名書き単語が動詞「かける」である場合に、入力
文中の各単語の品詞や意味素性等から、当該仮名書き単
語「かける」の格パターンは 《人》《もの》《場所》 かける であると決定できたとする。ところが、仮名表記が「か
ける」であって上記格パターンを有する動詞として、例
えば「架ける」および「掛ける」等が存在する。そのため、
上記決定された格パターンだけでは当該仮名書き単語
「かける」の意味が「架ける」なのか「掛ける」なのかを特定
できないのである。したがって、入力文中の仮名書き単
語の部分には意味の曖昧性がそのまま残ってしまい、そ
の後における処理の正確度が低下してオペレータが最初
に意図したものとは異なった処理結果が出力されてしま
うのである。その結果、機械翻訳装置の場合には意味不
明の翻訳文が出力される等の現象が現れることになり、
ポストエディト等の多大な労力が必要となるので効率良
い翻訳処理ができないという問題がある。
However, when the meaning of a kana-written word is specified by the method using the case pattern, there are the following problems. That is, for example, if the kana writing word is a verb "Call", from the part of speech and semantic features of each word of the input sentence, rank pattern of the kana writing the word "put" has "human" to "what""Let's say that it is decided to hang on “Place”. However, as verbs having the kana notation "kake" and the case pattern, for example, there are "kake" and "kake". for that reason,
It is not possible to identify whether the meaning of the kana-written word “Kake” is “Kake” or “Kake” using only the determined case pattern. Therefore, the ambiguity of the meaning remains in the part of the kana written word in the input sentence, and the accuracy of subsequent processing is reduced, and a processing result different from the one originally intended by the operator is output. It is. As a result, in the case of a machine translation device, a phenomenon such as outputting a translation with an unknown meaning appears,
Since a great deal of labor such as post-editing is required, there is a problem that efficient translation processing cannot be performed.

【0004】そこで、この発明の目的は、日本語におけ
る仮名書き単語の意味の曖昧性を減少させることによっ
て、効率の良い言語処理を可能にする言語処理装置およ
び言語処理方法を提供することにある。
It is an object of the present invention to provide a language processing apparatus and a language processing method which enable efficient language processing by reducing the ambiguity of the meaning of kana-written words in Japanese. .

【0005】[0005]

【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明の言語処理装置は、日本語文を
入力する入力部と、上記入力された日本語文等を表示す
る表示部と、入力された日本語文を複数の日本語形態素
に分割し,形態素解析を行って,単語とその品詞を認定す
る形態素解析部と、単語の読みと,当該読みを有する複
数の漢字表記と,各漢字表記に係る語義とが対応付けら
れて格納された表記情報格納部と、上記形態素解析部に
よって分割された単語列に仮名書き単語が在る場合に,
上記表記情報格納部に格納された読みの中から当該仮名
書き単語の読みを検索し,検索された当該単語の読みに
対応付けられた複数の漢字表記を上記表示部に表示する
表記情報処理部と、上記表記情報処理部によって表示さ
れた複数の漢字表記のうちから,所望の漢字表記を指示
して確定するための漢字表記決定部を備えて、上記漢字
表記決定部によって確定された当該仮名書き単語の漢字
表記に基づいて,当該仮名書き単語の語義を特定するこ
とを特徴としている。
According to a first aspect of the present invention, there is provided a language processing apparatus for inputting a Japanese sentence, and a display unit for displaying the input Japanese sentence and the like. The input Japanese sentence is divided into a plurality of Japanese morphemes, a morphological analysis is performed, a morphological analysis unit that recognizes the word and its part of speech, a reading of the word, a plurality of kanji notations having the reading, and In the case where a kana-written word is present in a word string divided by the morphological analyzer,
A notation information processing unit that searches for readings of the kana written word from the readings stored in the notation information storage unit and displays a plurality of kanji notations associated with the searched reading of the word on the display unit And a kanji notation determining unit for designating and confirming a desired kanji notation from among the plurality of kanji notations displayed by the notation information processing unit, and the kana determined by the kanji notation determining unit. It is characterized in that the meaning of the kana written word is specified based on the kanji notation of the written word.

【0006】また、請求項2に係る発明の言語処理装置
は、日本語文を入力する入力部と、上記入力された日本
語文等を表示する表示部と、入力された日本語文を複数
の日本語形態素に分割し,形態素解析を行って,単語とそ
の品詞を認定する形態素解析部と、単語の読みと,当該
読みを有する複数の漢字表記と,各漢字表記に係る語義
とが対応付けられて格納された表記情報格納部と、上記
形態素解析部によって分割された単語列に仮名書き単語
が在る場合に,上記表記情報格納部に格納された読みの
中から当該仮名書き単語の読みを検索し,検索された当
該単語の読みに対応付けられた複数の漢字表記を上記表
示部に表示する表記情報処理部と、上記表記情報処理部
によって表示された複数の漢字表記のうちから,所望の
漢字表記を指示して確定するための漢字表記決定部と、
上記漢字表記決定部によって確定された漢字表記の語義
と上記形態素解析部の解析結果とに基づいて,日本語文
の構文解析を行う構文解析部と、上記構文解析部の解析
結果に基づいて,上記入力された日本語文を他国語文に
言語翻訳する翻訳部を備えたことを特徴としている。
According to a second aspect of the present invention, there is provided a language processing apparatus comprising: an input unit for inputting a Japanese sentence; a display unit for displaying the input Japanese sentence; The morpheme is divided into morphemes, morphological analysis is performed, and a morphological analysis unit that recognizes the word and its part of speech, the reading of the word, a plurality of kanji notations having the reading, and the meaning of each kanji notation are associated with each other. When there is a kana written word in the stored notation information storage unit and the word string divided by the morphological analysis unit, search for the kana written word reading from the readings stored in the notation information storage unit. Then, a notation information processing unit that displays a plurality of kanji notations associated with the retrieved reading of the word on the display unit, and a desired kanji notation displayed from the plurality of kanji notations displayed by the notation information processing unit. Specify Kanji notation and confirm Kanji notation determination unit for
Based on the semantics of the kanji notation determined by the kanji notation determination unit and the analysis result of the morphological analysis unit, a syntax analysis unit that performs a syntax analysis of the Japanese sentence, and based on the analysis result of the syntax analysis unit, It is characterized by having a translation unit for translating the input Japanese sentence into a foreign language sentence.

【0007】また、請求項3に係る発明は、請求項1あ
るいは請求項2に係る発明の言語処理装置において、上
記表記情報格納部に格納されている漢字表記の夫々には
仮名書き頻度が付加されており、上記表記情報処理部
は、上記複数の漢字表記を表示する場合には、付加され
ている仮名書き頻度の高い漢字表記を優先して表示する
ようになっていることを特徴としている。
According to a third aspect of the present invention, in the language processing apparatus of the first or second aspect, a kana writing frequency is added to each of the kanji notations stored in the notation information storage unit. When displaying the plurality of kanji notations, the notation information processing unit preferentially displays the added kanji notation with a high kana writing frequency. .

【0008】また、請求項4に係る発明は、日本語文を
入力する入力手段と,入力された日本語文等を表示する
表示手段と,日本語単語の読みと当該読みを有する複数
の漢字表記と各漢字表記に係る語義を互いに対応付けて
メモリ手段に登録し,この登録情報に基づいて上記入力
された日本語文を処理する処理手段を有する日本語処理
装置による言語処理方法であって、入力された日本語文
を複数の日本語形態素に分割し,形態素解析を行って単
語とその品詞を認定し、上記分割された単語列に仮名書
き単語が在るか否かを判断し、上記仮名書き単語が在る
と判断した場合には,上記登録されている日本語単語の
読みの中から当該仮名書き単語の読みを検索し,検索さ
れた当該単語の読みに対応付けられた複数の漢字表記を
表示し、この表示された複数の漢字表記のうちから所望
の漢字表記を選択して指示し、この指示された当該仮名
書き単語の漢字表記に基づいて,当該仮名書き単語の語
義を特定することを特徴としている。
According to a fourth aspect of the present invention, there is provided an input means for inputting a Japanese sentence, a display means for displaying the input Japanese sentence or the like, a reading of a Japanese word and a plurality of kanji notations having the reading. A language processing method by a Japanese processing device having processing means for processing the input Japanese sentence based on the registration information, and registering the meanings of the respective kanji notations with each other in a memory means. The divided Japanese sentence is divided into a plurality of Japanese morphemes, morphological analysis is performed to identify the words and their parts of speech, and it is determined whether or not there are any kana-written words in the divided word strings. If it is determined that there is a Japanese word, the kana writing word is searched from the registered Japanese word readings, and a plurality of kanji notations associated with the searched word reading are searched. Display and this displayed multiple Selected by indicating a desired Chinese characters from among the Chinese characters, on the basis of the designated Chinese characters of the kana writing words, it is characterized by specifying the meaning of the kana writing words.

【0009】また、請求項5に係る発明は、日本語文を
入力する入力手段と,入力された日本語文等を表示する
表示手段と,日本語単語の読みと当該読みを有する複数
の漢字表記と各漢字表記に係る語義を互いに対応付けて
メモリ手段に登録し,この登録情報に基づいて上記入力
された日本語文を処理する処理手段を有する日本語処理
装置による言語処理方法であって、入力された日本語文
を複数の日本語形態素に分割し,形態素解析を行って単
語とその品詞を認定し、上記分割された単語列に仮名書
き単語が在るか否かを判断し、上記仮名書き単語が在る
と判断した場合には,上記登録されている日本語単語の
読みの中から当該仮名書き単語の読みを検索し,検索さ
れた当該単語の読みに対応付けられた複数の漢字表記を
表示し、この表示された複数の漢字表記のうちから所望
の漢字表記を選択して指示し、この指示された漢字表記
の語義と上記形態素解析部の解析結果とに基づいて,当
該入力日本語文の構文解析を行い、この構文解析結果に
基づいて,当該入力日本語文を他国語文に言語翻訳する
ことを特徴としている。
According to a fifth aspect of the present invention, there is provided an input means for inputting a Japanese sentence, a display means for displaying the input Japanese sentence, etc., a reading of a Japanese word and a plurality of kanji notations having the reading. A language processing method by a Japanese processing device having processing means for processing the input Japanese sentence based on the registration information, and registering the meanings of the respective kanji notations with each other in a memory means. The divided Japanese sentence is divided into a plurality of Japanese morphemes, morphological analysis is performed to identify the words and their parts of speech, and it is determined whether or not there are any kana-written words in the divided word strings. If it is determined that there is a Japanese word, the kana writing word is searched from the registered Japanese word readings, and a plurality of kanji notations associated with the searched word reading are searched. Display and this displayed multiple Of the input Japanese sentence based on the semantics of the specified kanji notation and the analysis result of the morphological analysis unit. Characteristically, the input Japanese sentence is translated into another language sentence based on the analysis result.

【0010】また、請求項6に係る発明は、請求項4あ
るいは請求項5に係る発明の言語処理方法において、上
記登録されている漢字表記の夫々には仮名書き頻度が付
加されており、上記複数の漢字表記を表示する場合に
は、付加されている仮名書き頻度の高い漢字表記を優先
して表示することを特徴としている。
According to a sixth aspect of the present invention, in the language processing method according to the fourth or fifth aspect, each of the registered kanji notations is added with a kana writing frequency. When displaying a plurality of kanji notations, the kanji notation with a high kana writing frequency attached is preferentially displayed.

【0011】[0011]

【作用】請求項1に係る発明では、入力された日本語文
が形態素解析部によって複数の日本語形態素に分割さ
れ、更に形態素解析が行われて単語とその品詞とが認定
される。そして、上記形態素解析部によって分割された
単語列中に仮名書き単語がある場合には、表記情報処理
部によって、表記情報格納部から当該仮名書き単語の読
みが検索されて、この検索された当該単語の読みに対応
付けられた複数の漢字表記が表示部に表示される。そう
すると、オペレータによって漢字表記決定部が操作され
て、上記表示部に表示された複数の漢字表記の中から、
所望の漢字表記が指示されて確定される。こうして、入
力された日本語文中における仮名書き単語の漢字表記が
確定されることによって、当該仮名書き単語の語義が特
定される。
According to the first aspect of the present invention, the input Japanese sentence is divided into a plurality of Japanese morphemes by the morphological analysis unit, and the morphological analysis is performed to identify the words and their parts of speech. Then, when there is a kana-written word in the word string divided by the morphological analysis unit, the notation information processing unit searches for the reading of the kana-written word from the notation information storage unit. A plurality of kanji notations associated with the reading of the word are displayed on the display unit. Then, the kanji notation determination unit is operated by the operator, and from among the plurality of kanji notations displayed on the display unit,
The desired kanji notation is instructed and confirmed. Thus, the kanji notation of the kana-written word in the input Japanese sentence is determined, and the meaning of the kana-written word is specified.

【0012】また、請求項2に係る発明では、入力され
た日本語文が形態素解析部によって複数の日本語形態素
に分割され、更に形態素解析が行われて単語とその品詞
とが認定される。そして、上記分割された単語列中に仮
名書き単語がある場合には、表記情報処理部によって、
表記情報格納部から当該仮名書き単語の読みが検索され
て、この検索された当該単語の読みに対応付けられた複
数の漢字表記が表示部に表示される。そして、オペレー
タによって漢字表記決定部が操作されて、上記表示部に
表示された複数の漢字表記の中から、所望の漢字表記が
指示されて確定される。そうすると、上記確定された漢
字表記の語義と上記形態素解析部の解析結果とに基づい
て、構文解析部によって上記入力日本語文の構文解析が
行われ、この構文解析結果に基づいて、翻訳部によって
上記入力日本語文が他国語文に言語翻訳される。こうし
て、入力された日本語文中における仮名書き単語の語義
が特定されて、効率良く且つ正しく言語翻訳が行われ
る。
Further, in the invention according to claim 2, the input Japanese sentence is divided into a plurality of Japanese morphemes by the morphological analysis unit, and the morphological analysis is further performed to recognize the word and its part of speech. If there is a kana-written word in the divided word string,
A reading of the kana-written word is searched from the written information storage unit, and a plurality of kanji notations associated with the searched reading of the word are displayed on the display unit. Then, the kanji notation determination unit is operated by the operator, and a desired kanji notation is instructed and determined from among the plurality of kanji notations displayed on the display unit. Then, based on the determined meaning of the kanji notation and the analysis result of the morphological analysis unit, the syntax analysis unit analyzes the syntax of the input Japanese sentence. Based on the syntax analysis result, the translation unit performs The input Japanese sentence is translated into another language sentence. In this way, the meaning of the kana word in the input Japanese sentence is specified, and the language translation is performed efficiently and correctly.

【0013】また、請求項3に係る発明では、上記表記
情報処理部によって、上記表記情報格納部から検索され
た複数の漢字表記が表示部に表示される際に、上記漢字
表記に付加された仮名書き頻度の高い漢字表記が優先し
て表示される。したがって、上記漢字表記決定部がオペ
レータによって繰り返し操作されることなく、所望の漢
字表記が表示される。
In the invention according to claim 3, when the plurality of kanji notations retrieved from the notation information storage unit are displayed on the display unit by the notation information processing unit, the plurality of kanji notations are added to the kanji notation. Kanji notation with high kana writing frequency is displayed with priority. Therefore, the desired kanji notation is displayed without the kanji notation determination unit being repeatedly operated by the operator.

【0014】また、請求項4に係る発明では、入力手段
から入力された日本語文が、処理手段によって、複数の
日本語形態素に分割され、形態素解析が行われて単語と
その品詞が認定される。そして、上記分割された単語列
に仮名書き単語が在る場合には、メモリ手段に登録され
ている日本語単語の読みの中から当該仮名書き単語の読
みが検索され、検索された当該単語の読みに対応付けら
れた複数の漢字表記が表示手段に表示される。そうする
と、オペレータによって、この表示された複数の漢字表
記のうちから所望の漢字表記が選択されて指示される。
そして、この指示された漢字表記に基づいて、当該仮名
書き単語の語義が特定される。
Further, in the invention according to claim 4, the Japanese sentence input from the input means is divided into a plurality of Japanese morphemes by the processing means, and morphological analysis is performed to identify the word and its part of speech. . If a kana word is present in the divided word string, a reading of the kana word is searched from among the readings of the Japanese words registered in the memory means. A plurality of kanji notations associated with the reading are displayed on the display means. Then, the operator selects and indicates a desired kanji notation from the displayed plurality of kanji notations.
Then, the meaning of the kana written word is specified based on the designated kanji notation.

【0015】また、請求項5に係る発明では、入力手段
から入力された日本語文が、処理手段によって、複数の
日本語形態素に分割され、形態素解析が行われて単語と
その品詞が認定される。そして、上記分割された単語列
に仮名書き単語が在る場合には、メモリ手段に登録され
ている日本語単語の読みの中から当該仮名書き単語の読
みが検索され、検索された当該単語の読みに対応付けら
れた複数の漢字表記が表示手段に表示される。そうする
と、オペレータによって、この表示された複数の漢字表
記のうちから所望の漢字表記が選択されて指示される。
そして、この指示された漢字表記に基づいて、当該仮名
書き単語の語義が特定される。そうした後、上記特定さ
れた漢字表記の語義と上記形態素解析部の解析結果とに
基づいて、当該入力日本語文の構文解析が行われる。そ
して、この構文解析結果に基づいて、当該入力日本語文
が他国語文に言語翻訳される。
Further, in the invention according to claim 5, the Japanese sentence input from the input means is divided into a plurality of Japanese morphemes by the processing means, and morphological analysis is performed to identify the word and its part of speech. . If a kana word is present in the divided word string, a reading of the kana word is searched from among the readings of the Japanese words registered in the memory means. A plurality of kanji notations associated with the reading are displayed on the display means. Then, the operator selects and indicates a desired kanji notation from the displayed plurality of kanji notations.
Then, the meaning of the kana written word is specified based on the designated kanji notation. After that, syntax analysis of the input Japanese sentence is performed based on the specified meaning of the kanji notation and the analysis result of the morphological analysis unit. Then, based on the result of the parsing, the input Japanese sentence is language-translated into another language sentence.

【0016】また、請求項6に係る発明では、上記複数
の漢字表記を表示する場合に、付加されている仮名書き
頻度の高い漢字表記が優先して表示される。こうして、
所望の漢字表記が早期に指定される。
In the invention according to claim 6, when the plurality of kanji notations are displayed, the added kanji notation with a high kana writing frequency is preferentially displayed. Thus,
The desired kanji notation is specified early.

【0017】[0017]

【実施例】以下、この発明を図示の実施例により詳細に
説明する。本実施例においては、この発明の言語処理装
置を日英機械翻訳装置に適用した場合を例に、この発明
について説明する。図1は本実施例における日英機械翻
訳装置の概略ブロック図であり、1はCPU(中央処理
装置)、2はCRT(カソード・レイ・チューブ)等から成
る表示部、3はOCR(光学式文字読取装置)やキーボー
ド等から成る入力部、4は翻訳プログラムおよび文法規
則等を格納するメインメモリ、5は日英翻訳処理を実施
する翻訳モジュール、6は翻訳処理用辞書や後に詳述す
る表記情報等を格納する外部記憶部である。上記入力部
3を構成するOCRによって読み取られた日本語文は、
CPU1の制御の下に、外部記憶部6に格納された翻訳
処理用辞書および表記情報を参照して、翻訳モジュール
5によって英語に翻訳される。図2は上記翻訳モジュー
ル5の更に詳細なブロック図である。辞書引き・形態素
解析部11は、入力されたソース言語としての日本語文
を日本語形態素(単語)列に分割し、外部記憶部6(図1
参照)に格納された翻訳処理用辞書を引いて上記分割さ
れた各日本語形態素の形態素情報(後に詳述)を得て形態
素解析を行なう。表記情報処理部12は、上記分割され
た日本語単語列中に仮名書きされた日本語単語が在る場
合に、上記仮名書きされた日本語単語の複数の漢字表記
を表示部2に表示する。そうすると、入力部3からのキ
ー入力に基づいて、上記仮名書きされた日本語単語の漢
字表記が一つに特定される。構文解析部13は、上記メ
インメモリ4に格納された文法規則および上記得られた
形態素情報を参照して、入力文から得られた日本語単語
列の構文解析を行なう。変換部14は、得られた日本語
における構文解析結果(構文解析木)を上記形態素情報を
参照して英語における構文解析木に変換する。翻訳文生
成部15は、上記形態素情報を参照して、得られた英語
における構文解析木に基づく翻訳文を英語として正しい
文章に校正して英語による翻訳文を生成する。こうして
生成された翻訳文は表示部2を構成するCRTに表示さ
れるのである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, the present invention will be described in detail with reference to the illustrated embodiments. In the present embodiment, the present invention will be described by taking as an example a case where the language processing apparatus of the present invention is applied to a Japanese-English machine translation apparatus. FIG. 1 is a schematic block diagram of a Japanese-to-English machine translation apparatus according to the present embodiment. Reference numeral 1 denotes a CPU (central processing unit), 2 denotes a display unit including a CRT (cathode ray tube), and 3 denotes an OCR (optical type). An input unit composed of a character reading device) and a keyboard; 4 is a main memory for storing translation programs and grammatical rules; 5 is a translation module for performing Japanese-English translation processing; 6 is a translation processing dictionary and notations described in detail below; The external storage unit stores information and the like. The Japanese sentence read by the OCR constituting the input unit 3 is
Under the control of the CPU 1, the translation module 5 refers to the translation processing dictionary and the notation information stored in the external storage unit 6, and is translated into English. FIG. 2 is a more detailed block diagram of the translation module 5. The dictionary lookup / morphological analysis unit 11 divides the input Japanese sentence as a source language into Japanese morpheme (word) strings,
The morphological analysis is performed by obtaining the morphological information (to be described later in detail) of each of the divided Japanese morphemes by looking up the translation processing dictionary stored in the translation processing dictionary stored in the Japanese dictionary. The notation information processing unit 12 displays, on the display unit 2, a plurality of kanji notations of the kana written Japanese words when the kana written Japanese words are present in the divided Japanese word strings. . Then, based on the key input from the input unit 3, the kanji representation of the Japanese word written in the kana is specified. The syntax analyzer 13 analyzes the syntax of the Japanese word string obtained from the input sentence with reference to the grammar rules stored in the main memory 4 and the obtained morpheme information. The conversion unit 14 converts the obtained syntax analysis result (syntax parse tree) in Japanese into a syntax parse tree in English with reference to the morphological information. The translated sentence generation unit 15 refers to the morphological information, corrects the obtained translated sentence based on the parse tree in English into a correct sentence as English, and generates a translated sentence in English. The generated translation is displayed on the CRT constituting the display unit 2.

【0018】以下、上記外部記憶部6に格納された翻訳
処理用辞書について更に詳細に説明する。図3は上記翻
訳処理用辞書の内容である上記形態素情報を示す。この
形態素情報は、日本語見出し情報16,日本語形態素情
報17,日本語解析情報18,日英変換情報19,英語生
成情報20の5つの情報から成り、通常は一つの単語毎
に上記5つの情報が対応付けられている。ここで、上記
日本語形態素情報17は日本語形態素の品詞情報や接続
情報等であり、上述の形態素解析や構文解析等の際に用
いられる。また、日本語解析情報18は日本語形態素の
意味素性情報等であり、意味解析等の際に用いられる。
また、日英変換情報19は日本語単語が英語単語に変換
された場合に英語文中で取り得る位置情報等であり、上
述の構文解析木の変換等の際に用いられる。また、英語
生成情報20は日本語単語の訳語情報等であり、上述の
翻訳文生成等の際に用いられる。
Hereinafter, the translation dictionary stored in the external storage unit 6 will be described in more detail. FIG. 3 shows the morphological information as the contents of the translation dictionary. This morpheme information is composed of five pieces of information, ie, Japanese headline information 16, Japanese morpheme information 17, Japanese analysis information 18, Japanese-English conversion information 19, and English generation information 20. Usually, the above five morpheme information are provided for each word. Information is associated. Here, the Japanese morpheme information 17 is part of speech information, connection information, and the like of the Japanese morpheme, and is used in the above-described morphological analysis and syntax analysis. The Japanese analysis information 18 is semantic feature information of a Japanese morpheme, and is used at the time of semantic analysis.
The Japanese-English conversion information 19 is position information and the like that can be taken in an English sentence when a Japanese word is converted into an English word, and is used in the above-described conversion of the parse tree and the like. The English generation information 20 is translated word information of Japanese words and the like, and is used when generating the above-described translation.

【0019】次に、上記外部記憶装置6に格納された表
記情報について説明する。この表記情報は、仮名書きに
よる日本語単語の漢字表記および語義を特定する際に用
いられる情報である。図4は上記表記情報の内容の一例
を示す。この表記情報は、日本語単語の“読み(すなわ
ち仮名表記)"と、この日本語単語の“読み"と同一の読
みを有する漢字表記による日本語単語の“日本語見出し
(すなわち漢字表記)"と、上記同一読みを有する漢字表
記による日本語単語の“語義"とを関連付けた情報であ
る。したがって、この表記情報を参照することによっ
て、同じ“読み"を有する日本語単語の総ての漢字表記
と、夫々の漢字表記に係る語義とを知ることができるの
である。
Next, the notation information stored in the external storage device 6 will be described. This notation information is information used when specifying the kanji notation and meaning of Japanese words written in kana. FIG. 4 shows an example of the contents of the notation information. This notation information includes the Japanese word “Yomi (ie, Kana notation)” and the Japanese word “Japanese heading” in Kanji notation having the same reading as this Japanese word “Yomi”.
(That is, kanji notation) "and the Japanese word" sense "of the kanji notation having the same reading. Therefore, by referring to this notation information, the Japanese word having the same" reading "can be obtained. It is possible to know the kanji notation of all words and the meaning of each kanji notation.

【0020】すなわち、上記外部記憶装置6で上記表記
情報格納部を構成し、上記入力部3で上記漢字表記決定
部を構成するのである。
That is, the external storage device 6 constitutes the notation information storage unit, and the input unit 3 constitutes the kanji notation determination unit.

【0021】上記構成の日英機械翻訳装置は次のように
動作する。図5は上記CPU1の制御の下に翻訳モジュ
ール5によって実行される日英翻訳処理動作のフローチ
ャートである。以下、図1〜図5に従って上記日英翻訳
処理動作について詳細に述べる。ステップS1で、入力
部3を構成するOCRから翻訳対象の日本語文が入力さ
れる。ステップS2で、上記辞書引き・形態素解析部11
によって、上記入力された日本語文が日本語形態素に分
割される。さらに、外部記憶部6に格納された上記翻訳
処理用辞書の日本語見出し情報16に基づいて、上記分
割された夫々の日本語形態素が検索される。そして、各
日本語形態素の日本語形態素情報17,日本語解析情報
18,日英変換情報19および英語生成情報20が得ら
れる。ステップS3で、上記ステップS2における検索の
結果や得られた日本語形態素情報17に基づいて、辞書
引き・形態素解析部11によって形態素解析が実施され
る。すなわち、入力日本語文の各日本語形態素の単語認
定が行われ、日本語単語とその品詞が得られるのであ
る。
The Japanese-English machine translator having the above configuration operates as follows. FIG. 5 is a flowchart of the Japanese-English translation processing operation executed by the translation module 5 under the control of the CPU 1. Hereinafter, the Japanese-English translation processing operation will be described in detail with reference to FIGS. In step S1, a Japanese sentence to be translated is input from the OCR constituting the input unit 3. In step S2, the dictionary lookup / morphological analysis unit 11
As a result, the input Japanese sentence is divided into Japanese morphemes. Further, based on the Japanese index information 16 of the translation processing dictionary stored in the external storage unit 6, each of the divided Japanese morphemes is searched. Then, Japanese morpheme information 17, Japanese analysis information 18, Japanese-English conversion information 19, and English generation information 20 of each Japanese morpheme are obtained. In step S3, a morphological analysis is performed by the dictionary lookup / morphological analysis unit 11 based on the search result in step S2 and the obtained Japanese morphological information 17. That is, the word recognition of each Japanese morpheme of the input Japanese sentence is performed, and the Japanese word and its part of speech are obtained.

【0022】ステップS4で、上記ステップS3において
得られた日本語単語列中に、仮名書きされた単語が存在
する場合には、表記情報処理部12によって上記仮名書
き単語に対して以下のような表記情報処理が実施され
る。すなわち、上記外部記憶部6に格納された表記情報
の“読み"の欄(図4参照)に基づいて、当該仮名書き単
語が検索される。その結果、当該仮名書き単語と同じ読
みが表記情報の“読み"の欄に存在する場合には、当該
仮名書き単語には複数の“日本語見出し(漢字表記)"が
存在する。つまり、当該仮名書き単語には複数の語義が
存在して意味が曖昧なのである。そこで、上記検索され
た表記情報の“読み"に関連付けられている総ての“日
本語見出し"が上記表示部2に表示されて、後に詳述す
るような対話処理によって当該仮名書き単語の漢字表記
が特定される。その際に、上記特定された漢字表記に
は、図4に示すように語義が対応付けられているのであ
る。したがって、当該仮名書き単語の漢字表記が特定さ
れることによって、自動的に当該仮名書き単語の語義が
特定されるのである。
In step S4, if there is a kana-written word in the Japanese word string obtained in step S3, the notation information processing unit 12 applies the following to the kana-written word. Notation information processing is performed. That is, the kana word is searched based on the “reading” column of the written information stored in the external storage unit 6 (see FIG. 4). As a result, if the same reading as the kana-written word is present in the “reading” column of the written information, the kana-written word has a plurality of “Japanese headlines (kanji notation)”. In other words, the kana word has a plurality of meanings and the meaning is ambiguous. Then, all the "Japanese headlines" associated with the "reading" of the retrieved notation information are displayed on the display unit 2, and the kanji of the kana-written word is displayed by an interactive process described later in detail. The notation is specified. At that time, the specified kanji notation is associated with the meaning as shown in FIG. Therefore, by specifying the kanji notation of the kana written word, the meaning of the kana written word is automatically specified.

【0023】ステップS5で、上記ステップS4における
表記情報処理によって仮名書き単語の語義が特定された
単語認定結果に対して、上記メインメモリ4に格納され
た文法規則および上記検索の結果得られた日本語形態素
情報17や日本語解析情報18等に基づいて、上記構文
解析部13によって意味解析を伴った構文解析が実施さ
れる。こうして、上記日本語単語列における文節分かち
結果および文節相互間の係り受けが決定されて、構文解
析木が決定されるのである。ステップS6で、上記検索
の結果得られた日英変換情報19に基づいて、上記ステ
ップS5において得られた日本語の構文解析木が英語の
構文解析木に変換される。ステップS7で、上記検索の
結果得られた英語生成情報20を用いて、上記ステップ
S6において得られた英語の構文解析木に基づいて正し
い翻訳文が生成される。ステップS8で、上記ステップ
S7において生成された英語による翻訳文が表示部2を
構成するCRTに表示されて、日英翻訳処理動作を終了
する。
In step S5, the grammatical rule stored in the main memory 4 and the Japanese language obtained as a result of the search are obtained for the word recognition result in which the meaning of the kana written word is specified by the notation information processing in step S4. Based on the word morpheme information 17, the Japanese analysis information 18, and the like, the syntactic analysis unit 13 performs syntactic analysis with semantic analysis. In this manner, the result of segmentation in the Japanese word string and the dependency between the segments are determined, and the parse tree is determined. In step S6, the Japanese parse tree obtained in step S5 is converted into an English parse tree based on the Japanese-English conversion information 19 obtained as a result of the search. In step S7, a correct translation is generated based on the English syntax parse tree obtained in step S6, using the English generation information 20 obtained as a result of the search. In step S8, the English translation sentence generated in step S7 is displayed on the CRT constituting the display unit 2, and the Japanese-English translation processing operation ends.

【0024】以下、ソース言語である日本語による入力
文「 前はここにかかっていた」 をターゲット言語である英語に翻訳する場合を例に、上
記日英翻訳処理動作を図1〜図10に従ってより具体的
に説明する。上記OCRによって読み取られた日本語文
が、図6に示すようにメインメモリ4の作業領域に格納
される。 …ステップ
S1そして、こうして読み取られた日本語文に対して、
上記翻訳処理用辞書を用いて辞書引き/形態素解析が実
施される。すなわち、読み取られた日本語文が日本語形
態素列に分割され、翻訳処理用辞書を用いて当該単語の
日本語見出しが検索され、得られた日本語見出し情報1
6に対応付けられた日本語形態素情報17,日本語解析
情報18,日英変換情報19および英語生成情報20の
内容がメインメモリ4のバッファに格納される。次に、
上記バッファに格納された日本語形態素情報17の内容
に基づいて、図7に示すような単語認定結果が得られ
る。 …ステップS2,ステップS3
The above-mentioned Japanese-English translation processing operation will be described below with reference to FIGS. 1 to 10 by taking as an example a case where an input sentence "was here before" is translated into English as a target language. This will be described more specifically. The Japanese sentence read by the OCR is stored in the work area of the main memory 4 as shown in FIG. … Step S1 Then, for the Japanese sentence thus read,
Dictionary lookup / morphological analysis is performed using the translation processing dictionary. That is, the read Japanese sentence is divided into Japanese morpheme strings, the Japanese heading of the word is searched using the dictionary for translation processing, and the obtained Japanese heading information 1 is obtained.
The contents of the Japanese morpheme information 17, Japanese analysis information 18, Japanese-English conversion information 19, and English generation information 20 associated with 6 are stored in the buffer of the main memory 4. next,
Based on the contents of the Japanese morpheme information 17 stored in the buffer, a word recognition result as shown in FIG. 7 is obtained. … Step S2, Step S3

【0025】次に、図7に示す上記単語認定結果に基づ
いて、上記表示情報を用いて表記情報処理が実施され
る。すなわち、上記単語認識結果における動詞「かかっ」
は仮名書きである。そこで、上記表記情報の“読み"の
欄に基づいて当該仮名書き単語「かかっ」の終止形「かか
る」が検索される。その結果、図4に示すように、“読
み"「かかる」は5個の“日本語見出し"「(1)架かる 架
る」,「(2) 掛かる 掛る」,「(3) 懸かる 懸る」,「(4) 罹
かる 罹る」および「(5) 係かる 係る」を有することが分
かる。そこで、図8に示すように、表示部2のCRTの
表示画面に仮名書き単語「かかっ」の具体的な“日本語見
出し"の内容「架かる 架る」,「掛かる 掛る」,「懸かる懸
る」,「罹かる 罹る」および「係かる 係る」を表示して、オ
ペレータに仮名書き単語「かかっ」の漢字表記の特定を促
すのである。その際に、上記表示画面には入力文「前は
ここにかかっていた」を同時に表示してその入力文中に
おける当該仮名書き単語「かかっ」の箇所を矩形21で囲
むことによって、現在ウインドウ22内に表示されてい
る複数の“日本語見出し"を有する仮名書き単語とその
仮名書き単語が用いられている日本語文がオペレータに
分かるようにしている。そうすると、オペレータは上記
ウインドウ22に表示された複数の“日本語見出し"の
中から、表示された入力文中における仮名書き単語「か
かっ」の漢字表記として最もふさわしい“日本語見出し"
をカーソル23によって指示し、実行キー等を押圧する
ことによって確定するのである。その結果、入力文「前
はここにかかっていた」における仮名書き単語「かかっ」
に対する最もふさわしい“日本語見出し"として、「架か
る 架る」が特定されるのである。 …ステップS4
Next, based on the word recognition result shown in FIG. 7, notation information processing is performed using the display information. That is, the verb “Kake” in the word recognition result
Is a pseudonym. Therefore, the final form of the kana word "kake" is searched for based on the "reading" column of the written information. As a result, as shown in FIG. 4, “reading” and “coming” are divided into five “Japanese headlines” “(1) hanging over”, “(2) hanging over”, “(3) hanging over”, It can be seen that "(4) is affected" and "(5) is affected". Therefore, as shown in FIG. 8, the contents of the specific "Japanese headline" of the kana word "Kake" on the CRT display screen of the display unit 2 "Kakeru Kakeru", "Kakeru Kakeru", "Kakeru Kakeru" , "I get affected" and "I get involved" are displayed to urge the operator to specify the kanji representation of the kana word "Kake." At this time, the input sentence “was previously hung here” is simultaneously displayed on the display screen, and the place of the kana word “kake” in the input sentence is surrounded by a rectangle 21 so that the current window 22 Are displayed so that the operator can recognize the kana written word having a plurality of "Japanese headlines" and the Japanese sentence using the kana written word. Then, the operator selects, from among the plurality of “Japanese headings” displayed in the window 22, the “Japanese heading” most suitable as the kanji notation of the kana word “Kake” in the displayed input sentence.
Is indicated by the cursor 23 and the execution key or the like is depressed to determine. As a result, the kana word "kake" in the input sentence "was here before"
"Kakeru Kakeru" is specified as the most appropriate "Japanese headline" for. … Step S4

【0026】次に、上記単語認定結果および上記バッフ
ァに格納された日本語形態素情報17の内容や日本語解
析情報18の内容に基づいて、構文解析が実施される。
まず、上記メインメモリ4に格納された文法規則を用い
て、上記日本語形態素情報17の内容および単語認識結
果に基づいて入力日本文が文節に分けられる。その際に
用いられる文法規則は、例えば 連用の名詞句 → 名詞 + 連用の格助詞 のごとく、矢印の左側が“句"であって右側が“品詞"で
あるような文法規則を用いるのである。そして、図7に
示す単語認定結果に上述のような文法規則を当て嵌め
て、入力された単語列を文節に分けるのである。すなわ
ち、例えば図7の単語認定結果における「ここ(代名詞)
− に(助詞)」なる単語連鎖の場合は、上記文法規則“連
用の名詞句 → 名詞 + 連用の格助詞"が当て嵌まるの
で、「ここ(代名詞)に(助詞)」を一つの文節として分か
つのである。こうして、図9に示すような文節分かち結
果が得られる。
Next, a syntax analysis is performed based on the word recognition result and the contents of the Japanese morpheme information 17 and the contents of the Japanese analysis information 18 stored in the buffer.
First, using the grammatical rules stored in the main memory 4, the input Japanese sentence is divided into phrases based on the contents of the Japanese morphological information 17 and the word recognition results. The grammatical rule used at that time is, for example, a grammatical rule in which the left side of an arrow is a "phrase" and the right side is a "part of speech", for example, a noun phrase for continuous use → noun + case particle for continuous use. Then, the grammar rule as described above is applied to the word recognition result shown in FIG. 7 to divide the input word string into phrases. That is, for example, "here (pronoun)" in the word recognition result of FIG.
In the case of the word chain "-(particle)", the grammatical rule "Noun phrase for continuous use → Noun + case particle for continuous use" applies, so "here (pronoun) (particle)" is divided into one phrase. It is. In this way, a segmentation result as shown in FIG. 9 is obtained.

【0027】さらに、上記文法規則を用いて、上記文節
分かち結果に基づいて文節相互間の係り受けが調べられ
る。その際に用いられる文法規則は、例えば、 動詞句 → 連用の名詞句 + 動詞句 (適用例1: 本を買う → 本を + 買う) (適用例2:私が本を買う → 私が + 本を買う) のごとく、矢印の左側が“句"であって、右側も“句"で
あるような文法規則である。そして、図9に示す文節分
かち結果に上述のような文法規則を当て嵌めて、分かた
れた各文節相互間の係り受けが求められるのである。す
なわち、例えば図9の文節分かち結果における文節「こ
こ(代名詞)に(助詞)」と文節「かかっ(動詞)てい(助
動詞) た(助動詞)」との場合には、上記文法規則“動詞
句 → 連用の名詞句 + 動詞句"が当て嵌まるので、文
節「ここ(代名詞)に(助詞)」は文節「かかっ(動詞)てい
(助動詞) た(助動詞)」に係るとするのである。その際
に、上記日本語解析情報18の内容である意味素性情報
および動詞「かかる」の格パターンを用いて意味解析を実
行して、上記格パターンに当て嵌まらない(換言すれ
ば、日本語として意味的に妥当とは言い難い)ような文
節相互間の係り受けを除去するのである。その結果、図
10に示すような文節相互間の係り受け(構文解析木)が
得られる。
Further, using the above grammatical rules, the dependency between phrases is examined based on the result of segmentation. The grammatical rules used at that time are, for example, verb phrase → noun phrase for continuous use + verb phrase (application example 1: buy a book → buy a book +) (application example 2: I buy a book → I am a + book Like the grammar rule, the left side of the arrow is a "phrase" and the right side is a "phrase". Then, the grammatical rules as described above are applied to the phrase segmentation results shown in FIG. 9 to determine the interdependence between the segmented phrases. That is, for example, in the case of the phrase “here (pronoun) is (adjective)” and the phrase “kake (verb) is (auxiliary verb) ta (auxiliary verb)” in the phrase segmentation result of FIG. 9, the grammatical rule “verb phrase → Since the phrase "noun phrase + verb phrase" is applied, the phrase "here (pronoun) to (particle)" is replaced by the phrase "kake (verb).
(Auxiliary verb). At this time, the semantic analysis is executed using the semantic feature information and the case pattern of the verb "to be", which are the contents of the Japanese language analysis information 18, and the case pattern does not apply (in other words, Japanese) It is difficult to say that it is semantically invalid). As a result, a dependency (a parse tree) between the phrases as shown in FIG. 10 is obtained.

【0028】すなわち、本実施例においては、構文解析
を実施するに先立って、表記情報処理によって、対話的
に意味の曖昧性を含む仮名書き単語の漢字標記を予め特
定する。その結果、入力文「 前はここにかかっていた」 の仮名書き単語「かかっ」の漢字表記が「架かる」に特定さ
れて、「かかる」の語義として図4に示す語義のうち
「7.障害物を渡るためのものを存在させる。」に確定さ
れるのである。こうして、動詞「かかる」の語義を一義に
定めることによって、上述の意味解析に際して動詞「か
かる」の格パターンが一義に求められる。したがって、
上記文法規則に基づいて得られた複数の構文解析木を、
一義に定められた格パターンを用いて、より正しい構文
解析木に絞り込むことができるのである。これに対し
て、上記入力文に対して表記情報処理を実施しない場合
には次のようになる。すなわち、上記構文解析に先立っ
て動詞「かかる」の語義が一義に決定されていないので、
動詞「かかる」の格パターンが複数得られる場合がある。
その場合には、上記文法規則に基づいて得られる文節相
互間の係り受け関係を絞り込むことができず、意味的に
妥当とは言い難い構文解析木も生成されることになるの
である。つまり、本実施例においては、表記情報処理に
よって仮名書き単語の漢字表記を指定することによっ
て、意味の曖昧性を含む仮名書き単語の語義を限定し、
構文解析の精度を高めるのである。 …ステップS5
That is, in this embodiment, prior to performing the syntax analysis, the kanji mark of the kana-written word including the ambiguity of the meaning is interactively specified by the notation information processing. As a result, the kanji notation of the kana written word “Kake” of the input sentence “was here before” was specified as “Kakeru”, and the meaning of “Kakeru” in the meaning shown in FIG. There must be something to cross the object. " In this way, by defining the meaning of the verb "to be" unambiguously, the case pattern of the verb "to be" is uniquely obtained in the above-described semantic analysis. Therefore,
Multiple parse trees obtained based on the above grammar rules are
It is possible to narrow down to a more correct parse tree using a uniquely defined case pattern. On the other hand, when notation information processing is not performed on the input sentence, the following is performed. That is, since the meaning of the verb "take" has not been unambiguously determined prior to the parsing,
In some cases, a plurality of case patterns of the verb "take" may be obtained.
In that case, the dependency relationship between the clauses obtained based on the grammar rules cannot be narrowed down, and a parse tree that is not semantically valid is also generated. That is, in the present embodiment, by specifying the kanji notation of the kana-written word by the notation information processing, the meaning of the kana-written word including the ambiguity of the meaning is limited,
It increases the accuracy of parsing. … Step S5

【0029】上述のようにして得られた図10に示すよ
うな文節相互間の係り受け(すなわち、日本語の構文解
析木)が英語の構文解析木に変換される。そして、得ら
れた英語の構文解析木に基づいて英語の翻訳文が生成さ
れ、翻訳結果が表示部2のCRTに表示される。その際
に、上述のようにCRTを介した対話形式によって、当
該仮名書き単語「かかる」に対する正しい語義が確定され
ているので、オペレータの意図を正しく反映した翻訳文
が生成されるのである。ところが、当該仮名書き単語
「かかる」の語義が特定されていない場合には、テキスト
の内容を反映しないような誤訳が出力されて、ポストエ
ディットの労力が大きくなるのである。 …ステップS6〜ステップS8
The interdependency between phrases (ie, a Japanese parse tree) as shown in FIG. 10 obtained as described above is converted into an English parse tree. Then, an English translation is generated based on the obtained English syntax analysis tree, and the translation result is displayed on the CRT of the display unit 2. At this time, since the correct meaning of the kana word "Katsu" is determined by the interactive form via the CRT as described above, a translated sentence that correctly reflects the intention of the operator is generated. However, if the meaning of the pseudonym word "take" is not specified, a mistranslation that does not reflect the contents of the text is output, and the labor of post-editing increases. ... Steps S6 to S8

【0030】このように、本実施例においては、外部記
憶部6に、同じ仮名表記を有する複数の単語の“日本語
見出し(漢字表記)"と、“読み(仮名表記)"と、“語義"
とを対応付けた表記情報を格納する。そして、翻訳処理
時に、入力された日本語文に対して辞書引き・形態素解
析部11によって辞書引き/形態素解析を行った後、構
文解析部13による構文解析に先立って表記情報処理部
12によって次のような表記情報処理を実施する。すな
わち、形態素解析の結果得られた単語認定結果中に外部
記憶部6に格納された翻訳処理用辞書の日本語見出し情
報16には無い仮名書き単語が存在する場合には、上記
表記情報の“読み"の欄に基づいて当該仮名書き単語を
検索する。そして、当該仮名書き単語の読みと同じ内容
が上記“読み"の欄に在る場合には、その“読み"に対応
付けられた総ての“日本語見出し"を入力文と共に表示
部2に表示する。そうすると、オペレータは、表示部2
に表示された入力文を参照して、入力文中における当該
仮名書き単語の漢字表記として最もふさわしい“日本語
見出し"を入力部3を構成するキーボードを操作して指
示した後に確定する。こうして、仮名書き単語の漢字表
記を特定することによって、意味の曖昧性の高い仮名書
き単語の語義を特定するのである。したがって、本実施
例によれば、日本語における仮名書き単語の意味の曖昧
性が除去されて、効率の良い日英翻訳処理が可能となる
のである。
As described above, in the present embodiment, in the external storage unit 6, “Japanese heading (Kanji notation)”, “Yomi (Kana notation)”, and “Word meaning” of a plurality of words having the same kana notation "
Is stored. Then, at the time of the translation process, after the input Japanese sentence is subjected to dictionary lookup / morpheme analysis by the dictionary lookup / morphological analysis unit 11, the notation information processing unit 12 performs the following before the syntax analysis by the syntax analysis unit 13. Such notation information processing is performed. That is, if the word recognition result obtained as a result of the morphological analysis includes a kana word that is not in the Japanese index information 16 of the translation processing dictionary stored in the external storage unit 6, the above described notation information “ The kana-written word is searched for based on the "reading" column. If the same content as the reading of the kana-written word is present in the “reading” column, all “Japanese headlines” associated with the “reading” are displayed on the display unit 2 together with the input sentence. indicate. Then, the operator operates the display unit 2
With reference to the input sentence indicated in (1), "Japanese headline" most suitable as the kanji notation of the kana-written word in the input sentence is specified after operating the keyboard constituting the input unit 3 and instructing. Thus, by specifying the kanji notation of the kana-written word, the meaning of the kana-written word having a highly ambiguous meaning is specified. Therefore, according to the present embodiment, the ambiguity of the meaning of the kana-written word in Japanese is removed, and efficient Japanese-English translation processing becomes possible.

【0031】図11は上記実施例における日英機械翻訳
装置に係る図5とは異なる日英翻訳処理動作のフローチ
ャートである。このフローチャートと上述の実施例に係
る図5に示すフローチャートとの相違点は表記情報処理
のステップの位置にある。すなわち、上述の実施例にお
いては表記情報処理を構文解析に先立って実施してい
る。しかしながら、本実施例においては、図2に示す表
記情報処理部12を構文解析部13と変換部14との間
に配置して、表記情報処理を構文解析の後に実施するの
である。本実施例の場合には、上記表記情報処理を実施
する前に構文解析を実施するので、構文解析時において
入力文中の仮名書き単語の漢字表記および語義を特定で
きない。したがって、入力文中の仮名書き単語は仮名表
記のまま構文解析を実施するのである。その結果、上記
実施例で説明したように、語義を特定できないような仮
名書き単語が存在する場合には、格パターンが一義に定
まらないので複数の構文解析木が得られる。そうした
後、上述の表記情報処理を実施して、上記語義を特定で
きない仮名書き単語の漢字表記を特定して当該仮名書き
単語の語義を決定し、構文解析木を絞り込むのである。
したがって、日本語における仮名書き単語の意味の曖昧
性が除去されて、効率の良い言語処理が可能となるので
ある。このように、上記表記情報処理は、構文解析の前
後いずれにおいて実施されてもその効果を発揮する。し
たがって、翻訳処理中におけるユーザの都合の良い段階
で表記情報処理を実施すればよいのである。
FIG. 11 is a flowchart of a Japanese-to-English translation processing operation of the Japanese-to-English machine translation apparatus in the above embodiment, which is different from FIG. The difference between this flowchart and the flowchart shown in FIG. 5 according to the above-described embodiment lies in the position of the steps of the notation information processing. That is, in the above-described embodiment, the notation information processing is performed prior to the syntax analysis. However, in the present embodiment, the notation information processing unit 12 shown in FIG. 2 is arranged between the syntax analysis unit 13 and the conversion unit 14, and the notation information processing is performed after the syntax analysis. In the case of the present embodiment, since the syntax analysis is performed before the notation information processing is performed, the kanji notation and the meaning of the kana-written word in the input sentence cannot be specified at the time of the syntax analysis. Therefore, the kana word in the input sentence is subjected to syntax analysis with the kana notation. As a result, as described in the above embodiment, if there is a kana word in which the meaning cannot be specified, the case pattern is not uniquely determined, so that a plurality of parse trees are obtained. After that, the above-described notation information processing is performed to specify the kanji notation of the kana-written word whose meaning cannot be specified, determine the meaning of the kana-written word, and narrow down the parse tree.
Therefore, the ambiguity of the meaning of the kana word in Japanese is removed, and efficient language processing can be performed. As described above, the above described notation information processing exhibits its effect regardless of whether it is executed before or after the syntax analysis. Therefore, the notation information processing may be performed at a stage convenient for the user during the translation process.

【0032】上記各実施例においては、表記情報処理の
際に表示部2に表示される“日本見出し"の順序は表記
情報の“日本語見出し"の順になるようにしている。し
たがって、仮名書きされる頻度の高い単語の漢字表記が
表記情報における“日本語見出し"の欄の下位に格納さ
れている場合には、よく仮名書きされる単語に係る表記
情報処理に際しては、オペレータは、繰り返してカーソ
ルを操作してウインドウ22の下部に表示された“日本
語見出し"を指定しなければならず、煩わしいという問
題がある。そこで、本実施例においては、上記表記情報
における“日本語見出し"に、各“日本語見出し"毎に仮
名書頻度を予め付加しておくのである。すなわち、仮名
書きされやすい単語の“日本語見出し"、例えば、 難しい字 … 「牡蛎」 動植物の名 … 「柿」,「犬」 機能動詞 … 「遇う」 には、仮名書きされ易さの度合いに応じて仮名書頻度を
表す情報“多い"あるいは“やや多い"を付加し、その他
の単語の“日本語見出し"には仮名書頻度を表す情報
“少ない"を付加するのである。その結果、例えば仮名
表記「かき」に係る表記情報の“日本語見出し"には、図
12に示すように、3ランクの仮名書頻度が付加される
のである。そして、表記情報処理を実行するに際して
は、図13に示すように、当該仮名書き単語の“日本語
見出し"を表示部2に表示するのである。すなわち、表
示画面には入力文「昨日かきを買ってきた。」を同時に表
示してその入力文中における当該仮名書き単語「かき」の
箇所を矩形31で囲む。そして、ウインドウ32内に複
数の辞書見出しを表示する際には、付加された仮名書頻
度のランクの高い“日本語見出し"から順に、また、仮
名書頻度のランクが同じ場合には“日本語見出し"の欄
の上位に格納された“日本語見出し"から順に表示する
のである。その際に、カーソル33の初期位置はウイン
ドウ32に表示された最上位の“日本語見出し"の位置
にするのである。このように、本実施例においては、表
記情報処理を実施する際に、仮名書頻度の高い“日本語
見出し"をウインドウ32の上位に表示するようにして
いる。したがって、ウインドウ32に表示された“日本
語見出し"の中から入力文中に矩形31で表示された仮
名書き単語「かき」の漢字表記として最もふさわしい“日
本語見出し"を特定する際に、カーソル33を移動させ
る操作が少なくて済み、オペレータの負担が軽くなるの
である。その際に、上記“日本語見出し"に仮名書頻度
を付加する場合に、ある基準に基づいて各“日本語見出
し"に仮名書頻度を予め付加しておき、オペレータは必
要に応じて上記予め付加されている仮名書頻度の内容を
変更するようにしておけば、オペレータの負担をさらに
軽くできる。
In each of the above embodiments, the order of the "Japanese heading" displayed on the display unit 2 in the notation information processing is the same as the order of the "Japanese heading" of the notation information. Therefore, if the kanji notation of a word that is frequently written in kana is stored below the column of “Japanese heading” in the notation information, the notation information processing related to the word that is frequently written in kana is performed by the operator. In this case, it is necessary to repeatedly operate the cursor to specify the "Japanese headline" displayed at the bottom of the window 22, which is troublesome. Therefore, in the present embodiment, the kana name frequency is added in advance to the “Japanese headline” in the above described notation information for each “Japanese headline”. In other words, “Japanese headlines” of words that are likely to be written in kana, for example, difficult characters… “oysters” names of animals and plants… “persimmons” and “dogs” functional verbs… Accordingly, information “many” or “slightly many” representing the kana name frequency is added, and information “small” representing the kana name frequency is added to the “Japanese headline” of other words. As a result, for example, as shown in FIG. 12, three ranks of the pseudonym frequency are added to the “Japanese headline” of the notation information related to the kana notation “Kaki”. Then, when executing the notation information processing, as shown in FIG. 13, the “Japanese headline” of the kana written word is displayed on the display unit 2. That is, the input sentence “I bought kaki yesterday.” Is displayed on the display screen at the same time, and the portion of the kana word “Kaki” in the input sentence is surrounded by the rectangle 31. When a plurality of dictionary headings are displayed in the window 32, “Japanese headlines” having the highest rank of the added kanabook frequency are sequentially displayed. The headlines are displayed in order from the “Japanese headlines” stored at the top of the column. At this time, the initial position of the cursor 33 is set to the position of the highest "Japanese headline" displayed in the window 32. As described above, in the present embodiment, when performing the notation information processing, the “Japanese headline” having a high pseudonym frequency is displayed above the window 32. Therefore, when specifying the “Japanese heading” most suitable as the kanji notation of the kana word “Kaki” displayed in the input sentence by the rectangle 31 from the “Japanese heading” displayed in the window 32, The number of operations for moving is reduced, and the burden on the operator is reduced. At this time, when adding the kana name frequency to the “Japanese heading”, the kana name frequency is added to each “Japanese heading” in advance based on a certain criterion, and the operator can add the kana name frequency as necessary. If the content of the added kana letter frequency is changed, the burden on the operator can be further reduced.

【0033】上記実施例においては、上記表記情報にお
ける各“日本語見出し"に仮名書頻度を予め付加して、
付加された仮名書頻度のランクの高い“日本語見出し"
から順に、また、仮名書頻度のランクが同じ場合には上
位に格納された“日本語見出し"から順に、ウインドウ
32に“日本語見出し"を表示するようにしている。と
ころが、上記表示情報処理においては、付加された仮名
書頻度のランクの高い“日本語見出し"が入力部3から
のキー入力によって特定される場合が当然多いのである
から、当該仮名書き単語に係る複数の“日本語見出し"
をわざわざウインドウ32に表示してオペレータに“日
本語見出し"の特定を要求する必要もない。そこで、表
記情報処理に際しては、当該仮名書き単語の漢字表記と
して仮名書頻度の最も高い“日本語見出し"を自動的に
当て嵌めるようにしてもよい。そして、当て嵌められた
“日本語見出し"に基づいて構文解析を実施した結果適
切な構文解析木が得られない場合は、自動的に次の仮名
書頻度を有する“日本語見出し"を当該仮名書き単語の
漢字表記とするのである。こうすることによって、“日
本語見出し"特定の煩わしさからオペレータを解放でき
るのである。
In the above embodiment, a kana name frequency is added in advance to each “Japanese headline” in the notation information,
“Japanese headlines” with the highest rank of added kana-semigraphy
, And if the rank of the kana name frequency is the same, the “Japanese headline” is displayed in the window 32 in order from the “Japanese headline” stored in the higher rank. However, in the above display information processing, it is natural that the “Japanese headline” having a high rank of the added kana name frequency is specified by key input from the input unit 3 in many cases. Multiple "Japanese headlines"
Need to be displayed in the window 32 to request the operator to specify the "Japanese headline". Therefore, at the time of the notation information processing, the “Japanese headline” having the highest kanagraph frequency may be automatically applied as the kanji notation of the kanawritten word. If an appropriate parse tree cannot be obtained as a result of performing the parsing based on the fitted “Japanese heading”, the “Japanese heading” having the next kana book frequency is automatically added to the kana. This is the kanji notation of the written word. By doing so, the operator can be relieved from the inconvenience of "Japanese headlines".

【0034】上記各実施例における表記情報処理におい
て、対象仮名書き単語に係る“日本語見出し"表示フォ
ーマットは図8および図13に限定されるものではな
い。上記各実施例においては、この発明の言語処理装置
を日英機械翻訳装置に適用した場合について述べたが、
これに限定されるものではない。すなわち、日本語で記
述されたテキストの処理を主たる目的とする日本語要約
機および日本語による自然言語インターフェースを用い
るコンピュータやロボット制御装置等にも適用可能であ
る。
In the notation information processing in each of the above embodiments, the display format of the "Japanese headline" relating to the target kana written word is not limited to FIGS. In each of the above embodiments, the case where the language processing apparatus of the present invention is applied to a Japanese-English machine translation apparatus has been described.
It is not limited to this. That is, the present invention can be applied to a Japanese summarizer mainly for processing text written in Japanese, a computer using a natural language interface in Japanese, a robot controller, and the like.

【0035】[0035]

【発明の効果】以上より明らかなように、請求項1に係
る発明の言語処理装置は、形態素解析部によって、入力
された日本語文を複数の日本語形態素に分割し、形態素
解析を行って単語とその品詞とを認定し、上記分割され
た単語列に仮名書き単語が在る場合には、表記情報処理
部によって、表記情報格納部から検索された当該仮名書
き単語の読みに対応付けられた複数の漢字表記を表示部
に表示し、オペレータによって操作される漢字表記決定
部で、上記表示された複数の漢字表記の中から所望の漢
字表記を指示して確定する。したがって、当該仮名書き
単語の漢字表記が確定されることによって、当該仮名書
き単語の語義が特定される。すなわち、この発明によれ
ば、日本語のテキスト中における仮名書き単語の意味の
曖昧性が減少されて、効率の良い言語処理が可能とな
る。
As is clear from the above description, the language processing apparatus according to the first aspect of the present invention divides an input Japanese sentence into a plurality of Japanese morphemes by a morphological analysis unit, performs morphological analysis, and performs word processing. And the part-of-speech are recognized, and if the kana word is present in the divided word string, the notation information processing unit associates the kana word with the reading of the kana word searched from the notation information storage unit. A plurality of kanji notations are displayed on a display unit, and a kanji notation determining unit operated by an operator designates and determines a desired kanji notation from the plurality of displayed kanji notations. Therefore, the kanji notation of the kana written word is determined, and the meaning of the kana written word is specified. That is, according to the present invention, the ambiguity of the meaning of the kana word in the Japanese text is reduced, and efficient language processing can be performed.

【0036】また、請求項2に係る発明の言語処理装置
は、形態素解析部によって、入力された日本語文を複数
の日本語形態素に分割し、形態素解析を行って単語とそ
の品詞とを認定し、上記分割された単語列に仮名書き単
語が在る場合には、表記情報処理部によって、表記情報
格納部から検索された当該仮名書き単語の読みに対応付
けられた複数の漢字表記を表示部に表示し、オペレータ
によって操作される漢字表記決定部によって、上記表示
された複数の漢字表記の中から所望の漢字表記が指示さ
れて確定される。更に、上記確定された漢字表記の語義
と上記形態素解析部の解析結果とに基づいて、構文解析
部によって上記入力日本語文の構文解析が行われ、この
構文解析結果に基づいて、翻訳部によって上記入力日本
語文が他国語文に言語翻訳される。したがって、当該仮
名書き単語の漢字表記が確定されることによってその語
義が特定される。すなわち、この発明によれば、日本語
のテキスト中における仮名書き単語の意味の曖昧性が減
少されて、効率の良い正しい言語翻訳処理が可能とな
る。
Further, in the language processing apparatus according to the second aspect of the invention, the morphological analysis unit divides the input Japanese sentence into a plurality of Japanese morphemes, performs morphological analysis, and recognizes words and their parts of speech. If there is a kana word in the divided word string, the notation information processing unit displays a plurality of kanji notations associated with the reading of the kana word searched from the notation information storage unit. Is displayed, and a desired kanji notation is designated and determined from among the plurality of displayed kanji notations by a kanji notation determining unit operated by an operator. Further, based on the determined meaning of the kanji notation and the analysis result of the morphological analysis unit, a syntax analysis of the input Japanese sentence is performed by the syntax analysis unit. Based on the syntax analysis result, the translation unit performs the syntax analysis. The input Japanese sentence is translated into another language sentence. Therefore, when the kanji notation of the kana-written word is determined, its meaning is specified. That is, according to the present invention, the ambiguity of the meaning of the kana words in Japanese text is reduced, and efficient and correct language translation processing can be performed.

【0037】また、請求項3に係る言語処理装置は、上
記表記情報処理部によって、上記表記情報格納部から検
索された複数の漢字表記を表示部に表示するに際して、
付加されている上記仮名書き頻度の高い漢字表記を優先
的に表示するので、オペレータは必要以上に上記漢字表
記決定部を操作することなく容易に漢字表記を確定でき
る。したがって、この発明によれば、日本語における仮
名書き単語の意味の曖昧性が容易に減少されて、更に効
率の良い言語処理が可能となる。
The language processing apparatus according to claim 3, when the plurality of kanji notations retrieved from the notation information storage unit are displayed on the display unit by the notation information processing unit,
Since the added kanji notation with high kana writing frequency is preferentially displayed, the operator can easily determine the kanji notation without operating the kanji notation determination unit more than necessary. Therefore, according to the present invention, the ambiguity of the meaning of the kana words in Japanese is easily reduced, and more efficient linguistic processing becomes possible.

【0038】また、請求項4に係る発明の言語処理方法
は、入力手段から入力された日本語文を、処理手段によ
って、複数の日本語形態素に分割し、形態素解析を行っ
て単語とその品詞を認定し、上記分割された単語列に仮
名書き単語が在る場合には、メモリ手段に登録されてい
る日本語単語の読みの中から当該仮名書き単語の読みを
検索し、この検索された当該単語の読みに対応付けられ
た複数の漢字表記を表示手段に表示し、表示された複数
の漢字表記のうちから所望の漢字表記を選択して指示
し、この指示された当該仮名書き単語の漢字表記に基づ
いて当該仮名書き単語の語義を特定するので、日本語の
テキスト中における仮名書き単語の意味の曖昧性を減少
できる。したがって、この発明によれば、日英機械翻訳
装置,日本語要約機あるいは日本語インターフェース等
を操作する場合における効率の良い言語処理が可能とな
る。
According to a fourth aspect of the present invention, there is provided a language processing method, wherein a Japanese sentence input from an input unit is divided into a plurality of Japanese morphemes by a processing unit, and morphological analysis is performed to convert a word and its part of speech. If there is a kana word in the divided word string, the kana word is read from the reading of the Japanese word registered in the memory means. A plurality of kanji notations associated with the reading of the word are displayed on the display means, a desired kanji notation is selected from the displayed plurality of kanji notations, and the designated kanji is indicated. Since the meaning of the kana-written word is specified based on the notation, the ambiguity of the meaning of the kana-written word in the Japanese text can be reduced. Therefore, according to the present invention, efficient language processing can be performed when operating a Japanese-English machine translator, a Japanese summarizing machine, a Japanese interface, or the like.

【0039】また、請求項5に係る発明の言語処理方法
は、入力手段から入力された日本語文を、処理手段によ
って、複数の日本語形態素に分割し、形態素解析を行っ
て単語とその品詞を認定し、上記分割された単語列に仮
名書き単語が在る場合には、メモリ手段に登録されてい
る日本語単語の読みの中から当該仮名書き単語の読みを
検索し、この検索された当該単語の読みに対応付けられ
た複数の漢字表記を表示手段に表示し、この表示された
複数の漢字表記のうちから所望の漢字表記を選択して指
示し、この指示された漢字表記の語義と上記形態素解析
部の解析結果とに基づいて入力日本語文の構文解析を行
い、この構文解析結果に基づいて当該入力日本語文を他
国語文に言語翻訳するので、日本語のテキスト中におけ
る仮名書き単語の意味の曖昧性を減少できる。したがっ
て、この発明によれば、効率の良い、且つ、正確な言語
翻訳処理が可能となる。
According to a fifth aspect of the present invention, there is provided a language processing method, wherein a Japanese sentence input from an input unit is divided into a plurality of Japanese morphemes by a processing unit, and morphological analysis is performed to convert a word and its part of speech. If there is a kana word in the divided word string, the kana word is read from the reading of the Japanese word registered in the memory means. A plurality of kanji notations associated with the reading of the word are displayed on the display means, a desired kanji notation is selected from the plurality of displayed kanji notations, and the selected kanji notation is designated. The input Japanese sentence is subjected to syntax analysis based on the analysis result of the morphological analysis unit, and the input Japanese sentence is translated into another language sentence based on the syntax analysis result. of It can reduce the ambiguity of taste. Therefore, according to the present invention, efficient and accurate language translation processing can be performed.

【0040】また、請求項6に係る発明の言語処理方法
は、上記複数の漢字表記を表示する場合に、付加されて
いる仮名書き頻度の高い漢字表記を優先して表示するの
で、オペレータは、所望の漢字表記を早期に指定でき
る。したがって、この発明によれば、更に効率の良い言
語処理を行うことが可能となる。
Further, in the language processing method according to the present invention, when displaying the plurality of kanji notations, the added kanji notation with a high kana writing frequency is preferentially displayed. The desired kanji notation can be specified early. Therefore, according to the present invention, more efficient language processing can be performed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】この発明の言語処理装置が適用された日英機械
翻訳装置における一実施例の概略ブロック図である。
FIG. 1 is a schematic block diagram of an embodiment of a Japanese-English machine translation apparatus to which a language processing apparatus according to the present invention is applied.

【図2】図1における翻訳モジュールの詳細なブロック
図である。
FIG. 2 is a detailed block diagram of a translation module in FIG. 1;

【図3】翻訳処理用辞書における形態素情報を示す図で
ある。
FIG. 3 is a diagram showing morphological information in a dictionary for translation processing.

【図4】表記情報の内容の一例を示す図である。FIG. 4 is a diagram showing an example of the content of notation information.

【図5】図1および図2に示す日英機械翻訳装置による
日英翻訳処理動作のフローチャートである。
FIG. 5 is a flowchart of a Japanese-English translation processing operation by the Japanese-English machine translation device shown in FIGS. 1 and 2;

【図6】入力文の一例を示す図である。FIG. 6 is a diagram illustrating an example of an input sentence.

【図7】図6に示す入力文に係る単語認定結果の一例を
示す図である。
FIG. 7 is a diagram showing an example of a word recognition result for the input sentence shown in FIG. 6;

【図8】図6に示す入力文における仮名書き単語とその
仮名書き単語に係る複数の日本語見出しの表示例を示す
図である。
8 is a diagram showing a display example of a kana-written word and a plurality of Japanese headlines related to the kana-written word in the input sentence shown in FIG. 6;

【図9】図7に示す単語認定結果に基づく入力文に係る
文節分かち結果の一例を示す図である。
9 is a diagram illustrating an example of a segmentation result of an input sentence based on the word recognition result illustrated in FIG. 7;

【図10】図9に示す文節分かち結果に基づく文節相互
間の係り受けの一例を示す図である。
FIG. 10 is a diagram showing an example of dependency between phrases based on the phrase segmentation result shown in FIG. 9;

【図11】図5とは異なる日英翻訳処理動作のフローチ
ャートである。
FIG. 11 is a flowchart of a Japanese-English translation processing operation different from FIG. 5;

【図12】仮名書頻度が付加された表記情報の内容の一
例を示す図である。
FIG. 12 is a diagram illustrating an example of the content of written information to which a kana name frequency is added;

【図13】図12に示す表記情報に基づく表記情報処理
の際における仮名書き単語とその仮名書き単語に係る複
数の日本語見出しの表示例を示す図である。
13 is a diagram illustrating a display example of a kana written word and a plurality of Japanese headlines related to the kana written word in the notation information processing based on the notation information shown in FIG.

【符号の説明】 1……CPU、 2…表示部、 3…入力部、 4…メインメモ
リ、 5…翻訳モジュール、 6…外部記憶部、 11…辞書引き・形態素解析部、 12…表記情報処
理部、 13…構文解析部、 14…変換部、 15…翻訳文生成部、 16…日本語見出
し情報、 17…日本語形態素情報、 18…日本語解析
情報、 19…日英変換情報、 20…英語生成情
報、 22,32…ウインドウ、 23,33…カー
ソル。
[Description of Signs] 1 ... CPU, 2 ... Display unit, 3 ... Input unit, 4 ... Main memory, 5 ... Translation module, 6 ... External storage unit, 11 ... Dictionary / morphological analysis unit, 12 ... Notation information processing , 13 ... Syntax analysis unit, 14 ... Conversion unit, 15 ... Translation sentence generation unit, 16 ... Japanese headline information, 17 ... Japanese morpheme information, 18 ... Japanese analysis information, 19 ... Japanese-English conversion information, 20 ... English generation information, 22, 32 ... window, 23, 33 ... cursor.

フロントページの続き (72)発明者 戸子田 まり 大阪府大阪市阿倍野区長池町22番22号 シャープ株式会社内 (56)参考文献 特開 平1−286075(JP,A) 特開 昭63−276174(JP,A) 特開 平2−25967(JP,A) 特開 昭63−219061(JP,A) 特開 昭62−175860(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/28 Continued on the front page (72) Inventor Mari Tokoda 22-22 Nagaikecho, Abeno-ku, Osaka-shi, Osaka Inside Sharp Corporation (56) References JP-A 1-286075 (JP, A) JP-A 63-276174 (JP, a) JP flat 2-25967 (JP, a) JP Akira 63-219061 (JP, a) JP Akira 62-175860 (JP, a) (58 ) investigated the field (Int.Cl. 7 G06F 17/20-17/28

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】日本語文を入力する入力部と、 前記入力部によって入力された日本語文を表示する表示
部と、 前記入力部によって入力された日本語文を複数の日本語
形態素に分割し、形態素解析を行って、単語と該単語の
品詞とを認定する形態素解析部と、 単語の読みと、該読みを有する複数の漢字表記と、各漢
字表記に係る語義とが対応付けられて格納された表記情
報格納部と、 前記形態素解析部によって解析されて得られた前記入力
された日本語文から得られた単語列に仮名書き単語があ
る場合に、上記表記情報格納部に格納された読みの中か
ら当該仮名書き単語の読みを検索し、検索された該単語
の読みに対応付けられた複数の漢字表記を前記表示部に
表示する表記情報処理部と、 前記表記情報処理部によって表示された複数の漢字表記
のうちから、所望の漢字表記を指示して確定するための
漢字表記決定部とを有し、 前記漢字表記決定部によって確定された該仮名書き単語
の漢字表記に基づいて、該仮名書き単語の語義を特定す
るとともに、 前記表記情報格納部に格納されている漢字表記の各々に
は、仮名書き頻度が付加されており、 前記表記情報処理部は、前記複数の漢字表記を表示する
場合には、付加されている仮名書き頻度の高い漢字表記
を優先して表示することを特徴とする言語処理装置。
An input unit for inputting a Japanese sentence; a display unit for displaying a Japanese sentence input by the input unit; and a Japanese sentence input by the input unit is divided into a plurality of Japanese morphemes. A morphological analysis unit that analyzes and recognizes the word and the part of speech of the word, reading of the word, a plurality of kanji notations having the reading, and the meaning of each kanji notation are stored in association with each other. A notation information storage unit, when there is a kana written word in a word string obtained from the input Japanese sentence obtained by being analyzed by the morphological analysis unit, And a notation information processing unit for displaying on the display unit a plurality of kanji notations associated with the searched reading of the kana word, and a plurality of notations displayed by the notation information processing unit Kanji of A kanji notation determining unit for designating and determining a desired kanji notation from among the kanji notations, based on the kanji notation of the kana written word determined by the kanji notation determining unit. The kana writing frequency is added to each of the kanji notations stored in the notation information storage unit, and the notation information processing unit is configured to display the plurality of kanji notations. Is a language processing apparatus characterized in that the added kanji notation with a high kana writing frequency is preferentially displayed.
JP04346491A 1991-03-08 1991-03-08 Language processing apparatus and language processing method Expired - Fee Related JP3253311B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04346491A JP3253311B2 (en) 1991-03-08 1991-03-08 Language processing apparatus and language processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04346491A JP3253311B2 (en) 1991-03-08 1991-03-08 Language processing apparatus and language processing method

Publications (2)

Publication Number Publication Date
JPH04280370A JPH04280370A (en) 1992-10-06
JP3253311B2 true JP3253311B2 (en) 2002-02-04

Family

ID=12664438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04346491A Expired - Fee Related JP3253311B2 (en) 1991-03-08 1991-03-08 Language processing apparatus and language processing method

Country Status (1)

Country Link
JP (1) JP3253311B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0746355B2 (en) * 1986-01-30 1995-05-17 セイコーエプソン株式会社 Kana-Kanji converter
JPS63219061A (en) * 1986-10-17 1988-09-12 Sanyo Electric Co Ltd Character processing device
JPH0225967A (en) * 1988-07-14 1990-01-29 Nec Corp Misinput correction system for homophone

Also Published As

Publication number Publication date
JPH04280370A (en) 1992-10-06

Similar Documents

Publication Publication Date Title
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
JP2654001B2 (en) Machine translation method
US7529656B2 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
US20050049881A1 (en) Computer-aided reading system and method with cross-language reading wizard
JPH1011447A (en) Translation method and system based upon pattern
JPS62163173A (en) Mechanical translating device
JPS62271064A (en) Mechanical translation system
JP2815714B2 (en) Translation equipment
JPH05197747A (en) Language processor
JPH05120324A (en) Language processing system
JPH0344764A (en) Mechanical translation device
JP3253311B2 (en) Language processing apparatus and language processing method
JPS6180362A (en) Translation system
JP4054353B2 (en) Machine translation apparatus and machine translation program
JPH0561902A (en) Mechanical translation system
JP3408830B2 (en) Japanese sentence parser
JP3197110B2 (en) Natural language analyzer and machine translator
JP3353873B2 (en) Machine translation equipment
JP2817497B2 (en) Dictionary editing device
JP3244286B2 (en) Translation processing device
JPH04130577A (en) Natural language processor
JP3233800B2 (en) Machine translation equipment
JPH07200592A (en) Text processor
JP2839419B2 (en) Machine translation device with idiom registration function
JPH08241315A (en) Word registering mechanism for document processor

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081122

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091122

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees