JPS6162175A - Analyzer for japanese language - Google Patents
Analyzer for japanese languageInfo
- Publication number
- JPS6162175A JPS6162175A JP59183700A JP18370084A JPS6162175A JP S6162175 A JPS6162175 A JP S6162175A JP 59183700 A JP59183700 A JP 59183700A JP 18370084 A JP18370084 A JP 18370084A JP S6162175 A JPS6162175 A JP S6162175A
- Authority
- JP
- Japan
- Prior art keywords
- morphological analysis
- words
- character string
- data
- morphological
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
技術分野
本発明は日本語解析装置に係シ、具体的には、機械翻訳
等の構文解析に利用できる日本語文の形態素解析を行な
う1本語処理装置に関する。DETAILED DESCRIPTION OF THE INVENTION TECHNICAL FIELD The present invention relates to a Japanese language analysis device, and more specifically, to a single-language processing device that performs morphological analysis of Japanese sentences that can be used for syntactic analysis such as machine translation.
従来技術
機械翻訳等においては一般に、日本語文の構文解析に先
立ち、日本語文の形態素解析が行われる。従来の翻訳シ
ステムにあっては日本語文の形態素解析は、たとえば、
何らかの方法で入力されたべた書きの漢字かな混9文に
対して行われていたために次のような欠点があった。In conventional machine translation, etc., morphological analysis of a Japanese sentence is generally performed prior to syntactic analysis of the Japanese sentence. In conventional translation systems, morphological analysis of Japanese sentences requires, for example,
This method had the following drawbacks because it was applied to nine solid kanji/kana mixed sentences that had been input in some way.
すなわち、日本語入力された文章が漢字かな混シ文のべ
た書きであるために、これを形態素解析するためのアル
ゴリズムが非常に複雑で大きなものになっていた。また
漢字かな混り文がべた書きであるために単語分割に曖昧
さが生じ、その結果複数の解析結果が生じて形態素解析
処理を複数回行わざるを得ながった。In other words, since the input Japanese text is a solid text of kanji, kana, etc., the algorithm for morphologically analyzing it is extremely complex and large. Furthermore, since the sentences containing kanji and kana are written in solid letters, ambiguity arises in word segmentation, resulting in multiple analysis results and the morphological analysis process has to be performed multiple times.
目 的
本発明はこのような従来技術の欠点を解消し、形態素解
析処理を複数回行うことなく適確に形態素解析を行うこ
とができる日本語解析装置を提供することを目的とする
ものである。Purpose The present invention aims to eliminate the drawbacks of the prior art and provide a Japanese language analysis device that can accurately perform morphological analysis without performing morphological analysis processing multiple times. .
構成
本発明の構成について以下、実施’I=lJに基づいて
説明する。本発明では、かな漢字変換処理において行う
日本語文の形態素解析の結果を保持することにより、次
の段階でちる機械翻訳等の構文解析にこれを利用できる
ようにしている。Configuration The configuration of the present invention will be explained below based on the implementation 'I=lJ. In the present invention, by retaining the results of the morphological analysis of Japanese sentences performed in the kana-kanji conversion process, this can be used in the next stage of syntactic analysis such as machine translation.
第1図には本発明に係る日本語解析装置の一実施例の構
成が示されておシ、同図において入力手段としてのキー
が一ド1oは数字を示すテンキー、ひらがな等の文字を
示す文字キー、かな漢字変換処理の実行の有無を指示す
るための変換キー、無変換キーを含む機能キー等から構
成されユーザはキーゲート10のキー操作にょシ構文解
析1−べき日本語文データ及びかな漢字変換処理のため
の指令を制御装置12に入力する。FIG. 1 shows the configuration of an embodiment of the Japanese language analysis device according to the present invention, and in the same figure, keys as input means are 1 and 1o are numeric keys indicating numbers, characters such as hiragana, etc. It consists of character keys, conversion keys for instructing whether or not to execute kana-kanji conversion processing, function keys including non-conversion keys, etc. The user operates the keys on the key gate 10. Syntax analysis 1 - Japanese sentence data and kana-kanji conversion A command for processing is input to the control device 12.
制御装置12はキーボードlOよ多入力された日本語文
データ及び指令を判定装置14に送出する一方、形態素
解析装置16による日本語文データの形態素解析結果を
判定装置14を介して受取り、表示装置22に転送する
。The control device 12 sends the Japanese sentence data and commands input from the keyboard IO to the determination device 14, and receives the morphological analysis results of the Japanese sentence data by the morphological analysis device 16 via the determination device 14, and displays them on the display device 22. Forward.
また判定装置14は制御装置12よシキーボード10か
ら入力された日本語文データを受は取り、該日本語文デ
ータを形態素解析装置16に転送し且つキーゲート10
における変換キー、無変換キーが操作されたか否かを記
憶すると共に、形態素解析装置16による日本語文デー
タの形態素解析結果を入力文パンツアメモリ20に転送
する。Further, the determination device 14 receives Japanese sentence data inputted from the control device 12 and the key gate 10, transfers the Japanese sentence data to the morphological analysis device 16, and sends the Japanese sentence data to the key gate 10.
It stores whether or not the conversion key and non-conversion key have been operated, and also transfers the morphological analysis result of the Japanese sentence data by the morphological analysis device 16 to the input sentence panzer memory 20.
更に単語辞書ROM l 8には、単語を示す文字
′列のデータに対応してその意味等の情報が分類、記
憶されておシ、形態素解析装置16は制御装置12、判
定装置14を介してキーゲート10よ多入力された日本
語文データを取り込み、単語辞書ROM 1 gに記憶
されている。辞書情報を参照して日本語文データのかな
漢字変換処理を実行する。ここで判定装置14にキーゲ
ートNoにおける変換キーが操作されたことが記憶され
ている場合には形態素解析を含むかな漢字変換処理が実
行されるが、無変換キーが操作されたことが記憶されて
いる場合には形態素解析のみが行われる。なお、本明細
書において「かな漢字変換処理」とは形態素解析とかな
漢字変換の両方の処理を含むものとする。Furthermore, the word dictionary ROM l8 contains characters indicating words.
Information such as the meaning is classified and stored in correspondence with the data in column '. , are stored in the word dictionary ROM 1g. Performs kana-kanji conversion processing for Japanese sentence data by referring to dictionary information. Here, if the determination device 14 remembers that the conversion key in the key gate number was operated, the kana-kanji conversion process including morphological analysis is executed, but it is not remembered that the non-conversion key was operated. If so, only morphological analysis is performed. Note that in this specification, "kana-kanji conversion processing" includes both morphological analysis and kana-kanji conversion processing.
入力文バッファメモリ2oはキーゲート1゜によ多入力
された日本語文データの形態素解析結果を判定装置14
を介して受は取)、記憶・蓄積する。The input sentence buffer memory 2o uses the morphological analysis results of the Japanese sentence data input to the key gate 1° to the judgment device 14.
Uke is memorized and accumulated through .
次に上記構成からなる日本語解析装置の具体的動作を以
下に説明する。まずユーザがキー号?−ド10のキー操
作によりたとえば「あなたは」という文字列を制御装置
12に入力し、且つ無変換キーを操作したものとする。Next, the specific operation of the Japanese language analysis device having the above configuration will be explained below. First, is the user the key number? It is assumed that, for example, the character string "Anata wa" is input into the control device 12 by operating the keys on the - code 10, and the non-conversion key is operated.
この結果、文字列データは制御装置12よシ判定装置1
4を介して形態素解析装置1Gに転送され且つ判定装置
14は無変換キーが操作されたことを記憶する。As a result, the character string data is transferred from the control device 12 to the determination device 1.
4 to the morphological analysis device 1G, and the determination device 14 stores that the no-conversion key has been operated.
一方、形態素解析装置16は前記文字列データを単語辞
W ROM l 8に記憶されている辞書情報を参照し
ながら形態素解析処理を行い、判定装置14に記憶され
ているかな漢字変換の実行の有無を示すデータを参照し
、この場合には無変換キーが操作されている旨、すなわ
ちかな漢字変換を実行しない旨のデータが判定装置14
に記憶されているので、形態素解析結果のみを判定装置
14に出力する。ここで形態素解析結果とは、単語分割
された文字列と分割された各単語の単語辞書ROM 1
8において登録されているアドレスを示すデータを意味
するものとする。On the other hand, the morphological analysis device 16 performs a morphological analysis process on the character string data while referring to the dictionary information stored in the word dictionary W ROM l 8, and determines whether or not the kana-kanji conversion stored in the determination device 14 has been performed. In this case, the determination device 14 receives data indicating that the no-conversion key is being operated, that is, data indicating that kana-kanji conversion is not to be performed.
Therefore, only the morphological analysis results are output to the determination device 14. Here, the morphological analysis result refers to the character string divided into words and the word dictionary ROM 1 of each divided word.
This means data indicating the address registered in 8.
判定装置14は形態素解析装置16から受けた形態素解
析結果を入力文パンツアメモリ20に転送し、該入力文
バッファメモリ20には第2図囚に示すように単語分割
された文字列とこれに対応して単語辞書ROM 18に
登録されている分割された単語の辞書アドレスとが記憶
される。The determination device 14 transfers the morphological analysis result received from the morphological analysis device 16 to the input sentence panzer memory 20, and the input sentence buffer memory 20 contains word-divided character strings and the word-divided character strings as shown in FIG. Correspondingly, the dictionary addresses of the divided words registered in the word dictionary ROM 18 are stored.
次ニユーザがキーボード10のキー操作により「あなた
は」という文字列を制御装置12に入力し、次に変換キ
ーを操作したものとする。Next, it is assumed that a second user inputs the character string "you" into the control device 12 by operating keys on the keyboard 10, and then operates a conversion key.
この結果、文字列データは制御装置12よシ判定装置1
4を介して形態素解析装置16に転送され、判定装置1
4は変換キーが操作されたことを記憶する。As a result, the character string data is transferred from the control device 12 to the determination device 1.
4 to the morphological analysis device 16, and the determination device 1
4 stores that the conversion key has been operated.
一方、形態素解析装置16は前記文字列データを単語辞
書ROM l 8に記憶されている辞書情報を参照しな
がら形態素解析処理を行い、且つ判定装置14に記憶さ
れているかな漢字変換の実行の有無を示すデータ(この
場合には変換キーが操作されている、すなわちかな漢字
変換を実行する旨を指示するデータ)を参照し、かな漢
字変換を行う。そして、かな漢字変換された形態素解析
結果、すなわち「貴方へは」というように単語分割され
た文字列とこの文字列の各単語が登録されている単語辞
書ROM l 8におけ −る辞書アドレスを示すデ
ータが形態素解析装置16よシ判定装置14に送出され
る。On the other hand, the morphological analysis device 16 performs a morphological analysis process on the character string data while referring to the dictionary information stored in the word dictionary ROM l 8, and also determines whether or not kana-kanji conversion stored in the determination device 14 has been performed. The kana-kanji conversion is performed by referring to the data indicating that the conversion key is being operated (in this case, data indicating that the conversion key is being operated, that is, data indicating that kana-kanji conversion is to be performed). Then, it shows the morphological analysis result after kana-kanji conversion, that is, a character string divided into words such as "For you" and the dictionary address in the word dictionary ROM 18 where each word of this character string is registered. The data is sent from the morphological analysis device 16 to the shading device 14.
判定装置14は形態素解析された文字列データを制御装
置12を介して表示装置22に中力する一方、その形態
素解析された文字列データがユーザに確認された時(レ
リえはユーザによりキーボード10のキー操作により次
の文字列データが入力される等の処理がなされた時)に
、入力文バッファメモリ20に第2図(B)に示すよう
な単語分割され且つかな漢字変換された文字列とこの文
字列の辞書アドレスとを示すデータが転送され、入力文
バッファメモリ20にこれらのデータが記憶・蓄積され
る。The determination device 14 inputs the morphologically analyzed character string data to the display device 22 via the control device 12, and when the morphologically analyzed character string data is confirmed by the user (the user inputs the character string data to the keyboard 10). When the next character string data is input by key operation), the input sentence buffer memory 20 stores a character string divided into words and converted into kana-kanji as shown in FIG. 2(B). Data indicating the dictionary address of this character string is transferred, and these data are stored and accumulated in the input sentence buffer memory 20.
以上に説明したように本実施列によれば従来のように形
態素解析を複数回行うことなく適確に形B索解析を行う
ことができる。 −次に本発明に係る日
本語解析装置の他の実施例の構成を第3図に示す。本実
施例が第1図に示した実施例と構成上、異なる点は、格
助詞相当語のように本質的には単語分割されてはいけな
い語について、形態素解析されて単語分割された後にこ
れらの分割された単語を結合して一つの単語として形成
するように処理する文字列結合装置30を付加したこと
であシ、他の構成は基本的に変るところがないので第1
図゛に示した実施例と同一の機能ブロックには同一の参
照符号を付し、重複する説明は省略する。As explained above, according to this embodiment, shape B chord analysis can be performed accurately without performing morphological analysis multiple times as in the conventional case. -Next, the configuration of another embodiment of the Japanese language analysis device according to the present invention is shown in FIG. This embodiment differs in structure from the embodiment shown in FIG. This is due to the addition of a character string combining device 30 that processes the words divided into words to form one word, and the other configurations are basically unchanged.
Functional blocks that are the same as those in the embodiment shown in FIG.
まずユーザがキーボードlOのキー操作にょシたとえ″
ば文字列データ「あなたに」を制御装置12に入力し、
次に無変換キーを操作したものとする。この場合には第
1図に示した実施列と同様に形態素解析処理がなされ、
文字列「あなた」とこの文字列の単語辞書ROM 18
における辞書アドレスのデータが入力文バッフアメ°モ
IJ 20に記憶される。そして表示装置22には文字
列「あなたに」が表示される。ただこの処理が実行され
た際に「あなた」の付属語「に」のデータが文字列結合
装置30の内部スタックに記憶される。First, let's say that the user operates the keys on a keyboard.
input the character string data "to you" into the control device 12,
Next, it is assumed that the non-conversion key is operated. In this case, the morphological analysis process is performed in the same way as the implementation sequence shown in FIG.
Word dictionary ROM 18 for the character string “you” and this character string
The data of the dictionary address in is stored in the input sentence buffer memory IJ 20. Then, the character string "For you" is displayed on the display device 22. However, when this process is executed, the data of the auxiliary word "ni" of "you" is stored in the internal stack of the character string combination device 30.
次にユーザからキー?−ド1Gのキー操作により文字列
「かんする」が入力されて変換キーが操作されると、文
字列「かんする」は制御装置12、判定装置14を介し
て文字列結合装置30に転送される。文字列結合装置3
0では、文字列データ「に」と「かんする」が結合され
文字列「にかんする」が形成される。この文字列「にか
んする」は文字列結合装置30よシ形態素解析装置16
に送られ、形態素解析及びかな漢字変換がなされる。こ
こで文字列「に関する」は単語辞書ROM l 8に格
助詞相当語として登録されているものとする。Then the key from the user? When the character string "kansuru" is input by key operation of the -do 1G and the conversion key is operated, the character string "kansuru" is transferred to the character string combination device 30 via the control device 12 and the determination device 14. String joiner 3
At 0, the character string data "ni" and "kansuru" are combined to form the character string "nikansuru". This character string "nikansuru" is passed to the character string combiner 30 and the morphological analyzer 16
The text is sent to , where morphological analysis and kana-kanji conversion are performed. Here, it is assumed that the character string "regarding" is registered in the word dictionary ROM 18 as a case particle equivalent word.
したがってかな漢字変換処理の結果、形態素解析装置1
6よシ文字列「に関する」及びこの格助詞相当語の辞書
アドレスを示すデータが文字列結合装置30に送出され
る。Therefore, as a result of the kana-kanji conversion process, the morphological analysis device 1
Data indicating the dictionary address of the 6-yoshi character string "regarding" and the case particle equivalent word is sent to the character string combination device 30.
文字列結合装置30では文字列「に関する」を内部スタ
ックの文字「に」を示すデータをインデックスとして検
索し、「にム関する」というように単語分割する(「ム
」は区切シ記号である。)、そしてこの文字列「にム関
する」を示すデータが文字列結合装置30よ)判定装置
14に送出され、判定装置14は文字列「にム関する」
のデータから「関する」の部分のデータを抽出し、この
文字列「関する」を示すデータを制御装置12を介して
表示装置22に送出する。The character string combining device 30 searches for the character string ``Kitsu'' using the data indicating the character ``ni'' in the internal stack as an index, and divides the string into words such as ``nimu kinki''(``mu'' is a punctuation mark). ), and the data indicating this character string "related to" is sent from the character string combination device 30 to the determination device 14, which determines the character string "related to"
The data of the part "related" is extracted from the data, and the data indicating this character string "related" is sent to the display device 22 via the control device 12.
次に第1図の実施例の場合と同様に、ユーザがキーボー
ド10のキー操作により、形態素解析された文字列デー
タを確認した旨の指示を制御装置12に与えると、判定
装置14は制御装置12の制御指令に基づいて文字列「
にム関する」を示すデータを入力文バッファメモIJ
20に、第4図に示すように、以前に入力された文字列
「あなた」の付属語の部分に対応させて文字列「に関す
る」を記憶し、この文字列「に関する」の記憶領域に対
応する記憶領域に文字列「に関する」の辞書アドレスを
記憶する。Next, as in the case of the embodiment shown in FIG. Based on 12 control commands, the character string “
Input the data indicating "related to" in the sentence buffer memo IJ.
20, as shown in FIG. 4, the character string "regarding" is stored in correspondence with the adjunct part of the previously input character string "you", and the storage area for this character string "regarding" is stored. Store the dictionary address of the character string ``related'' in the storage area.
以上に説明したように本実施例によれば、第1図の実施
例の効果に加えて、格助詞相当語等のように入力時には
単語分割されるが、本質的には分割されるべきではない
語についても形態素解析処理を行うことができるという
効果が発揮される。As explained above, according to this embodiment, in addition to the effects of the embodiment shown in FIG. The effect is that morphological analysis processing can be performed even for words that do not exist.
効果
本発明によれば形態素解析処理を複数回実行することな
く、適確に形態素解析を行うことができる。Effects According to the present invention, morphological analysis can be performed accurately without performing morphological analysis processing multiple times.
第1図は本発明に係る日本語解析装置の一実施例の構成
を示すブロック図、
第2図は入力文パンツアメモリの記憶内容の一例を示す
説明図、
第3図は本発明に係る日本語解析装置の他の実施例の構
成を示すブロック図、
第4図は入力文バッファメモリの記憶内容の他の91J
を示す説明図である。
主要部分の符号の説明
lO・・・キーボード
12・・・制御装置
14・・・判定装置
16・・・形態素解析装置
18・・・単語辞書ROM
20・・・入力文パンツアメモリ
22・・・表示装置
30・・・文字列結合装置
第1図
第2図
(A) (B)FIG. 1 is a block diagram showing the configuration of an embodiment of the Japanese language analysis device according to the present invention, FIG. 2 is an explanatory diagram showing an example of the stored contents of an input sentence panzer memory, and FIG. 3 is a block diagram showing the configuration of an embodiment of the Japanese language analysis device according to the invention. A block diagram showing the configuration of another embodiment of the Japanese language analysis device, FIG. 4 shows another 91J of the storage contents of the input sentence buffer memory.
FIG. Explanation of symbols of main parts 10...Keyboard 12...Control device 14...Determination device 16...Morphological analysis device 18...Word dictionary ROM 20...Input sentence panzer memory 22... Display device 30...Character string combination device Fig. 1 Fig. 2 (A) (B)
Claims (1)
段と、 単語を示す文字列のデータに対応してその意味等の情報
が分類・記憶されている第1の記憶手段と、 前記入力手段により入力された日本語文データの形態素
解析結果を記憶・蓄積する第2の記憶手段と、 前記入力手段から入力された日本語文データを取り込み
、前記第1の記憶手段に記憶されている辞書情報を参照
して日本語文データの形態素解析およびかな漢字変換処
理を実行する形態素解析手段と、 前記入力手段から入力された日本語文データを形態素解
析手段に転送し、且つ該日本語文データの形態素解析結
果を前記第2の記憶手段に転送すると共に、表示装置等
の出力手段に出力する制御手段とを有することを特徴と
する日本語解析装置。[Scope of Claims] Input means for inputting Japanese sentence data to be parsed; and first storage means in which information such as the meaning of words is classified and stored in correspondence with character string data indicating words. a second storage means for storing and accumulating the morphological analysis results of the Japanese sentence data input by the input means; and a second storage means for capturing the Japanese sentence data input from the input means and storing them in the first storage means. morphological analysis means that performs morphological analysis and kana-kanji conversion processing of Japanese sentence data by referring to dictionary information stored in the input means; A Japanese language analysis device characterized by comprising a control means for transferring the morphological analysis results to the second storage means and for outputting the results to an output means such as a display device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59183700A JPS6162175A (en) | 1984-09-04 | 1984-09-04 | Analyzer for japanese language |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59183700A JPS6162175A (en) | 1984-09-04 | 1984-09-04 | Analyzer for japanese language |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6162175A true JPS6162175A (en) | 1986-03-31 |
JPH0580021B2 JPH0580021B2 (en) | 1993-11-05 |
Family
ID=16140413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59183700A Granted JPS6162175A (en) | 1984-09-04 | 1984-09-04 | Analyzer for japanese language |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6162175A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01118961A (en) * | 1987-10-30 | 1989-05-11 | Brother Ind Ltd | Translating device |
-
1984
- 1984-09-04 JP JP59183700A patent/JPS6162175A/en active Granted
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01118961A (en) * | 1987-10-30 | 1989-05-11 | Brother Ind Ltd | Translating device |
Also Published As
Publication number | Publication date |
---|---|
JPH0580021B2 (en) | 1993-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS59165179A (en) | Dictionary look-up system | |
JPS6162175A (en) | Analyzer for japanese language | |
JPS628259A (en) | Kana (japanese syllabary)-kanji (chinese character) converting system | |
JPS6154559A (en) | Japanese word processor | |
JPS60195664A (en) | Kana-to-kanji-converting system | |
JPH01259448A (en) | Kanji input system | |
JPS62163174A (en) | Mechanical translating device | |
JPS61233862A (en) | Kana-kanji converter | |
JPH0380363A (en) | Document processor | |
JPH04372047A (en) | Kana/kanji converter | |
JPH0944496A (en) | Method and device for analyzing natural language | |
JPS6327966A (en) | Katakana conversion system in word processor | |
JPH06223055A (en) | Document input device | |
JPS63115264A (en) | Document processor | |
JPS62237565A (en) | Sentence input device | |
JPS6172360A (en) | Close writing kana-to-kanji conversion system | |
JPS61134866A (en) | Japanese word analyzer | |
JPH01111267A (en) | Character transforming device | |
JPH0693237B2 (en) | Japanese sentence generator | |
JPH01119858A (en) | Japanese language store system | |
JPH0468466A (en) | Kana / kanji converting device | |
JPS62264358A (en) | Japanese sentence input system | |
JPH06131337A (en) | Character input device | |
JPH02105254A (en) | Device and method for kana-kanji conversion | |
JPH05342197A (en) | Japanese word processor |