JPH03263266A

JPH03263266A - 未知語の品詞選択装置

Info

Publication number: JPH03263266A
Application number: JP2063577A
Authority: JP
Inventors: Hide Fuji; 秀富士
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1990-03-14
Filing date: 1990-03-14
Publication date: 1991-11-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔概要〕ニューラル・ネットワークを用いた未知語の品詞選択装
置に関し、ニューラル・ネットを使うことによって、どのような未
知単語の入力に対して何らかの適当な出力を学習した標
準パターンから類推して出力することを目的とし、入力された未知語の綴りを格納するバッファと、上記の
未知語の綴りの情報をニューラル・ネットワークの入力
に適した形に変換する入力インターフェース部と、入力された綴りの情報から品詞の推定をする逆伝播式ニ
ューラル・ネットワークと、ニューラル・ネットワークの出力を品詞候補およびそれ
らの確率情報に変換する出力インターフェース部とを備えている。

〔産業上の利用分野〕

本発明は、ニューラル・ネットワークを用いた未知語の
品詞選択装置に関する。

英語の解析などを行う際に、各単語の品詞を正しく選択
することが不可欠である。どのような入力文に対しても
一応の解析が出来るシステムを構築する際には、筆者が
その場で作った造語やシステムの辞書に登録されていな
いその他の単語等に対しても適切な品詞を与え、解析を
進めなければならない、このような予期しにくい入力の
解析は場合場合に応じた細かい規則を書き並べるよりは
、ニューラル・ネットのようなもっと融通性のあるシス
テムを使った方がより柔軟な解析ができる場合が多い、
ｌｌ近になって高速かつメモリ効率の良いネットワーク
・システムが手に入りやすくなり、これらを使って実用
にも充分に耐えられる自然言語処理システムの構築が可
能になってきた。

〔従来の技術〕

従来の自然言語処理システムの未登録語処理においては
、未登録語が出てくる度に、 ■　一定の品詞を与えて解析を進める。

■　織りと単語の対応規則を規則表として作っておき、
その場に応じて規則を当て嵌めてゆき、もし規則にそぐ
わない入力があった場合は、適当に可能性の高い品詞を
与えてしまう。

■　その場では品詞を決めずに文法で必要と思われる品
詞を使用する。

などの処理を行っていた。

〔発明が解決しようとする課題〕

■で示した方法では融通性の高い処理は出来なかった。

■の方法では失敗する可能性が何時も一定の確率であり
、■では適用できる規則がない場合には■と同じになっ
てしまい、■では文法だけでは品詞選択が出来ない場合
があったり、抜けた品詞を推定する「虫食い算」的な文
法を書くことが難しい、と言う欠点があった。

本発明は、この点に鑑みて創作されたものであって、ニ
ューラル・ネットを使うことによって、どのような未知
単語の入力に対しても何らかの適当な出力を学習した標
準パターンから類推して出力することを目的としている
。

〔課題を解決するための手段〕

第１図は本発明の原理説明図である。同図において、１
は未知語の綴りが格納されるバッファ、２はニューラル
・ネットワーク３への入力インターフェース、３は逆伝
播式ニューラル・ネットワーク、４はニューラル・ネッ
トワークの出力インターフェース、５はニューラル・ネ
・ントワーク３からの出力である品詞候補および候補品
詞の確率、６は品詞並び情報、７は品詞選択部、８は最
終的に選択された品詞をそれぞれ示している。

バッファ１には、未知語の綴りが格納される。

入力インターフェース２は、バッファ１の未知語の織り
の情報を逆伝播式ニューラル・ネットワーク３の入力に
適した形に変換するものである。逆伝播式ニューラル・
ネットワーク３の入力層には例えば未知語の先頭が大文
字か否かを示す情報。

未知語の長さの情報および未知語の語尾３文字に対応す
る織りの情報が入力され、出力層からは未知語の品詞候
補が出力される。なお、予め逆伝播式ニューラル・ネッ
トワーク３に対しては適当な学習が施されている。

出力インターフェース４は、逆伝播式ニューラル・ネッ
トワーク３からの出力を品詞候補および候補品詞の確率
情報に変換するものである。

品詞選択部７は、品詞並び情報６を使用して、出力イン
ターフェース４から出力される品詞候補の中から最も適
当と思われ品詞を選択する。この品詞選択部は既知の技
術のものであり、また、本発明の要旨外であるので、こ
れについての詳細な説明は省略する。

〔作用〕

入力インターフェース２は、バッファ１内の未知語の綴
りを取り出し、ニューラル・ネットワーク３の入力層に
未知語の先頭が大文字か否かを示す情報、未知語の長さ
を示す情報、未知語の語尾３文字が何であるかを示す情
報を入力する。出力インターフェース４は、逆伝播式ニ
ューラル・ネットワーク３の出カニニットの中から成る
閾値以上の値を出力しているものを取り出し、当該出カ
ニニットに対応する品詞と、当該出力値に対応した確率
値を出力する。

第１図のような品詞選択装置を使用すれば、既に学習さ
せた綴りのパターンから未知語の品詞を推定することが
出来る。

〔実施例〕

第２図は本発明の１実施例のブロック図である。

同図において、１は未知語が格納されるバッファ、２は
入力インターフェース、３は逆伝播式ニューラル・ネッ
トワーク、４は出力インターフェースをそれぞれ示して
いる。

バッファ１には未知語が格納される０図示の例ではｒｃ
ｏｍｆｙＪと言う文字列が格納されている。入力インタ
ーフェース２は、バッファ１に格納されている未知語の
織りを取り出し、先頭文字が大文字か否かを示す情報１
文字列長および語尾３文字をニューラル・ネットワーク
３の入力層に入力する。

ニューラル・ネットワーク３は逆伝播式のものである。

ニューラル・ネットワーク３の入力層は複数の入カニニ
ットを有しており、最左端の入カニニットは先頭文字が
大文字か小文字かを示すために用いられる。図示の例で
は、バッファ１の文字列の先頭文字は小文字であるので
、この入カニニットには０が入力される。次のｎ個の入
カニニットは文字列長を示すために用いらる。図示の例
では、バッファ１の文字列の長さは５であるので、文字
列長に割り当てられたｎ個の入カニニットの中の５番目
の入カニニットに１が入力され、その他の入カニニット
には０が入力される。語尾３文字のそれぞれに対して、
２６個の入カニニットが割り当てられている。２６個の
入カニニットは、それぞれａ、ｂ、・・・、２に割り当
てられている。

図示の例では、バッファ１の文字列の語尾３文字は“ｍ
　　、　　”ｆ″′、　　ｙ″であるので、第１ｔＪｌ
目の２６個の入カニニットのうちの“ｍ”に対応する入
カニニットに１が入力され、その他の入カニニットには
０が入力され、第２１１目の２６個の入カニニットのう
ちの“°ｒ″に対応する入カニニットに１が入力され、
その他の入カニニットにはＯが入力され、第３組目の２
６個の入カニニットのうちの“ｙ”に対応する入カニニ
ットに１が入力され、その他の入カニニットには０が入
力される。

逆伝播式ニューラル・ネットワーク３は、使用に先立っ
て学習をさせなければならない。各ユニットはＯと１の
間の任意の値を取り得るものとする。学習に際しては、
出来るだけ多くの単語を使い、入力インターフェース２
でニューラル・ネットワーク３に入力単語の綴りに関す
る情報を与え、教師信号としてはその入力単語に対応す
る品詞をニューラル・ネットワーク３の出力側に与える
。

例えば“ｕｓｅｆｕｌ”と言う単語が形容詞であること
を学習させるためには、先頭文字が小文字であると言う
情報、文字長が６であると言う情報および語尾３文字が
“ｆｕｌ”であると言う情報を逆伝播式ニューラル・ネ
ットワーク３の入力層に与えると共に、１の値を持つ教
師信号を形容詞に割り当てられた出カニニットに与える
。

逆伝播式ニューラル・ネットワーク３の中間層の数は学
習速度や反応の速さの面から１層を使用する。中間層の
ユニットの数は入力層と出力層のユニットの数の間ぐら
いを使う。出力層のユニット数は、使用する品詞の総数
と等しくする。各出カニニットに対しては品詞が割り当
てられている。

例えば、第５番目の出カニニットに対しては形容詞を割
り当て、第１３番目の出カニニットに対しては動詞を割
り当てる。

出力インタフェース４では、逆伝播式ニューラル・ネッ
トワーク３の出力層の中で成る闇値よりも大きい値を出
力する出カニニットのみを取り出し、それらに対応する
品詞を出力する。それぞれの品詞は、出カニニットの出
力値に対応した確率値と共に出力される。図示の例では
、「形容詞０．６」と言う情報と、「動詞　０．４　Ｊ
と言う情報が出力インターフェース４から出力されてい
る。

出力インターフェース４の後段には、上記の情報に更に
品詞並び情報を使って品詞候補の中から適当な品詞を選
択する機構が接続されるが、この機構は既知の技術のも
のであり、本発明の要旨外であるので説明は省略する。

〔発明の効果〕

以上に説明したように、本発明によれば、（ａ）　　個
々の規則を書く必要なくして未知語の処理が出来る。

Φ）どんな入力に対してもそれなりの品詞選択精度が得
られる。

と言う顕著な効果を奏することが出来る。

【図面の簡単な説明】

第１図は本発明の原理説明図、第２図は本発明の１実施
例のブロック図である。１・・・未知語の織りが格納されるバッファ、２・・・
ニューラル・ネットワーク３への入力インターフェース
、３・・・逆伝播式ニューラル・ネットワーク、４・・
・ニューラル・ネットワークの出力インターフェース、
５・・・ニューラル・ネットワーク３からの出力である
品詞候補および候補品詞の確率、６・・・品詞並び情報
、７・・・品詞選択部、８・・・最終的に選択された品
詞。

Claims

【特許請求の範囲】入力された未知語の綴りを格納するバッファ（１）と、上記の未知語の綴りの情報をニューラル・ネットワーク
（３）の入力に適した形に変換する入力インターフェー
ス部（２）と、入力された綴りの情報から品詞の推定をする逆伝播式ニ
ューラル・ネットワーク（３）と、ニューラル・ネット
ワーク（３）の出力を品詞候補およびそれらの確率情報
に変換する出力インターフェース部（４）とを備えたことを特徴とする未知語の品詞選択装置。