JPH0821033B2 - 言語解析装置 - Google Patents

言語解析装置

Info

Publication number
JPH0821033B2
JPH0821033B2 JP61243197A JP24319786A JPH0821033B2 JP H0821033 B2 JPH0821033 B2 JP H0821033B2 JP 61243197 A JP61243197 A JP 61243197A JP 24319786 A JP24319786 A JP 24319786A JP H0821033 B2 JPH0821033 B2 JP H0821033B2
Authority
JP
Japan
Prior art keywords
character string
dictionary
proper noun
property information
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61243197A
Other languages
English (en)
Other versions
JPS6398774A (ja
Inventor
壽彦 横川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61243197A priority Critical patent/JPH0821033B2/ja
Priority to NL8702359A priority patent/NL8702359A/nl
Priority to DE19873733674 priority patent/DE3733674A1/de
Priority to FR8713742A priority patent/FR2604814B1/fr
Publication of JPS6398774A publication Critical patent/JPS6398774A/ja
Priority to US07/714,990 priority patent/US5225981A/en
Publication of JPH0821033B2 publication Critical patent/JPH0821033B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は言語解析装置、特に自動翻訳装置に有用な言
語解析装置に関する。
従来技術 例えば英語等の外国語の文からそれに対応する日本語
の文を作成する場合、入力された英文の形態素を解析
し、その構文を解析し、その文構造を変換し、その後に
日本語の訳文を生成する。
すなわち、辞書を検索することによって入力文を構成
する各単語等の形態素を解析し、これらの形態素につい
ての品詞等の情報を得る。その後、得られた品詞等の情
報に基づいて、各々の単語またはこれらの単語により形
成されるブロック相互の修飾関係を文法ルールにより解
析することにより、入力文の構造の解析、すなわち構文
解析を行う。さらに、解析された構文に基づいて入力文
の文構造を日本語の構文配列の順序に変換し、変換され
た配列に従って日本語の形態素を生成し、日本語文を生
成する。
このような訳文生成の際に行われる形態素解析におい
ては、スペース、コンマ、コロン等のデリミッタにより
入力文を辞書引き単位に区分し、この辞書引き単位につ
いて辞書を検索することにより、単語等の形態素の品詞
その他の情報を得ている。その場合に、例えば固有名詞
は、文脈により2以上の異なった意味に用いられるもの
がある。例えば「Osaka City」は、「Osaka City decid
ed…」のように団体を表す意味で使用される場合と、
「…in Osaka City」のように場所を表す意味で使用さ
れる場合とがある。従来、固有名詞は1個の意味のみを
辞書に記憶していたから、このような使い分けには対応
できず、解析精度が低かった。
目 的 本発明はこのような従来技術の欠点を解消し、固有名
詞を文脈に応じて複数の意味に解析を行うことのできる
言語解析装置を提供することを目的とする。
構 成 本発明は上記の目的を達成させるため、所定の言語の
文字列を力する入力手段と、入力手段から入力された文
字列の検索に用いられる辞書手段と、入力された文字列
について辞書手段を検索する検索手段と、検索手段によ
る検索の結果、入力された文字列のうち辞書手段に記録
されていない文字列および辞書手段に性質情報が記録さ
れていない文字列について、性質情報を付与する性質情
報付与手段とを有し、性質情報付与手段は、性質情報の
ない文字列に複数の性質情報を付与することを特徴とし
たものである。以下、本発明の一実施例に基づいて具体
的に説明する。
第1図には、本発明による言語解析装置を英日自動翻
訳装置に適用した一実施例が示されている。なお、本発
明は、英語の入力文の形態素解析以外にも用いることが
でき、英語を日本語に翻訳する英日翻訳装置のみなら
ず、ある1つの言語を他の言語に翻訳する自動翻訳装置
にも効果的に適用されることは、言うまでもない。
本実施例は入力処理部14を有し、入力処理部14には入
力装置12からデータが入力される。入力装置12は例え
ば、英数字キー等の文字キーや機能キー等を有するキー
ボード、紙に記録された英字テキストを読み取る光学的
文字読み取り装置、磁気ディスクの読み取り装置等を含
む。
入力処理部14は入力文字列バッファ14aを有し、入力
装置12から入力された英語の入力文を入力文字列バッフ
ァ14aに記憶する。入力処理部14は入力文字列バッファ1
4aに記憶された入力文を読み出して単位切出し部16に出
力する。単位切出し部16は、デリミッタテーブル18の検
索によって、入力処理部14から送られた入力文の辞書引
き単位切出しを行い機能部であり。デリミッテーブル18
にはスペース、コマン等のデリミッタが格納されてい
る。
単位切出し部16はデリミッタテーブル18からデリミッ
タを読み出し、入力処理部14から送られる入力文をデリ
ミッタの存在する部分で区切ることにより、参照辞書20
を検索する場合の単位となる文字列に分割する。分割さ
れた文字列は辞書検索部22に入力される。
辞書検索部22は、単位切出し部16から送られる辞書引
き単位に分割された入力文について参照辞書20を検索す
る。参照辞書20には、例えば第2図に示すように、英文
の文字列のエントリ、その品詞、性質情報等が記録され
ている。参照辞書20には同図に示す固有名詞の他、その
他の品詞、例えば動詞、形容詞等の文字列も記録されて
いる。なお、同図において品詞としての固有名詞という
記録は、後述する登録固有名詞処理を行うものを意味
し、通常の文法上の固有名詞を表すものではない。ま
た、性質情報とは、その固有名詞が表すものを示し、1
つとは限らない。これは後述するように、固有名詞が使
用される場合に応じて複数の性質を表すからである。
辞書検索部22は辞書引き単位に分割された文字列につ
いて参照辞書20を検索し、文字列が固有名詞である場合
には固有名詞処理部24に出力し、後述する固有名詞の処
理を行う。また、固有名詞でない場合には処理部36に出
力し、処理部36の辞書情報保存テーブル36aに保存す
る。
固有名詞処理部24は、直前文末処理部26、直前固有名
詞処理部28、固有名詞自身処理部30、直前固有名詞およ
び固有名詞処理部32、デフォルト性質情報付与部34から
なる。
直前文末処理部26は、辞書検索部22により検索され入
力された文字列の直前の文字列が文末であるか否かを判
断し、直前の文字列が文末である場合には処理すべき文
字列の先頭の大文字を小文字に変換して辞書検索部22に
送り、辞書検索部22に再度参照辞書20の検索を行わせ
る。この再度の検索によっても検索されなかった文字列
は未登録の固有名詞と判断され、処理部36に送られ、辞
書情報保存テーブル36aに保存される。また直前の文字
列が文末でない場合に、後述するように性質情報未知の
固有名詞として処理部36に送り、辞書情報保存テーブル
36aに登録する。
直前固有名詞処理部28は、直前文末処理部26から送ら
れた直前の文字列の性質情報を解析し、固有名詞自身処
理部30に出力する。固有名詞自身処理部30は、解析すべ
き固有名詞の性質情報を調べ、後述するように、固有名
詞と直前の固有名詞のいずれかに性質情報が未登録の場
合に、他方の登録された性質情報により固有名詞と直前
の固有名詞をまとめて解析し、処理部36の辞書情報保存
テーブル36aに保存する。
直前固有名詞および固有名詞処理部32は、固有名詞自
身処理部30から送られた解析すべき固有名詞および直前
の固有名詞の性質情報の共通部分を調べ、共通部分によ
りこれらの固有名詞を解析し、処理部36に出力し、処理
部36の辞書情報保存テーブル36aに保存する。
デフォルト性質情報付与部34は辞書情報保存テーブル
36aから読み出され、単位切出し部16を通して辞書検索
部22に送られ、辞書検索部22により参照辞書20を検索し
た結果、性質情報のない固有名詞について、性質情報を
付与する。固有名詞は使用される状況に応じて各種の性
質を有することが有効であるため、付与される性質情報
は必要と思われるものをすべて付与する。例えば、
「人、場所、団体、その他」が付与される。デフォルト
性質情報付与部34は、固有名詞に性質情報を付与した
後、これらのデータを処理部36に送り、処理部36の辞書
情報保存テーブル36aに保存する。
処理部36は、辞書情報保存テーブル36aを有し、直前
固有名詞および固有名詞処理部32、デフォルト性質情報
付与部34または辞書検索部22から送られたデータを辞書
情報保存テーブル36aに保存した後、保存されたデータ
を読み出して構文解析部38に出力する。構文解析部38は
辞書情報保存テーブル36aから読み出された形態素解析
の行われた入力文の構文解析を行う。
第3図に示すフローチャートにより、本装置の動作を
説明する。
まず、入力装置12から英語の入力文を入力処理部14に
読み込む(100)。入力処理部14に読み込まれた入力文
は入力文字列バッファ14aに格納される。入力文字列バ
ッファ14aに記憶された入力文は単位切り出し部16に読
み出される。
単位切り出し部16では、入力文が入力されるとデリミ
ットテーブル18からデリミッタを読み出し、辞書引き単
位の切り出しが行われる(102)。すなわち、入力され
た入力文を構成する文字列は、スペース、コロン等のデ
リミッタのある部分で区切ることにより、参照辞書20を
検索する場合の単位である検索キー文字列に、文字列の
先頭から順に分割される。分割された辞書引き単位、す
なわち検索キー文字列が終りか否かを判断し(104)、
検索キー文字列がまだある場合(終りでない場合)には
検索キー文字列を辞書検索部22に送る。
辞書検索部22に検索キー文字列が送られると、辞書検
索部22はこの検索キー文字列について参照辞書20を検索
する(106)。第2図に示すような参照辞書20のエント
リに検索キー文字列があるか否かを判断し(108)、エ
ントリがある場合には参照辞書20に記憶されている品詞
情報を読み出し、検索キー文字列が固有名詞か否かを判
断する(110)。
検索キー文字列が固有名詞でない場合には、辞書検索
部22は参照辞書20から読み出したデータを処理部36に送
り、辞書情報保存テーブル36aに記録(112)。辞書情報
保存テーブル36aにデータが保存されると、処理部36か
ら単位切り出し部16にデータが保存された旨の入力およ
び直前に保存された検索キー文字列のデータが入力され
る。これによりステップ102に戻り、再び単位切り出し
部16において辞書引き単位の切り出しを行う。
ステップ110において検索キー文字列が固有名詞の場
合には、辞書検索部22は参照辞書20から読み出したその
固有名詞(以下単に固有名詞という)のデータを、処理
部36の辞書情報保存テーブル36aの最終のエントリの情
報(つまり、現在注目している固有名詞の直前のエント
リの情報)とともに固有名詞処理部24に送り、固有名詞
処理部24において辞書登録固有名詞の処理が行われる
(114)。
ここで辞書登録固有名詞の処理を第4図に示すフロー
チャートにより説明する。
辞書検索部22から固有名詞処理部24に送られたデータ
は、直前文末処理部26を通して直前固有名詞処理部28に
入力される。辞書登録固有名詞の処理においては、直前
文末処理部26は機能しない。
直前固有名詞処理部28において、固有名詞の直前にあ
るエントリが、参照辞書20に未登録の固有名詞、すなわ
ち後述する辞書未登録固有名詞処理を行われたものであ
るか否かを判断し(200)、未登録の固有名詞である場
合には、固有名詞および直前の未登録の固有名詞の全体
を固有名詞の性質情報をもつ固有名詞と判断し(20
2)、これらのデータを処理部36に送り、辞書情報保存
テーブル36aに記録する(218)。
直前固有名詞処理部28において、ステップ200で、固
有名詞の直前にあるエントリが未登録の固有名詞でない
と判断された場合には、固有名詞の直前にあるエントリ
が参照辞書20に登録された固有名詞か否かを判断する
(204)。固有名詞の直前にあるエントリが登録された
固有名詞である場合には、この直前の固有名詞の性質情
報が未知(Unknown)、すなわち参照辞書20に登録され
ていないものであるか否かを判断する(206)。
直前の固有名詞の性質情報が未知の場合には、ステッ
プ202に進み、固有名詞および直前の固有名詞の全体を
固有名詞の性質情報をもつ固有名詞と判断し(202)、
直前固有名詞処理部28はこれらのデータを処理部36に送
る。処理部36に送られたデータは、辞書情報保存テーブ
ル36aに記録される(218)。
直前固有名詞処理部28においてステップ206で、直前
の固有名詞の性質情報が未知(Unknown)でない、すな
わち参照辞書20に登録されていると判断された場合に
は、これらのデータは直前固有名詞処理部28から固有名
詞自身処理部30に送られる。固有名詞自身処理部30にお
いて、固有名詞の性質情報が未知(Unknown)であるか
否かを判断する(208)。固有名詞の性質情報が未知で
ある場合には、固有名詞自身処理部30は固有名詞および
直前の固有名詞の全体を直前の固有名詞の性質情報をも
つ固有名詞と判断し(210)、これらのデータを処理部3
6に送る。処理部36に送られたデータは、辞書情報保存
テーブル36aに記録される(218)。
固有名詞自身処理部30において、固有名詞自身の性質
情報が未知でない、すなわち参照辞書20に登録されてい
ると判断された場合には、固有名詞自身処理部30はこれ
らのデータを直前固有名詞および固有名詞処理部32に送
る。直前固有名詞および固有名詞処理部32において、固
有名詞と直前の固有名詞との間に性質情報の共通性があ
るか否かを判断し(212)、共通性がある場合には、固
有名詞と直前の固有名詞の全体を、共通部分の性質情報
をもつ固有名詞と判断し(214)、これらのデータを処
理部36に送る。処理部36に送られたデータは、辞書情報
保存テーブル36aに記録される(218)。
固有名詞と直前の固有名詞との間に性質情報の共通性
がない場合には、固有名詞を直前の固有名詞とは別に、
参照辞書20から検索された性質情報をもった固有名詞と
判断し(216)、そのデータを処理部36に送る。処理部3
6に送られたデータは、辞書情報保存テーブル36aに記録
される(218)。
第3図に戻って、ステップ108において参照辞書20の
エントリに検索キー文字列がない場合には、検索キー文
字列の1文字目が大文字か否かを判断し(116)、大文
字でない場合には辞書検索部22はこの検索キー文字列を
未登録語と判断して処理部36に送り、辞書情報保存テー
ブル36aに記録する(118)。
1文字目が大文字の場合には、辞書検索部22からこの
検索キー文字列のデータが直前の検索キー文字列のデー
タとともに、固有名詞処理部24に送られ、辞書未登録固
有名詞の処理が行われる(120)。
第5図により辞書未登録固有名詞の処理について説明
する。
検索キー文字列のデータは直前のエントリのデータと
ともに、直前文末処理部26に送られ、直前文末処理部26
において直前のエントリの末尾が文末候補か否かを判断
する(300)。この文末候補か否かの判断は、直前のエ
ントリの末尾が単独のピリオド(.)等の文末候補であ
るか否かを判断することにより行う。
直前のエントリの末尾が文末候補である場合には、直
前文末処理部26から直前固有名詞処理部28にデータが送
られ、直前固有名詞処理部28は直前のエントリを文末と
判断し(302)、検索キー文字列の1文字目の大文字を
小文字に直して辞書検索部22に送る。
辞書検索部22は小文字に直された検索キー文字列につ
いて参照辞書20を検索し(304)、参照辞書20にエント
リがあるか否かを判断する(306)。エントリがある場
合には、辞書検索部22は参照辞書20から検索したデータ
を処理部36に送り、辞書情報保存テーブル36aに記録す
る(308)。エントリがない場合には辞書検索部22は、
この検索キー文字列の1文字目を大文字に戻して未登録
の固有名詞として処理部36に送り、辞書情報保存テーブ
ル36aに記録する(310)。
ステップ300において、直前文末処理部26が直前のエ
ントリの末尾を文末候補でないと判断した場合には、直
前文末処理部26から直前固有名詞処理部28にそのデータ
が送られ、直前固有名詞処理部28は直前のエントリを文
末でないと判断する(312)。直前固有名詞処理部28か
ら固有名詞自身処理部30にデータが送られ、固有名詞自
身処理部30は検索キー文字列を性質情報が未知の固有名
詞と判断する(314)。
固有名詞自身処理部30はデータを直前固有名詞処理部
28に戻し、直前固有名詞処理部28において辞書登録固有
名詞の処理が行われる(316)。この辞書登録固有名詞
の処理は第4図に示すものと同じである。
第3図に戻って、ステップ104において切り出された
辞書引き単位が終りの場合には、辞書検索部22はデフォ
ルト性質情報付与部34にその旨の信号を送り、デフォル
ト性質情報付与部34は処理部36の辞書情報保存テーブル
36aに記録された情報を読み出し、固有名詞へのデフォ
ルト性質情報の付与を行う(122)。
第6図により固有名詞へのデフォルト性質情報の付与
の動作を説明する。
デフォルト性質情報付与部34において、まず辞書情報
保存テーブル36aのデータの先頭にポインタをセットす
る(400)。すなわち、各エントリに分割され、それぞ
れ参照辞書20の検索により情報が付与された入力文の先
頭のエントリにポインタをセットする。ポインタの指示
するエントリが固有名詞か否かを判断し(402)、固有
名詞の場合にはその固有名詞の性質情報が未知(Unknow
n)か否かを判断する(404)。固有名詞でない場合には
ステップ408に進み、ポインタを次のエントリにすすめ
る。
ステップ404においてその固有名詞の性質情報が未知
である場合には、デフォルト性質情報の付与を行う(40
6)。デフォルト性質情報の付与は、第7図の下部に示
すように、性質情報が未知の固有名詞にデフォルトの性
質情報を付与する。例えば同図最下部に示すように、性
質情報が未知の固有名詞「Johnson」に、すべての性質
情報、「人、場所、団体、その他」を付与する。性質情
報が未知の固有名詞に対して、このようにすべての性質
情報を付与することにより、後の構文解析において、そ
の固有名詞を複数の性質のいずれにも解析できる余地を
残しておくことができる。
ステップ404において固有名詞の性質情報が未知でな
い場合には、ステップ408に進み、ポインタを次のエン
トリにすすめる。
ポインタの示すエントリが終りか否かを判断し(40
8)、終りでない場合にはステップ402に戻り、次のエン
トリについて固有名詞か否かを判断する。ポインタの示
すエントリが終りの場合にはデフォルト情報の付与が終
了する。
固有名詞へのデフォルト性質情報の付与が終了した
後、処理部36から辞書情報保存テーブル36aに記録され
たデータを構文解析部38に出力し(124)、本実施例の
形態素解析が終了する。
以上説明した本装置の動作を入力文の例をあげて説明
する。
第7図に示すような入力文「In Tokyo Station Mr.Wa
lter met Johnson」が入力された場合について説明す
る。まず、この入力文を入力処理部14に読み込む入力処
理(100)を行う。次に辞書引き単位の切り出し(102)
を行い、スペースにより上記の入力文を各単語に分割す
る。まず「In」について参照辞書20の検索を行う(10
6)。「In」は、参照辞書20には、そのままではエント
リがないので、いったん辞書未登録固有名詞の処理には
いるが、直前が入力文字列の先頭であるので、文末候補
とみなし、Iをiに直して「in」として参照辞書20から
検索され、固有名詞ではないので(110)、参照辞書20
から検索されたデータを辞書情報保存テーブル36aに記
録する(112)。
次に「Tokyo」について参照辞書20の検索を行う(10
6)。「Tokyo」は、参照辞書20にエントリがなく(10
8)、1文字目が大文字なので(116)、辞書未登録固有
名詞の処理を行う(120)。第5図に進み、直前に「I
n」であり文末候補がないから(300)、「In」を文末で
ないと認定し(312)、「Tokyo」を性質情報未知(Unkn
own)の固有名詞とし(314)、辞書登録固有名詞の処理
を行う(316)。
第4図に進み、直前の「In」が未登録の固有名詞では
なく(200)、登録固有名詞でもないから(204)、単独
で自分自身の性質情報をもった固有名詞、すなわち性質
情報未知(Unknown)の固有名詞としとして記録する(2
16)。
第3図に戻り、次に「Station」について参照辞書20
の検索を行う(106)。「Station」は参照辞書20にエン
トリがあり(108)、固有名詞であるから(110)、辞書
登録固有名詞の処理を行う(114)。第4図に進み、直
前の「Tokyo」が未登録の固有名詞であるから(200)、
「Tokyo Station」全体を「Station」の性質情報「場
所、団体」を有する固有名詞として記録する(202)。
次に「Mr.」について第3図の参照辞書20の検索を行
う(106)。「Mr.」は、参照辞書20にエントリがあり、
固有名詞であるから(110)、辞書登録固有名詞の処理
を行う(114)。第4図に進み、直前の「Station」は未
登録の固有名詞ではなく(200)、登録固有名詞であり
(204)、性質情報「場所、団体」が未知ではない(20
6)。「Mr.」は、性質情報が「人」であり、未知ではな
いから(208)、直前の「Station」と「Mr.」とで性質
情報の共通部分があるか否かを判断する(212)。「Sta
tion」は「場所、団体」、「Mr.」は「人」でこれらに
は共通部分がないので、「Mr.」は単独で、性質情報
「人」の固有名詞として登録する(216)。
次に再び第3図に戻り、「Walter」について参照辞書
20を検索する(106)。「Walter」は参照辞書20にエン
トリがあり(108)、固有名詞であるから(110)、辞書
登録固有名詞の処理を行う(114)。第4図に進み、直
前の「Mr.」は未登録の固有名詞ではなく(200)、登録
固有名詞であり(204)、性質情報が「人」で未知では
なく(206)、「Walter」の性質情報「人、場所、団
体」も未知ではないので(208)、性質情報の共通部分
を判断する(212)。性質情報の共通部分「人」がある
ので、「Mr.Walter」をまとめて性質情報「人」をもつ
固有名詞として記録する(214)。
次に「met」について参照辞書20を検索し、エントリ
があり(108)、固有名詞ではないから(110)、参照辞
書20から検索されたデータを辞書情報保存テーブル36a
に記録する(112)。
さらに、「Johnson」について参照辞書20を検索する
(106)。「Johnson」はエントリがなく(108)、1文
字目は大文字であるから(116)、辞書未登録固有名詞
の処理を行う(120)。第5図に進み、直前の「met」は
文末候補がないから(300)、「met」を文末でないと認
定し(312)、「Johnson」を性質情報未知(Unknown)
の固有名詞とみなし(314)、辞書登録固有名詞の処理
を行う(316)。第4図に進み、直前の「met」は未登録
の固有名詞ではなく(200)、登録固有名詞でもないか
ら(204)、「Johnson」は単独で性質情報未知(Unknow
n)の固有名詞として記録される。
以上の処理の後、第6図の固有名詞へのデフォルト性
質情報の付与が行われる。
ポインタを先頭の辞書引き単位である「In」にセット
する(400)。固有名詞ではないから(402)、ポインタ
を進め(408)、「Tokyo Station」にセットする。「To
kyo Station」は固有名詞であり(402)、性質情報は前
記の登録固有名詞の処理において「Tokyo Station」全
体を場所、団体としており、未知(Unknown)ではない
から(404)、ポインタを進め(408)、「Station」に
セットする。
「Mr.Walter」は同様に固有名詞であり(402)、性質
情報が未知ではないから(404)、ポインタを進め(40
8)、「met」は固有名詞ではないから(402)、ポイン
タを進める(408)。「Johnson」は固有名詞であり(40
2)、性質情報が未知であるから(404)、デフォルト性
質情報の付与を行い(406)、第7図に示すように、「J
ohnson」に性質情報「人、場所、団体、その他」を付与
する。
以上のように本実施例によれば、英語の入力文を検索
キー文字列に分割して、まず参照辞書20により検索し、
参照辞書20に固有名詞としてエントリがあった場合に登
録固有名詞の処理を行う。登録固有名詞の処理は、直前
の検索キー文字列を考慮し、直前の検索キー文字列が固
有名詞である場合には直前の検索キー文字列および対象
の固有名詞の性質情報を調べ、いずれかの性質情報がな
い場合には他方の性質情報を付与し、いずれも性質情報
がある場合には共通部分をこれらの固有名詞の性質情報
としている。したがって、性質情報のない固有名詞に性
質情報を適切に付与するとともに、付与されている性質
情報をより適切な性質情報にしぼることができる。これ
により後の構文解析において、解析を有効に行うことが
でき、適切な翻訳を行うことができる。
また、参照辞書20に未登録の文字列について、1文字
目が大文字でかつ直前の文字列が文末と判断された場合
には、大文字を小文字に変換して再度参照辞書20を検索
しているから、文頭の文字列についても参照辞書20によ
る検索を行うことができる。さらに、文頭でない箇所に
大文字で始まる文字列が現れた場合には固有名詞と判断
し、この固有名詞の性質情報はその前後に性質情報の登
録された固有名詞がある場合にはこれによって付与され
る。したがって、参照辞書20に未登録の固有名詞をある
程度解析することができる。
さらに、性質情報の付与されていない固有名詞には必
要な性質情報をすべて付与し、その語の処理においてこ
れらの性質情報のうち不要のものを除去するようにして
いるから、あらかじめ性質情報が知られていない固有名
詞または未登録の固有名詞についても解析を行うことが
できる。
また、特定の固有名詞については性質情報を複数個付
与し、前後の固有名詞の性質情報により適切な性質情報
を選択するようにしているから、複数種類の性質情報を
有する固有名詞を解析する場合にその前後関係に応じて
適切な性質情報を選択することができ、入力文の解析を
有効に行うことができる。
効 果 本発明によれば、固有名詞の性質情報を辞書に複数保
存するとともに、辞書に性質情報が未登録の固有名詞に
は複数の性質情報を付与しているから、固有名詞が使用
される状況に応じて適切な性質情報を与え、入力文の解
釈を有効に行うことができる。
【図面の簡単な説明】
第1図は本発明による言語解析装置の一実施例を示すブ
ロック図、 第2図は第1図の参照辞書に記憶されるデータの一例を
示す図、 第3図は第1図の装置の全体の動作を示すフローチャー
ト、 第4図は第3図に示す動作のうち、辞書登録固有名詞の
処理を示すフローチャート、 第5図は第3図に示す動作のうち、辞書未登録固有名詞
の処理を示すフローチャート、 第6図は第3図に示す動作のうち、デフォルト性質情報
の付与処理を示すフローチャート、 第7図は第1図の装置において入力文が処理され、辞書
情報保存テーブルに格納されるデータが変化する例を示
す図である。 主要部分の符号の説明 14……入力処理部 16……単位切出し部 18……デリミッタテーブル 20……参照辞書 22……辞書検索部 24……固有名詞処理部 26……直前文末処理部 28……直前固有名詞処理部 30……固有名詞自身処理部 32……直前固有名詞および固有名詞処理部 34……デフォルト性質情報付与部 36……処理部 36a……辞書情報保存テーブル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】所定の言語の文字列を入力する入力手段
    と、 該入力手段から入力された前記文字列の検索に用いられ
    る辞書手段と、 前記入力された文字列について該辞書手段を検索する検
    索手段と、 前記入力された文字列に対して、文脈に応じて変化する
    性質を表わす性質情報が前記辞書手段に登録されている
    か否かを判断し、前記文字列の性質情報が前記辞書手段
    に登録されているときには、登録されている性質情報に
    基づいて、当該文字列の解析を行なう解析手段とを有
    し、 前記解析手段は、前記文字列の性質情報が前記辞書手段
    に登録されており、かつ、当該文字列の前および/また
    は後の文字列についても前記辞書手段に性質情報が登録
    されているときには、当該文字列とその前および/また
    は後の文字列との双方に共通の性質情報を、当該文字列
    の性質情報としてしぼり込み、これに基づいて、当該文
    字列の解析を行なうことを特徴とする言語解析装置。
  2. 【請求項2】特許請求の範囲第1項記載の装置におい
    て、前記解析手段は、前記入力された文字列に対して、
    性質情報が前記辞書手段に登録されているか否かを判断
    した結果、前記文字列の性質情報が前記辞書手段に登録
    されていないときには、当該文字列の前および/または
    後の文字列の性質情報を用いて、当該文字列の性質情報
    を付与し、当該文字列の解析を行なうことを特徴とする
    言語解析装置。
  3. 【請求項3】特許請求の範囲第2項記載の装置におい
    て、前記文字列の性質情報が前記辞書手段に登録されて
    いないときに、当該文字列の前および/または後の文字
    列の性質情報を用いて当該文字列の性質情報を付与でき
    ないときには、当該文字列に、必要と思われる全ての性
    質情報を付与し、前記辞書手段に登録することを特徴と
    する言語解析装置。
  4. 【請求項4】特許請求の範囲第1項ないし第3項のいず
    れかに記載の装置において、前記解析手段により性質情
    報の付与される前記文字列と、該文字列の前および/ま
    たは後の文字列は、固有名詞であることを特徴とする言
    語解析装置。
JP61243197A 1986-10-03 1986-10-15 言語解析装置 Expired - Lifetime JPH0821033B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP61243197A JPH0821033B2 (ja) 1986-10-15 1986-10-15 言語解析装置
NL8702359A NL8702359A (nl) 1986-10-03 1987-10-02 Taal analyse inrichting.
DE19873733674 DE3733674A1 (de) 1986-10-03 1987-10-05 Sprachanalysator
FR8713742A FR2604814B1 (fr) 1986-10-03 1987-10-05 Analyseur de langage
US07/714,990 US5225981A (en) 1986-10-03 1991-06-14 Language analyzer for morphemically and syntactically analyzing natural languages by using block analysis and composite morphemes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61243197A JPH0821033B2 (ja) 1986-10-15 1986-10-15 言語解析装置

Publications (2)

Publication Number Publication Date
JPS6398774A JPS6398774A (ja) 1988-04-30
JPH0821033B2 true JPH0821033B2 (ja) 1996-03-04

Family

ID=17100275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61243197A Expired - Lifetime JPH0821033B2 (ja) 1986-10-03 1986-10-15 言語解析装置

Country Status (1)

Country Link
JP (1) JPH0821033B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6190270A (ja) * 1984-10-09 1986-05-08 Sharp Corp 辞書機能を用いた翻訳方式

Also Published As

Publication number Publication date
JPS6398774A (ja) 1988-04-30

Similar Documents

Publication Publication Date Title
KR100453227B1 (ko) 번역 지원 시스템에서의 유사 문장 검색 방법
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JP2742115B2 (ja) 類似文書検索装置
JPH1145241A (ja) かな漢字変換システムおよびそのシステムの各手段としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0351020B2 (ja)
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JPH0821033B2 (ja) 言語解析装置
JPH0821031B2 (ja) 言語解析装置
JPH06124305A (ja) 文書検索方法
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JPH0821034B2 (ja) 言語解析装置
JP2632806B2 (ja) 言語解析装置
JP4059501B2 (ja) 自然語辞書更新装置
JPH0827803B2 (ja) テキストベース検索方法
JPH03229367A (ja) テキストベース検索方式
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JPH0320866A (ja) テキストベース検索方式
JPH0225973A (ja) 機械翻訳装置
JPH03161865A (ja) 文章の検索方法
JPS6395570A (ja) 言語解析方式
JPH103481A (ja) 文書検索装置
JP2006134051A (ja) 翻訳装置、翻訳方法およびプログラム
Singh et al. INTELLIGENT WORD AND PHRASE ANALYSIS AND PREDICTION TOOL
JPH0345423B2 (ja)
JP2002297590A (ja) 翻訳システム、翻訳方法およびプログラム

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term