JPH0869466A - 自然言語解析装置 - Google Patents

自然言語解析装置

Info

Publication number
JPH0869466A
JPH0869466A JP6205764A JP20576494A JPH0869466A JP H0869466 A JPH0869466 A JP H0869466A JP 6205764 A JP6205764 A JP 6205764A JP 20576494 A JP20576494 A JP 20576494A JP H0869466 A JPH0869466 A JP H0869466A
Authority
JP
Japan
Prior art keywords
natural language
pronoun
knowledge base
semantic
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6205764A
Other languages
English (en)
Inventor
Ko Arima
甲 有馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Electric Industries Ltd
Original Assignee
Sumitomo Electric Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Electric Industries Ltd filed Critical Sumitomo Electric Industries Ltd
Priority to JP6205764A priority Critical patent/JPH0869466A/ja
Publication of JPH0869466A publication Critical patent/JPH0869466A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 従来に比してより高精度に代名詞の先行詞を
同定し得る自然言語解析装置の提供を目的とする。 【構成】 自然言語入力文を単語単位に分解して各単語
の品詞を決定する前処理部2と、前処理部2により分解
された各単語の配列を文法規則と照合して文法的構造を
解析する構文解析部3と、自然言語に関して、各単語相
互間の意味的階層構造を推論規則型構造に変換したデー
タ構造を有する知識ベース1と、構文解析部3による構
文解析結果に従って単語間の意味的構造を解析し、知識
ベース1に格納する意味解析部4とを備えている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は所謂エキスパートシステ
ムを利用した自然言語解析装置に関し、特に代名詞を含
む文を解析する場合の先行詞の決定手法を改善した自然
言語解析装置に関する。
【0002】
【従来の技術】コンピュータを利用した機械翻訳の分野
においては、まず翻訳すべき原文を機械に入力して解析
する必要がある。そのための自然言語解析装置は種々提
案され、開発されている。そのような装置の一つとし
て、特に代名詞を含む文を対象とする場合の先行詞の決
定手法に着目した装置として、特開平5-128147号公報に
開示された発明がある。
【0003】この特開平5-128147号公報に開示された発
明では、代名詞を含む入力文の統語的構造に基づいて代
名詞の先行詞候補を抽出する対象領域をその代名詞より
も前の部分または前後双方の部分のいずれかに決定し、
決定された領域から先行詞候補を抽出し、これらの候補
の内から代名詞の文法的素性及び意味的素性を利用して
先行詞を同定している。
【0004】たとえば、以下のような二つの英文(1),
(2) (1) 「A little boy was selling strawberries.」 (2) 「After he tried some, John fell down.」 が入力された場合の、(2) に含まれる代名詞「he」の先
行詞「John」の同定は以下のようにして行なわれる。
【0005】まずこの場合、先行詞候補を抽出する対象
となる領域が当該代名詞「he」の前後の部分に決定さ
れ、先行詞候補として「John」, 「some」, 「strawber
ries」, 「a littli boy」の各名詞が抽出される。そし
て、このようにして抽出された先行詞候補の各名詞につ
いて、文法的素性 (性, 数の情報) 及び意味的素性 (意
味カテゴリ) が代名詞「he」の文法的素性及び意味的素
性と順次照合されていずれかの候補 (この場合は「Joh
n」) が最終的に先行詞として同定される。
【0006】
【発明が解決しようとする課題】このような特開平5-12
8147号公報に開示された発明、あるいは他の従来技術に
おいては、候補が多数残ったり、あるいはそれらの内か
らユーザが最終的な決定を行なう必要がある等の問題が
あった。
【0007】本発明はこのような問題に鑑みてなされた
ものであり、従来に比してより高精度に代名詞の先行詞
を同定し得る自然言語解析装置の提供を目的とする。
【0008】
【課題を解決するための手段】本発明に係る自然言語解
析装置は、自然言語入力文を単語単位に分解して各単語
の品詞を決定する前処理部と、前処理部により分解され
た各単語の配列を文法規則と照合して文法的構造を解析
する構文解析部と、自然言語に関して、各単語相互間の
意味的階層構造を推論規則型構造に変換したデータ構造
を有する知識ベースと、構文解析部による構文解析結果
に従って単語間の意味的構造を解析し、知識ベースに格
納する意味解析部とを備えている。
【0009】
【作用】本発明に係る自然言語解析装置では、前処理部
が入力文中に代名詞が含まれる場合に、当該代名詞と他
の名詞とを知識ベースに与え、知識ベースが、前処理部
から与えられた代名詞の先行詞候補の単語を内部の規則
型知識を用いた推論により選択する。
【0010】
【実施例】以下、本発明をその実施例を示す図面に基づ
いて詳述する。
【0011】図1は本発明に係る自然言語解析装置の基
本的な機能ブロックの構成を示すブロック図であり、所
謂エキスパートシステムを利用したコンピュータシステ
ムで構成されている。
【0012】図1において、参照符号1は知識ベースで
あり、入力された文を解析するために必要な種々のデー
タが格納されている。
【0013】参照符号2は前処理部であり、入力された
自然言語文を単語単位に分解し、各単語の品詞を決定し
てそれぞれに品詞情報を付加して内部のバッファメモリ
に記憶する。但し、この前処理部2では、通常の談話理
解の範囲と見做される5文程度の自然言語文を入力順に
記憶する。
【0014】この前処理部2に代名詞を含む文が入力さ
れると、代名詞は属性付き(man, woman, thing) の変数
に変換される。なお、変数の値は、バッファメモリに記
憶されている単語単位の解析結果の内から新たに入力さ
れた順序に従って候補が求められる。
【0015】参照符号3は構文解析部であり、入力文を
前処理部2で分解した各単語の配列順序等を予め記憶し
ている文法規則と照合することにより構文解析を行なっ
てその結果を出力する。
【0016】参照符号4は意味解析部であり、構文解析
部3による解析結果に従って、単語間の意味的構造を解
析し、知識ベース1に新たなデータとして格納させる。
【0017】ところで、知識ベース1内の各単語に関す
るデータは、意味的階層構造を規則型知識に変換したデ
ータ構造として格納されている。たとえばこのシステム
が本来的に有している基本名詞は、図2の模式図に示さ
れているように、「person」, 「thing 」の二つの型を
最上位とし、「person」の次位に「man 」, 「woman」
という二つの型を位置させ、更に「thing 」, 「man
」, 「woman 」それぞれの下位に種々の一般名詞、た
とえば「boy 」, 「policeman 」, 「actress 」等を位
置させたような意味的階層構造のデータ構造を有する。
【0018】このような本来は意味的階層構造を有する
データを、たとえば、「boy 」という名詞が「man 」の
下位の型であるというデータ構造を規則(boy→man)とい
う規則型知識に変換して知識ベース1が記憶している。
図2に対応する規則型データ構造の例を図3の模式図に
示す。
【0019】ところで、基本名詞以外の一般名詞及び固
有名詞に関しては、前処理部2から新たな知識を入力し
て知識ベース1に追加登録することも可能である。たと
えば、一般名詞であれば規則(schoolboy→boy)を与える
ことにより、意味解析部4から知識ベース1へ新たな規
則型知識として登録される。また固有名詞に関しては、
たとえば事実(John →schoolboy)を与えることにより、
意味解析部4から知識ベース1へ新たな事実型知識とし
て登録される。
【0020】このようなデータ構造を有する本発明の自
然言語解析装置による代名詞の先行詞を同定する際の動
作は以下の如くである。
【0021】いまたとえば、前述の従来例と同様の以下
のような二つの英文(1), (2) (1) 「A little boy was selling strawberries.」 (2) 「After he tried some, John fell down.」 が入力された場合の、(2) に含まれる代名詞「he」の先
行詞「John」の同定は以下のようにして行なわれる。
【0022】(2) の文が前処理部2に入力されると、代
名詞「he」の存在が検出され、属性付き(man, woman, t
hing) の変数に変換される。これに対して(1) 及び(2)
の文では名詞は「John」, 「some」, 「strawberrie
s」, 「a littli boy」が存在することが前処理部2に
より検出され、知識ベース1に与えられる。
【0023】知識ベース1では、「he」という代名詞の
属性からそれの先行詞になり得る名詞は「man 」の下位
に位置する名詞であることを推論し、「John」, 「a li
ttliboy」の二つのみを候補として選択する。以降の解
析処理はこれらの二つの候補に関してのみ行なわれる。
【0024】
【発明の効果】以上に詳述したように、本発明の自然言
語解析装置によれば、代名詞の先行詞となり得る候補が
複数存在する場合は、属性を持った変数を含む検索語の
リストを作成し、知識ベース内に予め登録されている知
識を用いて検索を行なうことにより、変数の属性と知識
ベース内に登録されている単語の上位の型とが一致する
のものみに限定することが出来るので、代名詞の先行詞
の候補の数を文法的解析のみによる場合に比して減少さ
せることが可能になる。
【図面の簡単な説明】
【図1】本発明に係る自然言語解析装置の基本的な機能
ブロックの構成を示すブロック図である。
【図2】本発明に係る自然言語解析装置の知識ベースに
格納されている各単語相互間の意味的階層構造を示す模
式図である。
【図3】本発明に係る自然言語解析装置の知識ベースに
おける各単語の規則型データ構造の例を示す模式図であ
る。
【符号の説明】
1 知識ベース 2 前処理部 3 構文解析部 4 意味解析部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 自然言語入力文を単語単位に分解して各
    単語の品詞を決定する前処理部と、 前記前処理部により分解された各単語の配列を文法規則
    と照合して文法的構造を解析する構文解析部と、 自然言語に関して、各単語相互間の意味的階層構造を推
    論規則型構造に変換したデータ構造を有する知識ベース
    と、 前記構文解析部による構文解析結果に従って単語間の意
    味的構造を解析し、前記知識ベースに格納する意味解析
    部とを備え、 前記前処理部は入力文中に代名詞が含まれる場合に、当
    該代名詞と他の名詞とを前記知識ベースに与え、 前記知識ベースは、前記前処理部から与えられた代名詞
    の先行詞候補の単語を内部の規則型知識を用いた推論に
    より選択すべくなしてあることを特徴とする自然言語解
    析装置。
JP6205764A 1994-08-30 1994-08-30 自然言語解析装置 Pending JPH0869466A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6205764A JPH0869466A (ja) 1994-08-30 1994-08-30 自然言語解析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6205764A JPH0869466A (ja) 1994-08-30 1994-08-30 自然言語解析装置

Publications (1)

Publication Number Publication Date
JPH0869466A true JPH0869466A (ja) 1996-03-12

Family

ID=16512287

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6205764A Pending JPH0869466A (ja) 1994-08-30 1994-08-30 自然言語解析装置

Country Status (1)

Country Link
JP (1) JPH0869466A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016068690A1 (en) * 2014-10-27 2016-05-06 Mimos Berhad Method and system for automated semantic parsing from natural language text
CN106372054A (zh) * 2015-07-24 2017-02-01 中兴通讯股份有限公司 一种多语言语义解析的方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016068690A1 (en) * 2014-10-27 2016-05-06 Mimos Berhad Method and system for automated semantic parsing from natural language text
CN106372054A (zh) * 2015-07-24 2017-02-01 中兴通讯股份有限公司 一种多语言语义解析的方法和装置
CN106372054B (zh) * 2015-07-24 2020-10-09 中兴通讯股份有限公司 一种多语言语义解析的方法和装置

Similar Documents

Publication Publication Date Title
CN110543639B (zh) 一种基于预训练Transformer语言模型的英文句子简化算法
US4931935A (en) User interface system for permitting natural language interaction with an information retrieval system
JP3266246B2 (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US6721697B1 (en) Method and system for reducing lexical ambiguity
US7949676B2 (en) Information search system, information search supporting system, and method and program for information search
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
KR20190133931A (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
WO2021100902A1 (ko) 문장 패러프레이즈 인식 기반 대화 시스템 답변 방법
KR100481598B1 (ko) 복합 형태소 분석 장치 및 방법
KR100597437B1 (ko) 하이브리드 정답유형 인식 장치 및 방법
CN113157887A (zh) 知识问答意图识别方法、装置、及计算机设备
Nakov et al. Guessing morphological classes of unknown German nouns.
JPH0869466A (ja) 自然言語解析装置
KR100327115B1 (ko) 부분 대역 패턴 데이터베이스에 기반한 번역문 생성장치및 그 방법
JP3326646B2 (ja) 機械翻訳システム用辞書・ルール学習装置
KR100431190B1 (ko) 주제 적응 품사 태깅 시스템 및 방법
Vickery et al. An application of language processing for a search interface
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
KR100286649B1 (ko) 연어패턴에 기초한 어휘 변환방법
Loftsson Tagging and parsing Icelandic text
Abdelkader et al. How Existing NLP Tools of Arabic Language Can Serve Hadith Processing
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JP3324910B2 (ja) 日本語解析装置
JP4103311B2 (ja) 自然言語処理装置及び方法
JP2600081B2 (ja) 自然言語対話装置