JP3300142B2 - 自然言語処理装置 - Google Patents

自然言語処理装置

Info

Publication number
JP3300142B2
JP3300142B2 JP31851093A JP31851093A JP3300142B2 JP 3300142 B2 JP3300142 B2 JP 3300142B2 JP 31851093 A JP31851093 A JP 31851093A JP 31851093 A JP31851093 A JP 31851093A JP 3300142 B2 JP3300142 B2 JP 3300142B2
Authority
JP
Japan
Prior art keywords
semantic analysis
verb
information
sentence
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31851093A
Other languages
English (en)
Other versions
JPH07175808A (ja
Inventor
美幸 須之内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP31851093A priority Critical patent/JP3300142B2/ja
Publication of JPH07175808A publication Critical patent/JPH07175808A/ja
Application granted granted Critical
Publication of JP3300142B2 publication Critical patent/JP3300142B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は自然言語処理装置に係
り、特に、情報検索装置、機械翻訳装置、文書要約支援
装置などに利用可能な省略表現補完を行う自然言語処理
装置に関する。
【0002】
【従来の技術】一般に、複数の文から構成される文章を
処理する技術は、文脈処理技術と呼ばれており、その中
の技術のひとつとして、指示代名詞の照応先を同定する
技術や、文脈による語の省略を処理する技術が挙げられ
る。特に、日本語の表現は文脈による名詞の省略が多い
という特性があり、情報検索、機械翻訳及び文書要約等
を行う場合の障害となっていた。
【0003】文脈による語の省略を処理する従来技術と
しては、以下の方法が提案されている。 (1)自然言語による情報検索において、入力文を解析
し、先行文脈中の名詞句と兄弟関係にある名詞句をその
入力文から検出することにより省略された名詞句を補完
する「文脈処理方式」(特開平4−220767号公
報)。 (2)会話システムにおいて、指示可能な対象が複数存
在する場合に、入力自然言語を格フレーム表現に変換
し、各対象物間の相対距離を記憶し、指示対象となる対
象物の同定を対象物の相対的な距離関係で行なう「会話
システム」(特開平4−306769号公報)。
【0004】
【発明が解決しようとする課題】しかしながら、前記
(1)に述べた文脈処理方式では、単語間の兄弟関係に
着目したデータである機能表現テーブルを利用すること
により、名詞句の補完を行なっており、補完の範囲対象
が限定される。したがって、入力された名詞が先行文脈
中の名詞句と兄弟間の関係を持たない場合は、表示され
た入力文字列に対して省略された名詞句の補完処理が行
なえないという問題点があった。
【0005】また、前記(2)に述べた方法では、指示
対象となる対象物の同定を各対象物の相対的な距離を用
いて行なっているが、会話文を対象としているために、
参照する格フレームを会話履歴の中の最新の格フレーム
表現中に限っている。しかしながら、現実の文章では、
直前の文の情報に限らず、先行する文章全体による省略
が起こり得る。したがって、入力文の指示対象が最新よ
り前の格フレームにおける対象物を指示している場合は
省略語の補完処理が行なえないという問題点があった。
【0006】以上の問題点に鑑み、本発明の課題は、複
数の文からなるある話題を提供する文章を対象に、省略
された名詞句に対して、名詞の兄弟間の関係に限定され
ることなく、また直前の格フレームに限定せず、先行す
るの文章全体の情報に基づいて、指示された名詞句の補
完を行なうことができる自然言語処理装置を提供するこ
とである。
【0007】
【課題を解決するための手段】前記課題を解決するた
め、本発明は次の構成を有する。すなわち、本発明は、
文を入力する入力手段と、単語に関する情報を格納する
単語情報格納手段と、名詞関連語辞書及び動詞関連語辞
書を含み、単語間の関係に関する情報を格納するシソー
ラス情報格納手段と、単語の属性情報を格納する属性情
報格納手段と、前記入力手段から入力された複数の文
を、前記単語情報、シソーラス情報、属性情報を参照す
ることにより、1文ずつ解析し、その意味解析結果を抽
出する意味解析手段と、前記意味解析手段によって解析
された意味解析結果を格納する意味解析結果格納手段
と、前記シソーラス情報を基に、意味解析結果中の省略
された語句の補完を行なう省略表現補完処理手段と、前
記省略表現補完処理手段による省略表現の補完結果を表
示する省略結果出力手段とを備えた自然言語処理装置で
あって、前記シソーラス情報格納手段に含まれる動詞関
連語辞書が、動詞の時系列関係を格納する動詞関連語辞
書であり、前記省略表現補完処理手段が、前記意味解析
結果から処理対象となる意味解析結果を1文ずつ読み込
み、動詞を核とした格関係表現毎に、省略された名詞句
を含む格要素を検出し、前記動詞関連語辞書から読み出
された動詞の時系列関係に基づいて、処理対象文の動詞
と時系列関係を持つ動詞を先行する文の意味解析結果か
ら抽出し、該抽出された動詞の格要素に基づいて、省略
された名詞句を同定し、該名詞句により省略表現を補完
する省略表現補完処理手段であることを特徴とする自然
言語処理装置である。
【0008】また本発明においては、前記意味解析手段
が、動詞を核として、WHO(主体)、WHAT(客
体)、WHEN(時間)、WHERE(場所)、WHY
(理由)及びHOW(方法)からなる5W1H相当句と
の格関係で表現される意味を解析する意味解析手段であ
ることができる。
【0009】
【作用】本発明の自然言語処理装置では、単語情報格納
手段は意味解析処理に利用する単語に関する情報を格納
し、シソーラス情報格納手段は、単語情報格納手段に格
納されている各単語間の意味的関係に関する情報を格納
する。シソーラス情報格納手段は名詞シソーラス辞書と
動詞シソーラス辞書から構成され、名詞シソーラス辞書
は名詞間の上位−下位関係に関する情報を格納し、動詞
シソーラス辞書は動詞の時系列関係に関する情報を格納
する
【0010】また、属性情報格納手段は、単語情報格納
手段に格納されている単語の属性関係に関する情報を格
納する。
【0011】入力手段は複数の文を1文ずつ入力する。
意味解析手段は、入力手段から入力された複数の文を、
前記単語情報格納手段の文法情報を用いて1文ずつ形態
素解析する。次いで、前記単語情報格納手段の用言パタ
ーン情報、シソーラス情報格納手段、属性情報格納手段
を使用して意味解析し、動詞を核とした5W1H相当語
句と格関係で表現される意味解析結果を意味解析結果格
納手段に格納する。
【0012】省略情報補完処理手段は、前記意味解析結
果中から対象となる意味解析結果を1文ずつ読み込む。
次いで、動詞を核にした5W1H相当語句との格関係表
現の中で名詞句が省略されている格関係を検出する。前
記動詞シソーラス辞書の動詞の時系列関係を基に、対象
となる動詞と時系列関係を持つ動詞を、対象となる文に
先行する文の意味解析結果から抽出する。次いで、その
動詞の5W1H(WHO,WHAT,WHEN,WHE
RE,WHY,HOW)相当語句との格関係表現を基に
省略された名詞句を同定し、対象となる意味解析結果の
中の省略された名詞句の埋め込み処理を行なう。次い
で、前記省略情報補完処理によって補完処理された省略
表現補完結果を省略情報補完処理結果出力手段から出力
する。
【0013】このように、複数の文から構成される文章
において、動詞の時系列関係を記述した動詞シソーラス
辞書を利用することにより、先行する全ての文を参照し
て、省略された名詞句の補完処理を行なうことが可能に
なり、文の構造を正しく抽出することが可能になる。
【0014】
【実施例】以下、図面を参照して、本発明の自然言語処
理装置の実施例を説明する。図1は、本発明の自然言語
処理装置における一実施例の構成を示すブロック図であ
る。図1の自然言語処理装置は、(1)文を入力する入
力部101、(2)前記入力部に接続された意味解析部
102、(3)前記意味解析部102に接続された、文
を解析するために必要な単語に関する情報を格納する単
語情報格納部106、(4)前記意味解析部102と後
述の省略表現補完処理部104に接続され、単語間の関
係に関する情報を格納し、後述の名詞シソーラス辞書1
08と動詞シソーラス辞書109から構成されるシソー
ラス辞書107、(5)前記シソーラス辞書107を構
成する名詞間の関係に関する情報を格納する名詞シソー
ラス辞書108、(6)同じく動詞間の時系列的な関係
に関する情報を格納する動詞シソーラス辞書109、
(7)意味解析部102に接続され、所定の属性情報を
格納する属性辞書110、(8)前記意味解析部に10
2接続された意味解析結果格納部103と、(9)意味
解析結果格納部103に接続され、前記シソーラス辞書
情報を基に、意味内容表現中の省略された語句の補完を
行なう省略表現補完処理部104、(10)前記省略表
現補完処理部104による省略表現の補完結果を表示す
る省略情報補完結果出力部105とによって構成され
る。
【0015】次に、上記構成の本実施例の動作を説明す
る。入力部101は複数文からなる文章の1文を読み込
み、意味解析部102は単語情報格納部106の文法情
報を用いて形態素解析を行ない、さらに単語辞書106
の意味情報及びシソーラス辞書107を用いて構文解
析、意味解析を行ない、意味解析結果格納部103にそ
の解析結果を格納する。省略情報補完処理部104は、
前記意味解析結果格納部103から意味解析結果を読み
込む。次いで、意味解析結果の用言毎に、図2のフロー
トチャートに示すように、動詞シソーラス辞書109の
時系列関係を基に前述の文の意味解析結果から省略され
ている名詞句を格要素毎に埋め込み、各名詞句の補完処
理を行なう。省略情報補完結果出力部105は、省略情
報補完処理部104によって行なわれた省略情報の補完
結果を出力する。上述した処理は全文に対して行なう。
【0016】次に図2のフロートチャートを参照して、
図1の自然言語処理装置の動作を説明する。まず対象文
の解析結果を対象意味解析結果読み取り処理で読み込ん
で(ステップS1)、対象文に前述する文があるかどう
かを判断(ステップS2)し、前述する文がある場合
は、対象文の動詞毎に、動詞と格関係でリンクされる5
W1H相当語句が未確定の格を検出(ステップS3)す
る。次いで、動詞シソーラス情報参照処理で各動詞の時
系列関係を参照(ステップS4)し、対象文に先行する
文の意味解析結果の動詞を順番に参照(ステップS5)
し、その結果を比較処理(ステップS6)し、上記ステ
ップの比較処理で同一であれば、その動詞を含む意味解
析結果の格要素を参照(ステップS7)する。
【0017】次いで、対象文の意味解析結果中の未確定
の格要素と比較処理を行ない(ステップ8)、比較処理
で同一であれば、両要素の名詞の制約条件を参照(ステ
ップS9)し、名詞シソーラス辞書参照により、両名詞
句間が上位−下位の関係を持つかどうかの判定処理を行
ない(ステップS10)、上位−下位関係を持つ場合は
その内容を未確定の格要素情報欄に埋め込み記入(ステ
ップS11)する。上記ステップ7の比較処理で同一で
なかった場合は、さらに先行する文の動詞参照処理を行
なう。この動詞参照処理は、対象文に先行する文を直前
文から昇順に参照し、対象文に先行する文章全体を検索
対象とする。
【0018】次に、図3、図4及び図5を参照して、本
発明の自然言語処理装置における省略情報補完処理を説
明する。図3に示すように、例文1は「A社はi486
を搭載するパソコンを開発した。」(以下、文31と称
する)、例文2は「1992年3月に日本で発売す
る。」(以下、文32と称する)を示している。まず、
先行する文31において、A社がパソコンを開発したこ
とが明示されているので、文32では、「だれ(WH
O)」という名詞句と「何(WHAT)」をという名詞
句が省略されている。しかし、文脈より「もの」を「開
発」した後にその「もの」を「発売」するという時系列
上の関係が明らかであるため、文32において省略され
た名詞句を補完することができる。
【0019】次に、本実施例における省略補完処理を具
体的に説明する。本実施例では、単語辞書、シソーラス
辞書を使用して、文31を意味解析部で処理し、意味解
析結果33を意味解析結果格納部に格納しておく。図4
に意味解析処理に使用した単語辞書の用言パターン情報
の内容の一例を示す。用言パターンとは、例えば「開
発」35という動詞が取り得る格関係と名詞の制約条件
を表す。なお、図4の文31の意味解析結果33におい
て網がけになっている格要素は、文31を意味解析結果
からは抽出されないが、「開発」という動詞が取り得る
格関係情報を表している。このような文から情報が抽出
されない格要素は単語辞書の用言パターン情報を基に名
詞句を仮に格納しておく。文32も同様に処理結果34
を得て格納しておく。
【0020】次に、文31の処理結果33を対象検索結
果読み取り処理で読み込み、対象文に先行する文がある
かどうかを処理する。先行する文がない場合は、参照で
きる情報がないので省略処理を行なわない。同様に、文
32の解析結果34を読み込む。先行する文があれば、
解析結果の中の動詞を核とした5W1H相当語句との格
関係表現の中で格要素が未確定の格要素を検出する。例
えば、意味解析結果34から、動詞「発売」36を核と
した5W1H相当語句との格関係表現の中で格要素が未
確定である「who格」を検出する。次いで、動詞シソ
ーラス辞書参照処理で前記動詞「発売」36の時系列関
係を参照し、「発売」と時系列関係にある「商品化」を
抽出する。
【0021】図5に本実施例が参照する動詞シソーラス
情報の内容の一部を示す。次に、前述の文の意味解析結
果33の動詞を参照する。意味解析結果33の動詞は
「商品化」と同一ではないので、再度動詞シソーラスの
時系列関係を参照し、「商品化」と時系列関係を持つ
「開発」を参照し、同様に意味解析結果の動詞参照処理
を行なう。意味解析結果33の動詞が「開発」と同一で
あれば、動詞シソーラスの格パターン情報に基づいて動
詞「開発」35を含む意味解析結果33の格要素を参照
する。例えば、「開発」35の格要素「who格」が意
味解析結果34における未確定の格要素「who格」と
格要素が同一であるので、次に、両格要素の名詞句の制
約条件を参照処理する。本実施例では詳細を明示してい
ないが、名詞シソーラス情報を参照すると、意味解析結
果33における名詞句「A社」と意味解析結果34にお
ける名詞の制約条件「組織」が上位−下位の関係を持つ
ので、「A社」を「発売」36の格要素「who格」の
情報欄に埋め込み処理する。同様に、全ての動詞毎に未
確定格要素の省略情報を補完処理され、省略情報補完処
理結果出力部から処理結果37が出力される。
【0022】
【発明の効果】以上説明したように、本発明の自然言語
処理装置は、動詞の時系列関係を記述した動詞シソーラ
ス辞書及び名詞間の関係を記述した名詞シソーラス辞書
と、言語解析した解析結果及び前述の両シソーラスを参
照して省略情報を補完する処理手段を備えているので、
複数の文からなるひとつの文章において、直前の文に拘
らず、文脈全体の文を利用して省略情報を補完すること
が可能になる。これにより、文の構造を正しく抽出する
ことが可能になり、それを基に複数の文から構成される
文章の構造をも正しく抽出することができるという効果
がある。
【図面の簡単な説明】
【図1】本発明に係る自然言語処理装置の一実施例の構
成を示すブロック図である。
【図2】図1の自然言語処理装置による省略情報補完処
理の動作を説明するためのフローチャートである。
【図3】省略情報補完処理の具体的な説明図である。
【図4】単語辞書の用言パターン情報の内容の一例を示
す説明図である。
【図5】動詞シソーラス辞書の内容の一部を示す説明図
である。
【符号の説明】
101 入力部 102 意味解析部 103 意味解析結果格納部 104 省略情報補完処理部 105 省略情報補完結果出力部 106 単語辞書 107 シソーラス辞書 108 動詞シソーラス辞書 109 名詞シソーラス辞書 110 属性辞書
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 17/20 - 17/30 JICSTファイル(JOIS)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文を入力する入力手段と、 単語に関する情報を格納する単語情報格納手段と、 名詞関連語辞書及び動詞関連語辞書を含み、単語間の関
    係に関する情報を格納するシソーラス情報格納手段と、 単語の属性情報を格納する属性情報格納手段と、 前記入力手段から入力された複数の文を、前記単語情
    報、シソーラス情報、属性情報を参照することにより、
    1文ずつ解析し、その意味解析結果を抽出する意味解析
    手段と、 前記意味解析手段によって解析された意味解析結果を格
    納する意味解析結果格納手段と、 前記シソーラス情報を基に、意味解析結果中の省略され
    た語句の補完を行なう省略表現補完処理手段と、 前記省略表現補完処理手段による省略表現の補完結果を
    表示する省略結果出力手段とを備えた自然言語処理装置
    であって、 前記シソーラス情報格納手段に含まれる動詞関連語辞書
    が、動詞の時系列関係を格納する動詞関連語辞書であ
    り、 前記省略表現補完処理手段が、前記意味解析結果から処
    理対象となる意味解析結果を1文ずつ読み込み、動詞を
    核とした格関係表現毎に、省略された名詞句を含む格要
    素を検出し、前記動詞関連語辞書から読み出された動詞
    の時系列関係に基づいて、処理対象文の動詞と時系列関
    係を持つ動詞を先行する文の意味解析結果から抽出し、
    該抽出された動詞の格要素に基づいて、省略された名詞
    句を同定し、該名詞句により省略表現を補完する省略表
    現補完処理手段である ことを特徴とする自然言語処理装
    置。
  2. 【請求項2】 請求項1において、 前記意味解析手段が、動詞を核として、WHO(主
    体)、WHAT(客体)、WHEN(時間)、WHER
    E(場所)、WHY(理由)及びHOW(方法)からな
    る5W1H相当句との格関係で表現される意味を解析す
    る意味解析手段であることを特徴とする自然言語処理装
    置。
JP31851093A 1993-12-17 1993-12-17 自然言語処理装置 Expired - Fee Related JP3300142B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31851093A JP3300142B2 (ja) 1993-12-17 1993-12-17 自然言語処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31851093A JP3300142B2 (ja) 1993-12-17 1993-12-17 自然言語処理装置

Publications (2)

Publication Number Publication Date
JPH07175808A JPH07175808A (ja) 1995-07-14
JP3300142B2 true JP3300142B2 (ja) 2002-07-08

Family

ID=18099924

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31851093A Expired - Fee Related JP3300142B2 (ja) 1993-12-17 1993-12-17 自然言語処理装置

Country Status (1)

Country Link
JP (1) JP3300142B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09179875A (ja) * 1995-12-25 1997-07-11 Sharp Corp 情報検索装置
JP3001047B2 (ja) 1997-04-17 2000-01-17 日本電気株式会社 文書要約装置
KR20000023961A (ko) 1999-12-22 2000-05-06 김정태 정보 모델링방법 및 데이터베이스 검색시스템
JP5948132B2 (ja) * 2012-04-27 2016-07-06 日本放送協会 情報処理装置およびプログラム
CN109791766A (zh) * 2016-10-06 2019-05-21 夏普株式会社 对话装置、对话装置的控制方法及控制程序

Also Published As

Publication number Publication date
JPH07175808A (ja) 1995-07-14

Similar Documents

Publication Publication Date Title
JP3220560B2 (ja) 機械翻訳装置
US5020021A (en) System for automatic language translation using several dictionary storage areas and a noun table
EP0953192B1 (en) Natural language parser with dictionary-based part-of-speech probabilities
EP0886226B1 (en) Linguistic search system
EP1899835B1 (en) Processing collocation mistakes in documents
JP2002215617A (ja) 品詞タグ付けをする方法
US8489384B2 (en) Automatic translation method
JP3300142B2 (ja) 自然言語処理装置
JPH05120324A (ja) 言語処理方式
JPS59140582A (ja) 自然言語翻訳援助方式
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JP2004287679A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
Neumann et al. Shallow natural language technology and text mining
JP2713354B2 (ja) 話題抽出装置
JP2939348B2 (ja) 画像処理装置
JPS62267872A (ja) 言語解析装置
Sinha Translating News Headings from English to Hindi
JP3244286B2 (ja) 翻訳処理装置
JP2719453B2 (ja) 機械翻訳装置
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP2901977B2 (ja) 翻訳装置
JPS6389976A (ja) 言語解析装置
JPH1115846A (ja) 情報検索装置および記録媒体
JP2661312B2 (ja) 文書検索装置
KR19990053161A (ko) 의미기반 정보검색을 위한 관련동사의 검색방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080419

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100419

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100419

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110419

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120419

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120419

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130419

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees