JPH0340067A - 文章検索方式 - Google Patents

文章検索方式

Info

Publication number
JPH0340067A
JPH0340067A JP1176516A JP17651689A JPH0340067A JP H0340067 A JPH0340067 A JP H0340067A JP 1176516 A JP1176516 A JP 1176516A JP 17651689 A JP17651689 A JP 17651689A JP H0340067 A JPH0340067 A JP H0340067A
Authority
JP
Japan
Prior art keywords
analysis
result
input sentence
retrieval
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1176516A
Other languages
English (en)
Other versions
JP2830097B2 (ja
Inventor
Akitoshi Okumura
明俊 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1176516A priority Critical patent/JP2830097B2/ja
Publication of JPH0340067A publication Critical patent/JPH0340067A/ja
Application granted granted Critical
Publication of JP2830097B2 publication Critical patent/JP2830097B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は自然言語処理システムにおいて文章を検索する
ための方法に関する。
〔従来の技術〕
従来、文章を検索するための検索条件として表層文字列
の正規表現によるものがある。表層文字による検索では
、部分文字列として文中に含まれているものも検索され
る。また、形態素解析を用いて形態素単位での検索を行
なう方式もあるが、一般に形態素には多品調性や多義性
が存在するので必要とする文以外のものが検索されるこ
とが多い。
〔発明が解決しようとする課題〕
上記のような従来の方法では結果として不要な文を多く
検索するので、必要な文のみを得るためには再度抽出作
業を行なう必要があるという欠点がある。
〔課題を解決するための手段〕
本発明による文章検索方式は、入力文を読み込む手段と
、前記入力文に対する辞書引きをする手段と、辞書引き
後の辞書情報を用いて前記入力文を解析する手段とを有
する自然言語解析システムにおいて、正規表現と辞書情
報と構文情報と意味情報とを組み合せた検索条件を指定
する手段と。
前記入力文の形態素解析結果と構文解析結果と意味解析
結果とに基づいて前記入力文と前記検索条件とを照合す
る手段とを具備する。
〔実施例〕
以下、本発明について図面を参照しながら説明する。
第1図は本発明による文章検索方式の一実施例を示すブ
ロック図である。同図において、通信線01を通じて入
力文読み込み部1に読み込まれた自然言語入力文は通信
線12を介して形態素解析部2に伝達される。形態素解
析部2は通信線23を介して入力文に対する辞書情報を
辞書部3より得て形態素解析を行ない、通信線25およ
び26を介して形態素解析結果を検索条件照合部5およ
び構文解析部6に伝達する。構文解析部6は構文解析を
行ない、通信線65および67を介して構文解析結果を
検索条件照合部5および意味解析部7に伝達する。意味
解析部7は意味解析を行ない、通信線75を介して意味
解析結果を検索条件照合部5に伝達する。
また、通信線04を通じて検索条件指定部4に読み込ま
れた検索条件は通信線45を介して検索条件照合部5に
伝達される。検索条件照合部5は形態素解析結果と構文
解析結果と意味解析結果とを用いて入力文と検索条件と
を照合し、条件を満足するなら通信線50を介して出力
する。
第2図は検索条件の例とその条件に従って検索された文
章の例を示す説明図である。検索条件は表層文字列とそ
の文字列に対する辞書情報と構文情報をコンマでならべ
て括弧で囲んで記述する。
括弧で囲まれていない表層文字列は部分文字列として文
中に含まれてもよい。辞書情報は属性と属性値の形式で
表現する。「品詞・名詞」の指定はその形態素の品詞が
名詞であることを示す。「意味・人工物」指定はその形
態素の意味が人工物であることを示す。構文情報は「主
語」、「目的語」のように示される。表層文字の指定法
は正規表現を用いる。ドツト(、〉は任意文字を示し、
アスタリスク(*)はO個以上連なついることを示す。
括弧内の表層文字や辞書情報の指定がない場合、その条
件に関しては無条件とする。論理条件子&、1はそれぞ
れAND、ORを示す。括弧内にコンマでならんでいる
辞書情報はAND条件とする。
検索条件の基本単位は次のようになる。この基本単位を
出現層にならべて記述する。
表層文字、*(表層文字、属性・値 属性・値1・・・・・・、WI文情報、意味情報〉、*
第2図(a>は、名詞または代名詞が主語であって用言
の対象格となるもの、任意の動詞がこの順で現れる文を
検索する例である。また同図(b)は、代名詞が主語で
あって用言の動作主格となるもの、任意の動詞がこの順
で現れる文を検索する例である。さらに同図(C)は、
主語となる人工物を意味する用言の道具路となる名詞、
任意の動詞がこの順で現れる文を検索する例である。
〔発明の効果〕
以上、詳細に説明したように本発明の文章検索方式によ
れば、検索条件として表層文字の正規表現と辞書情報と
構文情報と意味情報とを組み合せて検索できるので、検
索精度と検索指定表現能力とを一層向上させることがで
きるという効果がある。
【図面の簡単な説明】
第1図は本発明による文意検索方式の一実施例を示すブ
ロック図、第2図は検索条件と検索文の例を示す説明図
である。 1・・・入力文読み込み部、2・・・形態素解析部、3
・・・辞書部、4・・・検索条件指定部、5・・・検索
条件照合部、6・・・構文解析部、7・・・意味解析部

Claims (1)

    【特許請求の範囲】
  1. 入力文を読み込む手段と、前記入力文に対する辞書引き
    をする手段と、辞書引き後の辞書情報を用いて前記入力
    文を解析する手段とを有する自然言語解析システムにお
    いて、正規表現と辞書情報と構文情報と意味情報とを組
    み合せた検索条件を指定する手段と、前記入力文の形態
    素解析結果と構文解析結果と意味解析結果とに基づいて
    前記入力文と前記検索条件とを照合する手段とを具備す
    ることを特徴とする文章検索方式。
JP1176516A 1989-07-06 1989-07-06 文章検索方式 Expired - Fee Related JP2830097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1176516A JP2830097B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1176516A JP2830097B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Publications (2)

Publication Number Publication Date
JPH0340067A true JPH0340067A (ja) 1991-02-20
JP2830097B2 JP2830097B2 (ja) 1998-12-02

Family

ID=16014991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1176516A Expired - Fee Related JP2830097B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Country Status (1)

Country Link
JP (1) JP2830097B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0886226A1 (en) * 1997-06-20 1998-12-23 Xerox Corporation Linguistic search system
JP2010211664A (ja) * 2009-03-12 2010-09-24 Toshiba Corp 検索を支援する装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0886226A1 (en) * 1997-06-20 1998-12-23 Xerox Corporation Linguistic search system
JP2010211664A (ja) * 2009-03-12 2010-09-24 Toshiba Corp 検索を支援する装置、方法およびプログラム

Also Published As

Publication number Publication date
JP2830097B2 (ja) 1998-12-02

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US6269189B1 (en) Finding selected character strings in text and providing information relating to the selected character strings
JP2783558B2 (ja) 要約生成方法および要約生成装置
JPH0689304A (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPS6318458A (ja) 感情情報抽出装置
JPH0340067A (ja) 文章検索方式
JP2004287679A (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JPH0340069A (ja) 文章検索方式
JPH0340068A (ja) 文章検索方式
KR100371135B1 (ko) 용언 굴절사전을 이용한 용언 형태소 분석장치 및 방법
JPS60193074A (ja) 日本語解析装置
JPH0561902A (ja) 機械翻訳システム
JP3972697B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3222173B2 (ja) 日本語構文解析システム
JPH07334504A (ja) 日本語処理システム
JPH0320866A (ja) テキストベース検索方式
JPH01126767A (ja) 辞書参照装置
JP3132563B2 (ja) 文書作成支援装置
JP2000029882A (ja) 要約文作成装置
JPS6389976A (ja) 言語解析装置
JPH09146958A (ja) 語彙対応辞書作成装置および語彙対応辞書作成方法
JPH02208775A (ja) 機械翻訳方式
JP2002032374A (ja) 情報抽出方法及び記録媒体

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees