JPH0340068A - 文章検索方式 - Google Patents

文章検索方式

Info

Publication number
JPH0340068A
JPH0340068A JP1176517A JP17651789A JPH0340068A JP H0340068 A JPH0340068 A JP H0340068A JP 1176517 A JP1176517 A JP 1176517A JP 17651789 A JP17651789 A JP 17651789A JP H0340068 A JPH0340068 A JP H0340068A
Authority
JP
Japan
Prior art keywords
input sentence
retrieval
communication line
retrieval condition
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1176517A
Other languages
English (en)
Other versions
JP2830098B2 (ja
Inventor
Akitoshi Okumura
明俊 奥村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1176517A priority Critical patent/JP2830098B2/ja
Publication of JPH0340068A publication Critical patent/JPH0340068A/ja
Application granted granted Critical
Publication of JP2830098B2 publication Critical patent/JP2830098B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は自然言語処理システムにおいて文章を検索する
ための方法に関する。
〔従来の技術〕
従来、文章を検索するための検索条件として表層文字列
の正規表現によるものがある。表層文字による検索では
、部分文字列として文中に含まれているものも検索され
る。また、形態素解析を用いて形態素単位での検索を行
なう方式もあるが、一般に形態素には多品調性や多義性
が存在するので必要とする文以外のものが検索されるこ
とが多い。
〔発明が解決しようとする課題〕
上記のような従来の方法では結果として不要な文を多く
検索するので、必要な文のみを得るためには再度抽出作
業を行なう必要があるという欠点がある。
〔課題を解決するための手段〕
本発明による文章検索方式は、入力文を読み込む手段と
、前記入力文に対する辞書引きをする手段と、辞書引き
後の辞書情報を用いて前記入力文を解析する手段とを有
する自然言語解析システムにおいて、正規表現と辞書情
報とを組み合せた検索条件を指定する手段と、前記入力
文の形態素解析結果に基づいて前記入力文と前記検索条
件とを照合する手段とを具備する。
〔実施例〕
以下、本発明について図面を参照しながら説明する。
第1図は本発明による文章検索方式の一実施例を示すブ
ロック図である。同図において、通信線01を通じて入
力文読み込み部1に読み込まれた自然言語入力文は通信
線12を介して形態素解析部2に伝達される。形態素解
析部2は通信線23を介して入力文に対する辞書情報を
辞書部3より得て形態素解析を行ない、通信線25を介
して形態素解析結果を検索条件照合部5に伝達する。
また、通信線04を通じて検索条件指定部4に読み込ま
れた検索条件は通信線45を介して検索条件照合部5に
伝達される。検索条件照合部5は形態素解析結果と検索
条件とを照合し、条件を満足するなら通信線50を介し
て出力する。
第2図は検索条件の例とその条件に従って検索された文
章の例を示す説明図である。検索条件は表層文字列とそ
の文字列に対する辞書情報と構文情報をコンマでならべ
て括弧で囲んで記述する。
括弧で囲まれていない表層文字列は部分文字列として文
中に含まれてもよい。辞書情報は属性と属性値の形式で
表現する。「品詞・名詞」の指定はその形態素の品詞が
名詞であることを示す。「意味・人工物」指定はその形
態素の意味が人工物であることを示す。表層文字の指定
法は正規表現を用いる。ドツト(、〉は任意文字を示し
、アスタリスク(*〉はO個以上連なついることを示す
括弧内の表層文字や辞書情報の指定がない場合、その条
件に関しては無条件とする。論理条件子&、1はそれぞ
れAND、ORを示す。括弧内にコンマでならんでいる
辞書情報はAND条件とする。
検索条件の基本単位は次のようになる。この基本単位を
出現順にならべて記述する。
表層文字、*(表層文字、属性・値 属性・値1・・・・・)、* 第2図(a)は、助詞の「は」2助詞の「へ」、任意の
動詞がこの順で現れる文を検索する例である。また同図
(b)は、助詞の「は」またはFが」、助詞のrへ」ま
たは「に」、任意の動詞がこの順で現れる文を検索する
例である。さらに同図(c)は、人工物を意味する任意
の名詞、その次に助詞の「が」、任意の動詞がこの順で
現れる文を検索する例である。
〔発明の効果〕
以上、詳細に説明したように本発明の文章検索方式によ
れば、検索条件として表層文字の正規表現と辞書情報と
を組み合せて検索できるので、利用者の目的に合せた検
索項目を辞書に追加することによって検索精度と検索指
定表現能力とを一層向上させることができるという効果
がある。
【図面の簡単な説明】
第1図は本発明による文章検索方式の一実施例を示ずブ
ロック図、第2図は検索条件と検索文の例を示す説明図
である。 1・・・入力文読み込み部、2・・・形態素解析部、3
・・辞書部、 4・・ 検索条件指定部、 ・・検索条件照 合部。

Claims (1)

    【特許請求の範囲】
  1. 入力文を読み込む手段と、前記入力文に対する辞書引き
    をする手段と、辞書引き後の辞書情報を用いて前記入力
    文を解析する手段とを有する自然言語解析システムにお
    いて、正規表現と辞書情報とを組み合せた検索条件を指
    定する手段と、前記入力文の形態素解析結果に基づいて
    前記入力文と前記検索条件とを照合する手段とを具備す
    ることを特徴とする文章検索方式。
JP1176517A 1989-07-06 1989-07-06 文章検索方式 Expired - Lifetime JP2830098B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1176517A JP2830098B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1176517A JP2830098B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Publications (2)

Publication Number Publication Date
JPH0340068A true JPH0340068A (ja) 1991-02-20
JP2830098B2 JP2830098B2 (ja) 1998-12-02

Family

ID=16015010

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1176517A Expired - Lifetime JP2830098B2 (ja) 1989-07-06 1989-07-06 文章検索方式

Country Status (1)

Country Link
JP (1) JP2830098B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009215A (ja) * 2008-06-25 2010-01-14 Yahoo Japan Corp テキスト抽出装置、そのシステム、その方法、および、そのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010009215A (ja) * 2008-06-25 2010-01-14 Yahoo Japan Corp テキスト抽出装置、そのシステム、その方法、および、そのプログラム

Also Published As

Publication number Publication date
JP2830098B2 (ja) 1998-12-02

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
EP0645720B1 (en) Dictionary creation supporting system
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JPH0689304A (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
EP0294950A3 (en) A method of facilitating computer sorting
JP2005043977A (ja) 文書間の類似度算出方法および装置
JPH0340068A (ja) 文章検索方式
JP2830097B2 (ja) 文章検索方式
JPH0877196A (ja) 文書情報抽出装置
JP2830099B2 (ja) 文章検索方式
JPS59736A (ja) 構文解析方式
JPS63228326A (ja) キ−ワ−ド自動抽出方式
JPH0571982B2 (ja)
JP2878442B2 (ja) 画像処理装置
JPS63221475A (ja) 構文解析方法
JPH0668070A (ja) 複合語辞書登録装置
JPS6395573A (ja) 日本語文形態素解析における未知語処理方法
JPH04330565A (ja) 自然言語処理システム
JPH03288260A (ja) 文書処理装置
JPH07334504A (ja) 日本語処理システム
JPS63109572A (ja) 派生語処理方式
JPS6389976A (ja) 言語解析装置
JPS6250961A (ja) 翻訳処理装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080925

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090925

Year of fee payment: 11