JPH0340068A - 文章検索方式 - Google Patents
文章検索方式Info
- Publication number
- JPH0340068A JPH0340068A JP1176517A JP17651789A JPH0340068A JP H0340068 A JPH0340068 A JP H0340068A JP 1176517 A JP1176517 A JP 1176517A JP 17651789 A JP17651789 A JP 17651789A JP H0340068 A JPH0340068 A JP H0340068A
- Authority
- JP
- Japan
- Prior art keywords
- input sentence
- retrieval
- communication line
- retrieval condition
- condition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000014509 gene expression Effects 0.000 claims abstract description 9
- 230000000877 morphologic effect Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 abstract description 13
- 239000002245 particle Substances 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野〕
本発明は自然言語処理システムにおいて文章を検索する
ための方法に関する。
ための方法に関する。
従来、文章を検索するための検索条件として表層文字列
の正規表現によるものがある。表層文字による検索では
、部分文字列として文中に含まれているものも検索され
る。また、形態素解析を用いて形態素単位での検索を行
なう方式もあるが、一般に形態素には多品調性や多義性
が存在するので必要とする文以外のものが検索されるこ
とが多い。
の正規表現によるものがある。表層文字による検索では
、部分文字列として文中に含まれているものも検索され
る。また、形態素解析を用いて形態素単位での検索を行
なう方式もあるが、一般に形態素には多品調性や多義性
が存在するので必要とする文以外のものが検索されるこ
とが多い。
上記のような従来の方法では結果として不要な文を多く
検索するので、必要な文のみを得るためには再度抽出作
業を行なう必要があるという欠点がある。
検索するので、必要な文のみを得るためには再度抽出作
業を行なう必要があるという欠点がある。
本発明による文章検索方式は、入力文を読み込む手段と
、前記入力文に対する辞書引きをする手段と、辞書引き
後の辞書情報を用いて前記入力文を解析する手段とを有
する自然言語解析システムにおいて、正規表現と辞書情
報とを組み合せた検索条件を指定する手段と、前記入力
文の形態素解析結果に基づいて前記入力文と前記検索条
件とを照合する手段とを具備する。
、前記入力文に対する辞書引きをする手段と、辞書引き
後の辞書情報を用いて前記入力文を解析する手段とを有
する自然言語解析システムにおいて、正規表現と辞書情
報とを組み合せた検索条件を指定する手段と、前記入力
文の形態素解析結果に基づいて前記入力文と前記検索条
件とを照合する手段とを具備する。
以下、本発明について図面を参照しながら説明する。
第1図は本発明による文章検索方式の一実施例を示すブ
ロック図である。同図において、通信線01を通じて入
力文読み込み部1に読み込まれた自然言語入力文は通信
線12を介して形態素解析部2に伝達される。形態素解
析部2は通信線23を介して入力文に対する辞書情報を
辞書部3より得て形態素解析を行ない、通信線25を介
して形態素解析結果を検索条件照合部5に伝達する。
ロック図である。同図において、通信線01を通じて入
力文読み込み部1に読み込まれた自然言語入力文は通信
線12を介して形態素解析部2に伝達される。形態素解
析部2は通信線23を介して入力文に対する辞書情報を
辞書部3より得て形態素解析を行ない、通信線25を介
して形態素解析結果を検索条件照合部5に伝達する。
また、通信線04を通じて検索条件指定部4に読み込ま
れた検索条件は通信線45を介して検索条件照合部5に
伝達される。検索条件照合部5は形態素解析結果と検索
条件とを照合し、条件を満足するなら通信線50を介し
て出力する。
れた検索条件は通信線45を介して検索条件照合部5に
伝達される。検索条件照合部5は形態素解析結果と検索
条件とを照合し、条件を満足するなら通信線50を介し
て出力する。
第2図は検索条件の例とその条件に従って検索された文
章の例を示す説明図である。検索条件は表層文字列とそ
の文字列に対する辞書情報と構文情報をコンマでならべ
て括弧で囲んで記述する。
章の例を示す説明図である。検索条件は表層文字列とそ
の文字列に対する辞書情報と構文情報をコンマでならべ
て括弧で囲んで記述する。
括弧で囲まれていない表層文字列は部分文字列として文
中に含まれてもよい。辞書情報は属性と属性値の形式で
表現する。「品詞・名詞」の指定はその形態素の品詞が
名詞であることを示す。「意味・人工物」指定はその形
態素の意味が人工物であることを示す。表層文字の指定
法は正規表現を用いる。ドツト(、〉は任意文字を示し
、アスタリスク(*〉はO個以上連なついることを示す
。
中に含まれてもよい。辞書情報は属性と属性値の形式で
表現する。「品詞・名詞」の指定はその形態素の品詞が
名詞であることを示す。「意味・人工物」指定はその形
態素の意味が人工物であることを示す。表層文字の指定
法は正規表現を用いる。ドツト(、〉は任意文字を示し
、アスタリスク(*〉はO個以上連なついることを示す
。
括弧内の表層文字や辞書情報の指定がない場合、その条
件に関しては無条件とする。論理条件子&、1はそれぞ
れAND、ORを示す。括弧内にコンマでならんでいる
辞書情報はAND条件とする。
件に関しては無条件とする。論理条件子&、1はそれぞ
れAND、ORを示す。括弧内にコンマでならんでいる
辞書情報はAND条件とする。
検索条件の基本単位は次のようになる。この基本単位を
出現順にならべて記述する。
出現順にならべて記述する。
表層文字、*(表層文字、属性・値
属性・値1・・・・・)、*
第2図(a)は、助詞の「は」2助詞の「へ」、任意の
動詞がこの順で現れる文を検索する例である。また同図
(b)は、助詞の「は」またはFが」、助詞のrへ」ま
たは「に」、任意の動詞がこの順で現れる文を検索する
例である。さらに同図(c)は、人工物を意味する任意
の名詞、その次に助詞の「が」、任意の動詞がこの順で
現れる文を検索する例である。
動詞がこの順で現れる文を検索する例である。また同図
(b)は、助詞の「は」またはFが」、助詞のrへ」ま
たは「に」、任意の動詞がこの順で現れる文を検索する
例である。さらに同図(c)は、人工物を意味する任意
の名詞、その次に助詞の「が」、任意の動詞がこの順で
現れる文を検索する例である。
以上、詳細に説明したように本発明の文章検索方式によ
れば、検索条件として表層文字の正規表現と辞書情報と
を組み合せて検索できるので、利用者の目的に合せた検
索項目を辞書に追加することによって検索精度と検索指
定表現能力とを一層向上させることができるという効果
がある。
れば、検索条件として表層文字の正規表現と辞書情報と
を組み合せて検索できるので、利用者の目的に合せた検
索項目を辞書に追加することによって検索精度と検索指
定表現能力とを一層向上させることができるという効果
がある。
第1図は本発明による文章検索方式の一実施例を示ずブ
ロック図、第2図は検索条件と検索文の例を示す説明図
である。 1・・・入力文読み込み部、2・・・形態素解析部、3
・・辞書部、 4・・ 検索条件指定部、 ・・検索条件照 合部。
ロック図、第2図は検索条件と検索文の例を示す説明図
である。 1・・・入力文読み込み部、2・・・形態素解析部、3
・・辞書部、 4・・ 検索条件指定部、 ・・検索条件照 合部。
Claims (1)
- 入力文を読み込む手段と、前記入力文に対する辞書引き
をする手段と、辞書引き後の辞書情報を用いて前記入力
文を解析する手段とを有する自然言語解析システムにお
いて、正規表現と辞書情報とを組み合せた検索条件を指
定する手段と、前記入力文の形態素解析結果に基づいて
前記入力文と前記検索条件とを照合する手段とを具備す
ることを特徴とする文章検索方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1176517A JP2830098B2 (ja) | 1989-07-06 | 1989-07-06 | 文章検索方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1176517A JP2830098B2 (ja) | 1989-07-06 | 1989-07-06 | 文章検索方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0340068A true JPH0340068A (ja) | 1991-02-20 |
JP2830098B2 JP2830098B2 (ja) | 1998-12-02 |
Family
ID=16015010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1176517A Expired - Lifetime JP2830098B2 (ja) | 1989-07-06 | 1989-07-06 | 文章検索方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2830098B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009215A (ja) * | 2008-06-25 | 2010-01-14 | Yahoo Japan Corp | テキスト抽出装置、そのシステム、その方法、および、そのプログラム |
-
1989
- 1989-07-06 JP JP1176517A patent/JP2830098B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010009215A (ja) * | 2008-06-25 | 2010-01-14 | Yahoo Japan Corp | テキスト抽出装置、そのシステム、その方法、および、そのプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2830098B2 (ja) | 1998-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2783558B2 (ja) | 要約生成方法および要約生成装置 | |
EP0645720B1 (en) | Dictionary creation supporting system | |
EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
JPH0689304A (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
EP0294950A3 (en) | A method of facilitating computer sorting | |
JPH0340068A (ja) | 文章検索方式 | |
JP2830097B2 (ja) | 文章検索方式 | |
JPH0877196A (ja) | 文書情報抽出装置 | |
JP2830099B2 (ja) | 文章検索方式 | |
JPS59736A (ja) | 構文解析方式 | |
JPS63228326A (ja) | キ−ワ−ド自動抽出方式 | |
JPH0571982B2 (ja) | ||
JP2878442B2 (ja) | 画像処理装置 | |
JPS63221475A (ja) | 構文解析方法 | |
JPH0668070A (ja) | 複合語辞書登録装置 | |
JPS6395573A (ja) | 日本語文形態素解析における未知語処理方法 | |
JPH04330565A (ja) | 自然言語処理システム | |
JPH03288260A (ja) | 文書処理装置 | |
JPH07334504A (ja) | 日本語処理システム | |
JPS63109572A (ja) | 派生語処理方式 | |
JPS6389976A (ja) | 言語解析装置 | |
JPS6250961A (ja) | 翻訳処理装置 | |
JPS6366665A (ja) | 文書解析整形装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080925 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080925 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090925 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090925 Year of fee payment: 11 |