JPH10334101A - Retrieval logical expression generating device, retrieval system, and record medium - Google Patents

Retrieval logical expression generating device, retrieval system, and record medium

Info

Publication number
JPH10334101A
JPH10334101A JP9147609A JP14760997A JPH10334101A JP H10334101 A JPH10334101 A JP H10334101A JP 9147609 A JP9147609 A JP 9147609A JP 14760997 A JP14760997 A JP 14760997A JP H10334101 A JPH10334101 A JP H10334101A
Authority
JP
Japan
Prior art keywords
search
noun
operator
range
logical expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9147609A
Other languages
Japanese (ja)
Inventor
Tomoyuki Tada
多田  智之
Toshihiro Fujinami
稔弘 藤並
Hidenobu Kaneoka
秀信 金岡
Shinichi Mukogawa
信一 向川
Yasuyuki Furukawa
靖之 古河
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP9147609A priority Critical patent/JPH10334101A/en
Publication of JPH10334101A publication Critical patent/JPH10334101A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To enable speedy retrieval by narrowing down documents. SOLUTION: A morpheme an analyzing device 11 takes a morpheme analysis of a retrieval request sentence into words of parts of speech. A retrieval operator determination device 12 determines a retrieval key word by a retrieval key word determination part 20. A decision part 21 decides whether or not the retrieval key word constitutes a noun phrase. A process part 22 combines noun phrases with a near operator NEAR1 or NEAR2 to generate a retrieval logical expression. A document retrieval device 2 retrieves a document corresponding to the inputted retrieval logical expression.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、検索論理式生成装
置、検索システムおよび記録媒体に関し、特に、より確
実に、所望の情報を検索することができるようにした、
検索論理式生成装置、検索システムおよび記録媒体に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a retrieval logical expression generation device, a retrieval system, and a recording medium, and more particularly, to a method for retrieving desired information more reliably.
The present invention relates to a search logical expression generation device, a search system, and a recording medium.

【0002】[0002]

【従来の技術】図20は、従来の検索システムの構成例
を表している。検索論理式生成装置1には、検索要求文
が入力される。この検索要求文は、例えば「アジアのパ
ソコン生産について知りたい」のような日常用いる言語
とされる。このように、ユーザが日常用いる自然言語で
検索ができるようにすることで、ユーザの検索要求文作
成の負担を軽減することができる。
2. Description of the Related Art FIG. 20 shows a configuration example of a conventional search system. A search request sentence is input to the search logical expression generation device 1. This search request sentence is in a language used everyday, such as “I want to know about the production of personal computers in Asia”. In this way, by enabling the user to perform a search in a natural language that is used daily, the burden on the user for creating a search request sentence can be reduced.

【0003】検索要求文は、検索論理式生成装置1にお
いて、形態素解析により各種の品詞の単語に分割され
る。そして、名詞が検索キーワードとされ、接続詞、助
詞が検索演算子(検索オペレータ)のANDまたはOR
に置換され、例えば、次のような検索論理式が生成され
る。 アジアANDパソコンAND生産
[0003] The search request sentence is divided into various parts of speech words by morphological analysis in the search logical formula generation device 1. Nouns are used as search keywords, and conjunctions and particles are AND or OR of search operators (search operators).
And, for example, the following search logical expression is generated. Asian AND PC AND production

【0004】このようにして生成された検索論理式は、
文書検索装置2に入力され、検索論理式に対応する文書
が検索される。
[0004] The search formula thus generated is:
The document is input to the document search device 2 and a document corresponding to the search logical expression is searched.

【0005】自然言語から検索論理式を生成する方法と
しては、種々のものが提案されている。例えば、「特許
検索のための日本語質問文解析 1984年 情報処理
学会論文誌Vol.25 No.3」では、接続詞を、検索
オペレータANDに置き換えるものと、ORに置き換え
るものとに分類し、検索論理式では、分類に従ってキー
ワードを結合している。また、検索要求文中に接続詞で
結合されていないキーワードは、暗黙的にANDで結合
されている。
Various methods have been proposed for generating a search logical expression from a natural language. For example, in “Japanese Query Sentence Analysis for Patent Search 1984, IPSJ Transactions Vol.25 No.3”, connectives are classified into those that are replaced with search operators AND and those that are replaced with ORs. In logical expressions, keywords are combined according to classification. Also, keywords that are not connected by a conjunction in the search request sentence are implicitly connected by AND.

【0006】さらに、例えば、特開平5−189492
号公報の従来技術の欄には、格助詞「の」をANDに置
き換え、また、並列助詞「と」をORに置き換えて検索
論理式を生成することが開示されている。
Further, for example, see Japanese Patent Application Laid-Open No. 5-189492.
In the prior art section of the publication, it is disclosed that a search logical expression is generated by replacing the case particle "no" with AND, and replacing the parallel particle "to" with OR.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、このよ
うな方法においては、例えば、図21に示すように、
「アジア」、「パソコン」、および「生産」の検索キー
ワードが、比較的短い文章中に存在している場合に、こ
れが検索論理式に適合する文献として検索されるのはも
ちろんであるが、例えば、図22に示すように、1つの
文献内に複数の話題が紹介されているような場合にも、
検索論理式に適合するものとして検索されてしまう課題
があった。その結果、検索対象を充分絞ることができ
ず、関連がないか、あったとしても薄い文献も検索され
てしまう課題があった。
However, in such a method, for example, as shown in FIG.
If the search keywords “Asia”, “PC”, and “Production” are present in relatively short sentences, they are searched as documents that match the search formula. Also, as shown in FIG. 22, when a plurality of topics are introduced in one document,
There was a problem that the search was performed as a match with the search logical expression. As a result, there is a problem in that the search target cannot be sufficiently narrowed, and even if there is no relation, even if there is a thin document, it is also searched.

【0008】本発明はこのような状況に鑑みてなされた
ものであり、より確実に、所望の文献を絞り込んで検索
することができるようにするものである。
[0008] The present invention has been made in view of such a situation, and it is an object of the present invention to be able to narrow down and search a desired document more reliably.

【0009】[0009]

【課題を解決するための手段】請求項1に記載の検索論
理式生成装置は、検索要求の文字列を形態素解析した結
果から、検索キーワードを決定する決定手段と、検索キ
ーワードが名詞句を構成するか否かを判定する判定手段
と、判定手段により判定された名詞句を構成する検索キ
ーワードを、近傍オペレータで結合して検索論理式を生
成する生成手段とを備えることを特徴とする。
According to a first aspect of the present invention, there is provided a search logical expression generating apparatus which determines a search keyword based on a result of morphological analysis of a character string of a search request, and wherein the search keyword forms a noun phrase. A determination unit for determining whether or not to perform the search, and a generation unit for generating a search logical expression by combining search keywords constituting the noun phrase determined by the determination unit with a nearby operator.

【0010】なお近傍オペレータとは、与えられた複数
の検索キーワードが所定の近傍範囲内にある場合に真と
なり、そうでない場合に偽となる演算を行う演算子であ
る。
[0010] The neighborhood operator is an operator that performs an operation that is true when a plurality of given search keywords are within a predetermined neighborhood, and that is false otherwise.

【0011】すなわち、検索キーワードK1と検索キー
ワードK2が近傍演算子NEARで結合された項(K1NEAR
K2)は、K1とK2が処理対象のテキストの中で所定
の近傍関係にあるときに値1(真)となり、所定の近傍
関係にないとき値0(偽)となる。
That is, the term (K1NEAR) in which the search keyword K1 and the search keyword K2 are connected by the neighborhood operator NEAR
K2) has a value of 1 (true) when K1 and K2 have a predetermined neighborhood relation in the text to be processed, and has a value of 0 (false) when they have no predetermined neighborhood relation.

【0012】所定の近傍関係には、様々な種類のものが
ある。
There are various types of predetermined neighborhood relations.

【0013】近傍関係をその近傍結合強度の順に説明す
る。 (1)最も強い近傍結合:K1とK2が連続して存在す
る場合 (2)(1)の次に強い近傍結合:K1とK2の間に1
文字だけ他の文字がはいる場合 (3)(2)の次に強い近傍結合:K1とK2の間にN
文字だけ他の文字がはいる場合 (4)(2)の次に強い近傍結合:K1とK2の間に1
単語がはいる場合 (5)(2)の次に強い近傍結合:K1とK2の間にN
単語がはいる場合 (6)(2)の次に強い近傍結合:K1とK2とが同一
文に属する場合 (7)(2)の次に強い近傍結合:K1とK2とが同一
の段落に属する場合
The neighborhood relation will be described in the order of the neighborhood coupling strength. (1) Strongest neighborhood coupling: when K1 and K2 exist continuously (2) Next strongest neighborhood coupling after (1): 1 between K1 and K2
When other characters are included only in the character (3) Next strongest neighbor connection after (2): N between K1 and K2
When other characters are included only in character (4) Next strongest neighbor bond after (2): 1 between K1 and K2
(5) Next strongest neighbor connection after (2): N between K1 and K2
(6) Next strongest neighbor connection after (2): K1 and K2 belong to the same sentence (7) Next strongest neighbor connection after (2): K1 and K2 are in the same paragraph If you belong

【0014】上記の近傍結合の中では(6)の方が
(7)よりも近傍結合の強度が強い。
Among the above-mentioned neighborhood couplings, the strength of the neighborhood coupling is stronger in (6) than in (7).

【0015】判定手段には、引用符で囲われている範
囲、固有名詞の前または後に名詞または固有名詞が助詞
「の」を含んでまたは含まないで連続している範囲、形
容詞または形容動詞が連続している範囲、または、名詞
が助詞「の」を含んでまたは含まないで連続している範
囲を、名詞句と判定させることができる。
The judgment means includes a range enclosed by quotation marks, a range in which a noun or proper noun is continuous before or after a proper noun with or without the particle "no", an adjective or an adjective verb. A continuous range or a range in which the noun includes or does not include the particle "no" can be determined as a noun phrase.

【0016】生成手段には、範囲に対応して、名詞句を
構成する検索キーワードを、結合力のより強い第1の近
傍オペレータまたは結合力のより弱い第2の近傍オペレ
ータで結合させることができる。
[0016] The generating means can combine the search keywords constituting the noun phrase with a first neighboring operator having a stronger binding force or a second neighboring operator having a weaker binding force in accordance with the range. .

【0017】生成手段には、名詞句が、名詞が助詞
「の」を含んでまたは含まないで連続している範囲であ
る場合、助詞「の」を、第2の近傍オペレータで置換さ
せるとともに、名詞を第2の近傍オペレータで結合させ
ることができる。
When the noun phrase is in a range in which the noun is continuous with or without the particle "no", the generation unit causes the particle "no" to be replaced by a second neighborhood operator, Nouns can be combined with a second neighborhood operator.

【0018】生成手段には、名詞句が、固有名詞の前ま
たは後に名詞または固有名詞が助詞「の」を含んでまた
は含まないで連続している範囲である場合、助詞「の」
を、第1の近傍オペレータで置換させるとともに、固有
名詞または名詞を、第1の近傍オペレータで結合させる
ことができる。
When the noun phrase is a range in which the noun or proper noun is continuous before or after the proper noun including or not including the particle "no",
Can be replaced with a first neighborhood operator, and proper nouns or nouns can be combined with the first neighborhood operator.

【0019】生成手段には、名詞句が、引用符で囲まれ
ている範囲である場合、名詞句を構成する検索キーワー
ドを、第1の近傍オペレータで結合させることができ
る。
When the noun phrase is in a range enclosed by quotation marks, the generating means can combine the search keywords constituting the noun phrase with a first neighborhood operator.

【0020】検索要求の文字列を形態素解析する解析手
段をさらに設けることができる。
Analysis means for morphologically analyzing the character string of the search request can be further provided.

【0021】請求項8に記載の検索システムは、上記し
た生成手段により生成された検索論理式を用いて、検索
を行う検索手段を備えることを特徴とする。
[0021] A search system according to an eighth aspect of the present invention is characterized in that the search system is provided with a search means for performing a search using the search logical expression generated by the generation means.

【0022】請求項9に記載の記録媒体は、検索要求の
文字列を形態素解析した結果から、検索キーワードを決
定する決定ステップと、検索キーワードが名詞句を構成
するか否かを判定する判定ステップと、判定ステップで
判定された名詞句を構成する検索キーワードを、近傍オ
ペレータで結合して検索論理式を生成する生成ステップ
とを備えるプログラムが記録されていることを特徴とす
る。
According to a ninth aspect of the present invention, in the recording medium, a determination step of determining a search keyword from a result of morphological analysis of a character string of a search request, and a determination step of determining whether the search keyword forms a noun phrase And a generation step of generating a search logical expression by combining search keywords constituting the noun phrase determined in the determination step by a nearby operator.

【0023】判定ステップでは、引用符で囲われている
範囲、固有名詞の前または後に名詞または固有名詞が助
詞「の」を含んでまたは含まないで連続している範囲、
形容詞または形容動詞が連続している範囲、または、名
詞が助詞「の」を含んでまたは含まないで連続している
範囲を、名詞句と判定させることができる。
In the determining step, a range enclosed by quotation marks, a range in which the noun or proper noun is continuous before or after the proper noun with or without the particle "no",
A range in which adjectives or adjective verbs are continuous, or a range in which a noun continues with or without the particle "no" can be determined as a noun phrase.

【0024】生成ステップでは、範囲に対応して、名詞
句を構成する検索キーワードを、結合力のより強い第1
の近傍オペレータまたは結合力のより弱い第2の近傍オ
ペレータで結合させることができる。
In the generation step, a search keyword constituting a noun phrase is first matched with the range by a first keyword having a stronger binding force.
Can be connected by a nearby operator having a lower strength or a second neighbor operator having a weaker bonding force.

【0025】生成ステップでは、名詞句が、名詞が助詞
「の」を含んでまたは含まないで連続している範囲であ
る場合、助詞「の」を、第2の近傍オペレータで置換す
るとともに、名詞を第2の近傍オペレータで結合させる
ことができる。
In the generation step, if the noun phrase is a continuous range of the noun including or not including the particle “no”, the particle “no” is replaced by a second neighborhood operator, and Can be combined by a second neighbor operator.

【0026】生成ステップでは、名詞句が、固有名詞の
前または後に名詞または固有名詞が助詞「の」を含んで
または含まないで連続している範囲である場合、助詞
「の」を、第1の近傍オペレータで置換するとともに、
固有名詞または名詞を、第1の近傍オペレータで結合さ
せることができる。
In the generation step, if the noun phrase is a range in which the noun or proper noun is continuous before or after the proper noun including or not including the particle "no", the particle "no" is added to the first noun. With the neighbor operator of
Proper nouns or nouns can be combined with a first neighborhood operator.

【0027】生成ステップでは、名詞句が、引用符で囲
まれている範囲である場合、名詞句を構成する検索キー
ワードを、第1の近傍オペレータで結合させることがで
きる。
In the generation step, when the noun phrase is in a range surrounded by quotation marks, the search keywords constituting the noun phrase can be combined by the first neighborhood operator.

【0028】検索要求の文字列を形態素解析する解析ス
テップをさらに設けることができる。
An analysis step of morphologically analyzing the character string of the search request can be further provided.

【0029】請求項1に記載の検索論理式生成装置およ
び請求項9に記載の記録媒体においては、検索要求の文
字列を形態素解析した結果から、検索キーワードが決定
される。検索キーワードが名詞句を構成するか否かがさ
らに判定され、名詞句を構成する検索キーワードを、近
傍オペレータで結合して検索論理式が生成される。
[0029] In the retrieval logical expression generation device according to the first aspect and the recording medium according to the ninth aspect, the retrieval keyword is determined from the result of the morphological analysis of the character string of the retrieval request. It is further determined whether or not the search keyword forms a noun phrase, and the search keywords forming the noun phrase are combined by a nearby operator to generate a search logical expression.

【0030】請求項8に記載の検索システムにおいて
は、このように生成された検索論理式を用いて、検索が
行われる。
In the search system according to the present invention, the search is performed using the search logical expression generated in this manner.

【0031】[0031]

【発明の実施の形態】以下に本発明の実施の形態を説明
するが、特許請求の範囲に記載の発明の各手段と以下の
実施の形態との対応関係を明らかにするために、各手段
の後の括弧内に、対応する実施の形態(但し一例)を付
加して本発明の特徴を記述すると、次のようになる。但
し勿論この記載は、各手段を記載したものに限定するこ
とを意味するものではない。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below. In order to clarify the correspondence between each means of the invention described in the claims and the following embodiments, each means is described. When the features of the present invention are described by adding the corresponding embodiment (however, an example) in parentheses after the parentheses, the result is as follows. However, of course, this description does not mean that each means is limited to those described.

【0032】請求項1に記載の検索論理式生成装置は、
検索要求の文字列を形態素解析した結果から、検索キー
ワードを決定する決定手段(例えば、図1の検索キーワ
ード決定部20)と、検索キーワードが名詞句を構成す
るか否かを判定する判定手段(例えば、図1の判定部2
1)と、判定手段により判定された名詞句を構成する検
索キーワードを、近傍オペレータで結合して検索論理式
を生成する生成手段(例えば、図1の処理部22)とを
備えることを特徴とする。
[0032] The retrieval logical expression generation device according to claim 1 is
Determining means for determining a search keyword from the result of morphological analysis of the character string of the search request (for example, the search keyword determining unit 20 in FIG. 1), and determining means for determining whether the search keyword forms a noun phrase ( For example, the determination unit 2 in FIG.
1) and generating means (for example, the processing unit 22 in FIG. 1) for generating a search logical expression by combining search keywords constituting a noun phrase determined by the determination means with a nearby operator. I do.

【0033】図1は、本発明の検索システムの構成例を
表している。この検索システムにおいては、検索論理式
生成装置1に、自然言語からなる検索要求文が入力され
るようになされている。この検索要求文は、検索論理式
生成装置1の形態素解析装置11に入力され、形態素解
析される。そして、形態素解析された結果が、検索論理
式生成装置1の検索オペレータ決定装置12に入力さ
れ、検索オペレータが決定されるようになされている。
FIG. 1 shows an example of the configuration of a search system according to the present invention. In this search system, a search request sentence composed of a natural language is input to the search logical expression generation device 1. This search request sentence is input to the morphological analysis device 11 of the search logical expression generation device 1 and subjected to morphological analysis. Then, the result of the morphological analysis is input to the search operator determination device 12 of the search logical expression generation device 1, and the search operator is determined.

【0034】検索オペレータ決定装置12は、形態素解
析装置11から供給された形態素解析結果から検索キー
ワードを決定する検索キーワード決定部20を有してい
る。検索キーワード決定部20より出力された検索キー
ワードは、判定部21に入力され、各種の検索オペレー
タを適用するための条件が満たされるか否かが判定され
る。判定部21で判定された結果は、処理部22に供給
され、判定結果に対応して検索オペレータの適用処理が
行われ、検索論理式が生成されるようになされている。
The search operator determining device 12 has a search keyword determining unit 20 for determining a search keyword from the morphological analysis result supplied from the morphological analyzer 11. The search keyword output from the search keyword determination unit 20 is input to the determination unit 21, and it is determined whether or not conditions for applying various search operators are satisfied. The result determined by the determination unit 21 is supplied to the processing unit 22, where a search operator application process is performed in accordance with the determination result, and a search logical expression is generated.

【0035】検索オペレータ決定装置12で生成した検
索論理式は、文書検索装置2に入力され、文書検索装置
2は、入力された検索論理式に従って、文書の検索を行
うようになされている。
The search logical expression generated by the search operator determining device 12 is input to the document search device 2, and the document search device 2 searches for a document according to the input search logical expression.

【0036】次に、図2のフローチャートを参照して、
その動作について説明する。最初にステップS1におい
て、ユーザは、検索論理式生成装置1に、自然言語から
なる検索要求文を入力する。例えば、「アジアのパソコ
ン生産について知りたい」の検索要求文が入力される。
次に、ステップS2において、形態素解析装置11は、
入力された検索要求文の形態素解析を実行する。これに
より、入力された検索要求文は、単語に分解され、各単
語の品詞も特定される。
Next, referring to the flowchart of FIG.
The operation will be described. First, in step S1, the user inputs a search request sentence composed of a natural language to the search logical expression generation device 1. For example, a search request sentence “I want to know about Asian PC production” is input.
Next, in step S2, the morphological analyzer 11
The morphological analysis of the input search request sentence is performed. Thereby, the input search request sentence is decomposed into words, and the part of speech of each word is also specified.

【0037】例えば、いまの場合、図1に示すような形
態素解析結果が得られる。この例では、「アジア」は固
有名詞、「の」は助詞、「パソコン」と「生産」は名
詞、「に」と「ついて」は助詞、「知」は動詞、「り」
と「たい」は、それぞれ助動詞とされる。
For example, in this case, a morphological analysis result as shown in FIG. 1 is obtained. In this example, "Asia" is a proper noun, "No" is a particle, "PC" and "Production" are nouns, "Ni" and "About" are particles, "Intelligence" is a verb, "Ri"
And "tai" are auxiliary verbs.

【0038】このほか、特定される品詞としては、図3
に示すようなものを挙げることができる。なお、この形
態素解析の方法は、公知のものを用いることができる。
この形態素解析については、例えば、1996年4月2
6日岩波書店発行の岩波講座ソフトウェア化学15の
「自然言語処理」の第118頁乃至第125頁に開示さ
れている。
In addition, as the part of speech to be specified, FIG.
The following can be mentioned. A known method can be used for the morphological analysis.
This morphological analysis is described in, for example, April 2, 1996.
It is disclosed on pages 118-125 of "Natural Language Processing" of Iwanami Koza Software Chemistry 15 published by Iwanami Shoten on the 6th.

【0039】このように、形態素解析された結果は、形
態素解析装置11から検索オペレータ決定装置12の検
索キーワード決定部20に入力される。検索キーワード
決定部20は、ステップS3で、デフォルトとして定め
られている、名詞、固有名詞、形容詞、および形容動詞
を検索キーワードとする。ユーザは、必要に応じて、任
意の品詞を検索キーワードとして指定することができ
る。
As described above, the result of the morphological analysis is input from the morphological analysis device 11 to the search keyword determination section 20 of the search operator determination device 12. The search keyword determination unit 20 sets the noun, proper noun, adjective, and adjective verb set as defaults in step S3 as search keywords. The user can specify any part of speech as a search keyword as needed.

【0040】判定部21は、検索キーワード決定部20
から検索キーワードを含む形態素解析の結果が入力され
ると、ステップS4で、検索オペレータOR相当の接続
詞または助詞が形態素解析結果に含まれているか否かを
判定する。OR相当の接続詞とは、例えば「または」、
「あるいは」、「もしくは」、または「それとも」など
である。また、OR相当の助詞は「か」である。
The determination unit 21 includes a search keyword determination unit 20
When the result of the morphological analysis including the search keyword is input from, it is determined in step S4 whether a conjunction or a particle corresponding to the search operator OR is included in the morphological analysis result. The conjunction equivalent to OR is, for example, "or",
"Or", "or", or "or". The particle equivalent to OR is “KA”.

【0041】このようなOR相当の接続詞または助詞が
含まれている場合、その形態素解析結果は処理部22に
入力され、ステップS5において、その接続詞または助
詞をORに置換する処理が実行される。
If such a conjunction or particle equivalent to OR is included, the result of the morphological analysis is input to the processing unit 22, and in step S5, a process of replacing the conjunction or particle with OR is executed.

【0042】例えば、図4に示すように、「新卒就業者
または就職内定者」の検索要求文が入力されたような場
合、この「または」がORに置換され、「新卒就業者O
R就職内定者」の検索論理式が生成される。なお、図4
には、「新卒就業者」と「就職内定者」が、それぞれ
「新卒NEAR1就業者」と、「就職NEAR1内定者」の検索
論理式にされているが、この処理は、後述するステップ
S17で行われる。
For example, as shown in FIG. 4, when a search request sentence of “new graduate worker or unemployment candidate” is input, this “or” is replaced with OR and “new graduate worker O”
A search logical expression of “R job vacant” is generated. FIG.
In the table, "new graduates employed" and "employee in employment" are set as search logical expressions of "new graduate NEAR1 employed" and "employment NEAR1 unapproved", respectively. This process is performed in step S17 described later. Done.

【0043】ステップS4で、OR相当の接続詞または
助詞が、形態素解析結果に含まれていないと判定された
場合、またはステップS5で、接続詞または助詞をOR
に置換する処理が実行された後、ステップS6に進み、
判定部21で、形態素解析結果に引用符が含まれている
か否かが判定される。この引用符は、例えば図3におい
て、開括弧および閉括弧として示すようなものである。
この実施の形態の場合、引用符で囲まれた範囲は、名詞
句とされる。
If it is determined in step S4 that a conjunction or particle corresponding to OR is not included in the result of the morphological analysis, or in step S5, the conjunction or particle is ORed.
After execution of the process of replacing
The determination unit 21 determines whether a quotation mark is included in the morphological analysis result. The quotes are, for example, as shown in FIG. 3 as open and closed parentheses.
In the case of this embodiment, the range enclosed by quotation marks is a noun phrase.

【0044】ステップS6において、形態素解析結果に
引用符が含まれていると判定された場合、ステップS7
に進み、引用符の内部に、助動詞または「の」以外の助
詞が含まれているか否かが判定される。引用符の内部
に、助動詞または「の」以外の助詞が含まれていない場
合には、ステップS8に進み、助詞「の」が含まれてい
れば、それが最も強い近傍オペレータNEAR2に置換され
る。また、引用符の内部に含まれる名詞または固有名詞
が、近傍オペレータNEAR2で結合される。
If it is determined in step S6 that the morphological analysis result includes a quotation mark, the process proceeds to step S7.
Then, it is determined whether or not the quotes include an auxiliary verb or a particle other than “no”. If the quotation mark contains no auxiliary verb or a particle other than "no", the process proceeds to step S8. If the particle "no" is included, it is replaced with the strongest neighbor NEAR2. . Further, nouns or proper nouns included in the quotation marks are combined by the neighborhood operator NEAR2.

【0045】なお、近傍オペレータについては、上記し
た文献の第416頁に説明されている。
The neighborhood operator is described on page 416 of the above-mentioned document.

【0046】例えば、図5に示すように、「「ゴルフコ
ンペ保険」を発売している会社」の検索要求文が入力さ
れた場合、「ゴルフコンペ保険」は、引用符で囲まれて
いる。その結果、「ゴルフNEAR2コンペNEAR2保険」の
検索論理式が生成される。なお、図5においては、さら
に「保険AND発売AND会社」の検索論理式も生成さ
れているが、この検索論理式は、後述するステップS1
8で生成されるものである。
For example, as shown in FIG. 5, when a search request sentence of “Company that sells“ Golf Competition Insurance ”” is entered, “Golf Competition Insurance” is enclosed in quotation marks. As a result, a search logical expression of “Golf NEAR2 Competition NEAR2 Insurance” is generated. In FIG. 5, a search logical expression of “insurance AND release AND company” is also generated.
8 is generated.

【0047】このほか、例えば、図6に示すように、
「A社の「プロセス開発センター」」の検索要求文が入
力されたような場合、「プロセス開発センター」は引用
符で囲われているため、「プロセスNEAR2開発NEAR2セ
ンター」の検索論理式が生成される。なお、図6の「A
社ANDプロセス」の検索論理式は、後述するステップ
S18で生成されるものである。
In addition, for example, as shown in FIG.
If a search request sentence of “Process Development Center of Company A” is entered, the search formula of “Process NEAR2 Development NEAR2 Center” is generated because “Process Development Center” is enclosed in quotation marks. Is done. Note that “A” in FIG.
The search logical expression of "company AND process" is generated in step S18 described later.

【0048】さらに、図7に示すように、「アジアでの
パソコン生産の「半導体供給センター」について」の検
索要求文が入力されたような場合にも、「半導体供給セ
ンター」は引用符で囲われているため、「半導体NEAR2
供給NEAR2センター」の検索論理式が生成される。な
お、「アジアANDパソコン」の論理式と、「生産AN
D半導体」の検索論理式は、ステップS18で生成さ
れ、「パソコンNEAR1生産」の検索論理式は、後述する
ステップS17で生成されるものである。
Further, as shown in FIG. 7, even when a search request sentence "about" Semiconductor supply center for personal computer production in Asia "is input," Semiconductor supply center "is enclosed in quotation marks. Has been described, "Semiconductor NEAR2
A search formula for "supply NEAR2 center" is generated. Note that the logical expression of “Asia AND personal computer” and “Production AN”
The search logical expression of "D semiconductor" is generated in step S18, and the search logical expression of "production of personal computer NEAR1" is generated in step S17 described later.

【0049】一方、図8に示すように、例えば「政府に
よる危機管理対応を整えていく過程」の検索要求文が入
力された場合、この検索要求文は引用符に囲われてはい
るが、「の」以外の助詞が含まれている。このため、ス
テップS7でYesの判定が行われ、ステップS8の処
理はスキップされる。すなわち、NEAR2による結合は行
われない。なお、図8における「政府AND危機」と
「対応AND過程」の検索論理式は、ステップS18で
生成され、「危機NEAR1管理NEAR1対応」の検索論理式
は、ステップS17で生成される。
On the other hand, as shown in FIG. 8, for example, when a search request sentence of “Process for preparing a crisis management response by the government” is input, this search request sentence is enclosed in quotation marks. Particles other than "no" are included. Therefore, a determination of Yes is made in step S7, and the process of step S8 is skipped. That is, the connection by NEAR2 is not performed. The search logical formula of “government AND crisis” and “correspondence AND process” in FIG. 8 is generated in step S18, and the search logical formula of “crisis NEAR1 management NEAR1 correspondence” is generated in step S17.

【0050】ステップS6で、形態素解析の結果に引用
符が含まれていないと判定された場合、ステップS7
で、引用符の内部に助動詞が含まれているか、または
「の」以外の助詞が含まれていると判定された場合、ま
たは、ステップS8のNEAR2による検索論理式の生成が
終了した後、ステップS9に進み、形態素解析結果に固
有名詞が含まれているか否かが判定される。固有名詞が
含まれている場合には、ステップS10に進み、その固
有名詞の前後で、名詞や固有名詞が助詞を含まずに連続
している範囲、または助詞「の」を含んで連続している
範囲が決定される。この実施の形態の場合、この範囲も
名詞句とされる。そして、ステップS11において、ス
テップS10で決定された範囲で、助詞「の」をNEAR2
に置換する処理が実行される。また、名詞や固有名詞を
NEAR2で結合する処理が実行される。
If it is determined in step S6 that the result of the morphological analysis does not include a quotation mark, step S7
When it is determined that the quotation mark contains an auxiliary verb or a particle other than "no", or after the generation of the search logical expression by NEAR2 in step S8, Proceeding to S9, it is determined whether the morphological analysis result includes a proper noun. When the proper noun is included, the process proceeds to step S10, and before and after the proper noun, a range in which the noun or proper noun is continuous without including the particle, or continuously including the particle "no". Is determined. In the case of this embodiment, this range is also a noun phrase. Then, in step S11, the particle "no" is changed to NEAR2 in the range determined in step S10.
Is performed. Also, nouns and proper nouns
The combining process is performed in NEAR2.

【0051】例えば、図9に示すように、「琵琶湖科学
賞について」の検索要求文が入力された場合、ここに
は、固有名詞「琵琶湖」が含まれているので、「琵琶湖
科学賞」が固有名詞を含んで連続する範囲(名詞句)と
して抽出され、それらを近傍オペレータNEAR2で結合し
て、次に示すような検索論理式が生成される。 琵琶湖NEAR2科学NEAR2賞
For example, as shown in FIG. 9, when a search request sentence of “about Lake Biwa Science Award” is entered, since the proper noun “Lake Biwa” is included, the “Lake Biwa Science Award” is entered. It is extracted as a continuous range (noun phrase) including proper nouns, and these are combined by the neighborhood operator NEAR2 to generate a search logical expression as shown below. Lake Biwa NEAR2 Science NEAR2 Award

【0052】このほか、例えば、図10に示すように、
「山田商事が売っている商品」の検索要求文が入力され
ると、「山田」は固有名詞であるため、「山田商事」が
固有名詞に連続する名詞の範囲として抽出され、「山
田」と「商事」が近傍オペレータNEAR2で結合され、
「山田NEAR2商事」の検索論理式が生成される。なお、
「商事AND商品」の検索論理式は、ステップS18で
生成されるものである。
In addition, for example, as shown in FIG.
When a search request sentence of “product sold by Yamada Shoji” is input, “Yamada” is a proper noun, so “Yamada Shoji” is extracted as a range of nouns following the proper noun, and “Yamada” "Trading" is joined by nearby operator NEAR2,
A search logical expression of “Yamada NEAR2 Shoji” is generated. In addition,
The search logical expression of “commercial AND product” is generated in step S18.

【0053】ステップS9で、形態素解析結果に固有名
詞が含まれていないと判定された場合、またはステップ
S11の近傍オペレータNEAR2による処理が終了した
後、ステップS12に進み、形態素解析結果に形容詞ま
たは形容動詞が含まれているか否かが判定される。形容
詞または形容動詞が含まれている場合には、ステップS
13に進み、形容詞は終止形に標準化され、また形容動
詞は語幹のみに標準化される。
In step S9, when it is determined that the proper noun is not included in the morphological analysis result, or after the processing by the nearby operator NEAR2 in step S11 is completed, the process proceeds to step S12, and the adjective or adjective is included in the morphological analysis result. It is determined whether a verb is included. If an adjective or an adjective verb is included, step S
Proceeding to 13, the adjective is standardized to the final form, and the adjective verb is standardized only to the stem.

【0054】例えば、図11に示すように、「パソコン
の全社的な展開」の検索要求文が入力された場合、この
検索要求文には、形容動詞である「全社的な」が含まれ
ている。この形容動詞は、「全社的」の語幹のみに標準
化される。
For example, as shown in FIG. 11, when a search request sentence “Company-wide deployment of personal computers” is input, this search request sentence includes an adjective “company-wide”. I have. This adjective verb is standardized only to the "company-wide" stem.

【0055】次に、ステップS14に進み、形容詞また
は形容動詞を含んで名詞が連続する範囲が決定される。
この実施の形態の場合、この範囲も名詞句とされる。図
11の例の場合、「パソコンの全社的展開」が、名詞が
連続する範囲として決定される。次に、ステップS15
に進み、決定された範囲で、名詞、形容詞、形容動詞
を、近傍オペレータNEAR2よりは弱い近傍オペレータNE
AR1で結合する処理が行われる。その結果、図11に示
す例の場合、「パソコンNEAR1全社的NEAR1展開」の検
索論理式が生成される。
Next, the process proceeds to step S14, in which a range including nouns including the adjective or the adjective verb is determined.
In the case of this embodiment, this range is also a noun phrase. In the case of the example of FIG. 11, “company-wide deployment of personal computers” is determined as a range in which nouns are continuous. Next, step S15
In the determined range, the noun, adjective, and adjective verb are changed to the neighborhood operator NE weaker than the neighborhood operator NEAR2.
The process of combining with AR1 is performed. As a result, in the case of the example shown in FIG. 11, a search logical expression of “PC NEAR1 company-wide NEAR1 development” is generated.

【0056】以上のようにして、ステップS15の処理
が終了した後、またはステップS12で形態素解析の結
果に、形容詞または形容動詞が含まれていないと判定さ
れた場合、ステップS16に進み、名詞が助詞を含まず
に連続する範囲、または名詞が助詞「の」を含んで連続
する範囲が決定される。この実施の形態の場合、この範
囲も名詞句とされる。そして、ステップS17に進み、
決定された範囲で助詞「の」が存在する場合、それが近
傍オペレータNEAR1に置換される。また、名詞がNEAR1
で結合される。例えば、図12に示すように、「リース
業界の本業強化」の検索要求文が入力されたとき、「リ
ース業界の本業強化」が助詞「の」を含んで連続する範
囲(名詞句)として決定される。そして、助詞「の」が
NEAR1に置換され、各名詞もNEAR1で結合されるので、
結局、次の検索論理式が生成される。 リースNEAR1業界NEAR1本業NEAR1強化
As described above, after the processing in step S15 is completed, or when it is determined in step S12 that the result of the morphological analysis does not include an adjective or an adjective verb, the process proceeds to step S16, and the noun is changed. A continuous range including no particles or a continuous range including nouns “no” is determined. In the case of this embodiment, this range is also a noun phrase. Then, the process proceeds to step S17,
If the particle "no" exists in the determined range, it is replaced by the nearby operator NEAR1. The noun is NEAR1
Are combined. For example, as shown in FIG. 12, when a search request sentence "strengthening the main business of the leasing industry" is input, "strengthening the main business of the leasing industry" is determined as a continuous range (noun phrase) including the particle "no". Is done. And the particle "no"
It is replaced by NEAR1 and each noun is also joined by NEAR1, so
As a result, the following search formula is generated. Leasing NEAR1 industry NEAR1 main business NEAR1 reinforcement

【0057】このほか、例えば、図13に示すように、
「アジアでのパソコンの生産」の検索要求文が入力され
た場合、「パソコンの生産」が助詞「の」を挟んで連続
する範囲として抽出され、「パソコンNEAR1生産」の検
索論理式が生成される。
In addition, for example, as shown in FIG.
When a search request sentence of "PC production in Asia" is entered, "PC production" is extracted as a continuous range across the particle "NO", and a search formula for "PC NEAR1 production" is generated. You.

【0058】また、図14に示すように、「アジアでの
パソコン生産」の検索要求文が入力されると、「パソコ
ン生産」が、助詞を挟まずに名詞が連続する範囲として
抽出され、「パソコンNEAR1生産」の検索論理式が生成
される。
Further, as shown in FIG. 14, when a search request sentence of "PC production in Asia" is input, "PC production" is extracted as a range in which nouns are continuous without interposing particles. The search logical expression of "PC NEAR1 production" is generated.

【0059】次に、ステップS18に進み、名詞、固有
名詞、形容詞、形容動詞以外の品詞の単語(検索キーワ
ードにしない単語)を、検索オペレータANDに置換す
る処理が実行される。例えば、図3に示す品詞のうち、
副詞、連体詞、接続詞、感動詞といった検索キーワード
としない品詞がANDに置換される。その結果、図13
または図14の検索要求文においては、「での」がAN
Dに置換される。
Next, the process proceeds to step S18, in which processing is performed to replace words of parts of speech (words not used as search keywords) other than nouns, proper nouns, adjectives, and adjective verbs with the search operator AND. For example, of the parts of speech shown in FIG.
Parts of speech that are not search keywords, such as adverbs, adverbs, conjunctions, and verbs, are replaced with AND. As a result, FIG.
Alternatively, in the search request sentence of FIG.
D is substituted.

【0060】次に、ステップS19に進み、それまでの
処理の結果生成された検索論理式中にANDが2個以上
連続する場合には、これを1つにする処理が実行され
る。また、ANDが検索論理式の先頭または最後にある
場合には、それが削除される。
Next, the process proceeds to step S19, and if two or more ANDs are consecutive in the search logical expression generated as a result of the processing up to that point, a process of reducing the number to one is executed. If AND is at the beginning or end of the search logical expression, it is deleted.

【0061】以上のようにして生成された検索論理式
は、ステップS20で処理部22から文書検索装置2に
出力される。「アジアのパソコン生産について知りた
い」の検索要求文が入力された場合には、「アジアAN
DパソコンNEAR1生産」の検索論理式が出力されること
になる。
The search logical expression generated as described above is output from the processing unit 22 to the document search device 2 in step S20. If the search request sentence "I want to know about PC production in Asia" is entered, "Asian AN
The search logical expression of "D personal computer NEAR1 production" is output.

【0062】文書検索装置2においては、入力された検
索論理式に従って文書が検索される。検索論理式に含ま
れる検索オペレータは、次のような検索を行うことにな
る。
In the document search device 2, a document is searched according to the input search logical expression. The search operator included in the search logical expression performs the following search.

【0063】X OR Y 検索キーワードXまたはY
のいずれか一方が含まれる文献が検索される。 X AND Y キーワードXとキーワードYの両方が
含まれる文献が検索される。 X NEAR1 Y キーワードXとキーワードYが1つの
段落に含まれる文献が検索される。この近傍オペレータ
は、上記した「課題を解決するための手段」の欄で説明
した(1)乃至(7)の近傍オペレータのうちの(7)
の近傍オペレータに対応する。 X NEAR2 Y 検索キーワードXと検索キーワードY
が、この順番で連続して含まれる文献が検索される。こ
の近傍オペレータは、上記した「課題を解決するための
手段」ので説明した(1)乃至(7)の近傍オペレータ
のうちの(1)の近傍オペレータに対応する。
X OR Y Search keyword X or Y
Documents containing any one of the above are searched. X AND Y Documents containing both keywords X and Y are searched. X NEAR1 Y Documents in which keyword X and keyword Y are included in one paragraph are searched. This neighborhood operator is (7) of the neighborhood operators (1) to (7) described in the section of "Means for Solving the Problem" described above.
Corresponds to a nearby operator. X NEAR2 Y Search keyword X and search keyword Y
Are sequentially searched in this order. This neighborhood operator corresponds to the neighborhood operator (1) among the neighborhood operators (1) to (7) described in the above “Means for Solving the Problem”.

【0064】これらの検索オペレータの優先順位は、次
のように設定されている。
The priorities of these search operators are set as follows.

【0065】NEAR2>NEAR1>AND>ORNEAR2> NEAR1> AND> OR

【0066】図15乃至図19は、以上のようにして生
成された検索論理式の検索の順番を優先順位の高いもの
から順番に数字で表している。例えば、図15において
は、番号1で示す「パソコンNEAR1生産」の検索論理式
が最初に検索され、この検索論理式を満足するものから
さらに、「アジア」の検索キーワードを含むものが検索
される。
FIGS. 15 to 19 show the search order of the search logical expressions generated as described above in numerical order from the one with the highest priority. For example, in FIG. 15, the search logical expression of “PC NEAR1 production” indicated by number 1 is searched first, and those that include the search keyword of “Asia” are further searched from those satisfying the search logical expression. .

【0067】また、例えば、図19に示す例において
は、「半導体NEAR2供給」の検索論理式を満足するもの
が検索され、これを満足するものの中からさらに「半導
体NEAR2供給NEAR2センター」の検索論理式を満足する
ものが検索され、さらに、この検索論理式を満足するも
のの中から、「パソコンNEAR1生産」を満足するものが
検索される。以下、「アジアANDパソコンNEAR1生
産」を満足するものが検索され、最後に、「アジアAN
DパソコンNEAR1生産AND半導体NEAR2供給NEAR2セ
ンター」を満足するものが検索される。
Further, for example, in the example shown in FIG. 19, a search logic that satisfies the search logical expression of “semiconductor NEAR2 supply” is searched, and a search logic of “semiconductor NEAR2 supply NEAR2 center” is further searched from those satisfying this. Those satisfying the formula are searched, and those satisfying "production of personal computer NEAR1" are searched from those satisfying the search logical formula. In the following, those that satisfy "Asian AND personal computer NEAR1 production" are searched.
Those that satisfy "D personal computer NEAR1 production AND semiconductor NEAR2 supply NEAR2 center" are searched.

【0068】その結果、例えば「アジアのパソコン生産
について知りたい」の検索要求文を入力すると、従来、
図20に示すように、「アジアANDパソコンAND生
産」の検索論理式が生成されていたため、図21と図2
2に示す文献が、両方とも検索される結果となっていた
が、本実施の形態の場合、図1に示すように、「アジア
ANDパソコンNEAR1生産」の検索論理式が生成される
ため、図21に示すような文献は検索されるが、図22
に示すように、「パソコン」と「生産」の検索キーワー
ドが含まれてはいるが、それらが1つの段落内の文章に
は含まれていない文献は、検索されないことになる。そ
の結果、より対象を絞り込んで検索することが可能とな
る。
As a result, for example, when a search request sentence “I want to know about Asian PC production” is input,
As shown in FIG. 20, since a search logical expression of “Asian AND personal computer AND production” was generated, FIG. 21 and FIG.
Although both documents shown in FIG. 2 are searched, in the case of the present embodiment, as shown in FIG. 1, a search logical expression of “Production of Asian AND personal computer NEAR1” is generated. Documents such as those shown in FIG.
As shown in (1), documents that include the search keywords of “PC” and “production” but are not included in the text in one paragraph are not searched. As a result, it is possible to narrow down the search and search.

【0069】なお、以上においては、日本語の文章を検
索する場合を例として説明したが、日本語以外の文章を
検索する場合にも、本発明は適用することが可能であ
る。
In the above description, the case of searching for Japanese sentences has been described as an example. However, the present invention can be applied to the case of searching for sentences other than Japanese.

【0070】また、上記処理を行うプログラムは、磁気
ディスク、CD-ROMディスクなどの記録媒体に記録し、こ
れをユーザに提供したり、ネットワークなどの媒体を介
して提供することが可能である。もちろん、検索論理式
生成装置1に内蔵されるハードディスク、固体メモリな
どの記録媒体に予め記録しておくようにすることも可能
である。
The program for performing the above processing can be recorded on a recording medium such as a magnetic disk or a CD-ROM disk and provided to a user or provided via a medium such as a network. Of course, it is also possible to record in advance on a recording medium such as a hard disk or a solid-state memory built in the search logical expression generation device 1.

【0071】なお、上記実施の形態においては、近傍オ
ペレータNEAR2をNEAR1より優先するものとしたが、後
者を優先するものとすることもできる。
In the above embodiment, the near operator NEAR2 is given priority over NEAR1, but the latter may be given priority.

【0072】[0072]

【発明の効果】以上の如く、請求項1に記載の検索論理
式生成装置および請求項9に記載の記録媒体によれば、
名詞句を判定し、名詞句を構成する検索キーワードを近
傍オペレータで結合するようにしたので、所望の文章を
絞り込んで、迅速に検索することが可能な検索論理式を
生成することが可能となる。
As described above, according to the retrieval logical expression generation apparatus of the first aspect and the recording medium of the ninth aspect,
Since the noun phrase is determined and the search keywords constituting the noun phrase are combined by the neighborhood operator, it is possible to narrow down a desired sentence and generate a search logical expression that can be searched quickly. .

【0073】また、請求項8に記載の検索システムによ
れば、このようにして生成された検索論理式を用いて検
索を行うようにしたので、所望の文章を絞り込んで、迅
速、かつ確実に検索することができる。
According to the search system of the present invention, since the search is performed using the search logical expression generated in this manner, desired sentences can be narrowed down, and quickly and reliably. Can be searched.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の検索システムの構成例を示すブロック
図である。
FIG. 1 is a block diagram illustrating a configuration example of a search system according to the present invention.

【図2】図1の検索システムの動作を説明するフローチ
ャートである。
FIG. 2 is a flowchart illustrating an operation of the search system in FIG. 1;

【図3】図1の形態素解析装置で素解析される品詞を説
明する図である。
FIG. 3 is a diagram illustrating parts of speech that are subjected to elementary analysis by the morphological analyzer of FIG. 1;

【図4】検索要求文と検索論理式の例を示す図である。FIG. 4 is a diagram illustrating an example of a search request sentence and a search logical expression.

【図5】検索要求文と検索論理式の例を示す図である。FIG. 5 is a diagram showing an example of a search request sentence and a search logical expression.

【図6】検索要求文と検索論理式の例を示す図である。FIG. 6 is a diagram illustrating an example of a search request statement and a search logical expression.

【図7】検索要求文と検索論理式の例を示す図である。FIG. 7 is a diagram showing an example of a search request sentence and a search logical expression.

【図8】検索要求文と検索論理式の例を示す図である。FIG. 8 is a diagram showing an example of a search request statement and a search logical expression.

【図9】検索要求文と検索論理式の例を示す図である。FIG. 9 is a diagram showing an example of a search request statement and a search logical expression.

【図10】検索要求文と検索論理式の例を示す図であ
る。
FIG. 10 is a diagram showing an example of a search request sentence and a search logical expression.

【図11】検索要求文と検索論理式の例を示す図であ
る。
FIG. 11 is a diagram showing an example of a search request sentence and a search logical expression.

【図12】検索要求文と検索論理式の例を示す図であ
る。
FIG. 12 is a diagram illustrating an example of a search request statement and a search logical expression.

【図13】検索要求文と検索論理式の例を示す図であ
る。
FIG. 13 is a diagram showing an example of a search request statement and a search logical expression.

【図14】検索要求文と検索論理式の例を示す図であ
る。
FIG. 14 is a diagram showing an example of a search request sentence and a search logical expression.

【図15】検索の順番を説明する図である。FIG. 15 is a diagram illustrating a search order.

【図16】検索の順番を説明する図である。FIG. 16 is a diagram illustrating a search order.

【図17】検索の順番を説明する図である。FIG. 17 is a diagram illustrating a search order.

【図18】検索の順番を説明する図である。FIG. 18 is a diagram illustrating a search order.

【図19】検索の順番を説明する図である。FIG. 19 is a diagram illustrating a search order.

【図20】従来の検索システムの構成例を示すブロック
図である。
FIG. 20 is a block diagram illustrating a configuration example of a conventional search system.

【図21】検索される文献の例を示す図である。FIG. 21 is a diagram illustrating an example of a document to be searched.

【図22】検索される他の文献の例を示す図である。FIG. 22 is a diagram illustrating an example of another document to be searched.

【符号の説明】[Explanation of symbols]

1 検索論理式生成装置 2 文書検索装置 11 形態素解析装置 12 検索オペレータ決定装置 20 検索キーワード決定部 21 判定部 22 処理部 REFERENCE SIGNS LIST 1 search logical formula generation device 2 document search device 11 morphological analysis device 12 search operator determination device 20 search keyword determination unit 21 determination unit 22 processing unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 向川 信一 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 (72)発明者 古河 靖之 京都府京都市右京区花園土堂町10番地 オ ムロン株式会社内 ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Shinichi Mukakawa 10 Hanazono Todocho, Ukyo-ku, Kyoto, Kyoto Prefecture Inside of Omron Co., Ltd. OMRON Corporation

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 検索要求の文字列を形態素解析した結果
から、検索キーワードを決定する決定手段と、 前記検索キーワードが名詞句を構成するか否かを判定す
る判定手段と、 前記判定手段により判定された前記名詞句を構成する前
記検索キーワードを、近傍オペレータで結合して検索論
理式を生成する生成手段とを備えることを特徴とする検
索論理式生成装置。
1. A determination unit for determining a search keyword from a result of morphological analysis of a character string of a search request, a determination unit for determining whether the search keyword forms a noun phrase, and a determination by the determination unit Generating means for generating a search logical expression by combining said search keywords constituting said noun phrase by a nearby operator.
【請求項2】 前記判定手段は、引用符で囲われている
範囲、固有名詞の前または後に名詞または固有名詞が助
詞「の」を含んでまたは含まないで連続している範囲、
形容詞または形容動詞が連続している範囲、または、名
詞が助詞「の」を含んでまたは含まないで連続している
範囲を、前記名詞句と判定することを特徴とする請求項
1に記載の検索論理式生成装置。
2. The method according to claim 1, wherein the determining unit includes: a range enclosed by quotation marks; a range in which the noun or proper noun is continuous before or after the proper noun including or not including the particle “no”;
The range in which an adjective or an adjective verb is continuous, or a range in which a noun is continuous with or without the particle "no" is determined as the noun phrase. Search formula generator.
【請求項3】 前記生成手段は、前記範囲に対応して、
前記名詞句を構成する前記検索キーワードを、結合力の
より強い第1の近傍オペレータまたは結合力のより弱い
第2の近傍オペレータで結合することを特徴とする請求
項2に記載の検索論理式生成装置。
3. The method according to claim 1, wherein the generating unit includes:
3. The search logical expression generation according to claim 2, wherein the search keywords forming the noun phrase are combined by a first neighbor operator having a stronger binding force or a second neighbor operator having a weaker binding force. 4. apparatus.
【請求項4】 前記生成手段は、前記名詞句が、名詞が
助詞「の」を含んでまたは含まないで連続している範囲
である場合、前記助詞「の」を、前記第2の近傍オペレ
ータで置換するとともに、前記名詞を前記第2の近傍オ
ペレータで結合することを特徴とする請求項3に記載の
検索論理式生成装置。
4. The method according to claim 1, wherein the generating unit is configured to, when the noun phrase is in a range in which the noun is continuous including or not including the particle "no", the particle "no" to the second neighborhood operator. The search logical expression generation apparatus according to claim 3, wherein the noun is replaced by the second neighborhood operator.
【請求項5】 前記生成手段は、前記名詞句が、固有名
詞の前または後に名詞または固有名詞が助詞「の」を含
んでまたは含まないで連続している範囲である場合、前
記助詞「の」を、前記第1の近傍オペレータで置換する
とともに、前記固有名詞または名詞を、前記第1の近傍
オペレータで結合することを特徴とする請求項3に記載
の検索論理式生成装置。
5. The method according to claim 1, wherein the noun phrase is a range in which the noun or proper noun is continuous before or after the proper noun including or not including the particle “no”. ”Is replaced by the first neighborhood operator, and the proper noun or noun is combined by the first neighborhood operator.
【請求項6】 前記生成手段は、前記名詞句が、引用符
で囲まれている範囲である場合、前記名詞句を構成する
検索キーワードを、前記第1の近傍オペレータで結合す
ることを特徴とする請求項3に記載の検索論理式生成装
置。
6. The method according to claim 1, wherein, when the noun phrase is in a range enclosed by quotation marks, the generation unit combines the search keywords constituting the noun phrase with the first neighborhood operator. The search logical expression generation device according to claim 3.
【請求項7】 前記検索要求の文字列を形態素解析する
解析手段をさらに備えることを特徴とする請求項1乃至
6のいずれかに記載の検索論理式生成装置。
7. The search logical expression generation device according to claim 1, further comprising an analysis unit configured to perform a morphological analysis on the character string of the search request.
【請求項8】 前記請求項1乃至7のいずれかに記載の
前記生成手段により生成された検索論理式を用いて、検
索を行う検索手段を備えることを特徴とする検索システ
ム。
8. A search system comprising a search unit for performing a search using a search logical expression generated by the generation unit according to claim 1. Description:
【請求項9】 検索要求の文字列を形態素解析した結果
から、検索キーワードを決定する決定ステップと、 前記検索キーワードが名詞句を構成するか否かを判定す
る判定ステップと、 前記判定ステップで判定された前記名詞句を構成する前
記検索キーワードを、近傍オペレータで結合して検索論
理式を生成する生成ステップとを備えるプログラムが記
録されていることを特徴とする記録媒体。
9. A determination step of determining a search keyword from a result of morphological analysis of a character string of a search request, a determination step of determining whether the search keyword forms a noun phrase, and a determination in the determination step Generating a search logical expression by combining the search keywords forming the noun phrase with a nearby operator.
【請求項10】 前記判定ステップでは、引用符で囲わ
れている範囲、固有名詞の前または後に名詞または固有
名詞が助詞「の」を含んでまたは含まないで連続してい
る範囲、形容詞または形容動詞が連続している範囲、ま
たは、名詞が助詞「の」を含んでまたは含まないで連続
している範囲を、前記名詞句と判定することを特徴とす
る請求項9に記載の記録媒体。
10. In the determining step, a range enclosed by quotation marks, a range where nouns or proper nouns are continuous before or after proper nouns with or without the particle "no", adjectives or adjectives 10. The recording medium according to claim 9, wherein a range in which a verb is continuous or a range in which a noun includes or does not include the particle "no" is determined as the noun phrase.
【請求項11】 前記生成ステップでは、前記範囲に対
応して、前記名詞句を構成する前記検索キーワードを、
結合力のより強い第1の近傍オペレータまたは結合力の
より弱い第2の近傍オペレータで結合することを特徴と
する請求項10に記載の記録媒体。
11. In the generating step, the search keyword forming the noun phrase is defined according to the range,
11. The recording medium according to claim 10, wherein the connection is performed by a first neighboring operator having a stronger binding force or a second neighboring operator having a weaker binding force.
【請求項12】 前記生成ステップでは、前記名詞句
が、名詞が助詞「の」を含んでまたは含まないで連続し
ている範囲である場合、前記助詞「の」を、前記第2の
近傍オペレータで置換するとともに、前記名詞を前記第
2の近傍オペレータで結合することを特徴とする請求項
10に記載の記録媒体。
12. In the generating step, when the noun phrase is a range in which the noun is continuous including or not including the particle “no”, the noun phrase is replaced with the second neighboring operator. The recording medium according to claim 10, wherein the noun is replaced by the second neighbor operator.
【請求項13】 前記生成ステップでは、前記名詞句
が、固有名詞の前または後に名詞または固有名詞が助詞
「の」を含んでまたは含まないで連続している範囲であ
る場合、前記助詞「の」を、前記第1の近傍オペレータ
で置換するとともに、前記固有名詞または名詞を、前記
第1の近傍オペレータで結合することを特徴とする請求
項10に記載の記録媒体。
13. In the generating step, when the noun phrase is a range in which the noun or proper noun is continuous before or after the proper noun including or not including the particle “no”, "Is replaced by the first neighborhood operator, and the proper noun or noun is combined by the first neighborhood operator.
【請求項14】 前記生成ステップでは、前記名詞句
が、引用符で囲まれている範囲である場合、前記名詞句
を構成する検索キーワードを、前記第1の近傍オペレー
タで結合することを特徴とする請求項10に記載の記録
媒体。
14. In the generating step, when the noun phrase is in a range enclosed by quotation marks, search keywords constituting the noun phrase are combined by the first neighborhood operator. The recording medium according to claim 10, wherein
【請求項15】 前記検索要求の文字列を形態素解析す
る解析ステップをさらに備えることを特徴とする請求項
9乃至14のいずれかに記載の記録媒体。
15. The recording medium according to claim 9, further comprising an analysis step of morphologically analyzing the character string of the search request.
JP9147609A 1997-06-05 1997-06-05 Retrieval logical expression generating device, retrieval system, and record medium Pending JPH10334101A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9147609A JPH10334101A (en) 1997-06-05 1997-06-05 Retrieval logical expression generating device, retrieval system, and record medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9147609A JPH10334101A (en) 1997-06-05 1997-06-05 Retrieval logical expression generating device, retrieval system, and record medium

Publications (1)

Publication Number Publication Date
JPH10334101A true JPH10334101A (en) 1998-12-18

Family

ID=15434206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9147609A Pending JPH10334101A (en) 1997-06-05 1997-06-05 Retrieval logical expression generating device, retrieval system, and record medium

Country Status (1)

Country Link
JP (1) JPH10334101A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004114179A1 (en) * 2003-06-19 2004-12-29 Hitachi, Ltd. System for communicating message according to situation of managed object
JP2012083543A (en) * 2010-10-12 2012-04-26 Nec Informatec Systems Ltd Language model creation device, method thereof, and program thereof

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03116375A (en) * 1989-09-29 1991-05-17 Ricoh Co Ltd Information retriever
JPH05189492A (en) * 1992-01-14 1993-07-30 Nec Corp Automatic generator for retrieval formula
JPH08339383A (en) * 1995-04-11 1996-12-24 Ricoh Co Ltd Document retrieving device and dictionary preparing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03116375A (en) * 1989-09-29 1991-05-17 Ricoh Co Ltd Information retriever
JPH05189492A (en) * 1992-01-14 1993-07-30 Nec Corp Automatic generator for retrieval formula
JPH08339383A (en) * 1995-04-11 1996-12-24 Ricoh Co Ltd Document retrieving device and dictionary preparing device

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004114179A1 (en) * 2003-06-19 2004-12-29 Hitachi, Ltd. System for communicating message according to situation of managed object
JP2012083543A (en) * 2010-10-12 2012-04-26 Nec Informatec Systems Ltd Language model creation device, method thereof, and program thereof
US8831945B2 (en) 2010-10-12 2014-09-09 Nec Informatec Systems, Ltd. Language model generating device, method thereof, and recording medium storing program thereof
US9128907B2 (en) 2010-10-12 2015-09-08 Nec Informatec Systems, Ltd. Language model generating device, method thereof, and recording medium storing program thereof

Similar Documents

Publication Publication Date Title
US7949676B2 (en) Information search system, information search supporting system, and method and program for information search
US6243670B1 (en) Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
Hayes Intelligent high-volume text processing using shallow, domain-specific techniques
US4994967A (en) Information retrieval system with means for analyzing undefined words in a natural language inquiry
JP3173411B2 (en) Related document search device and recording medium storing related document search program
JPH1145274A (en) Extension method for key word using co-occurrence between words and computer readable recording medium recording program for making computer execute respective processes of the method
JP2850952B2 (en) Document search method and apparatus
JP3363501B2 (en) Text search device
JP4361299B2 (en) Evaluation expression extraction apparatus, program, and storage medium
JPH10334101A (en) Retrieval logical expression generating device, retrieval system, and record medium
JPH1115841A (en) Information retrieving device and medium recording information retrieving program
JP2008204133A (en) Answer search apparatus and computer program
JP4378106B2 (en) Document search apparatus, document search method and program
JP2007087157A (en) Translation system, translation device, translation method, and program
JPH10149370A (en) Document retrieval method and device using context information
JPH09185632A (en) Method and device for retrieving/editing information
JPH10207896A (en) Method and device for retrieval term extension and method and device for information retrieval
JPH1145236A (en) Document management support device and computer-readable recording medium where program allowing computer to function as same device is recorded
JP2006053907A (en) Information extraction method, information extraction device, information extraction program, and recording medium recording information extraction program
JPH1145249A (en) Information retrieval device and computer-readable recording medium where program for making computer function as same device is recorded
JPH0320866A (en) Text base retrieval system
JPH09128395A (en) Device for preparing document and its method
JP2002183133A (en) Device and method for extracting proper noun, and storage medium
JPH05189492A (en) Automatic generator for retrieval formula
JP2003058539A (en) Thesaurus dictionary generator for case translation

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041115