JP3411246B2 - Query output device, document search system, query output method, document search method, and recording medium - Google Patents
Query output device, document search system, query output method, document search method, and recording mediumInfo
- Publication number
- JP3411246B2 JP3411246B2 JP29779499A JP29779499A JP3411246B2 JP 3411246 B2 JP3411246 B2 JP 3411246B2 JP 29779499 A JP29779499 A JP 29779499A JP 29779499 A JP29779499 A JP 29779499A JP 3411246 B2 JP3411246 B2 JP 3411246B2
- Authority
- JP
- Japan
- Prior art keywords
- query
- term
- unit
- input
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Description
【0001】[0001]
【発明の属する技術分野】本発明は、検索したい文献を
キーワードではなく文章で指定することができ、当該文
章から検索に適したクエリを生成するのに好適なクエリ
出力装置、クエリ出力方法、文献検索システム、文献検
索方法、並びに、これらを実現するためのプログラムを
記録したコンピュータ読取可能な記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention can specify a document to be searched by a sentence rather than a keyword and is suitable for generating a query suitable for a search from the sentence, a query output device, a query output method, and a document. The present invention relates to a search system, a document search method, and a computer-readable recording medium recording a program for realizing these.
【0002】[0002]
【従来の技術】WWW(World Wide Web)技術の発展に
ともない、多数の文献から所望の文献を検索する文献検
索技術はますますその重要性を増している。2. Description of the Related Art With the development of WWW (World Wide Web) technology, a document search technology for searching a desired document from a large number of documents is becoming more and more important.
【0003】このような文献検索では、従来、以下のよ
うな手法が用いられていた。すなわち、ユーザは、所望
の文献を検索するためのキーワードを指定するか、ある
いは、文献を検索するための条件をより詳細に指定した
クエリを入力する。Conventionally, the following technique has been used in such document retrieval. That is, the user specifies a keyword for searching for a desired document, or inputs a query that specifies a condition for searching for a document in more detail.
【0004】すると、文献検索エンジンは、文献中に当
該キーワードが含まれる個数や、ベクトル空間法により
クエリにより指定された条件と文献との適合度を求め、
これらを元に当該文献の得点を計算する。Then, the document search engine obtains the number of times the keyword is included in the document, the degree of matching between the condition specified by the query by the vector space method and the document,
The score of the document is calculated based on these.
【0005】最後に、ユーザに対して、得点の高い文献
を検索結果として順に提示する。Finally, the documents with high scores are presented to the user in order as search results.
【0006】なお、ベクトル空間法では、クエリに含ま
れる検索用のキーワード(以下「ターム」という。)に
対して適宜重みを付ける手法や、文献検索エンジンの検
索範囲に含まれる文献に対して、それぞれ、当該文献か
ら抽出されたターム(以下「検索用ターム」という。)
を別途記憶しておき、得点計算を高速化する手法も提案
されている。In the vector space method, a method of appropriately weighting a keyword for retrieval (hereinafter referred to as a "term") included in a query, or a document included in a search range of a document search engine, Each term extracted from the document (hereinafter referred to as "search term")
There is also proposed a method for accelerating score calculation by separately storing.
【0007】[0007]
【発明が解決しようとする課題】しかしながら、キーワ
ードを入力する手法では、キーワードを複数入力した場
合、当該キーワードをすべて含むものを検索したいの
か、当該キーワードのいずれかを含むものを検索したい
のか、不明確となり、ユーザが期待しない検索結果が得
られるおそれがある。However, in the method of inputting a keyword, when a plurality of keywords are input, whether one wants to search for one that includes all the keywords or one that includes any of the keywords, There is a possibility that the search result will be clear and that the search result that the user does not expect is obtained.
【0008】また、指定されたキーワードが用意された
検索用タームでない場合には、検索結果として有意な結
果が得られないおそれがある。Further, if the designated keyword is not a prepared search term, there is a possibility that a significant result will not be obtained as a search result.
【0009】このほか、文献検索エンジン用のクエリを
一般ユーザが自分で構成したり、クエリが含むタームの
重みを調整したりするのは難しい。In addition, it is difficult for a general user to compose a query for a document search engine by himself or to adjust the weight of terms included in the query.
【0010】さらに、ユーザが自然な文章で検索対象の
文献を特定すると、この文章から自動的に適切なクエリ
を生成する手法が望まれている。Further, there is a demand for a method of automatically generating an appropriate query from a document when a user specifies a document to be searched with a natural sentence.
【0011】本発明が解決しようとする課題は、検索し
たい文献をキーワードではなく文章で指定し、当該文章
から検索に適したクエリを生成し、さらには当該クエリ
により文献を検索に行うことにある。The problem to be solved by the present invention is to specify a document to be searched by a sentence rather than a keyword, generate a query suitable for the search from the sentence, and further search the document by the query. .
【0012】[0012]
【課題を解決するための手段】上記課題を解決するた
め、本発明の第1の観点にかかるクエリ出力装置は、タ
ームを含むクエリを文献に対して適用して得られた得点
が所定の範囲に含まれる文献を獲得する文献検索エンジ
ンに与えるクエリを出力する。In order to solve the above problems, the query output device according to the first aspect of the present invention has a score obtained by applying a query including a term to a document within a predetermined range. The query given to the document search engine that acquires the documents contained in is output.
【0013】当該クエリ出力装置は、文字列入力受付部
と、ターム抽出部と、入力制御部と、クエリ生成部と、
メッセージ表示部と、修正入力受付部と、修正制御部
と、クエリ出力部とを備えるように構成する。The query output device includes a character string input receiving unit, a term extracting unit, an input control unit, a query generating unit,
It is configured to include a message display unit, a correction input reception unit, a correction control unit, and a query output unit.
【0014】ここで、文字列入力受付部は、文字列の入
力を受け付ける。Here, the character string input receiving unit receives the input of the character string.
【0015】ターム抽出部は、与えられた文字列を形態
素解析し、これに含まれるタームを抽出する。The term extractor morphologically analyzes the given character string and extracts the terms contained therein.
【0016】入力制御部は、前記文字列入力受付部によ
り文字列の入力が受け付けられた場合、前記ターム抽出
部に当該文字列を与える。When the input of the character string is accepted by the character string input accepting unit, the input control unit gives the character string to the term extracting unit.
【0017】クエリ生成部は、前記ターム抽出部により
抽出されたタームを含むクエリを生成する。The query generation unit generates a query including the terms extracted by the term extraction unit.
【0018】メッセージ表示部は、メッセージ表示条件
が満たされる場合、当該メッセージ表示条件にあらかじ
め対応付けられたメッセージを表示する。When the message display condition is satisfied, the message display unit displays a message previously associated with the message display condition.
【0019】修正入力受付部は、前記メッセージ表示部
によりメッセージが表示された場合、前記文字列入力受
付部により入力された文字列を修正する修正入力を受け
付ける。The correction input receiving unit receives a correction input for correcting the character string input by the character string input receiving unit when the message is displayed by the message display unit.
【0020】修正制御部は、前記修正入力受付部により
修正入力が受け付けられた場合、当該修正入力により修
正された文字列を、前記ターム抽出部に与える。When the correction input is received by the correction input receiving unit, the correction control unit supplies the term extracting unit with the character string corrected by the correction input.
【0021】クエリ出力部は、クエリ出力条件が満たさ
れる場合、前記クエリ生成部により生成されたクエリを
出力する。The query output unit outputs the query generated by the query generation unit when the query output condition is satisfied.
【0022】上記クエリ出力装置では、ユーザが自然な
文章で検索対象とする文献を特定すると、当該文章から
検索に適したクエリが生成される。また、たとえば、有
意な検索結果が得られないおそれがある場合には、その
旨をユーザに通知し、さらに詳細な検索条件を入力する
よう求める。このため、ユーザは、自然な文章を入力す
るだけで所望の検索結果を得ることができる。In the above-mentioned query output device, when the user specifies a document to be searched with a natural sentence, a query suitable for the search is generated from the sentence. Further, for example, when there is a possibility that a significant search result may not be obtained, the user is notified of that fact and requested to input further detailed search conditions. Therefore, the user can obtain a desired search result simply by inputting a natural sentence.
【0023】また、上記クエリ出力装置は、ターム記憶
部をさらに備えるように構成することができる。Further, the query output device can be configured to further include a term storage unit.
【0024】ここで、ターム記憶部は、複数のタームを
記憶する。Here, the term storage unit stores a plurality of terms.
【0025】一方、前記クエリ生成部により生成された
クエリに含まれるタームが前記ターム記憶部に記憶され
た複数のタームのいずれとも一致しない場合に、当該メ
ッセージ表示条件が満たされる。On the other hand, when the terms included in the query generated by the query generation unit do not match any of the plurality of terms stored in the term storage unit, the message display condition is satisfied.
【0026】上記クエリ出力装置では、ユーザが入力し
た文章から生成されたクエリが検索用タームでないター
ムを含む場合、有意な検索結果が得られないおそれがあ
るため、検索条件を修正するようユーザに促す。このた
め、文献検索エンジンに対する問い合わせを実行する前
にユーザはより詳細な条件を指定することができる。In the above query output device, if the query generated from the sentence input by the user includes a term that is not a search term, a significant search result may not be obtained. Therefore, the user is requested to correct the search condition. Urge. Therefore, the user can specify more detailed conditions before executing the inquiry to the document search engine.
【0027】また、上記クエリ出力装置は、パラメータ
入力受付部をさらに備えるように構成することができ
る。Further, the query output device can be configured so as to further include a parameter input acceptance unit.
【0028】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives the input of the generation parameter given to the query generating unit.
【0029】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該タームのそれぞれに対応
付けられ、当該得点を得る際に参照される重みを含む。On the other hand, the query generated by the query generation unit includes, in addition to terms, weights associated with each of the terms and referred to when obtaining the score.
【0030】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの重みを前記
パラメータ入力受付部により入力を受け付けられた生成
パラメータにより決定し、当該タームと、これに対応付
けて決定された重みと、を含むクエリを生成する。Further, the query generation unit determines the weight of each of the terms extracted by the term extraction unit based on the generation parameter input by the parameter input reception unit, and associates the term with the term. And a weight determined by the above are generated.
【0031】上記クエリ出力装置では、クエリ中に含ま
れるタームの重みの調整をするためのパラメータをユー
ザが入力できる。たとえば、パラメータを「ゆるい検
索」とした場合と、「きつい検索」とした場合とで、各
タームに与える重みを、当該タームの係り受け関係や品
詞などの情報から変更することにより、ユーザの要望や
用途に応じた適切なクエリを生成することができる。In the above-mentioned query output device, the user can input parameters for adjusting the weight of terms included in the query. For example, by changing the weight given to each term depending on whether the parameter is "loose search" or "tight search", the user's request It is possible to generate an appropriate query according to the application and usage.
【0032】また、上記クエリ出力装置は、パラメータ
入力受付部をさらに備えるように構成することができ
る。Further, the query output device can be configured so as to further include a parameter input acceptance unit.
【0033】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives the input of the generation parameter given to the query generating unit.
【0034】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該文献検索エンジンが獲得
する文献は当該タームを含むものに限るか否かを示す必
須ターム情報を含む。On the other hand, the query generated by the query generating unit includes, in addition to the term, essential term information indicating whether or not the documents acquired by the document search engine are limited to those including the term.
【0035】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの必須ターム
情報を、前記パラメータ入力受付部により入力を受け付
けられた生成パラメータにより決定し、当該タームと、
これに対応付けて決定された必須ターム情報と、を含む
クエリを生成する。Further, the query generation unit determines the essential term information of each of the terms extracted by the term extraction unit according to the generation parameter input of which is received by the parameter input reception unit.
A query including the required term information determined in association with this is generated.
【0036】上記クエリ出力装置では、クエリ中に含ま
れるタームが必ず文献に表れることを要する(この場
合、当該タームを「必須ターム」という。)か否かの調
整をするためのパラメータをユーザが入力できる。たと
えば、パラメータを「ゆるい検索」とした場合と、「き
つい検索」とした場合とで、当該タームの係り受け関係
や品詞などの情報から、タームのいずれか、もしくは、
すべてを必須タームとすることにより、ユーザの要望や
用途に応じた適切なクエリを生成することができる。In the above query output device, the user needs to set a parameter for adjusting whether or not the term included in the query needs to appear in the document (in this case, the term is referred to as "essential term"). You can enter. For example, depending on whether the parameter is "loose search" or "tight search", one of the terms or
By making all required terms, it is possible to generate an appropriate query according to the user's request and usage.
【0037】上記の課題を解決するため、第2の観点に
かかる本発明の文献検索システムは、上記のクエリ出力
装置と、文献検索エンジン部と、文献出力部とを備える
ように構成する。In order to solve the above problems, a document retrieval system according to a second aspect of the present invention is configured to include the above query output device, a document retrieval engine section, and a document output section.
【0038】ここで、文献検索エンジン部は、前記クエ
リ出力装置により出力されたクエリを文献に対して適用
して得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, the document search engine unit acquires a document in which the score obtained by applying the query output by the query output device to the document falls within a predetermined range.
【0039】一方、文献出力部は、文献出力部と前記文
献検索エンジン部により獲得された文献を出力する。On the other hand, the document output unit outputs the documents acquired by the document output unit and the document search engine unit.
【0040】上記文献検索システムでは、上記クエリ出
力装置により生成されたクエリを文献検索エンジンに与
えて、実際の検索を行う。文献検索エンジンでの処理は
長時間を要することがあるが、上記文献検索システムで
は、文献検索エンジンでの処理の前に、クエリ出力装置
によって適切な検索結果が得られると予想されるクエリ
をあらかじめ生成してから文献検索エンジンでの問い合
わせを行う。このため、ユーザが文献検索に要する問い
合わせの回数をきわめて少ないものとすることができ
る。In the document search system, the query generated by the query output device is given to the document search engine to perform an actual search. Although the processing in the document search engine may take a long time, in the above document search system, before the processing in the document search engine, a query expected to obtain an appropriate search result by the query output device is previously After creating, make an inquiry with the document search engine. Therefore, the number of inquiries required by the user for the document search can be made extremely small.
【0041】上記課題を解決するため、本発明の第3の
観点にかかるクエリ出力方法は、タームを含むクエリを
文献に対して適用して得られた得点が所定の範囲に含ま
れる文献を獲得する文献検索エンジンに与えるクエリを
出力し、文字列入力受付ステップと、ターム抽出ステッ
プと、入力制御ステップと、クエリ生成ステップと、メ
ッセージ表示ステップと、修正入力受付ステップと、修
正制御ステップと、クエリ出力ステップとを備えるよう
に構成する。In order to solve the above problems, a query output method according to a third aspect of the present invention obtains a document in which a score obtained by applying a query including a term to a document falls within a predetermined range. The query given to the document search engine is output, and a character string input receiving step, a term extracting step, an input controlling step, a query generating step, a message displaying step, a correction input receiving step, a correction controlling step, and a query. And an output step.
【0042】ここで、文字列入力受付ステップでは、文
字列の入力を受け付ける。Here, in the character string input receiving step, the input of the character string is received.
【0043】ターム抽出ステップでは、与えられた文字
列を形態素解析し、これに含まれるタームを抽出する。In the term extracting step, the given character string is subjected to morphological analysis, and terms included in this are extracted.
【0044】入力制御ステップでは、前記文字列入力受
付ステップにて文字列の入力が受け付けられた場合、前
記ターム抽出ステップに当該文字列からタームを抽出さ
せる。In the input control step, when the input of the character string is accepted in the character string input accepting step, the term extracting step causes the term to be extracted from the character string.
【0045】クエリ生成ステップでは、前記ターム抽出
ステップにて抽出されたタームを含むクエリを生成す
る。In the query generation step, a query including the terms extracted in the term extraction step is generated.
【0046】メッセージ表示ステップでは、メッセージ
表示条件が満たされる場合、当該メッセージ表示条件に
あらかじめ対応付けられたメッセージを表示する。In the message display step, when the message display condition is satisfied, the message previously associated with the message display condition is displayed.
【0047】修正入力受付ステップでは、前記メッセー
ジ表示ステップにてメッセージが表示された場合、前記
文字列入力受付ステップにて入力された文字列を修正す
る修正入力を受け付ける。In the correction input receiving step, when the message is displayed in the message displaying step, the correction input for correcting the character string input in the character string input receiving step is received.
【0048】修正制御ステップでは、前記修正入力受付
ステップにて修正入力が受け付けられた場合、前記ター
ム抽出ステップに当該修正入力により修正された文字列
からタームを抽出させる。In the correction control step, when the correction input is received in the correction input receiving step, the term extracting step causes the term to be extracted from the character string corrected by the correction input.
【0049】クエリ出力ステップでは、クエリ出力条件
が満たされる場合、前記クエリ生成ステップにて生成さ
れたクエリを出力する。In the query output step, if the query output condition is satisfied, the query generated in the query generation step is output.
【0050】また、上記クエリ出力方法において、前記
クエリ生成ステップにて生成されたクエリに含まれるタ
ームがあらかじめ記憶された複数のタームのいずれとも
一致しない場合に、当該メッセージ表示条件が満たされ
るように構成することができる。In the above query output method, if the term included in the query generated in the query generating step does not match any of a plurality of prestored terms, the message display condition is satisfied. Can be configured.
【0051】また、上記クエリ出力方法は、パラメータ
入力受付ステップをさらに備えるように構成することが
できる。The query output method can be configured so as to further include a parameter input receiving step.
【0052】ここで、パラメータ入力受付ステップで
は、前記クエリ生成ステップにて参照される生成パラメ
ータの入力を受け付ける。Here, in the parameter input receiving step, the input of the generation parameter referred to in the query generating step is received.
【0053】一方、前記クエリ生成ステップにて生成さ
れるクエリは、タームのほか、当該タームのそれぞれに
対応付けられ、当該得点を得る際に参照される重みを含
む。On the other hand, the query generated in the query generating step includes, in addition to the terms, weights associated with each of the terms and referred to when obtaining the score.
【0054】さらに、前記クエリ生成ステップは、前記
ターム抽出ステップにて抽出されたタームのそれぞれの
重みを前記パラメータ入力受付ステップにて入力を受け
付けられた生成パラメータにより決定し、当該ターム
と、これに対応付けて決定された重みと、を含むクエリ
を生成する。Further, in the query generation step, the weight of each of the terms extracted in the term extraction step is determined by the generation parameter input in the parameter input reception step, and the term and A weight including the weight determined in association with the query is generated.
【0055】また、上記クエリ出力方法は、パラメータ
入力受付ステップをさらに備えるように構成することが
できる。The query output method can be configured to further include a parameter input receiving step.
【0056】ここで、パラメータ入力受付ステップで
は、前記クエリ生成ステップにて参照される生成パラメ
ータの入力を受け付ける。Here, in the parameter input receiving step, the input of the generation parameter referred to in the query generating step is received.
【0057】一方、前記クエリ生成ステップにて生成さ
れるクエリは、タームのほか、当該文献検索エンジンが
獲得する文献は当該タームを含むものに限るか否かを示
す必須ターム情報を含む。On the other hand, the query generated in the query generating step includes, in addition to the term, essential term information indicating whether or not the documents acquired by the document search engine are limited to those including the term.
【0058】さらに、前記クエリ生成ステップは、前記
ターム抽出ステップにて抽出されたタームのそれぞれの
必須ターム情報を、前記パラメータ入力受付ステップに
て入力を受け付けられた生成パラメータにより決定し、
当該タームと、これに対応付けて決定された必須ターム
情報と、を含むクエリを生成する。Further, in the query generation step, the essential term information of each term extracted in the term extraction step is determined by the generation parameter input of which is accepted in the parameter input acceptance step,
A query including the term and the essential term information determined in association with the term is generated.
【0059】上記課題を解決するため、本発明の文献検
索方法は、文献検索ステップと、文献出力ステップとを
備えるように構成する。In order to solve the above problems, the document search method of the present invention is configured to include a document search step and a document output step.
【0060】ここで、文献検索ステップでは、上記クエ
リ出力方法により出力されたクエリを文献に対して適用
して得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, in the document search step, a document in which the score obtained by applying the query output by the query output method to the document is included in a predetermined range is acquired.
【0061】文献出力ステップでは、前記文献検索ステ
ップにて獲得された文献を出力する。In the document output step, the document acquired in the document search step is output.
【0062】上記課題を解決するため、本発明のコンピ
ュータ読取可能な記録媒体は、コンピュータを、文字列
入力受付部、ターム抽出部、入力制御部、クエリ生成
部、メッセージ表示部、修正入力受付部、修正制御部、
および、クエリ出力部として機能させるプログラムを記
録するように構成する。In order to solve the above-mentioned problems, the computer-readable recording medium of the present invention has a computer as a character string input receiving unit, a term extracting unit, an input control unit, a query generating unit, a message display unit, a correction input receiving unit. , Correction controller,
Also, it is configured to record a program that functions as a query output unit.
【0063】ここで、文字列入力受付部は、文字列の入
力を受け付ける。Here, the character string input receiving unit receives the input of the character string.
【0064】ターム抽出部は、与えられた文字列を形態
素解析し、これに含まれるタームを抽出する。The term extracting unit morphologically analyzes the given character string and extracts terms contained in this.
【0065】入力制御部は、前記文字列入力受付部によ
り文字列の入力が受け付けられた場合、前記ターム抽出
部に当該文字列を与える。When the input of the character string is accepted by the character string input accepting unit, the input control unit gives the character string to the term extracting unit.
【0066】クエリ生成部は、前記ターム抽出部により
抽出されたタームを含むクエリを生成する。The query generation unit generates a query including the terms extracted by the term extraction unit.
【0067】メッセージ表示部は、メッセージ表示条件
が満たされる場合、当該メッセージ表示条件にあらかじ
め対応付けられたメッセージを表示する。When the message display condition is satisfied, the message display section displays the message previously associated with the message display condition.
【0068】修正入力受付部は、前記メッセージ表示部
によりメッセージが表示された場合、前記文字列入力受
付部により入力された文字列を修正する修正入力を受け
付ける。The correction input receiving unit receives a correction input for correcting the character string input by the character string input receiving unit when the message is displayed by the message display unit.
【0069】修正制御部は、前記修正入力受付部により
修正入力が受け付けられた場合、当該修正入力により修
正された文字列を、前記ターム抽出部に与える。When the correction input is received by the correction input receiving unit, the correction control unit supplies the term extracting unit with the character string corrected by the correction input.
【0070】クエリ出力部は、クエリ出力条件が満たさ
れる場合、前記クエリ生成部により生成されたクエリを
出力する。The query output section outputs the query generated by the query generation section when the query output condition is satisfied.
【0071】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
ターム記憶部としてさらに機能させるように構成するこ
とができる。Further, in the above computer-readable recording medium, the program causes the computer to
It can be configured to further function as a term storage unit.
【0072】ここで、ターム記憶部は、複数のタームを
記憶する。Here, the term storage unit stores a plurality of terms.
【0073】一方、前記クエリ生成部により生成された
クエリに含まれるタームが前記ターム記憶部に記憶され
た複数のタームのいずれとも一致しない場合に、当該メ
ッセージ表示条件が満たされる。On the other hand, when the terms included in the query generated by the query generation unit do not match any of the plurality of terms stored in the term storage unit, the message display condition is satisfied.
【0074】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
パラメータ入力受付部としてさらに機能させるように構
成することができる。Further, in the above computer-readable recording medium, the program causes the computer to
It can be configured to further function as a parameter input reception unit.
【0075】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives the input of the generation parameter given to the query generating unit.
【0076】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該タームのそれぞれに対応
付けられ、当該得点を得る際に参照される重みを含む。On the other hand, the query generated by the query generating section includes, in addition to terms, weights associated with each of the terms and referred to when obtaining the score.
【0077】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの重みを前記
パラメータ入力受付部により入力を受け付けられた生成
パラメータにより決定し、当該タームと、これに対応付
けて決定された重みと、を含むクエリを生成する。Further, the query generation unit determines the weight of each of the terms extracted by the term extraction unit based on the generation parameter input by the parameter input reception unit, and associates the term with the term. And a weight determined by the above are generated.
【0078】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
パラメータ入力受付部としてさらに機能させるように構
成することができる。Further, in the above computer-readable recording medium, the program causes the computer to
It can be configured to further function as a parameter input reception unit.
【0079】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input reception unit receives the input of the generation parameter given to the query generation unit.
【0080】一方、前記クエリ生成部により生成される
クエリは、タームのほか、文献検索エンジンが獲得する
文献は当該タームを含むものに限るか否かを示す必須タ
ーム情報を含む。On the other hand, the query generated by the query generation unit includes, in addition to the term, essential term information indicating whether or not the documents acquired by the document search engine are limited to those including the term.
【0081】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの必須ターム
情報を、前記パラメータ入力受付部により入力を受け付
けられた生成パラメータにより決定し、当該タームと、
これに対応付けて決定された必須ターム情報と、を含む
クエリを生成する。Further, the query generation unit determines the essential term information of each of the terms extracted by the term extraction unit according to the generation parameter input of which is accepted by the parameter input acceptance unit.
A query including the required term information determined in association with this is generated.
【0082】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
文献検索エンジン部、文献出力部としてさらに機能させ
るように構成することができる。Further, in the above computer-readable recording medium, the program causes the computer to
It can be configured to further function as a document search engine unit and a document output unit.
【0083】ここで、文献検索エンジン部は、前記クエ
リ出力部により出力されたクエリを文献に対して適用し
て得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, the document search engine unit acquires a document whose score obtained by applying the query output by the query output unit to the document falls within a predetermined range.
【0084】一方、文献出力部は、前記文献検索エンジ
ン部により獲得された文献を出力する。On the other hand, the document output unit outputs the document acquired by the document search engine unit.
【0085】[0085]
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態について説明する。BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the accompanying drawings.
【0086】(概要構成)図1は、本発明のクエリ出力
装置として機能する典型的な情報処理装置(汎用のコン
ピュータ、各種端末、携帯端末、携帯電話、ゲーム装置
などの専用機器を含む)の概要構成を示す模式図であ
る。以下、図1を参照して説明する。(Outline Configuration) FIG. 1 shows a typical information processing apparatus (including a general-purpose computer, various terminals, mobile terminals, mobile phones, game machines, and other dedicated equipment) that functions as the query output apparatus of the present invention. It is a schematic diagram which shows a schematic structure. Hereinafter, description will be given with reference to FIG.
【0087】情報処理装置101は、CPU(Central
Processing Unit;中央処理ユニット)102によって
制御される。情報処理装置101に電源を投入すると、
CPU102は、ROM(Read Only Memory;読出専用
メモリ)103に記憶されたIPL(Initial Program
Loader;初期プログラムローダ)を実行する。The information processing apparatus 101 has a CPU (Central
Processing Unit (Central Processing Unit) 102. When the information processing apparatus 101 is powered on,
The CPU 102 has an IPL (Initial Program) stored in a ROM (Read Only Memory) 103.
Loader; initial program loader) is executed.
【0088】IPLは、ハードディスク104、FD
(Floppy Disk;フロッピーディスク)ドライブ110
に装着されたFD、CD−ROM(Compact Disk ROM)
ドライブ111に装着されたCD−ROMなどの記録媒
体に記憶されたOS(Operating System;オペレーティ
ング・システム)プログラムを読み出して実行するプロ
グラムである。The IPL is the hard disk 104, FD
(Floppy Disk) drive 110
FD, CD-ROM (Compact Disk ROM) installed in
It is a program for reading and executing an OS (Operating System) program stored in a recording medium such as a CD-ROM mounted in the drive 111.
【0089】OSを起動した後、CPU102は、キー
ボード105やマウス106などにより入力されたユー
ザの指示にしたがって、あるいは、ハードディスクなど
にあらかじめ記述された設定ファイルの内容にしたがっ
て、ハードディスクなどに記憶されたアプリケーション
プログラムを実行する。After booting the OS, the CPU 102 is stored in the hard disk or the like according to the user's instruction input by the keyboard 105 or the mouse 106 or according to the contents of the setting file previously described in the hard disk or the like. Run the application program.
【0090】なお、携帯端末などの小規模な情報処理装
置では、IPL自体がOSやアプリケーションプログラ
ムとしての機能を果たすような実施形態も採用すること
ができる。In a small-scale information processing device such as a mobile terminal, an embodiment in which the IPL itself functions as an OS and an application program can be adopted.
【0091】CPU102は、プログラムの実行の際
に、RAM(Random Access Memory)107を一時的な
作業用記憶領域として用いる。このほか、一時的な作業
用記憶領域として、CPU102内に設けられたレジス
タやキャッシュ(図示せず)が使われる。The CPU 102 uses a RAM (Random Access Memory) 107 as a temporary work storage area when executing a program. In addition, a register and a cache (not shown) provided in the CPU 102 are used as a temporary work storage area.
【0092】プログラムの実行に伴ない、ユーザに結果
を報告したり、途中経過を見せるため、CPU102
は、液晶ディスプレイやCRT(Cathode Ray Tube)な
どの表示装置108に当該情報を表示することができ
る。マウス106による指示操作では、マウス106を
移動することにより、画面に表示されたカーソルが移動
し、マウス106をクリックすることにより、カーソル
が指すメニュー項目を選択することができる。In order to report the result to the user or show the progress along with the execution of the program, the CPU 102
Can display the information on a display device 108 such as a liquid crystal display or a CRT (Cathode Ray Tube). In the instruction operation by the mouse 106, the cursor displayed on the screen is moved by moving the mouse 106, and the menu item pointed by the cursor can be selected by clicking the mouse 106.
【0093】情報処理装置101は、NIC(Network
Interface Card)やモデムなどのインターフェース10
9を介してインターネットなどのコンピュータ通信網と
通信を行うことができる。インターフェース109を介
して他のサーバコンピュータ(文献検索エンジン)にク
エリを送信したり、これから応答として送信された検索
結果を受信することができる。また、インターフェース
109を介して受信したプログラムを実行することもで
きる。The information processing apparatus 101 has a NIC (Network
Interface card, interface such as modem 10
9 can communicate with a computer communication network such as the Internet. It is possible to send a query to another server computer (literature search engine) via the interface 109 and receive the search result sent as a response from this. It is also possible to execute the program received via the interface 109.
【0094】図2は、上記情報処理装置101が本発明
のクエリ出力装置として機能する場合の、各機能の概要
構成を示す模式図である。FIG. 2 is a schematic diagram showing a schematic configuration of each function when the information processing apparatus 101 functions as the query output apparatus of the present invention.
【0095】クエリ出力装置201は、文字列入力受付
部202と、ターム抽出部203と、入力制御部204
と、クエリ生成部205と、メッセージ表示部206
と、修正入力受付部207と、修正制御部208と、ク
エリ出力部209とを備える。The query output device 201 includes a character string input acceptance unit 202, a term extraction unit 203, and an input control unit 204.
A query generation unit 205 and a message display unit 206
A correction input reception unit 207, a correction control unit 208, and a query output unit 209.
【0096】さらに、ターム記憶部210、および、パ
ラメータ入力受付部211を、備えるように構成するこ
とができる。以下、これらを備える構成をもとに説明す
る。Further, the term storage unit 210 and the parameter input reception unit 211 can be provided. Hereinafter, description will be given based on a configuration including these.
【0097】文字列入力受付部202は、ユーザから検
索用の自然な文章を表す文字列の入力を受け付ける。し
たがって、キーボード105やマウス106などの入力
装置は、文字列入力受付部202として機能する。The character string input receiving unit 202 receives an input of a character string representing a natural sentence for retrieval from the user. Therefore, the input device such as the keyboard 105 and the mouse 106 functions as the character string input receiving unit 202.
【0098】ターム抽出部203は、与えられた文字列
を形態素解析し、これに含まれるタームを抽出する。し
たがって、CPU102は、ターム抽出部203として
機能する。The term extracting unit 203 morphologically analyzes the given character string and extracts terms included in this. Therefore, the CPU 102 functions as the term extracting unit 203.
【0099】入力制御部204は、文字列入力受付部2
02により文字列の入力が受け付けられた場合、ターム
抽出部203に当該文字列を与える。したがって、CP
U102は、キーボード105やマウス106などの入
力装置と共働して、ターム抽出部203として機能す
る。The input control unit 204 includes the character string input receiving unit 2
When the input of the character string is accepted by 02, the character string is given to the term extracting unit 203. Therefore, CP
The U 102 works in cooperation with an input device such as the keyboard 105 and the mouse 106, and functions as the term extraction unit 203.
【0100】クエリ生成部205は、ターム抽出部20
3により抽出されたタームを含むクエリを生成する。し
たがって、CPU102は、クエリ生成部205として
機能する。The query generation unit 205 includes the term extraction unit 20.
Generate a query that includes the terms extracted by 3. Therefore, the CPU 102 functions as the query generation unit 205.
【0101】メッセージ表示部206は、メッセージ表
示条件が満たされる場合、当該メッセージ表示条件にあ
らかじめ対応付けられたメッセージを表示する。したが
って、表示装置108は、CPU102と共働して、メ
ッセージ表示部206として機能する。When the message display condition is satisfied, the message display unit 206 displays a message previously associated with the message display condition. Therefore, the display device 108 functions as the message display unit 206 in cooperation with the CPU 102.
【0102】修正入力受付部207は、メッセージ表示
部206によりメッセージが表示された場合、文字列入
力受付部202により入力された文字列を修正する修正
入力を受け付ける。したがって、キーボード105やマ
ウス106などの入力装置は、修正入力受付部207と
して機能する。When the message display unit 206 displays a message, the correction input receiving unit 207 receives a correction input for correcting the character string input by the character string input receiving unit 202. Therefore, the input device such as the keyboard 105 or the mouse 106 functions as the correction input receiving unit 207.
【0103】修正制御部208は、修正入力受付部20
7により修正入力が受け付けられた場合、当該修正入力
により修正された文字列を、ターム抽出部203に与え
る。したがって、CPU102は、修正制御部208と
して機能する。The correction control unit 208 includes the correction input reception unit 20.
When the correction input is accepted by 7, the character string corrected by the correction input is given to the term extracting unit 203. Therefore, the CPU 102 functions as the correction control unit 208.
【0104】修正入力があった場合は、ターム抽出部2
03が再度駆動される。本実施形態では、メッセージ表
示部206によるメッセージは「有意な検索結果が得ら
れないおそれがある」旨のものであるため、当該メッセ
ージが表示されなった場合に、クエリ出力条件が満たさ
れる。When there is a correction input, the term extraction unit 2
03 is driven again. In the present embodiment, the message displayed by the message display unit 206 indicates that “a significant search result may not be obtained.” Therefore, when the message is not displayed, the query output condition is satisfied.
【0105】クエリ出力部209は、クエリ出力条件が
満たされる場合、クエリ生成部205により生成された
クエリを出力し、文献検索サーバへ当該クエリを送信す
る。したがって、インターフェース109は、クエリ出
力部209として機能する。When the query output condition is satisfied, the query output unit 209 outputs the query generated by the query generation unit 205 and transmits the query to the document search server. Therefore, the interface 109 functions as the query output unit 209.
【0106】ターム記憶部210は、複数のタームを記
憶する。したがって、ROM103、ハードディスク1
04、FDD110に装着されたFD、CD−ROMド
ライブ111に装着されたCD−ROM、インターフェ
ース109を介して接続された他のコンピュータは、タ
ーム記憶部210として機能する。The term storage unit 210 stores a plurality of terms. Therefore, the ROM 103 and the hard disk 1
04, the FD installed in the FDD 110, the CD-ROM installed in the CD-ROM drive 111, and another computer connected via the interface 109 function as the term storage unit 210.
【0107】本実施形態では、クエリ生成部205によ
り生成されたクエリに含まれるタームがターム記憶部2
10に記憶された複数のタームのいずれとも一致しない
場合、有意な検索結果が得られないおそれがあるため、
当該メッセージ表示条件が満たされる。In this embodiment, the terms included in the query generated by the query generating section 205 are the term storage section 2
If there is no match with any of the multiple terms stored in 10, there is a possibility that significant search results may not be obtained.
The message display condition is satisfied.
【0108】パラメータ入力受付部211は、クエリ生
成部205に与える生成パラメータの入力を受け付け
る。したがって、キーボード105やマウス106など
の入力装置は、パラメータ入力受付部211として機能
する。The parameter input acceptance unit 211 accepts the input of the generation parameter given to the query generation unit 205. Therefore, the input device such as the keyboard 105 and the mouse 106 functions as the parameter input reception unit 211.
【0109】本実施形態では、クエリ生成部205によ
り生成されるクエリは、タームのほか、当該タームのそ
れぞれに対応付けられ、当該得点を得る際に参照される
重みを含む。In the present embodiment, the query generated by the query generating unit 205 includes, in addition to terms, weights associated with each of the terms and referred to when obtaining the score.
【0110】また、クエリ生成部205は、ターム抽出
部203により抽出されたタームのそれぞれの重みをパ
ラメータ入力受付部211により入力を受け付けられた
生成パラメータにより決定し、当該タームと、これに対
応付けて決定された重みと、を含むクエリを生成する。
重みの決定の手法については後述する。Further, the query generation unit 205 determines the weight of each of the terms extracted by the term extraction unit 203 based on the generation parameter input by the parameter input reception unit 211, and associates it with the term. And a weight determined by the above are generated.
The method for determining the weight will be described later.
【0111】さらに、クエリ生成部205により生成さ
れるクエリは、タームのほか、当該文献検索エンジンが
獲得する文献は当該タームを含むものに限るか否かを示
す必須ターム情報を含む。Further, the query generated by the query generation unit 205 includes, in addition to the term, essential term information indicating whether or not the documents acquired by the document search engine are limited to those including the term.
【0112】クエリ生成部205は、ターム抽出部20
3により抽出されたタームのそれぞれの必須ターム情報
を、パラメータ入力受付部211により入力を受け付け
られた生成パラメータにより決定し、当該タームと、こ
れに対応付けて決定された必須ターム情報と、を含むク
エリを生成する。必須ターム情報の生成については後述
する。The query generation unit 205 uses the term extraction unit 20.
The essential term information of each of the terms extracted by 3 is determined by the generation parameter input of which is accepted by the parameter input accepting unit 211, and the term and the essential term information determined in association with the term are included. Generate a query. The generation of the essential term information will be described later.
【0113】このほか、文献検索エンジン部(図示せ
ず)、および、文献出力部(図示せず)をクエリ出力装
置201と同じ情報処理装置101上に構成することが
可能である。ただし、負荷分散や文献データベースの集
中管理の観点からは、これらを分離した態様とすること
が望ましい。Besides, it is possible to configure a document search engine unit (not shown) and a document output unit (not shown) on the same information processing device 101 as the query output device 201. However, from the viewpoint of load distribution and centralized management of the literature database, it is desirable to separate them.
【0114】このほか、ハードディスク104、FDド
ライブ110に装着されたFD、CD−ROMドライブ
111に装着されたCD−ROM、ROM103、RA
M107、および、インターフェース109を介して接
続された他のコンピュータのこれら読み取り可能な情報
記憶装置に相当するものは、CPU102で実行される
プログラムを記録することにより、本発明の記録媒体と
して機能する。In addition, the hard disk 104, the FD installed in the FD drive 110, the CD-ROM installed in the CD-ROM drive 111, the ROM 103, and the RA.
M107 and the equivalent of these readable information storage devices of other computers connected via the interface 109 function as the recording medium of the present invention by recording the program executed by the CPU 102.
【0115】上述のように、図1に示す情報処理装置1
01は、図2に示す本発明のクエリ出力装置201とし
て機能する。これは、本発明のクエリ出力装置201の
典型的な実施態様である。As described above, the information processing device 1 shown in FIG.
01 functions as the query output device 201 of the present invention shown in FIG. This is an exemplary implementation of the query output device 201 of the present invention.
【0116】一方、携帯端末等では、外部記憶装置とし
て、不揮発性半導体メモリ(フラッシュメモリカード)
やバッテリバックアップがされたRAMを使用すること
ができる。この場合、必ずしもハードディスク104、
FDドライブ110、CD−ROMドライブ111等は
必要ない。On the other hand, in a portable terminal or the like, a nonvolatile semiconductor memory (flash memory card) is used as an external storage device.
A battery-backed RAM can be used. In this case, the hard disk 104,
The FD drive 110, the CD-ROM drive 111, etc. are not necessary.
【0117】(処理の流れ)図3は、図1に示す情報処
理装置101を本発明のクエリ出力装置201として機
能させる場合の処理の手順を示すフローチャートであ
る。(Processing Flow) FIG. 3 is a flowchart showing a processing procedure when the information processing apparatus 101 shown in FIG. 1 functions as the query output apparatus 201 of the present invention.
【0118】まず、CPU102は、ユーザから検索対
象の文書を特定するための検索条件を示す文章の入力を
受け付ける(ステップS301)。ユーザは、たとえ
ば、「日本と中国の合弁企業」のような自然な文章を検
索条件として入力することができる。First, the CPU 102 accepts an input of a sentence indicating a search condition for specifying a document to be searched from the user (step S301). The user can input a natural sentence such as “Japanese-Chinese joint venture” as a search condition.
【0119】次に、CPU102は、入力された文字列
を形態素解析して、これに含まれるタームを抽出する
(ステップS302)。上記入力例の場合は、タームは
形態素解析の結果は、「日本/と/中国/の/合弁/企
業」のように形態素解析される。ここで/は形態素の区
切りを示す。ここからタームとして「日本」「中国」
「合弁/企業」を抽出する。Next, the CPU 102 morphologically analyzes the input character string and extracts terms included in it (step S302). In the case of the above input example, the result of the term morphological analysis is morphologically analyzed as "Japan / and / China / of / joint venture / company". Here, / indicates a morpheme delimiter. From here, the terms "Japan" and "China"
Extract "joint venture / company".
【0120】タームがほかのタームを含む場合には、こ
れらも抽出する(ステップS303)。他のタームに含
まれるタームを「サブターム」という。たとえば、「合
弁/企業」のサブタームは、「合弁」と「企業」であ
る。If the term includes other terms, these terms are also extracted (step S303). Terms included in other terms are called "subterms". For example, the sub-terms of “joint venture / company” are “joint venture” and “company”.
【0121】さらに、これらタームやサブタームの同義
語・類義語など、関連するターム(以下「関連ターム」
という。)を、抽出する(ステップS304)。Further, related terms such as synonyms and synonyms of these terms and sub-terms (hereinafter referred to as “related terms”)
Say. ) Is extracted (step S304).
【0122】あるタームと、これの関連タームとの情報
は、あらかじめハードディスク104などに記憶してお
くことが望ましい。たとえば、「日本」の関連タームと
して、「日本国」「ニッポン」「ジャパン」「Japa
n」などのほか、「東アジア」「北海道」「九州」「四
国」などが抽出される。Information on a certain term and related terms is preferably stored in the hard disk 104 or the like in advance. For example, as related terms of "Japan", "Japan", "Nippon", "Japan", and "Japan"
In addition to “n”, “East Asia”, “Hokkaido”, “Kyushu”, “Shikoku”, etc. are extracted.
【0123】一方、CPU102は、ユーザから別途入
力された検索パラメータを取得する(ステップS30
5)。この検索パラメータは、たとえば、ステップS3
01において同時に入力されるような実施形態をとるこ
とができる。図4は、ユーザが検索条件文字列と検索パ
ラメータを入力する検索条件入力フォームの表示例であ
る。On the other hand, the CPU 102 acquires the search parameters separately input by the user (step S30).
5). This search parameter is, for example, step S3.
It is possible to adopt an embodiment in which the data are simultaneously input at 01. FIG. 4 is a display example of a search condition input form in which a user inputs a search condition character string and a search parameter.
【0124】検索条件入力フォーム401のテキストフ
ィールド402は、検索条件文字列の入力を受け付け
る。スライダ403は、検索パラメータの入力を受け付
ける。ユーザは、マウス106やキーボード105を操
作して、これらのフォームにそれぞれの情報を入力す
る。The text field 402 of the search condition input form 401 receives input of a search condition character string. The slider 403 receives input of search parameters. The user operates the mouse 106 and the keyboard 105 to input respective information in these forms.
【0125】本実施形態では、ユーザがクエリ出力ボタ
ン404をクリックすると、ステップS301以降の処
理が開始される。In the present embodiment, when the user clicks the query output button 404, the processing after step S301 is started.
【0126】ついで、CPU102は、抽出されたター
ムに、あらかじめ定めたタームでないものが含まれてい
るか否かを調べる(ステップS306)。「あらかじめ
定めたターム」は、ハードディスク104やCD−RO
Mなどに記憶されている。これらは、本クエリ出力装置
201が接続される文献検索エンジンで用いることがで
きる検索キーワードである。検索キーワードでないター
ムがある場合(ステップS306;Yes)、「有意な
検索結果が得られないおそれがある」旨のメッセージを
表示し(ステップS307)、ユーザに検索条件の再入
力を促す。Next, the CPU 102 checks whether or not the extracted terms include a term that is not a predetermined term (step S306). The “predetermined term” is the hard disk 104 or the CD-RO.
It is stored in M or the like. These are search keywords that can be used in the document search engine to which the query output device 201 is connected. If there is a term that is not a search keyword (step S306; Yes), a message that “significant search results may not be obtained” is displayed (step S307), and the user is prompted to re-enter search conditions.
【0127】本実施形態では、「検索キーワードでない
タームがある」場合にメッセージ表示条件が満たされる
が、メッセージ表示条件については、適宜変更が可能で
ある。In the present embodiment, the message display condition is satisfied when "there is a term that is not a search keyword", but the message display condition can be changed as appropriate.
【0128】図5は、このメッセージが表示される様子
を示す表示例である。メッセージ表示フォーム501に
は、当該メッセージが表示されるメッセージ表示領域5
02のほか、再入力をする場合にクリックする再入力ボ
タン503と、強行する場合、すなわち、このままの検
索条件で検索を行う場合にクリックする強行ボタン50
4とが表示される。FIG. 5 is a display example showing how this message is displayed. The message display area 501 displays the message in the message display area 5
02, and a re-entry button 503 to be clicked when re-entering, and a forcible button 50 to be clicked when forcing, that is, when performing a search with the search conditions as they are.
4 and are displayed.
【0129】CPU102は、ユーザが再入力するか否
かを判断し(ステップS308)、再入力する場合(ス
テップS308;Yes)、ステップS301に戻る。The CPU 102 determines whether or not the user re-inputs (step S308), and when re-inputting (step S308; Yes), returns to step S301.
【0130】一方、タームがすべて検索キーワードであ
る場合(ステップS306;No)、および、ユーザが
強行を選択した場合(ステップS308;No)、CP
U102は、タームと、形態素解析によって得られた当
該タームの品詞情報や係り受けの情報と、検索パラメー
タと、から、クエリを生成する(ステップS309)。On the other hand, when all the terms are search keywords (step S306; No) and when the user selects the forced line (step S308; No), CP
U102 produces | generates a query from a term, the part-of-speech information of the said term acquired by morphological analysis, the information of dependency, and a search parameter (step S309).
【0131】ここで生成されるクエリには、以下の情報
が含まれる。
・ターム。サブタームや関連タームを含む。
・当該タームの重み。ベクトル空間法で文献の得点を計
算する際に用いる。
・必須ターム情報。当該タームが必須タームか否かを示
す。The query generated here includes the following information. ·term. Includes sub-terms and related terms. -The weight of the term. It is used when calculating the scores of documents by the vector space method.・ Required term information. Indicates whether the term is an essential term.
【0132】タームの重みや必須ターム情報の決定の手
法については後述する。The method of determining the weight of the term and the essential term information will be described later.
【0133】最後に、CPU102は、生成されたクエ
リを出力する(ステップS310)。出力先としては、
たとえば、RAM107を採用することができる。出力
されたクエリは、後述するように、文献検索エンジンへ
の問い合わせに用いられる。Finally, the CPU 102 outputs the generated query (step S310). As the output destination,
For example, the RAM 107 can be adopted. The output query is used to make an inquiry to the document search engine, as described later.
【0134】図6は、出力されたクエリを用いて、文献
検索エンジンへ問い合わせを行う処理の流れを示すフロ
ーチャートである。FIG. 6 is a flow chart showing the flow of processing for making an inquiry to the document search engine using the output query.
【0135】CPU102は、ステップS310におい
て、RAM107に出力されたクエリを、インターフェ
ース109を介して文献検索エンジンサーバへ送信する
(ステップS601)。The CPU 102 transmits the query output to the RAM 107 in step S310 to the document search engine server via the interface 109 (step S601).
【0136】文献検索エンジンサーバは、当該クエリを
受信し(ステップS602)、当該クエリに基づいて、
各文献の得点を計算し(ステップS603)、上位の所
定の数の文献を取得し(ステップS604)これらを検
索結果として送信する(ステップS605)。The document search engine server receives the query (step S602), and based on the query,
The score of each document is calculated (step S603), a predetermined number of high-ranking documents are acquired (step S604), and these are transmitted as search results (step S605).
【0137】CPU102は、インターフェース109
を介して、検索結果の文献を受信し(ステップS60
6)、当該文献を表示装置108に表示して(ステップ
S607)、本処理を終了する。The CPU 102 has an interface 109.
The document of the search result is received via (step S60
6) Then, the document is displayed on the display device 108 (step S607), and this processing ends.
【0138】このように、ユーザは、自然な文章を入力
することで検索の条件を指定することができる一方、有
意な検索結果が得られないおそれがある場合には、その
旨を表示してユーザに再入力を促すことで、所望の検索
結果が得られやすくなり、文献検索エンジンへの問い合
わせ回数を減らすことができる。As described above, the user can specify a search condition by inputting a natural sentence, but if there is a possibility that a significant search result may not be obtained, that effect is displayed. By prompting the user to re-input, desired search results can be easily obtained, and the number of inquiries to the document search engine can be reduced.
【0139】(重みの決定)クエリ生成部205、およ
び、ステップS309においては、タームと、形態素解
析によって得られた当該タームの品詞情報や係り受けの
情報と、検索パラメータと、から、クエリを生成する。
以下では、このクエリにおけるタームの重みの決定手法
の一例について説明する。(Determination of Weight) In the query generation unit 205 and step S309, a query is generated from a term, part-of-speech information and dependency information of the term obtained by morphological analysis, and a search parameter. To do.
Hereinafter, an example of a method for determining the term weight in this query will be described.
【0140】日本語では名詞同士の係り受けや複合名詞
が多用されるため、文献検索においてもこれらを考慮す
る必要がある。そこで、これらを検索結果の傾向から以
下のように類型化して、各タームの重みを決定する。In Japanese, since the relation between nouns and compound nouns are often used, it is necessary to consider them also in the document search. Therefore, these are categorized as follows from the tendency of the search result, and the weight of each term is determined.
【0141】第1の類型は、一般名詞と一般名詞が連接
(助詞「の」を挟んで連なる場合を含む。以下同様。)
する場合である。この場合は、前に配置された一般名詞
が主題となる場合が多い。たとえば、「食事/療法」
「食事/の/療法」「ゴルフ/トーナメント」「ゴルフ
/の/トーナメント」の場合、主題となるのはそれぞれ
「食事」「ゴルフ」である。そこで、これら主題となる
前に配置されたタームの重みを大きくする。The first type is a concatenation of general nouns and general nouns (including a case where particles are continuous with a particle "no" in between. The same applies hereinafter).
This is the case. In this case, the common noun placed before is often the subject. For example, "meal / therapy"
In the case of “meal / no / therapy”, “golf / tournament”, and “golf / no / tournament”, the main subjects are “meal” and “golf”, respectively. Therefore, the weight of terms placed before these subjects are increased.
【0142】第2の類型は、サブタームを含むタームの
場合である。サブタームとタームとで、意味が大きく異
なる場合は、サブタームの重みを低くし、全体のターム
の重みを高くする。たとえば、「地方/銀行」「就職/
協定」では、これら全体の重みを高くし、「地方」「銀
行」「就職」「協定」の重みは低くする。The second type is the case of terms containing subterms. When the meanings of subterms and terms are significantly different, the weight of the subterm is lowered and the weight of the entire term is raised. For example, "Regional / Bank""Job /
In the “Agreement,” the overall weight of these is increased, and the weight of “regional,” “bank,” “employment,” and “agreement” is lowered.
【0143】本実施形態では、これらの重み決定の手法
を採用するが、自然言語による研究の成果に応じ、他の
重みの決定のためのヒューリスティックスを採用するこ
とができる。また、他国語についても同様の処理を行う
ことができる。In the present embodiment, these weight determination methods are adopted, but heuristics for determining other weights can be adopted according to the results of research by natural language. Further, similar processing can be performed for other languages.
【0144】(必須ターム情報の決定)クエリ生成部2
05、および、ステップS309においては、ターム
と、形態素解析によって得られた当該タームの品詞情報
や係り受けの情報と、検索パラメータと、から、クエリ
を生成する。以下では、このクエリにおける必須ターム
情報の決定手法の一例について説明する。(Determination of Required Term Information) Query Generation Unit 2
In 05 and step S309, a query is generated from the term, the part-of-speech information and the dependency information of the term obtained by the morphological analysis, and the search parameter. Below, an example of a method of determining the essential term information in this query will be described.
【0145】必須タームか否かは、そのタームが主題で
あるか否かに関わる。そこで、上記の重み決定の類型に
おいて、「重みを高くする」としたタームを必須ターム
とすることができる。Whether or not a required term is related to whether or not the term is a subject. Therefore, in the above type of weight determination, the term “increasing weight” can be made an essential term.
【0146】また、上記第2の類型において、サブター
ム「地方」「銀行」「就職」「協定」を用いずにクエリ
を作成してもよい。In the second type, the query may be created without using the sub-terms “region”, “bank”, “employment”, and “agreement”.
【0147】(検索パラメータによる調整)本実施形態
では、ユーザが入力した検索パラメータに応じてターム
の重みや必須ターム情報を決定する。図4に示す検索条
件入力フォーム401では、スライダ403により「き
つい検索」から「ゆるい検索」まで検索パラメータを数
段階の値として入力することができる。(Adjustment by Search Parameter) In this embodiment, the term weight and the essential term information are determined according to the search parameter input by the user. In the search condition input form 401 shown in FIG. 4, a slider 403 can be used to input search parameters from "tight search" to "soft search" as values in several stages.
【0148】「きつい検索」の場合には、重みの高低の
差を増し、あるいは、必須タームの割合を増す。一方、
「ゆるい検索」の場合には、重みの高低の差を減らし、
あるいは、必須タームの割合を減らす。In the case of "tight search", the difference in height between weights is increased, or the proportion of essential terms is increased. on the other hand,
In the case of "loose search", reduce the difference in weight level,
Alternatively, reduce the proportion of mandatory terms.
【0149】たとえば、「格安/旅行」(後に配置され
たタームが主題となる場合)について、「ゆるい検索」
から「きつい検索」までクエリに含まれる情報を順に列
挙すると以下のようになる。For example, for “cheap / travel” (when the term placed later is the subject), “loose search”
The information included in the query is listed in order from to "tight search".
【0150】・「格安」は重み小、「旅行」は重み小"Cheap" is light weight, "Travel" is light weight
【0151】・「格安」は重み小、「旅行」は重み大"Cheap" has a small weight, and "Travel" has a large weight
【0152】・「格安」は重み小、「旅行」は重み大か
つ必須"Cheap" has a small weight, and "travel" has a large weight and is essential
【0153】・「格安」は重み大、「旅行」は重み大か
つ必須"Cheap" is heavy and "travel" is heavy and essential
【0154】・「格安」は重み大かつ必須、「旅行」は
重み大かつ必須"Cheap" is heavy and essential, and "Travel" is heavy and essential
【0155】これらの検索パラメータと生成されるクエ
リとの関係についても、適宜変更が可能であり、変更し
た実施形態も本発明の範囲に含まれる。The relationship between these search parameters and the generated query can be modified as appropriate, and modified embodiments are also included in the scope of the present invention.
【0156】[0156]
【発明の効果】本発明により、検索したい文献をキーワ
ードではなく文章で指定することができ、当該文章から
検索に適したクエリを生成するのに好適なクエリ出力装
置、クエリ出力方法、文献検索システム、文献検索方
法、並びに、これらを実現するためのプログラムを記録
したコンピュータ読取可能な記録媒体を提供することが
できる。According to the present invention, a document to be searched can be designated by a sentence rather than a keyword, and a query output device, a query output method, and a document search system suitable for generating a query suitable for the search from the sentence. It is possible to provide a document search method and a computer-readable recording medium in which a program for realizing these is recorded.
【図1】本発明のクエリ出力装置として機能する典型的
な情報処理装置の概要構成を示す模式図である。FIG. 1 is a schematic diagram showing a schematic configuration of a typical information processing device that functions as a query output device of the present invention.
【図2】本発明のクエリ出力装置の各機能の概要構成を
示す模式図である。FIG. 2 is a schematic diagram showing a schematic configuration of each function of the query output device of the present invention.
【図3】本発明のクエリ出力装置の処理の手順を示すフ
ローチャートである。FIG. 3 is a flowchart showing a processing procedure of a query output device of the present invention.
【図4】検索条件入力フォームの表示例を示す説明図で
ある。FIG. 4 is an explanatory diagram showing a display example of a search condition input form.
【図5】メッセージ表示フォームの表示例を示す説明図
である。FIG. 5 is an explanatory diagram showing a display example of a message display form.
【図6】本発明のクエリ出力装置により出力されたクエ
リを用いて文献検索を行う処理の手順を示すフローチャ
ートである。FIG. 6 is a flowchart showing a procedure of processing for performing a document search using a query output by the query output device of the present invention.
101 情報処理装置 102 CPU 103 ROM 104 ハードディスク 105 キーボード 106 マウス 107 RAM 108 表示装置 109 インターフェース 110 FDドライブ 111 CD−ROMドライブ 201 クエリ出力装置 202 文字列入力受付部 203 ターム抽出部 204 入力制御部 205 クエリ生成部 206 メッセージ表示部 207 修正入力受付部 208 修正制御部 209 クエリ出力部 210 ターム記憶部 211 パラメータ入力受付部 401 検索条件入力フォーム 402 テキストフィールド 403 スライダ 404 クエリ出力ボタン 501 メッセージ表示フォーム 502 メッセージ表示領域 503 再入力ボタン 504 強行ボタン 101 Information processing device 102 CPU 103 ROM 104 hard disk 105 keyboard 106 mice 107 RAM 108 display device 109 interface 110 FD drive 111 CD-ROM drive 201 query output device 202 Character string input reception part 203 Term Extraction Unit 204 Input control unit 205 Query generator 206 Message display area 207 Correction input acceptance section 208 Correction control unit 209 Query output section 210 term storage 211 Parameter input acceptance section 401 Search condition input form 402 text field 403 slider 404 Query output button 501 message display form 502 Message display area 503 Re-enter button 504 push button
フロントページの続き (56)参考文献 特開 平3−179563(JP,A) 特開 平2−82354(JP,A) 特開 平2−176868(JP,A) 特開 平5−324728(JP,A) 特開 昭63−261424(JP,A) 特開 平7−129622(JP,A) 特開 平7−146878(JP,A) 特開 平10−260981(JP,A) 山階正樹、小島順治,対話型サウンド 情報提供システム,情報処理学会研究報 告,日本,社団法人情報処理学会,1990 年 1月26日,第90巻、第8号,第1− 7頁 堤富士雄,キーワードの2次元空間配 置により検索条件を表す全文検索システ ム,インタラクティブシステムとソフト ウェアIII 日本ソフトウェア科学会 WISS’95,日本,株式会社近代科学 社,1995年12月10日,初版,第221−229 頁 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 - 17/30 419 G06F 3/00 654 JICSTファイル(JOIS)Continuation of the front page (56) Reference JP-A-3-179563 (JP, A) JP-A-2-82354 (JP, A) JP-A-2-176868 (JP, A) JP-A-5-324728 (JP , A) JP 63-261424 (JP, A) JP 7-129622 (JP, A) JP 7-146878 (JP, A) JP 10-260981 (JP, A) Masaki Yamashina, Junji Kojima, Interactive Sound Information Providing System, Information Processing Society of Japan, Research Report, Japan, Information Processing Society of Japan, January 26, 1990, Volume 90, No. 8, 1-7, Fujio Tsutsumi, Keyword Full-text search system that expresses search conditions by two-dimensional space arrangement, interactive system and software III Japan Society for Software Science and Technology WISS'95, Japan, Modern Science Co., Ltd., December 10, 1995, first edition, 221-229 page (58) investigated the field (Int.Cl. 7, DB name) G06F 17/30 - 17/30 419 G06F 3/00 654 JICST file Le (JOIS)
Claims (15)
て得られた得点が所定の範囲に含まれる文献を獲得する
文献検索エンジンに与えるクエリを出力するクエリ出力
装置であって、 文字列の入力を受け付ける文字列入力受付部と、 与えられた文字列を形態素解析し、これに含まれるター
ムを抽出するターム抽出部と、 前記文字列入力受付部により文字列の入力が受け付けら
れた場合、前記ターム抽出部に当該文字列を与える入力
制御部と、 前記ターム抽出部により抽出されたタームを含むクエリ
を生成するクエリ生成部と、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示部と、 前記メッセージ表示部によりメッセージが表示された場
合、前記文字列入力受付部により入力された文字列を修
正する修正入力を受け付ける修正入力受付部と、 前記修正入力受付部により修正入力が受け付けられた場
合、当該修正入力により修正された文字列を、前記ター
ム抽出部に与える修正制御部と、 クエリ出力条件が満たされる場合、前記クエリ生成部に
より生成されたクエリを出力するクエリ出力部と、 複数のタームを記憶するターム記憶部とを備え、 前記クエリ生成部により生成されたクエリに含まれるタ
ームが前記ターム記憶部に記憶された複数のタームのい
ずれとも一致しない場合に、当該メッセージ表示条件が
満たされ、 前記クエリ生成部は、当該抽出されたタームが複数ある
場合、 (a)ある一般名詞のタームと、他の一般名詞のターム
と、が連接する(助詞「の」を挟んで連なる場合を含
む。)か否かにより、これらのタームの重みを変更して
クエリを生成し、 (b)あるタームが他のタームを含むか否かにより、こ
れらのタームの重みを変更してクエリを生成する ことを
特徴とする クエリ出力装置。1. A query output device for outputting a query given to a document search engine that obtains documents whose scores obtained by applying a query including a term to a document is a character string. A character string input acceptance unit that accepts the input of, a term extraction unit that morphologically analyzes the given character string and extracts the terms included in it, and when the character string input is accepted by the character string input acceptance unit An input control unit that gives the character string to the term extraction unit, a query generation unit that generates a query including the terms extracted by the term extraction unit, and a message display condition that meets the message display condition in advance. A message display unit that displays the associated message, and when the message is displayed by the message display unit, the character string input A correction input reception unit that receives a correction input for correcting the character string input by the reception unit; and, when the correction input is received by the correction input reception unit, the character string corrected by the correction input is used as the term extraction unit. a correction control section that gives, if the query output conditions are met, a query output unit for outputting a query generated by the query generation unit, and a term storage unit for storing a plurality of terms, by the query generation unit When the terms included in the generated query do not match any of the plurality of terms stored in the term storage unit, the message display condition is satisfied, and the query generation unit has a plurality of the extracted terms.
In this case, (a) terms of one general noun and terms of another general noun
And are concatenated (including the case where they are concatenated with the particle "no" in between)
Mu. ) Change the weight of these terms depending on
Generate a query, and (b) determine if one term contains another term or not.
Generating a query by changing the weights of these terms
Characteristic query output device.
ムと、が連接する場合、前に配置されたタームの重みをWhen the and are connected, the weight of the term placed in front is
大きくし、Make it bigger, 当該あるタームが当該他のタームを含む場合、前者の重If the one term includes the other term, the weight of the former
みを大きくし、後者の重みを小さくすることを特徴とすIs characterized by increasing the weight and decreasing the weight of the latter.
る請求項1に記載のクエリ出力装置。The query output device according to claim 1.
の入力を受け付けるパラメータ入力受付部をさらに備
え、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該タームのそれぞれに対応付けられ、当該得点
を得る際に参照される重みを含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの重みの大小差を前記パラメータ入
力受付部により入力を受け付けられた生成パラメータに
より決定し、当該タームと、これに対応付けて決定され
た重みと、を含むクエリを生成することを特徴とする請
求項1または2に記載のクエリ出力装置。3. A parameter input acceptance unit for accepting an input of a generation parameter given to the query generation unit, wherein the query generated by the query generation unit is associated with each term in addition to the term, Including the weight referred to when obtaining the score, the query generation unit determines the magnitude difference of each weight of the terms extracted by the term extraction unit according to the generated parameter input of which is received by the parameter input reception unit. and, wherein the said term, the weights determined in association with this, to generate a query that contains a 請
The query output device according to claim 1 or 2 .
の入力を受け付けるパラメータ入力受付部をさらに備
え、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該文献検索エンジンが獲得する文献は当該ター
ムを含むものに限るか否かを示す必須ターム情報を含
み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの必須ターム情報を、前記パラメー
タ入力受付部により入力を受け付けられた生成パラメー
タにより決定し、当該タームと、これに対応付けて決定
された必須ターム情報と、を含むクエリを生成すること
を特徴とする請求項1または2に記載のクエリ出力装
置。4. A parameter input acceptance unit for accepting an input of a generation parameter given to the query generation unit, wherein the query generated by the query generation unit is a term, and documents acquired by the document search engine are Including essential term information indicating whether or not to include the term, the query generation unit, each essential term information of the term extracted by the term extraction unit, the input is accepted by the parameter input acceptance unit The query output device according to claim 1 or 2, wherein the query output device determines a query based on the generated generation parameter, and generates a query including the term and the essential term information determined in association with the term.
と、 前記クエリ出力装置により出力されたクエリを文献に対
して適用して得られた得点が所定の範囲に含まれる文献
を獲得する文献検索エンジン部と、 前記文献検索エンジン部により獲得された文献を出力す
る文献出力部とを備える ことを特徴とする文献検索システム。5. The query output device according to claim 1, and a document in which a score obtained by applying the query output by the query output device to a document is included in a predetermined range. A document search system, comprising: a document search engine unit; and a document output unit that outputs a document acquired by the document search engine unit.
て得られた得点が所定の範囲に含まれる文献を獲得する
文献検索エンジンに与えるクエリを出力するクエリ出力
方法であって、 文字列の入力を受け付ける文字列入力受付ステップと、 与えられた文字列を形態素解析し、これに含まれるター
ムを抽出するターム抽出ステップと、 前記文字列入力受付ステップにて文字列の入力が受け付
けられた場合、前記ターム抽出ステップに当該文字列か
らタームを抽出させる入力制御ステップと、 前記ターム抽出ステップにて抽出されたタームを含むク
エリを生成するクエリ生成ステップと、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示ステップと、 前記メッセージ表示ステップにてメッセージが表示され
た場合、前記文字列入力受付ステップにて入力された文
字列を修正する修正入力を受け付ける修正入力受付ステ
ップと、 前記修正入力受付ステップにて修正入力が受け付けられ
た場合、前記ターム抽出ステップに当該修正入力により
修正された文字列からタームを抽出させる修正制御ステ
ップと、 クエリ出力条件が満たされる場合、前記クエリ生成ステ
ップにて生成されたクエリを出力するクエリ出力ステッ
プとを備え、 前記クエリ生成ステップにて生成されたクエリに含まれ
るタームがあらかじめ記憶された複数のタームのいずれ
とも一致しない場合に、当該メッセージ表示条件が満た
され、 前記クエリ生成工程では、当該抽出されたタームが複数
ある場合、 (a)ある一般名詞のタームと、他の一般名詞のターム
と、が連接する(助詞「の」を挟んで連なる場合を含
む。)か否かにより、これらのタームの重みを変更して
クエリを生成し、 (b)あるタームが他のタームを含むか否かにより、こ
れらのタームの重みを変更してクエリを生成する ことを
特徴とする クエリ出力方法。6. A query output method for outputting a query given to a document search engine that obtains documents whose scores obtained by applying a query including a term to a document is a character string. A character string input acceptance step of accepting the input of, a term extraction step of performing morphological analysis of the given character string and extracting the terms contained therein, and the character string input acceptance step of the character string input acceptance step In the case, an input control step of extracting a term from the character string in the term extraction step, a query generation step of generating a query including the term extracted in the term extraction step, and a message display condition are satisfied, A message display step of displaying a message previously associated with the message display condition; If a message is displayed in the message display step, a correction input reception step of receiving a correction input for correcting the character string input in the character string input reception step, and a correction input reception in the correction input reception step If the query output condition is satisfied, a modification control step of extracting a term from the character string modified by the modification input, and a query that outputs the query generated in the query generation step if the query output condition is satisfied and an output step, when the terms included in the query generated by the query generation step does not match any of the pre-stored plurality of terms, the message display condition is satisfied
In the query generation step, there are a plurality of extracted terms.
In some cases, (a) terms of one general noun and terms of another general noun
And are concatenated (including the case where they are concatenated with the particle "no" in between)
Mu. ) Change the weight of these terms depending on
Generate a query, and (b) determine if one term contains another term or not.
Generating a query by changing the weights of these terms
Characterized query output method.
ムと、が連接する場合、前に配置されたタームの重みをWhen the and are connected, the weight of the term placed in front is
大きくし、Make it bigger, 当該あるタームが当該他のタームを含む場合、前者の重If the one term includes the other term, the weight of the former
みを大きくし、後者の重みを小さくすることを特徴とすIs characterized by increasing the weight and decreasing the weight of the latter.
る請求項6に記載のクエリ出力方法。The query output method according to claim 6.
成パラメータの入力を受け付けるパラメータ入力受付ス
テップをさらに備え、 前記クエリ生成ステップにて生成されるクエリは、ター
ムのほか、当該タームのそれぞれに対応付けられ、当該
得点を得る際に参照される重みを含み、 前記クエリ生成ステップは、前記ターム抽出ステップに
て抽出されたタームのそれぞれの重みの大小差を前記パ
ラメータ入力受付ステップにて入力を受け付けられた生
成パラメータにより決定し、当該タームと、これに対応
付けて決定された重みと、を含むクエリを生成すること
を特徴とする請求項6または7に記載のクエリ出力方
法。8. The method further comprises a parameter input accepting step of accepting an input of a generation parameter referred to in the query generating step, wherein the query generated in the query generating step corresponds to each term in addition to the term. The weight is referred to when obtaining the score, and the query generation step receives an input in the parameter input reception step regarding a difference in weight of each of the terms extracted in the term extraction step. The query output method according to claim 6 or 7, wherein a query including the term and the weight determined in association with the term is generated based on the generated generation parameter.
成パラメータの入力を受け付けるパラメータ入力受付ス
テップをさらに備え、 前記クエリ生成ステップにて生成されるクエリは、ター
ムのほか、当該文献検索エンジンが獲得する文献は当該
タームを含むものに限るか否かを示す必須ターム情報を
含み、 前記クエリ生成ステップは、前記ターム抽出ステップに
て抽出されたタームのそれぞれの必須ターム情報を、前
記パラメータ入力受付ステップにて入力を受け付けられ
た生成パラメータにより決定し、当該タームと、これに
対応付けて決定された必須ターム情報と、を含むクエリ
を生成することを特徴とする請求項6または7に記載の
クエリ出力方法。9. The method further comprises a parameter input accepting step for accepting an input of a generation parameter referred to in the query generating step, wherein the query generated in the query generating step is acquired by the document search engine in addition to the term. The document includes essential term information indicating whether or not the term is limited to those including the term, the query generation step, each essential term information of the terms extracted in the term extraction step, the parameter input acceptance step 8. The query according to claim 6 or 7, wherein the query is determined by the generation parameter received as input in step S6, and the term and the essential term information determined in association with the term are generated. output method.
により出力されたクエリを文献に対して適用して得られ
た得点が所定の範囲に含まれる文献を獲得する文献検索
ステップと、 前記文献検索ステップにて獲得された文献を出力する文
献出力ステップと、を備えることを特徴とする文献検索
方法。10. A document search step of obtaining a document in which a score obtained by applying the query output by the query output method according to claim 6 to a document is within a predetermined range, And a document output step of outputting the document acquired in the document search step.
ムを抽出するターム抽出部、 前記文字列入力受付部により文字列の入力が受け付けら
れた場合、前記ターム抽出部に当該文字列を与える入力
制御部、 前記ターム抽出部により抽出されたタームを含むクエリ
を生成するクエリ生成部、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示部、 前記メッセージ表示部によりメッセージが表示された場
合、前記文字列入力受付部により入力された文字列を修
正する修正入力を受け付ける修正入力受付部、 前記修正入力受付部により修正入力が受け付けられた場
合、当該修正入力により修正された文字列を、前記ター
ム抽出部に与える修正制御部、 クエリ出力条件が満たされる場合、前記クエリ生成部に
より生成されたクエリを出力するクエリ出力部、およ
び、 複数のタームを記憶するターム記憶部として機能させ、 前記クエリ生成部により生成されたクエリに含まれるタ
ームが前記ターム記憶部に記憶された複数のタームのい
ずれとも一致しない場合に、当該メッセージ表示条件が
満たされ、 前記クエリ生成部は、当該抽出されたタームが複数ある
場合、 (a)ある一般名詞のタームと、他の一般名詞のターム
と、が連接する(助詞「の」を挟んで連なる場合を含
む。)か否かにより、これらのタームの重みを変更して
クエリを生成し、 (b)あるタームが他のタームを含むか否かにより、こ
れらのタームの重みを変更してクエリを生成する ように
機能させるプログラムを記録することを特徴とするコン
ピュータ読取可能な記録媒体。11. A computer, a character string input receiving unit for receiving a character string input, a term extracting unit for morphologically analyzing a given character string and extracting a term contained therein, the character string input receiving unit When a column input is accepted, an input control unit that gives the character string to the term extraction unit, a query generation unit that generates a query including the term extracted by the term extraction unit, and a message display condition is satisfied, A message display unit that displays a message previously associated with the message display condition, and a correction that receives a correction input that corrects the character string input by the character string input reception unit when the message is displayed by the message display unit The input acceptance unit, when the modification input is accepted by the modification input acceptance unit, More modified string, correction control unit that gives the term extractor, if the query output condition is satisfied, the query output unit for outputting a query generated by the query generation unit, Oyo
Beauty, to function as a term storage unit for storing a plurality of terms, wherein when a term included in the generated query by the query generation unit does not match any of the plurality of terms stored in said term storage unit, the message The display condition is
Satisfied, the query generator has multiple extracted terms
In this case, (a) terms of one general noun and terms of another general noun
And are concatenated (including the case where they are concatenated with the particle "no" in between)
Mu. ) Change the weight of these terms depending on
Generate a query, and (b) determine if one term contains another term or not.
A computer-readable recording medium, which records a program that functions to generate a query by changing the weight of these terms .
おいて、Be careful 前記クエリ生成部は、The query generation unit, 当該ある一般名詞のタームと、当該他の一般名詞のターThe term of the relevant general noun and the term of the other generic noun
ムと、が連接する場合、前に配置されたタームの重みをWhen the and are connected, the weight of the term placed in front is
大きくし、Make it bigger, 当該あるタームが当該他のタームを含む場合、前者の重If the one term includes the other term, the weight of the former
みを大きくし、後者の重みを小さくするように機能させFunction to increase the weight of the latter and decrease the weight of the latter.
ことを特徴とする請求項11に記載のコンピュータ読取Computer read according to claim 11, characterized in that
可能な記録媒体。Possible recording medium.
を、 前記クエリ生成部に与える生成パラメータの入力を受け
付けるパラメータ入力受付部としてさらに機能させ、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該タームのそれぞれに対応付けられ、当該得点
を得る際に参照される重みを含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの重みの大小差を前記パラメータ入
力受付部により入力を受け付けられた生成パラメータに
より決定し、当該タームと、これに対応付けて決定され
た重みと、を含むクエリを生成することを特徴とする請
求項11または12に記載のコンピュータ読取可能な記
録媒体。13. The program further causes the computer to function as a parameter input reception unit that receives an input of a generation parameter given to the query generation unit, and the query generated by the query generation unit is a term in addition to the term. Corresponding to each of the terms, including the weight referred to when obtaining the score, the query generation unit, by the parameter input reception unit, the difference in weight of each of the terms extracted by the term extraction unit. A contract characterized in that the input is determined by the received generation parameter, and a query including the term and the weight determined in association with the term is generated.
The computer-readable recording medium according to claim 11 or 12 .
を、 前記クエリ生成部に与える生成パラメータの入力を受け
付けるパラメータ入力受付部としてさらに機能させ、 前記クエリ生成部により生成されるクエリは、タームの
ほか、文献検索エンジンが獲得する文献は当該タームを
含むものに限るか否かを示す必須ターム情報を含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの必須ターム情報を、前記パラメー
タ入力受付部により入力を受け付けられた生成パラメー
タにより決定し、当該タームと、これに対応付けて決定
された必須ターム情報と、を含むクエリを生成すること
を特徴とする請求項11または12に記載のコンピュー
タ読取可能な記録媒体。14. The program further causes the computer to function as a parameter input reception unit that receives an input of a generation parameter given to the query generation unit, and the query generated by the query generation unit is a term in addition to a term. The documents acquired by the search engine include essential term information indicating whether or not the documents include the term, and the query generation unit includes the essential term information of each of the terms extracted by the term extraction unit as the parameter. 13. The query, which is determined by a generation parameter whose input is accepted by the input accepting unit, and which includes the term and the essential term information determined in association with the term, is generated. Computer readable recording medium.
を、 前記クエリ出力部により出力されたクエリを文献に対し
て適用して得られた得点が所定の範囲に含まれる文献を
獲得する文献検索エンジン部、および、 前記文献検索エンジン部により獲得された文献を出力す
る文献出力部としてさらに機能させることを特徴とする
請求項11から14のいずれか1項に記載のコンピュー
タ読取可能な記録媒体。15. The document search engine unit, wherein the program obtains a document in which a score obtained by applying the query output by the query output unit to a document, is included in a predetermined range, by the computer. 15. The computer-readable recording medium according to claim 11, further functioning as a document output unit that outputs a document acquired by the document search engine unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29779499A JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29779499A JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001117939A JP2001117939A (en) | 2001-04-27 |
JP3411246B2 true JP3411246B2 (en) | 2003-05-26 |
Family
ID=17851265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29779499A Expired - Fee Related JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3411246B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3717808B2 (en) * | 2001-06-29 | 2005-11-16 | 株式会社日立製作所 | Information retrieval system |
NO318841B1 (en) * | 2002-08-20 | 2005-05-09 | Telenor Asa | System and methods for providing mobile services with greater accessibility |
US7194455B2 (en) * | 2002-09-19 | 2007-03-20 | Microsoft Corporation | Method and system for retrieving confirming sentences |
US7698626B2 (en) | 2004-06-30 | 2010-04-13 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
US8738606B2 (en) * | 2007-03-30 | 2014-05-27 | Microsoft Corporation | Query generation using environment configuration |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63261424A (en) * | 1987-04-17 | 1988-10-28 | Matsushita Electric Ind Co Ltd | Document retrieving device |
JPH0282354A (en) * | 1988-09-20 | 1990-03-22 | Fujitsu Ltd | Retrieving strategy preparing system |
JPH02176868A (en) * | 1988-12-27 | 1990-07-10 | Mitsubishi Heavy Ind Ltd | Data base retrieve device |
JPH03179563A (en) * | 1989-12-08 | 1991-08-05 | Nippon Telegr & Teleph Corp <Ntt> | Data base retrieving method |
JPH05324728A (en) * | 1992-05-18 | 1993-12-07 | Hitachi Ltd | Information retrieving device |
JPH07129622A (en) * | 1993-11-01 | 1995-05-19 | Nippon Steel Corp | Document retrieving device |
JPH07146878A (en) * | 1993-11-25 | 1995-06-06 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device |
JP3500893B2 (en) * | 1997-03-19 | 2004-02-23 | ミノルタ株式会社 | Information processing apparatus and information processing method |
-
1999
- 1999-10-20 JP JP29779499A patent/JP3411246B2/en not_active Expired - Fee Related
Non-Patent Citations (2)
Title |
---|
堤富士雄,キーワードの2次元空間配置により検索条件を表す全文検索システム,インタラクティブシステムとソフトウェアIII 日本ソフトウェア科学会WISS’95,日本,株式会社近代科学社,1995年12月10日,初版,第221−229頁 |
山階正樹、小島順治,対話型サウンド情報提供システム,情報処理学会研究報告,日本,社団法人情報処理学会,1990年 1月26日,第90巻、第8号,第1−7頁 |
Also Published As
Publication number | Publication date |
---|---|
JP2001117939A (en) | 2001-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9361361B2 (en) | Interactively entering data into the database | |
US6996561B2 (en) | System and method for interactively entering data into a database | |
US20110320468A1 (en) | Modular system and method for managing chinese, japanese and korean linguistic data in electronic form | |
US20140149103A1 (en) | Modular system and method for managing chinese, japanese, and korean linguistic data in electronic form | |
US20070124295A1 (en) | Systems, methods, and media for searching documents based on text characteristics | |
JP2004021791A (en) | Method for describing existing data by natural language and program for the method | |
JP2020095653A (en) | Creation support device and creation support method | |
JP3411246B2 (en) | Query output device, document search system, query output method, document search method, and recording medium | |
JP2002197118A (en) | Information access method, information access system and storage medium | |
JP7572643B2 (en) | Information processing system, control method thereof, and program | |
JP3444592B2 (en) | Document search device, query output device, document search method, query output method, and recording medium | |
US20050165712A1 (en) | Method for operating software object using natural language and program for the same | |
US8429148B1 (en) | Method and apparatus for automatically generating headlines based on data retrieved from a network and for answering questions related to a headline | |
JP2019121164A (en) | Document creating apparatus, document creating method, database construction apparatus, database construction method, and program | |
JPH1145252A (en) | Information retrieval device and computer readable recording medium for recording program for having computer function as the same device | |
JP2003316775A (en) | Specification preparation support device | |
JP2003296327A (en) | Translation server, genre-classified online machine translation method, and program therefor | |
JP4000332B2 (en) | Information retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
KR20090072774A (en) | Method, apparatus and computer-readable recording medium for search with image input device | |
JP4617015B2 (en) | Document display device, document display method, and program | |
JP4138048B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device | |
JP7315817B2 (en) | Information processing device, its control method, and program | |
JP2002288190A (en) | System, and method for summarizing and program therefor | |
JP5843235B2 (en) | WEB information processing apparatus, WEB information processing method, and program | |
JP5073423B2 (en) | Translation search support apparatus, translation search support method, and translation search support program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090320 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120320 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |