JP2010092357A - Facility-related information retrieval method and facility-related information retrieval system - Google Patents

Facility-related information retrieval method and facility-related information retrieval system Download PDF

Info

Publication number
JP2010092357A
JP2010092357A JP2008263039A JP2008263039A JP2010092357A JP 2010092357 A JP2010092357 A JP 2010092357A JP 2008263039 A JP2008263039 A JP 2008263039A JP 2008263039 A JP2008263039 A JP 2008263039A JP 2010092357 A JP2010092357 A JP 2010092357A
Authority
JP
Japan
Prior art keywords
facility
information
search
keyword
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008263039A
Other languages
Japanese (ja)
Other versions
JP5302614B2 (en
Inventor
Yasuki Kato
康記 加藤
Yukari Oya
由香里 大屋
Masakazu Hori
雅和 堀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
INTEC SYSTEMS Inst Inc
Original Assignee
INTEC SYSTEMS Inst Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by INTEC SYSTEMS Inst Inc filed Critical INTEC SYSTEMS Inst Inc
Priority to JP2008263039A priority Critical patent/JP5302614B2/en
Publication of JP2010092357A publication Critical patent/JP2010092357A/en
Application granted granted Critical
Publication of JP5302614B2 publication Critical patent/JP5302614B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a facility-related information retrieval method to select information based on retrieval conditions of various viewpoints, and a facility-related information retrieval system adapted to retrieval conditions using a free sentence. <P>SOLUTION: The system has: an information collection device 12 which collects facility-related information, a facility information database 14 which stores the collected and organized facility-related information, and an input/output terminal 16. The system comprises an information retrieval device 18 which extracts a facility and the facility-related information adapted to request input by a retrieval user from the facility information database 14 and transmits the information to the input/output terminal 16, and a facility information index 20 and a dictionary database 22 storing the information related to the facility when the information retrieval device 18 retrieves the facility information database 14. The information collection device 12 comprises: an information collection means 12a, a keyword extraction means 12b which extracts keywords of content and feature of the facility, and an information organizing means 12c which adds a facility ID and the type of the facility and associates the facility ID with each keyword. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、インターネット上のWebサイトや市販の雑誌等に公開されている各種の施設関連情報を収集する施設関連情報検索方法、及び検索ユーザのリクエスト入力に適合した施設関連情報を提供する施設関連情報検索システムに関する。   The present invention relates to a facility-related information search method for collecting various facility-related information published in a website on the Internet, a commercial magazine, and the like, and facility-related information that provides facility-related information suitable for a search user's request input The present invention relates to an information retrieval system.

近年、買い物、食事、観光旅行等する機会に、例えばパソコンからインターネット等のネットワークを通じて所定のデータベースにアクセスし、目的に合った施設(例えば、デパート、レストラン、遊園地、景勝地など)を検索することは一般的に行われている。この種の情報検索においては、検索ユーザの要求に適合した施設情報を的確に抽出することが求められ、それに応えるべく様々な形態の検索装置又は検索方法が提案されている。   In recent years, on occasions such as shopping, eating, sightseeing, etc., a predetermined database is accessed from a personal computer through a network such as the Internet, and facilities (for example, department stores, restaurants, amusement parks, scenic spots, etc.) suitable for the purpose are searched. Things are generally done. In this type of information search, it is required to accurately extract facility information that meets the search user's request, and various forms of search devices or search methods have been proposed in response to this requirement.

例えば、特許文献1に開示されているように、情報提供者端末から提供される施設識別情報と、施設や商品等及びそれらの価値よりなる内容情報とを個別情報としてデータベースに記憶させる記憶手段と、個別情報のうちの内容情報を、予め設定された基本分類に関連付けて識別コードを発生する関連付け手段と、消費者端末から入力されるキーワードによりデータベースを検索し、それに適合する識別コードを有する個別情報を読み出して消費者端末の表示装置に供給する手段とを備えた情報収集検索装置がある。これは、商品コード、特性・価値コード、行動コード等の識別コードを体系的に定義し、収集した施設情報ごとに適合する識別コードを付与した特定フォーマットによるデータの一つのセットである個別データセットを整備し、コード体系に従って施設情報を検索するものである。また、消費者による検索は、消費者端末の画面を用いて、対話形式の下に進められる。   For example, as disclosed in Patent Document 1, storage means for storing facility identification information provided from an information provider terminal and content information including facilities, products, etc. and their values in a database as individual information; , An association means for associating the content information of the individual information with a preset basic classification to generate an identification code, and searching the database by a keyword input from a consumer terminal, and an individual having an identification code suitable for it There is an information collection / retrieval device provided with means for reading out information and supplying it to a display device of a consumer terminal. This is an individual data set that is a set of data in a specific format that systematically defines identification codes such as product codes, characteristic / value codes, behavior codes, etc., and that provides identification codes that match each collected facility information And search for facility information according to the code system. In addition, the search by the consumer proceeds in an interactive manner using the screen of the consumer terminal.

また、特許文献2に開示されているように、電話帳情報等の情報検索装置に係り、問合せ文を入力し、その入力情報に合致した情報を出力する入出力装置と、被検索情報として少なくとも名義、職業名、商品名を含む情報が格納されたデータベースと、データベース中の所定の単語と各単語の属性を対の形で記憶した単語辞書記憶装置と、問合せ文に現れる職業に関する文言を商品名と動詞に変換する変換テーブルが定義付けられた知識ベース記憶装置と、制御装置とを備え、問合せ文中の曖昧な職業情報から職業分類名を推定してデータベース検索を行うことができる情報検索装置がある。
特開平11−328223号公報 特許第2669827号公報
Further, as disclosed in Patent Document 2, the present invention relates to an information search device such as telephone directory information, an input / output device that inputs an inquiry sentence and outputs information that matches the input information, and at least search target information A database that stores information including name, occupation name, and product name, a word dictionary storage device that stores predetermined words in the database and attributes of each word in pairs, and words related to occupations that appear in the inquiry sentence An information retrieval device comprising a knowledge base storage device in which a conversion table for converting names and verbs is defined, and a control device, and capable of performing a database search by estimating occupation classification names from ambiguous occupation information in query sentences There is.
JP 11-328223 A Japanese Patent No. 2666927

しかし、特許文献1の情報収集検索装置は、施設情報は所定のコード体系によって識別され、検索ユーザ(消費者)が入力するキーワードに対応した識別コードを有する施設情報を抽出するものであり、施設情報が検索ユーザの要求に対してどの程度適合しているかを評価する機能を備えていない。従って、検索条件に適合するとして抽出された施設情報が多数あると、施設情報の適合度の高い低いに関係なく羅列して出力されるため、検索ユーザにとっては、その中から要求に近い施設情報を見つけ出すのが面倒であった。   However, the information collection and retrieval apparatus of Patent Document 1 extracts facility information having an identification code corresponding to a keyword input by a search user (consumer), with facility information identified by a predetermined code system. It does not have a function to evaluate how well the information meets the search user's request. Therefore, if there is a lot of facility information extracted as conforming to the search condition, the facility information is listed and output regardless of whether the fitness level of the facility information is high or low. It was troublesome to find out.

また、検索ユーザは、施設等を調査するときに「有名な」とか「人気の」といった施設利用者等の評価や口コミ等の評判情報を重視する場合が多い。しかし、特許文献1の情報収集検索装置では、施設利用者の評価等について考慮されておらず、検索ユーザの要求に適合した施設情報を抽出できない場合があった。   In addition, when searching for facilities or the like, search users often place importance on evaluations of facility users such as “famous” or “popular” and reputation information such as word-of-mouth. However, the information collection / retrieval device of Patent Document 1 does not take into account the facility user's evaluation and the like, and may not be able to extract facility information that meets the search user's request.

さらに、特許文献1の情報収集検索装置は、検索は対話形式の下で行われるため、検索ユーザは事前に自己の要求を明確にしておく必要がある。従って、検索ユーザはいろいろな施設の情報を気楽に検索することができず、使い難い検索装置であった。   Furthermore, since the information collection / retrieval apparatus of Patent Document 1 performs a search in an interactive format, the search user needs to clarify his / her request in advance. Therefore, the search user cannot easily search for information on various facilities, and is a search device that is difficult to use.

一方、特許文献2の情報検索装置においても、検索ユーザの要求に対する出力情報の適合度について評価する機能を備えておらず、特許文献1と同様に、多数の出力結果から要求に近い情報を見つけ出すのが面倒であった。   On the other hand, the information search apparatus of Patent Document 2 does not have a function for evaluating the degree of suitability of output information with respect to the request of the search user, and finds information close to the request from a large number of output results as in Patent Document 1. Was troublesome.

また、検索ユーザが自由文形式の問合せ文を入力しても、特定の名詞(商品名)と動詞のみが検索条件として採り上げられ、それ以外の語句については考慮されてない。従って、例えば、この情報検索装置を娯楽・観光施設等を検索する用途に用いた場合、「有名な」や「人気の」といった形容詞や副詞等の抽象的な語句を含んだ問合せ文が入力されても、適合する施設情報を抽出することができないことがあった。   Even if the search user inputs a query sentence in free text format, only specific nouns (product names) and verbs are taken up as search conditions, and other words are not considered. Therefore, for example, when this information search device is used for searching for entertainment / tourism facilities, etc., an inquiry sentence including abstract phrases such as adjectives and adverbs such as “famous” and “popular” is inputted. However, it was not possible to extract suitable facility information.

この発明は、上記背景技術に鑑みて成されたもので、多くの施設関連情報を収集し、様々な観点の検索条件に基づく情報の選択を可能にする施設関連情報検索方法と、抽象的な語句を含んだ自由文形式による検索条件にも対応でき、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができる施設関連情報検索システムを提供することを目的とする。   The present invention has been made in view of the above-described background art, and collects a lot of facility-related information and makes it possible to select information based on search conditions from various viewpoints. It is an object of the present invention to provide a facility-related information search system that can cope with a search condition in a free text format including words and that can be output preferentially from facility information having a high degree of suitability for a search user's request.

この発明は、施設に関する情報を収集してデータベースを作成し、検索サーバにより検索可能にする施設関連情報検索方法において、文書情報を有した施設関連情報を収集する情報収集工程と、前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章に算出するスコア値算出工程と、各単位文章に出現したキーワードを、その単位文章を含む各文書情報に取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えた施設関連情報検索方法である。   The present invention relates to a facility-related information search method that collects information about a facility, creates a database, and makes a search possible by a search server, an information collecting step of collecting facility-related information having document information, and the information collecting step For each facility-related information collected in step 1, a facility ID that identifies a facility that is the main body of the facility-related information and a facility ID that indicates a facility type that indicates the facility classification, and a facility that is assigned the facility ID Among the related information, at least the facility information storage step for storing the facility related information including the facility information in which the individual document information, the facility ID and the facility type are associated with each other is included in the storage device of the search server, and included in the facility related information. A keyword extraction process that divides document information into words and extracts keywords representing the contents and features of the facility from the words, A score assigning step for assigning a score value indicating the degree of association for each corresponding facility ID, and an index information storing step for storing index information including the keyword, the facility ID, and the score value in the storage device of the search server. The score assigning step includes a document information dividing step for dividing the document information of each facility-related information into a predetermined number of unit sentences from the beginning to the back of the document information, and the keyword extracted in the keyword extracting step. Is recognized in each unit sentence, the position of the unit sentence where the keyword appears, and the number of modifiers depending on the keyword in each unit sentence. The extraction key for the corresponding facility ID is based on at least one of the position of the front and the number of modifiers. The score value calculation process that calculates the weighted score value for the word relevance to each unit sentence, and the keywords that appear in each unit sentence are collected in each document information including the unit sentence, and different units A facility-related information search method comprising: a score value adding step of adding a score value assigned to each unit sentence when there is a keyword appearing redundantly in a sentence and setting the score value of the keyword in the document information It is.

前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたものである。   In the score assigning step, each keyword in which the score value is assigned to each document information in the score value adding step is collected in each facility ID, and if there is a keyword that appears redundantly in different document information, Among the assigned score values, a score value selecting step that selects the score value having the highest degree of relevance and sets the score value of the keyword in the facility ID is provided.

文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与するものである。   When the number of sentences constituting the document information is less than the number of divisions set in advance in the sentence information dividing step, the sentence information dividing step treats the document information from the beginning to the back as one unit sentence, and the score In the value calculation step, a uniform score value is assigned to the keyword appearing in the unit sentence, which is less relevant than when the number of sentences constituting the document information is equal to or greater than a preset number of divisions. Is.

またこの発明は、コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は施設種別が付与された施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられている施設関連情報検索システムである。   Further, the present invention is a facility search system that is configured by a computer system, extracts a facility suitable for a request input by a search user, and provides the facility and the facility related information, and collects facility related information including document information. An information collection device for organizing, a facility information database for storing each of the facility-related information collected and organized, an input / output terminal operated by a search user, the facility suitable for the search user's request input, and the facility-related An information search device that extracts information from the facility information database and sends the information to the input / output terminal, and a facility information index that stores information related to the facility that is referred to when the information search device searches the facility information database And the dictionary database, and the information collection device includes the document information. Information collecting means for collecting facility-related information, keyword extracting means for extracting a keyword expressing the contents and characteristics of the facility from the document information included in the collected facility-related information, and individual facility-related information. On the other hand, a facility ID for identifying a facility that is the subject of the facility-related information and a facility type indicating the classification of the facility are given, and the facility ID of the facility corresponding to the document information is assigned to each keyword. An information organizing unit for performing an association process, and the facility information database includes at least the document information and the individual facility IDs assigned to the document information among the information organized by the information organizing unit. And each facility information including the facility type is stored in association with each other, and the facility information index stores information organized by the information organizing means. Are stored in association with the keyword and the facility ID associated with the keyword, and in the dictionary database, feature words representing the contents and features of the facility are set in advance. A dictionary in which the facility ID associated with each feature word is defined, or a dictionary in which the facility type associated with each feature word is defined, or both. An input means for inputting a sentence; and an output means for outputting or displaying a search result sent from the information search apparatus, wherein the information search apparatus divides and analyzes the request sentence sent from the input / output terminal. Word dividing means for obtaining word information, a dictionary of the dictionary database and the facility information index with reference to a feature word or keyword that matches the word information Extract the facility ID or the facility type defined to be related to the feature word or keyword, and extract the facility information to which the acquired facility ID or facility type is assigned from the facility information database A facility-related information search system provided with search means for sending to the input / output terminal.

前記施設情報インデックスに格納された前記キーワードには、前記情報整理手段によって、対応する施設IDごとに関連度を示すスコア値が付与され、前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示するものである。   The keyword stored in the facility information index is given a score value indicating the degree of association for each corresponding facility ID by the information organizing unit, and the search unit extracts the facility information extracted from the facility information database. For each facility ID, the score value is aggregated to calculate the degree of match indicating the suitability for the request sentence, and the output means prioritizes the facility information to which the facility ID having a high match degree is assigned. Are output or displayed.

前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されるものである。   The score value given to the keyword by the information organizing means includes the number of times the keyword appears in each document information, the appearance position in the document information, and the keyword in the document information. The keyword is determined based on the number of modifiers depending on the number of occurrences, the number of appearances is large, the position of the sentence relatively appears at the front position of the sentence information, and the keyword having a large number of modifiers has a higher degree of association. The score value weighted as follows is given.

前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得するものである。   The dictionary database is a verb facility type dictionary in which feature words made up of verbs representing actions of users of the facilities are preset, and the facility types related to each feature word are individually defined by the information organizing means. The search means refers to at least the verb facility type dictionary and acquires the corresponding facility type.

前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得するものである。   The dictionary database includes a place name dictionary in which feature words including place names representing the addresses of the facilities and related areas are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. The search means refers to at least the place name dictionary and acquires the corresponding facility ID.

前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、前記検索手段は、少なくとも前記外部知識語辞書を参照し、該当する前記施設IDを取得するものである。   The dictionary database is an external knowledge word dictionary in which feature words made up of nouns that the user is interested in regarding the facility are preset, and the facility ID related to each feature word is individually defined by the information organizing means. The search means refers to at least the external knowledge word dictionary and acquires the corresponding facility ID.

前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得するものである。   In the dictionary database, feature words made up of modifiers expressing the user's evaluation of the facility are set in advance, and the facility ID related to each feature word is individually defined by the information organizing means. A dictionary is provided, and the search means refers to at least the previous external evaluation dictionary and acquires the corresponding facility ID.

前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示するものである。   In the dictionary database, feature words composed of modifiers expressing the evaluation of users of the facility are set in advance, and the facility ID associated with the information processing unit is individually defined in each feature word, and And an external evaluation word dictionary to which an evaluation value indicating the degree of association with the facility ID is individually given by the information organizing unit, and the search unit refers to at least the inside of the external evaluation dictionary, and the corresponding facility ID For the facility information extracted from the facility information database, the score value and the evaluation value are aggregated for each facility ID, and a matching degree indicating suitability for the request sentence is calculated, and the output means Is to output or display the facility related information corresponding to the facility ID having a high degree of match with priority.

この発明の施設関連情報検索方法は、Webサイト等に公開された膨大な量の施設関連情報を収集し、少なくとも施設ID、キーワード、スコア値からなるインデックス情報を付与して検索サーバ内に格納することによって、様々な観点の検索条件に基づき情報選択をすることができるよう整理格納することができる。   The facility-related information search method according to the present invention collects a huge amount of facility-related information disclosed on a website and the like, assigns at least index information including a facility ID, a keyword, and a score value and stores the index information in a search server. Thus, information can be organized and stored so that information can be selected based on search conditions from various viewpoints.

また、この発明の施設情報検索システムは、上記の施設関連情報検索方法等によって施設関連情報を収集及び整理格納する情報収集装置、施設情報データベース、施設情報インデックスを備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベースを備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設情報を的確に抽出することができる。   The facility information retrieval system of the present invention further comprises an information collection device that collects and organizes facility-related information by the facility-related information retrieval method described above, a facility information database, a facility information index, and further includes a place name / verb / modifier. Since a dictionary database in which feature words such as words and facilities are associated with each other is provided, it is possible to interpret a search user's request from various viewpoints and accurately extract facility information that meets the request.

さらに、情報検索装置は、抽象的な語句を含んだ自由文形式による検索条件にも対応できるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができるので、検索ユーザにとって非常に利便性が高い。   Furthermore, since the information search apparatus can cope with a search condition in a free sentence format including an abstract word / phrase, the search user can easily perform a search without preparing in advance. In addition, the information search device weights each facility related information using an evaluation value indicating the evaluation of the facility user or the like, a score value indicating the degree of association between the facility and the keyword, and the degree of conformity to the request of the search user Since it is possible to preferentially output high facility information, it is very convenient for search users.

以下、本発明の施設関連情報検索システムの一実施形態について、図に基づいて説明する。施設関連情報検索システム10はコンピュータシステムにより構成され、図1に示すように、文書情報を含む施設関連情報を収集して整理する情報収集装置12と、収集整理された施設関連情報を格納する施設情報データベース14と、検索ユーザが操作する入出力端末16とを備えている。さらに、検索ユーザのリクエスト入力に該当する施設及び施設関連情報を施設情報データベース14から抽出して入出力端末16へ送る情報検索装置18と、情報検索装置18が施設情報データベース14を検索するときの検索効率を良くし、検索の的確性等を高める施設情報インデックス20及び辞書データベース22とを備えている。   Hereinafter, an embodiment of a facility-related information search system of the present invention will be described with reference to the drawings. The facility related information search system 10 is configured by a computer system, and, as shown in FIG. 1, an information collection device 12 that collects and organizes facility related information including document information, and a facility that stores the collected facility related information. An information database 14 and an input / output terminal 16 operated by a search user are provided. Furthermore, the facility corresponding to the request input of the search user and the facility related information are extracted from the facility information database 14 and sent to the input / output terminal 16, and the information search device 18 searches the facility information database 14. A facility information index 20 and a dictionary database 22 are provided to improve search efficiency and improve search accuracy.

情報収集装置12には、インターネット上のWebサイトや市販の雑誌等に公開された文書情報を含む施設関連情報を自動収集又はシステム管理者による手動入力が可能な情報収集手段12aが設けられている。また、収集した施設関連情報に含まれる文書情報を形態素解析等を用いて単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段12bが設けられている。さらに、個々の施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与するとともに、各キーワードに対して、分割前の個々の文書情報に付与された施設IDを対応付ける処理を行う情報整理手段12cが設けられている。   The information collecting device 12 is provided with information collecting means 12a capable of automatically collecting facility-related information including document information published on a website on the Internet, a commercial magazine, etc., or manually input by a system administrator. . Further, there is provided keyword extracting means 12b for dividing the document information included in the collected facility-related information into words using morphological analysis or the like, and extracting keywords expressing the contents and features of the facility from the words. . Furthermore, a facility ID that identifies the facility that is the subject of the facility-related information and a facility type that indicates the classification of the facility are given to each facility-related information, and each document before division is assigned to each keyword. An information organizing unit 12c that performs processing for associating the facility ID assigned to the information is provided.

施設情報データベース14には、情報整理手段12cで整理された情報のうち、少なくとも、文書情報とそれに対応した施設ID及び施設種別との組み合わせで成る個々の施設情報が格納されている。   The facility information database 14 stores at least individual facility information composed of a combination of document information, a facility ID and a facility type corresponding to the document information, among the information organized by the information organizing unit 12c.

施設情報インデックス20には、情報整理手段12cで整理された情報のうち、個々のキーワードとそのキーワードに対応付けられた施設IDに、そのキーワードと施設IDとの関連度を示すスコア値が付与されて格納されている。スコア値は、そのキーワードが個々の文書情報の中に出現する回数と、出現位置と、そのキーワードに係り受けする修飾語の数とに基づいて決定される。そして、出現回数が多く、文書の先頭から後方寄りの位置に出現し、修飾語数が多いキーワードほど関連度が高いとするスコア値が付与される。   The facility information index 20 is given a score value indicating the degree of association between the keyword and the facility ID to each keyword and the facility ID associated with the keyword among the information organized by the information organizing means 12c. Stored. The score value is determined based on the number of times the keyword appears in individual document information, the appearance position, and the number of modifiers that depend on the keyword. Then, a score value is given that the relevance degree is higher for a keyword that appears more frequently, appears at a position closer to the rear from the beginning of the document, and has a larger number of modifiers.

なお、情報収集装置12、施設情報データベース14及び施設情報インデックス20によって、本発明の施設関連情報検索方法の一実施形態に該当する動作が行われる。詳細については、後の施設情報検索システム10の動作説明の中で述べる。   In addition, the operation | movement applicable to one Embodiment of the facility relevant-information search method of this invention is performed by the information collection apparatus 12, the facility information database 14, and the facility information index 20. FIG. Details will be described later in the description of the operation of the facility information search system 10.

辞書データベース22は、図8に示すように、動詞施設種別辞書22a、地名辞書22b、外部知識語辞書22c及び外部評価語辞書22dを備えている。動詞施設種別辞書22aは、施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設種別が定義されている。地名辞書22bは、施設の住所や関係する地域等を現す名詞である地名からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部知識語辞書22cは、施設に関し利用者が興味を示す名詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部評価語辞書22dは、施設の利用者の評価を表現する形容詞または形容動詞である修飾語からなる特徴語が予め設定され、各特徴語には、前記情報整理手段12cによって関連する施設IDが個々に定義され、且つ、前記情報処理手段12cによって施設IDごと関連度を示す評価値が個々に付与されている。   As shown in FIG. 8, the dictionary database 22 includes a verb facility type dictionary 22a, a place name dictionary 22b, an external knowledge word dictionary 22c, and an external evaluation word dictionary 22d. In the verb facility type dictionary 22a, feature words composed of verbs expressing the behavior of the facility user are set in advance, and the facility type related to each feature word is defined by the information organizing unit 12c. In the place name dictionary 22b, feature words made up of place names that are nouns representing the address of the facility, a related area, and the like are set in advance, and the facility ID related to each feature word is individually defined by the information organizing means 12c. In the external knowledge word dictionary 22c, feature words including nouns that the user is interested in regarding the facility are set in advance, and facility IDs related to the feature words are individually defined by the information organizing unit 12c. In the external evaluation word dictionary 22d, feature words composed of adjectives expressing the evaluation of facility users or modifiers that are adjective verbs are set in advance, and the facility ID related by the information organizing unit 12c is assigned to each feature word. Evaluation values that are defined individually and indicate the degree of association for each facility ID are individually given by the information processing means 12c.

入出力端末16は、検索ユーザによって自由文形式のリクエスト文が入力される入力手段16aと、情報検索装置18から送られた検索結果を検索ユーザに対して出力又は表示する出力手段16bとを備えている。   The input / output terminal 16 includes input means 16a for inputting a request sentence in free text format by the search user, and output means 16b for outputting or displaying the search result sent from the information search device 18 to the search user. ing.

情報検索装置18には、入出力端末16に入力されたリクエスト文を形態素解析等の解析方法を用いて単語情報に分割する単語分割手段18aと、辞書データベース22が有する各辞書と施設情報インデックス20を参照し、その単語情報と一致する特徴語又はキーワードを抽出し、該当する特徴語又はキーワードに関連すると定義された施設ID又は施設種別を取得し、取得した施設ID及び施設種別が付与された施設情報を施設情報データベース14の中から抽出し、出力手段16bへ送る検索手段18bとが設けられている。   The information search device 18 includes a word dividing unit 18a that divides a request sentence input to the input / output terminal 16 into word information using an analysis method such as morphological analysis, each dictionary and facility information index 20 included in the dictionary database 22. The feature word or keyword that matches the word information is extracted, the facility ID or facility type defined to be related to the corresponding feature word or keyword is acquired, and the acquired facility ID and facility type are given. A search means 18b is provided that extracts the facility information from the facility information database 14 and sends it to the output means 16b.

なお、施設情報検索システム10は、入出力端末16を除く各装置によって構成される検索サーバに、インターネット等の通信回線を通じて入出力端末16が接続され、入出力端末16の操作によって、不特定多数の検索ユーザが検索サーバにアクセスすることができるよう構成されている。   The facility information search system 10 includes an input / output terminal 16 connected to a search server constituted by devices other than the input / output terminal 16 through a communication line such as the Internet. The search users can access the search server.

次に、施設関連情報検索システム10の動作について説明する。まず、情報収集装置12、施設情報データベース14及び施設情報インデックス20が行う、本発明の一実施形態の施設関連情報検索方法24に該当する動作を、図2の処理工程図に基づいて説明する。   Next, the operation of the facility related information search system 10 will be described. First, operations corresponding to the facility-related information search method 24 according to an embodiment of the present invention performed by the information collection device 12, the facility information database 14, and the facility information index 20 will be described with reference to the process diagram of FIG.

まず、情報収集工程S1で、インターネット上のWebサイトや市販の雑誌等に公開された施設関連情報であって、少なくとも文書情報を含み、その他画像や図表等が付加された施設関連情報を収集し、コンピュータ上に取り込む。次に、施設ID等付与工程S2で、収集した個々の施設関連情報に、その情報の主体である施設を識別する施設IDと、施設の分類を示す施設種別を付与する。そして、施設情報格納工程S3で、施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を、施設情報データベース14に格納する。   First, in the information collection step S1, facility-related information published on a website on the Internet, a commercial magazine, etc., which includes at least document information, and other facility-related information to which images, diagrams, etc. are added is collected. , Capture on the computer. Next, in the facility ID etc. granting step S2, a facility ID for identifying the facility that is the subject of the information and a facility type indicating the facility classification are assigned to the collected individual facility related information. Then, in the facility information storage step S3, among the facility related information, at least the facility related information including the facility information in which the individual document information, the facility ID, and the facility type are associated is stored in the facility information database 14.

例えば、図3に示すように、イギリスの有名な教会であるウェストミンスター寺院に関する施設関連情報が2件あれば、1件目については、その文書情報「英国で最も美しい・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報1として施設情報データベース14に格納される。同様に、2件目については、その文書情報「中世のゴシック建築で・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報2として施設情報データベース14に格納される。   For example, as shown in FIG. 3, if there are two pieces of facility-related information related to Westminster Abbey, a famous British church, the document information “the most beautiful in the UK…” The ID “1” is associated with the facility type “Temple” and stored in the facility information database 14 as the facility information 1. Similarly, for the second case, the document information “in medieval Gothic architecture ...”, sentence facility ID “1”, and facility type “Temple” are associated with each other as facility information 2 in the facility information database 14. Stored.

一方、情報収集工程S1の後、施設ID等付与工程S2の処理とともに、キーワード抽出工程S4において、施設関連情報に含まれる文書情報を形態素解析等によって単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出する。そして、スコア付与工程S5で、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与する。   On the other hand, after the information collecting step S1, the document information included in the facility related information is divided into words by morphological analysis or the like in the keyword extracting step S4 along with the processing of the facility ID etc. granting step S2, and Extract keywords that express content and features. Then, in the score assignment step S5, a score value indicating the degree of association is assigned to each extracted facility ID for the extracted keyword.

以下、スコア付与工程S5について、図4〜図6に基づいて詳しく説明する。スコア付与工程S5は、文章情報分割工程S51と、スコア値算出工程S52と、スコア値合算工程S53と、スコア値選択工程S54とで成る。まず、文書情報分割工程S51では、個々の施設関連情報が有する1または複数の文書から成る情報を、一つの文章を最小単位として、文書情報の先頭から後方までを単位文章に分割する。例えば、図4に示す例の場合、ウェストミンスター寺院に関する1件目の施設関連情報に含まれる文書情報1は、3つの文章で構成されている。ここでは、説明の便宜のため、文書情報を3つの単位文章に分割することとし、文書情報1は、第1,2,3文が個々に1つの単位文章を構成するものとする。   Hereinafter, the score provision process S5 will be described in detail with reference to FIGS. The score providing step S5 includes a sentence information dividing step S51, a score value calculating step S52, a score value adding step S53, and a score value selecting step S54. First, in the document information dividing step S51, information consisting of one or a plurality of documents included in each facility related information is divided into unit sentences from the beginning to the back of the document information with one sentence as a minimum unit. For example, in the case of the example shown in FIG. 4, the document information 1 included in the first facility-related information related to Westminster Abbey is composed of three sentences. Here, for convenience of explanation, it is assumed that the document information is divided into three unit sentences, and in the document information 1, the first, second, and third sentences individually constitute one unit sentence.

なお、この文書情報1は、上記キーワード抽出工程S4によって、既にキーワードが抽出されている。図4に示す例では、第1文にあっては、「お勧め」「世界遺産」「ウェストミンスター寺院」がキーワードとして抽出され、助詞等である「の」「は」「である」は重要な語句ではないと判断して抽出されない。同様に、第2文にあっては、「ウェストミンスター寺院」「中世」「美しい」「建築物」がキーワードとして抽出されている。「ウェストミンスター寺院」は、第1文と重複するが、第2文においてもキーワードとして取り扱う。第3文についても同様である。   In this document information 1, keywords have already been extracted by the keyword extraction step S4. In the example shown in FIG. 4, in the first sentence, “recommended”, “world heritage”, “Westminster Abbey” are extracted as keywords, and “no”, “ha”, “wa” are important particles. It is not extracted because it is judged that it is not a proper word. Similarly, in the second sentence, “Westminster Abbey”, “Medieval”, “Beautiful”, and “Building” are extracted as keywords. “Westminster Abbey” overlaps with the first sentence, but is also treated as a keyword in the second sentence. The same applies to the third sentence.

次に、スコア値算出工程S52で、キーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、キーワードと施設IDとの関連度を算出する。一般に、施設を紹介する文書情報にあっては、文書長が短いものが多く、重要な語が繰り返し使用されるという傾向が当てはまらない場合がある。そこで、キーワードの出現回数以外の要素にも着眼するものである。   Next, in the score value calculation step S52, the number of times the keyword appears in each unit sentence, the position of the unit sentence in which the keyword appears, and the number of modifiers that depend on the keyword in each unit sentence And the degree of association between the keyword and the facility ID is calculated. In general, in document information that introduces facilities, there are many cases in which the document length is short, and the tendency that important words are used repeatedly may not apply. Therefore, attention is also paid to elements other than the number of occurrences of the keyword.

まず、出現回数が多いキーワードほど重要な情報であり、関連度が高いと判断する。ただし、図4に示す例の場合、各キーワードが各文章群内で出現する回数は各々1回ずつと同じのため、ここでは、出現回数Aは全て「1」という値が付与される。   First, it is determined that a keyword having a higher number of appearances is more important information and has a higher degree of relevance. However, in the example shown in FIG. 4, since the number of times each keyword appears in each sentence group is the same as each time, the value “1” is assigned to all the appearance times A here.

次に、キーワードが出現した文章群が、文書情報の先頭に近いときほど重要度高く、後方寄りのときほど重要度が低いと判断する。これは、検索ユーザの興味を惹く内容や第三者の感想等の重要な情報は先頭寄りの単位文章に記載される傾向があるという経験則に基づいている。例えば、図4に示す例では、キーワードの出現位置による重み付けBは、先頭に近い第1文には「3」、中盤の第2文には「2」、後方の第3文には「1」という値が付与される。   Next, it is determined that the importance of the sentence group in which the keyword appears is closer to the head of the document information, and the importance is lower as it is closer to the back. This is based on an empirical rule that important information such as content that attracts the search user's interest and impressions of third parties tend to be written in unit sentences near the top. For example, in the example shown in FIG. 4, the weight B based on the keyword appearance position is “3” for the first sentence near the top, “2” for the second sentence in the middle, and “1” for the third sentence behind. "Is given.

さらに、キーワードに係り受けする修飾語の数が多いほど重要度が高いと判断する。例えば、図4に示す例の場合、第1文の「お勧め」というキーワードには修飾語が係っていないので、修飾語の数Cには「0」が、「ウェストミンスター寺院」というキーワードに係る修飾語は「お勧め」と「世界遺産」の2つなので、修飾語の数Cには「2」が各々付与される。その他のキーワードについても、同じ要領で修飾語の数Cが付与される。   Further, it is determined that the importance is higher as the number of modifiers depending on the keyword is larger. For example, in the case of the example shown in FIG. 4, since the keyword “recommended” in the first sentence is not related to the modifier, “0” is used for the number C of modifiers and the keyword “Westminster Abbey”. Since there are two modifiers “recommended” and “world heritage”, “2” is assigned to the number C of modifiers. For other keywords, the number C of modifiers is given in the same manner.

そして、出現回数Aと重み付けBを積算し、さらに修飾語の数Cを加算することによって、単位文章ごとのキーワードのスコア値である小計(A×B+C)を算出する。   Then, by adding up the number of appearances A and the weight B, and further adding the number C of modifiers, a subtotal (A × B + C) that is a keyword score value for each unit sentence is calculated.

次に、スコア値合算工程S53で、各単位文章に出現したキーワードを、各文書情報の単位で取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算し、そのキーワードのスコア値とする。例えば、図4に示す例の場合、「ウェストミンスター寺院」というキーワードは、第1,2,3文に重複して出現し、各々「5」「5」「3」という小計(A×B+C)が算出されている。従って、文章情報1による「ウェストミンスター寺院」のスコア値D(1)は、それらを合算した「13」と決定する。なお、「ウェストミンスター寺院」以外のキーワードは重複していないので、スコア値を合算することなく、単位文章ごとに算出された小計(A×B+C)の値を、そのまま文章情報1によるスコア値D(1)と決定する。   Next, in the score value summarizing step S53, the keywords appearing in each unit sentence are collected in units of each document information, and if there are keywords that appear redundantly in different unit sentences, the score value assigned to each unit sentence is given. Are combined to obtain the score value of the keyword. For example, in the example shown in FIG. 4, the keyword “Westminster Abbey” appears in duplicate in the first, second, and third sentences, and subtotals (A × B + C) of “5”, “5”, and “3”, respectively. Is calculated. Therefore, the score value D (1) of “Westminster Abbey” based on the sentence information 1 is determined as “13” obtained by adding them. Since keywords other than “Westminster Abbey” do not overlap, the value of the subtotal (A × B + C) calculated for each unit sentence is directly used as the score value D based on the sentence information 1 without adding up the score values. (1) is determined.

また、スコア付与工程S5の対象がウェストミンスター寺院に関する2件目の施設関連情報であって、図5に示すように、その文書情報2が1つの文章で構成されている場合の取り扱いについて説明する。ここでは文書情報の重み付けの分割数は3に設定してあるが、一つの文章を最小単位とするため、文書情報2を分割することができない。そこで、スコア値算出工程S52では、文書情報2全体を1つの単位文章として取り扱う。   Further, the handling in the case where the object of the score giving step S5 is the second facility related information related to Westminster Abbey and the document information 2 is composed of one sentence as shown in FIG. 5 will be described. . Here, the weighting division number of the document information is set to 3, but since one sentence is a minimum unit, the document information 2 cannot be divided. Therefore, in the score value calculation step S52, the entire document information 2 is handled as one unit sentence.

また、文章情報2の場合、各キーワードの出現回数Aは、文書情報1の場合と同様に、実際の出現回数である「1」が付与される。しかし、キーワードの出現位置による重み付けBは、一律「0.9」が付与される。文章情報の長さが短い文書情報は質の悪い情報であることが多いという経験則に基づき、文章の長さが長い文書情報よりも重要度が低いと判断するものである。さらに、修飾語の数Cは、スコア値に反映させない。そして、各キーワードのスコア値である小計(A×B)が算出される。なお、次のスコア値合算工程S53では、文章情報2の文章群の数が1つであるため、各キーワードについて算出された小計(A×B)の値を、そのまま文章情報2によるスコア値D(2)と決定する。   In the case of the text information 2, the number of appearances A of each keyword is given “1” that is the actual number of appearances as in the case of the document information 1. However, the weight B based on the appearance position of the keyword is uniformly assigned “0.9”. Based on an empirical rule that document information with a short length of text information is often poor quality information, it is determined that the importance is lower than document information with a long text length. Furthermore, the number C of modifiers is not reflected in the score value. Then, a subtotal (A × B) that is a score value of each keyword is calculated. In the next score value adding step S53, since the number of sentence groups of the sentence information 2 is one, the value of the subtotal (A × B) calculated for each keyword is directly used as the score value D based on the sentence information 2. (2) is determined.

次に、スコア値選択工程S54で、文書情報ごとにスコア値が決定された各キーワードを、各施設IDごとに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択してそのキーワードのスコア値とする。例えば、図6に示す例の場合、文書情報1,2は、共にウェストミンスター寺院を示す施設ID「1」が付与されている。そして、文書情報1,2において、キーワード「ウェストミンスター寺院」と「建築物」が各々重複している。重複する場合は、文書情報1によるスコア値D(1)と文書情報2によるスコア値D(2)を比較し、関連度が高い方のスコア値を選択して施設ID「1」のスコア値に決定する。また、重複しないキーワードについては、スコア値D(1),D(2)を施設ID「1」のスコア値と決定する。   Next, in the score value selection step S54, the keywords whose score values are determined for each document information are collected for each facility ID, and if there are keywords that appear redundantly in different document information, the keywords are assigned to each document information. Among the score values, the score value having the highest degree of relevance is selected and set as the score value of the keyword. For example, in the case of the example shown in FIG. 6, the document IDs 1 and 2 are both given the facility ID “1” indicating Westminster Abbey. In the document information 1 and 2, the keywords “Westminster Abbey” and “building” are duplicated. If they overlap, the score value D (1) based on the document information 1 and the score value D (2) based on the document information 2 are compared, and the score value with the higher relevance level is selected and the score value of the facility ID “1” To decide. For keywords that do not overlap, the score values D (1) and D (2) are determined as the score values of the facility ID “1”.

そして、上記スコア付与工程S5の後、インデックス情報格納工程S6で、キーワード、施設ID及びスコア値からなるインデックス情報を、データベースである施設情報インデックス20に格納する。その結果、施設情報インデックス20には、例えば図7に示すように、全ての施設IDに係るインデックス情報が格納される。   Then, after the score assigning step S5, in the index information storing step S6, the index information including the keyword, the facility ID, and the score value is stored in the facility information index 20 that is a database. As a result, the facility information index 20 stores index information relating to all facility IDs as shown in FIG. 7, for example.

以上説明したように、情報収集装置12、施設情報データベース14及び施設情報インデックス20は、情報収集工程S1、施設ID等付与工程S2、施設情報格納工程S3、キーワード抽出工程S4、スコア値付与工程S5及びインデックス情報格納工程S6からなる施設関連情報検索方法24に従って動作する。そして、施設関連情報検索方法24によれば、多くの施設関連情報を、様々な観点の検索条件に該当する情報選択を行うことができるように整理格納される。また、後述する施設関連情報検索システム10のように、検索ユーザの要求に適合した施設情報を的確に抽出することができる検索システムを容易に構築することができ、さらに、スコア値を利用すれば、関連度の高い施設関連情報から順番に提供することも可能になる。   As described above, the information collection device 12, the facility information database 14, and the facility information index 20 are the information collection step S1, the facility ID etc. provision step S2, the facility information storage step S3, the keyword extraction step S4, and the score value provision step S5. And the facility related information retrieval method 24 comprising the index information storage step S6. According to the facility related information search method 24, a lot of facility related information is organized and stored so that information corresponding to search conditions from various viewpoints can be selected. Further, as in the facility-related information search system 10 described later, a search system that can accurately extract facility information suitable for a search user's request can be easily constructed, and furthermore, if a score value is used, It is also possible to provide in order from facility-related information with a high degree of relevance.

次に、情報検索装置18の検索効率を良くし検索の的確性等を高めるための辞書データベース22を整備する動作について、図2の処理工程図に戻って説明する。工程S7では、施設ID等付与工程S2の後、辞書データベース22の各辞書に設定された特徴語ごとに関連する施設を定義し、関連する施設に該当する施設ID又は施設種別を各特徴語に対応付けて格納する。   Next, the operation of preparing the dictionary database 22 for improving the search efficiency of the information search device 18 and improving the accuracy of the search will be described with reference to the process diagram of FIG. In step S7, after the facility ID etc. granting step S2, a related facility is defined for each feature word set in each dictionary of the dictionary database 22, and the facility ID or facility type corresponding to the related facility is defined as each feature word. Store in association.

辞書データベース22の動詞施設種別辞書22aは、「観る」「遊ぶ」のように、施設の利用者の動作を表現する動詞からなる特徴語があらかじめ設定されている(図8(a))。一般に、施設の管理者等が作成した施設紹介文には、施設の利用者を動作の主体とする動詞があまり使用されない。一方、検索ユーザが入力するリクエスト文は、施設の利用者の動作や行動を表す動詞を使用されることが多い。従って、検索ユーザが入力した動詞を用いて文字列一致による検索を行っても、必ずしも検索ユーザが目的とする施設関連情報を抽出することができないときある。そこで、利用者の動作を表現する動詞からなる特徴語を設定し、それに関連する施設種別を定義した動詞施設種別辞書22aを設けることによって、上記検索漏れ等が生じないようにすることができる。   In the verb facility type dictionary 22a of the dictionary database 22, feature words made up of verbs representing the operation of the facility user, such as “watch” and “play”, are set in advance (FIG. 8A). In general, in the facility introduction sentence created by the facility manager or the like, a verb whose operation is the subject of the facility user is not often used. On the other hand, verbs representing actions and actions of facility users are often used in request sentences input by search users. Therefore, even if a search by character string matching is performed using the verb input by the search user, the facility related information intended by the search user may not always be extracted. Therefore, by setting a feature word composed of a verb expressing the user's action and providing a verb facility type dictionary 22a defining a facility type related to the verb, it is possible to prevent the search omission and the like from occurring.

具体的には、施設ID等付与工程S2で、新規な施設関連情報に対して施設種別が付与され、その施設種別が新規である場合、工程S7で、動詞施設種別辞書22aに設定されている特徴語(動詞)の中のいずれかに、その新規の施設種別が対応する旨を定義する動作を行う。また、既存の特徴語(動詞)の中に適切なものがないときは、新たな特徴語を設定し、その新規の施設種別に対応する旨を定義する動作を行ってもよい。例えば、「観る」は「美術館」「博物館」等に、「遊ぶ」は「遊園地」等に対応する施設種別とする。   Specifically, when the facility type is assigned to the new facility-related information in the facility ID etc. assigning step S2, and the facility type is new, it is set in the verb facility type dictionary 22a in step S7. An operation is performed to define that the new facility type corresponds to any of the feature words (verbs). In addition, when there is no appropriate feature word (verb), a new feature word may be set and an operation may be performed to define that it corresponds to the new facility type. For example, “watch” is a facility type corresponding to “art museum”, “museum”, etc., and “play” is a facility type corresponding to “amusement park”.

辞書データベース22の地名辞書22bは、「ロンドン」「△△府××市」のように、施設の住所や関係する地域等を現す名詞である地名からなる特徴語があらかじめ設定されている(図8(b))。一般に、施設紹介文には、施設の住所等が記載されていない場合が少なくない。従って、例えば、検索ユーザがイタリアに在る施設を検索する目的で「イタリア」の語句を入力して文字列一致による検索を行っても、イタリアに住所を有する施設の情報を抽出することができず、目的に合致しない日本のイタリア料理店が多数抽出されることがある。そこで、施設の住所や関係する地域などを現す地名からなる特徴語を設定し、それに関連する施設IDを定義する地名辞書22bを設けることによって、上記検索漏れが生じないようにすることができる。   In the place name dictionary 22b of the dictionary database 22, feature words made up of place names, which are nouns representing the address of the facility, the related area, etc., such as “London” and “△△ Fu XX City” are set in advance (see FIG. 8 (b)). Generally, there are many cases where the facility address does not include the address of the facility. Therefore, for example, even if the search user inputs the phrase “Italy” for the purpose of searching for a facility in Italy and performs a search by character string matching, information on a facility having an address in Italy can be extracted. In many cases, a number of Japanese Italian restaurants that do not meet the objectives are extracted. Therefore, by setting a feature word consisting of a place name representing a facility address, a related area, and the like, and providing a place name dictionary 22b that defines a facility ID related thereto, the above-mentioned search omission can be prevented.

具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、地名辞書22bに設定されている特徴語(地名)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作をする。また、既存の特徴語(地名)の中に適切なものがないときは、新たに特徴語(地名)を設定し、その新規の施設IDが対応する旨を定義する動作を行ってもよい。   Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the place name dictionary 22b in step S7. An operation is performed to define that the new facility ID corresponds to any one of the feature words (place names). In addition, when there is no appropriate feature word (place name), a new feature word (place name) may be set, and an operation of defining that the new facility ID corresponds may be performed.

辞書データベース22の外部知識語辞書22cは、「世界遺産」「戯曲作家」「シェークスピア」のように、施設に関して利用者が興味を示す名詞からなる特徴語があらかじめ設定されている(図8(c))。一般に、施設の紹介文には、シェークスピアに縁のある施設である旨の記載があっても、シェークスピアが戯曲作家である旨が記載されていない場合がある。すると、検索ユーザが入力した「戯曲作家」用いた文字列一致による検索が行われても、シェークスピアに縁のある施設の情報を抽出できないという問題が生じる。そこで、利用者が興味を示す名詞からなる特徴語を設定し、その特徴語に関連する施設IDを定義する外部知識語辞書22cを設けることによって、上記検索漏れが生じないようにすることができる。   In the external knowledge word dictionary 22c of the dictionary database 22, feature words made up of nouns that the user is interested in regarding the facility, such as “World Heritage”, “Drama writer”, and “Shakespeare”, are set in advance (FIG. 8 (c). )). In general, there are cases in which introductory text of a facility does not indicate that Shakespeare is a playwright even though there is a description that the facility is related to Shakespeare. Then, even if a search by character string matching using “drama writer” input by the search user is performed, there is a problem in that information on facilities that are related to Shakespeare cannot be extracted. Therefore, by setting a feature word composed of nouns that the user is interested in and providing an external knowledge word dictionary 22c that defines a facility ID related to the feature word, the above-mentioned search omission can be prevented. .

具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部知識語辞書22cに設定されている特徴語(名詞)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(名詞)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院の施設ID「1」は、「世界遺産」「史跡」等に関連する旨が定義される。   Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the external knowledge word dictionary 22c in step S7. An operation is performed to define that the new facility ID corresponds to any of the feature words (nouns). In addition, when there is no appropriate feature word (noun) in the existing feature word, a new feature word may be set and an operation for defining that the new facility type corresponds may be performed. For example, the facility ID “1” of Westminster Abbey is defined to be related to “World Heritage”, “Historic Site”, and the like.

辞書データベース22の外部評価語辞書22dは、「有名な」「楽しい」のように、施設の利用者の評価を表現する修飾語からなる特徴語があらかじめ設定されている(図8(d))。なお、この特徴語は形容詞や形容動詞等が該当する。一般に、施設の管理者等が作成した施設の紹介文には、施設の利用者の感想や評価、口コミで広がった評判を表す修飾語はほとんど使用されない。特に、悪い評判は皆無に等しい。従って、これらを適切に検索するには、各施設の知名度や、人気度に関する知識を検索システムに与える必要がある。そこで、利用者の評価等を表現する修飾語からなる特徴語を設定し、それに関連する施設IDを定義する外部評価辞書22dを設けることによって、適切な検索を行うことを可能にする。さらに、ここでは、特徴語(修飾語)と施設IDとの関連度を示す評価値も同時に付与する。   In the external evaluation word dictionary 22d of the dictionary database 22, feature words made up of modifiers expressing the evaluations of facility users, such as “famous” and “fun”, are set in advance (FIG. 8D). . This feature word corresponds to an adjective or an adjective verb. In general, facility introductory texts created by facility managers and the like rarely use modifiers that express the reputation and spread of reviews and evaluations of the users of the facilities. In particular, there is no bad reputation. Therefore, in order to search for these appropriately, it is necessary to give the search system knowledge about the name and popularity of each facility. Therefore, it is possible to perform an appropriate search by setting a feature word composed of a modifier that expresses a user's evaluation and the like and providing an external evaluation dictionary 22d that defines a facility ID related thereto. Further, here, an evaluation value indicating the degree of association between the feature word (modifier) and the facility ID is also given.

具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部評価語辞書22dに設定されている特徴語(修飾語)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(修飾語)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院を現す施設ID「1」は、修飾語「有名な」に関連し、その関連度は「5」と定義される。一方、○○動物園を現す施設ID「2」も修飾語「有名な」に関連するが、ウェストミンスター寺院ほど有名ではないので、関連度は「2」と定義されている。このように、評価値の定義方法は任意であり、例えば、文書情報を所定の方法で解析して知名度や人気度を自動的に算出したり、施設関連情報検索システム10の管理者等の独自の調査に基づいて決定し、手動で登録する方法等がある。   Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the external evaluation word dictionary 22d in step S7. An operation is performed to define that the new facility ID corresponds to one of the feature words (modifiers). In addition, when there is no appropriate feature word (modifier), a new feature word may be set, and an operation may be performed to define that the new facility type corresponds. For example, the facility ID “1” representing Westminster Abbey is associated with the modifier “famous”, and the degree of association is defined as “5”. On the other hand, the facility ID “2” representing the OO zoo is also related to the modifier “famous”, but is not as famous as Westminster Abbey, so the degree of association is defined as “2”. As described above, the evaluation value can be defined by any method. For example, the document information is analyzed by a predetermined method to automatically calculate the degree of popularity and popularity, or the administrator of the facility-related information search system 10 or the like is unique. There is a method of making a decision based on the survey and manually registering.

なお、個々の施設IDに評価値を付与することによって、検索ユーザの要求に適合する施設関連情報を、関連度の高いものから順番に提供する動作が可能になる。この動作については、後で詳しく述べる。   In addition, by assigning an evaluation value to each facility ID, it is possible to perform an operation of providing facility-related information that meets the search user's request in descending order of relevance. This operation will be described in detail later.

次に、検索ユーザが入出力端末16を操作して、所望の施設関連情報を検索する動作について、図9のフローチャートに基づいて説明する。まず、工程S10で、検索ユーザが、入出力端末16の入力手段16aにリクエスト文を入力する。ここでは、例えば「ロンドンで有名な教会の建築物を観たい。」のように、目的がやや曖昧に表現された自由文形式のリクエスト文でよい。   Next, an operation in which the search user operates the input / output terminal 16 to search for desired facility-related information will be described based on the flowchart of FIG. First, in step S <b> 10, the search user inputs a request sentence to the input unit 16 a of the input / output terminal 16. Here, for example, a request sentence in a free text form in which the purpose is expressed somewhat vaguely, such as “I want to see the architecture of a famous church in London” may be used.

次に、工程S11で、単語分割手段18aで形態素解析等を行い、リクエスト文を品詞ごとの単語情報に分割する。このとき、シソーラスを用いて同義語や類義語も合わせて単語情報としてもよい。また、リクエスト文に「国立公園」のような複合名詞が含まれるとき、「国立」「公園」「国立公園」について各々シソーラス検索を行い、各検索結果を集計して「国立公園」についての単語情報としてもよい。すなわち、単語分割手段18aによる単語情報の抽出方法は、検索ユーザの目的を適切に認識できるように適宜設定される。   Next, in step S11, morphological analysis is performed by the word dividing means 18a, and the request sentence is divided into word information for each part of speech. At this time, synonyms and synonyms may be combined into word information using a thesaurus. In addition, when the request sentence contains a compound noun such as “National Park”, the thesaurus is searched for “National”, “Park”, and “National Park”, and the search results are aggregated to create a word for “National Park”. It may be information. That is, the method of extracting word information by the word dividing unit 18a is appropriately set so that the purpose of the search user can be properly recognized.

次に、工程S12で、検索手段18bが、辞書データベース22内の各辞書と施設情報インデックス20とを参照し、単語分割手段18で得られた単語情報に該当する施設ID、評価値、施設種別、スコア値を取得する。以下、この検索手段18bの動作について、図10のフローチャートに基づいて詳しく説明する。   Next, in step S12, the search means 18b refers to each dictionary in the dictionary database 22 and the facility information index 20, and the facility ID, evaluation value, and facility type corresponding to the word information obtained by the word dividing means 18 Get the score value. Hereinafter, the operation of the search means 18b will be described in detail based on the flowchart of FIG.

単語情報が動詞の場合、検索手段18bは、動詞施設種別辞書22aを参照してその単語情報と一致する特徴語(動詞)を調べ、該当する施設種別を所得する(工程S121)。例えば、単語分割手段18で「観る」という単語情報が得られた場合、図8(a)の動詞施設種別辞書22aを参照して、「美術館」「博物館」等の施設種別を取得する。   If the word information is a verb, the search means 18b refers to the verb facility type dictionary 22a for a feature word (verb) that matches the word information, and obtains the corresponding facility type (step S121). For example, when the word information “view” is obtained by the word dividing means 18, the facility type such as “museum” or “museum” is acquired with reference to the verb facility type dictionary 22 a of FIG.

単語情報が地名の場合、検索手段18bは、地名辞書22bを参照してその単語情報と一致する特徴語(地名)を調べ、該当する施設IDを所得する(工程S122)。例えば、単語分割手段18で「ロンドン」という単語情報が得られた場合、図8(b)の地名辞書22bを参照して、「1」等の施設IDを取得する。   When the word information is a place name, the search means 18b refers to the place name dictionary 22b, searches for a feature word (place name) that matches the word information, and obtains the corresponding facility ID (step S122). For example, when word information “London” is obtained by the word dividing means 18, a facility ID such as “1” is acquired with reference to the place name dictionary 22 b of FIG.

単語情報が名詞の場合、検索手段18bは、外部知識語辞書22cを参照してその単語情報と一致する特徴語(名詞)が在るか否かを判断する(S123)。そして、一致する特徴語(名詞)があれば、検索手段18bは、その単語情報に該当する施設IDを取得する(工程S124)。例えば、単語分割手段18で「世界遺産」という単語情報が得られた場合、図8(c)の外部知識語辞書22cを参照して、「1」等の施設IDを取得する。   When the word information is a noun, the search unit 18b refers to the external knowledge word dictionary 22c to determine whether there is a feature word (noun) that matches the word information (S123). If there is a matching feature word (noun), the search unit 18b acquires a facility ID corresponding to the word information (step S124). For example, when word information “world heritage” is obtained by the word dividing means 18, a facility ID such as “1” is acquired with reference to the external knowledge word dictionary 22 c of FIG.

一方、一致する特徴語(名詞)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を取得する(工程S125)。例えば、単語分割手段18で「教会」という単語情報が得られた場合、図7の施設情報インデックス20を参照して、施設ID「1」及びスコア値「2」を取得する。   On the other hand, when there is no matching feature word (noun), the search unit 18b refers to the facility information index 20 to check a keyword that matches the word information, and acquires a corresponding facility ID and a corresponding score value ( Step S125). For example, when word information “Church” is obtained by the word dividing unit 18, the facility ID “1” and the score value “2” are acquired with reference to the facility information index 20 of FIG. 7.

単語情報が修飾語の場合、検索手段18bは、外部評価語辞書22dを参照してその単語情報と一致する特徴語(修飾語)が在るか否かを判断する(S126)。そして、一致する特徴語(修飾語)があれば、検索手段18bは、その単語情報に該当する施設IDとそれに対応する評価値を取得する(工程S127)。例えば、単語分割手段18で「有名な」という単語情報が得られた場合、図8(d)の外部知識語辞書22dを参照して、施設ID「1」及び評価値「5」を取得する。   If the word information is a modifier, the search unit 18b refers to the external evaluation word dictionary 22d to determine whether there is a feature word (modifier) that matches the word information (S126). If there is a matching feature word (modifier), the search unit 18b acquires a facility ID corresponding to the word information and an evaluation value corresponding to the facility ID (step S127). For example, when the word information “famous” is obtained by the word dividing unit 18, the facility ID “1” and the evaluation value “5” are acquired with reference to the external knowledge word dictionary 22d in FIG. .

一方、一致する特徴語(修飾語)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を所得する(工程S128)。   On the other hand, when there is no matching feature word (modifier), the search means 18b refers to the facility information index 20 to check a keyword that matches the word information, and obtains the corresponding facility ID and the corresponding score value. (Step S128).

次に、検索手段18bは、工程S12を経て、施設ID又は施設種別を取得したかどうか判断する(工程13)。工程S12で、各辞書と施設情報インデックス20から施設IDと施設種別を全く取得することができなかったときには、検索手段18bは「リクエスト文に適合する施設関連情報が見当たらない」と判断し、その旨を出力手段16bから出力させ、検索動作が終了する(S14)。   Next, the search means 18b determines whether the facility ID or the facility type has been acquired through step S12 (step 13). When the facility ID and the facility type cannot be acquired from each dictionary and the facility information index 20 in step S12, the search unit 18b determines that “facility related information matching the request sentence is not found” The output means 16b outputs the information and the search operation is terminated (S14).

一方、施設ID又は施設種別を取得したときは、検索手段18bは、施設情報データベース14内を検索し、取得した施設IDや施設種別に該当する施設情報を抽出する(工程S15)。   On the other hand, when the facility ID or the facility type is acquired, the search unit 18b searches the facility information database 14 and extracts the facility information corresponding to the acquired facility ID and the facility type (step S15).

次に、検索手段18bが、工程S15で抽出された施設情報に付与されているスコア値や評価値に基づき、施設IDごとに、リクエスト文に対する適切性を表すマッチ度を算出する(S16)。例えば、図11に示すように、ウェストミンスター寺院の施設ID「1」が抽出された場合、施設ID「1」には、修飾語「有名な」に対する評価値「5」、キーワード「建築物」に対するスコア値「4」、キーワード「教会」に対するスコア値「2」が付与されている。ここでは、これらを加算して、施設ID「1」のマッチ度「11」を算出する。工程S15で抽出された他の施設ID「7」「12」等についても、同様の方法でマッチ度を算出する。   Next, the search means 18b calculates the degree of match representing the suitability for the request sentence for each facility ID based on the score value and evaluation value given to the facility information extracted in step S15 (S16). For example, as shown in FIG. 11, when the facility ID “1” of Westminster Abbey is extracted, the facility ID “1” has an evaluation value “5” for the modifier “famous” and a keyword “building”. Is assigned a score value “4” and a score value “2” for the keyword “church”. Here, these are added together to calculate the degree of match “11” of the facility ID “1”. For the other facility IDs “7” and “12” extracted in step S15, the matching degree is calculated by the same method.

そして、検索手段18bは、工程S15で抽出した施設情報を施設IDごとにマッチ度が高いものから順番に出力手段16bから出力させる(S17)。出力手段16bは、紙に印刷したり、ディスプレイ表示などによって検索結果を検索ユーザに提供する。そして、出力形式としては、例えば、図12に示すようなレイアウトでディスプレイに表示する方法等が考えられる。ただし施設関連情報に含まれる文書情報、施設ID、マッチ度等の情報のうち、いずれの情報を表示するかは、システム管理者が自由に設定すればよく、あるいは、検索ユーザが選択できるようにしてもよい。   And the search means 18b makes the facility information extracted by process S15 output from the output means 16b in an order with a high matching degree for every facility ID (S17). The output unit 16b provides the search result to the search user by printing on paper or by display display. As an output format, for example, a method of displaying on a display with a layout as shown in FIG. However, the system administrator can freely set which information is to be displayed among the document information, facility ID, match degree, etc. included in the facility related information, or the search user can select it. May be.

以上説明したように、施設関連情報検索システム10は、膨大な施設関連情報を収集、整理格納する情報収集装置12、施設情報データベース14、施設情報インデックス20を備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベース22を備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設関連情報を的確に抽出することができる。   As described above, the facility-related information search system 10 includes the information collection device 12, the facility information database 14, and the facility information index 20 that collect, organize, and store a large amount of facility-related information, and further includes place names / verbs / modifiers. Since the dictionary database 22 that associates the feature words such as and the like with the facility is provided, the request of the search user can be interpreted from various viewpoints, and the facility related information that meets the request can be accurately extracted.

さらに、情報検索装置18は、抽象的な語句を含んだ自由文形式によるリクエスト文の入力ができるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置18は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができ、検索ユーザにとって非常に利便性が高い。   Furthermore, since the information search apparatus 18 can input a request sentence in a free sentence format including an abstract word / phrase, the search user can easily perform a search without preparing in advance. In addition, the information search device 18 weights each facility related information using an evaluation value indicating evaluation of the facility user, a score value indicating the degree of association between the facility and the keyword, etc., and conforms to the search user's request. It is possible to preferentially output high-level facility information, which is very convenient for search users.

なお、本発明は上記実施形態に限定されるものではなく、例えば、検索対象が一定の施設種別に限定されているなどの事情に応じて、辞書データベース22内に設ける辞書の種類を増減させることができる。   Note that the present invention is not limited to the above embodiment. For example, the number of types of dictionaries provided in the dictionary database 22 is increased / decreased depending on circumstances such that the search target is limited to a certain facility type. Can do.

また、各辞書に設定する特徴語や、特徴語に付与されるスコア値及び評価値については、時代の流れとともに適切性を失うことが考えられるので、必要に応じてメンテナンス(再登録又は修正)を行う必要がある。その場合、辞書データベース、施設情報インデックスなどの登録データを修正する作業は、図示しないシステム管理者用端末装置を操作することによって行われる。この場合、蓄積されたすべての施設関連情報に対して、施設ID、施設種別などのインデックス情報が付与されているため、例えば、特定の施設種別の情報を一括して修正する等の処理も容易に行うことができるので、手間がかからず、メンテナンス性にも優れている。   Also, feature words set in each dictionary, and score values and evaluation values assigned to feature words may lose their appropriateness with the passage of time, so maintenance (re-registration or correction) as necessary Need to do. In that case, the operation of correcting registration data such as a dictionary database and a facility information index is performed by operating a terminal device for a system manager (not shown). In this case, since index information such as a facility ID and a facility type is assigned to all the facility-related information accumulated, for example, processing such as correcting the information of a specific facility type at once is easy. Therefore, it is easy and easy to maintain.

また、例えば、施設関連情報の蓄積件数が少ない施設情報検索システムでは、必ずしもスコア値や評価値を用いたマッチ度計算を行う機能を設けずに、工程S15で抽出された施設関連情報が任意の順番で出力されるものであってもよい。   Further, for example, in a facility information retrieval system with a small number of facility-related information accumulated, the facility-related information extracted in step S15 is not necessarily provided with a function for calculating the degree of match using score values and evaluation values. It may be output in order.

また、上記の実施形態のような一連の処理動作をプログラムとして構築し、施設関連情報検索システムとして利用されるサーバーコンピュータにインストールし、CPUなどの制御手段によって実行させる他、そのプログラムをネットワークを介して流通させるようにしてもよい。また、構築されたプログラムを、施設関連情報検索システムとして利用される各種のコンピュータに接続されるハードディスク装置、DVD−ROM、CD−ROMなどの可搬記憶媒体に格納し、コンピュータにインストールして実行させるようにしてもよい。   In addition to constructing a series of processing operations as in the above embodiment as a program, installing it in a server computer used as a facility-related information retrieval system, and executing it by a control means such as a CPU, the program is also transmitted via a network. May be distributed. In addition, the constructed program is stored in a portable storage medium such as a hard disk device, DVD-ROM, or CD-ROM connected to various computers used as a facility-related information retrieval system, and installed in the computer for execution. You may make it make it.

この発明の施設関連情報検索システムの一実施形態の構成を示すブロック図である。It is a block diagram which shows the structure of one Embodiment of the facility relevant-information search system of this invention. 本実施形態の情報収集装置が施設情報データベース、施設情報インデックス及び辞書データベースを整備する動作と、この発明の施設関連情報検索方法の一実施形態を説明する処理工程図である。It is a processing process figure explaining one Embodiment of the operation | movement which the information collection device of this embodiment maintains a facility information database, a facility information index, and a dictionary database, and the facility related information search method of this invention. 本実施形態の施設情報データベースの例を示す図である。It is a figure which shows the example of the facility information database of this embodiment. 本実施形態の施設情報インデックスに格納されるスコア値を説明する第一の図である。It is a 1st figure explaining the score value stored in the facility information index of this embodiment. 本実施形態の施設情報インデックスに格納されるスコア値を説明する第二の図である。It is a 2nd figure explaining the score value stored in the facility information index of this embodiment. 本実施形態の施設情報インデックスに格納されるスコア値を説明する第三の図である。It is a 3rd figure explaining the score value stored in the facility information index of this embodiment. 本実施形態の施設情報インデックスに格納されるスコア値を説明する第四の図である。It is a 4th figure explaining the score value stored in the facility information index of this embodiment. 本実施形態の辞書データベースが備える辞書の例を示す図であって、動詞施設種別辞書(a)、地名辞書(b)、外部知識語辞書(c)、外部評価語辞書(d)である。It is a figure which shows the example of the dictionary with which the dictionary database of this embodiment is provided, Comprising: It is a verb facility classification dictionary (a), a place name dictionary (b), an external knowledge word dictionary (c), and an external evaluation word dictionary (d). 本実施形態の入出力端末を操作し、検索した施設情報を出力する動作を説明するフローチャートである。It is a flowchart explaining the operation | movement which operates the input / output terminal of this embodiment, and outputs the searched facility information. 本実施形態の検索手段が辞書等を参照し、単語情報に該当する所定の情報を取得する動作を説明するフローチャートである。It is a flowchart explaining the operation | movement in which the search means of this embodiment acquires the predetermined information applicable to word information with reference to a dictionary etc. 本実施形態の検索手段がマッチ度を算出する動作を説明する図である。It is a figure explaining the operation | movement which the search means of this embodiment calculates a matching degree. 本実施形態の出力手段から出力される検索結果の例を説明する図である。It is a figure explaining the example of the search result output from the output means of this embodiment.

符号の説明Explanation of symbols

10 施設関連情報検索システム
12 情報収集装置
12a 情報収集手段
12b キーワード抽出手段
12c 情報整理手段
14 施設情報データベース
16 入出力端末
18 情報検索装置
18a 単語分割手段
18b 検索手段
20 施設情報インデックス
22 辞書データベース
22a 動詞施設種別辞書
22b 地名辞書
22c 外部知識語辞書
22d 外部評価語辞書
24 施設関連情報検索方法
S1 情報収集工程
S2 施設ID等付与工程
S3 施設情報格納工程
S4 キーワード抽出工程
S5 スコア付与工程
S51 文章情報分割工程
S52 スコア値算出工程
S53 スコア値合算工程
S54 スコア値選択工程
S6 インデックス情報格納工程
DESCRIPTION OF SYMBOLS 10 Facility related information search system 12 Information collection apparatus 12a Information collection means 12b Keyword extraction means 12c Information arrangement means 14 Facility information database 16 Input / output terminal 18 Information search apparatus 18a Word division means 18b Search means 20 Facility information index 22 Dictionary database 22a Verb Facility type dictionary 22b Place name dictionary 22c External knowledge word dictionary 22d External evaluation word dictionary 24 Facility related information search method S1 Information collection step S2 Facility ID etc. addition step S3 Facility information storage step S4 Keyword extraction step S5 Score assignment step S51 Text information division step S52 Score value calculating step S53 Score value adding step S54 Score value selecting step S6 Index information storing step

Claims (11)

施設に関する情報を収集してデータベースを作成し、検索サーバにより検索可能にする施設関連情報検索方法において、
文書情報を有した施設関連情報を収集する情報収集工程と、
前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、
前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、
施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、
抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、
キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、
前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、
前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章ごとに算出するスコア値算出工程と、
各単位文章に出現したキーワードを、その単位文章を含む各文書情報ごとに取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えたことを特徴とする施設関連情報検索方法。
In a facility-related information search method that collects information about facilities, creates a database, and enables search by a search server,
An information collection process for collecting facility-related information with document information;
For each facility related information collected in the information collecting step, a facility ID etc. granting step for assigning a facility ID for identifying a facility that is a subject of the facility related information and a facility type indicating a classification of the facility,
Facility information storage that stores, in the storage device of the search server, facility related information including at least facility information associated with individual document information, facility ID, and facility type, among the facility related information to which the facility ID and the like are assigned Process,
A keyword extraction step of dividing the document information included in the facility-related information into words, and extracting keywords expressing the contents and features of the facility from the words;
A score giving step for giving a score value indicating a degree of association for each extracted facility keyword for each corresponding facility ID;
An index information storage step of storing index information including a keyword, a facility ID, and a score value in a storage device of a search server,
The score assigning step is a document information dividing step for dividing the document information of each facility-related information into a predetermined number of unit sentences from the beginning to the back of the document information;
Recognizes the number of times the keyword extracted in the keyword extraction step appears in each unit sentence, the position of the unit sentence in which the keyword appears, and the number of modifiers that depend on the keyword in each unit sentence And weighting that the degree of relevance of the extracted keyword to the corresponding facility ID is high with reference to at least one of the number of appearances and the position of the unit sentence in front and the number of modifiers A score value calculating step for calculating the score value for each unit sentence;
The keywords that appear in each unit sentence are compiled for each document information that includes the unit sentence. If there are keywords that appear in different unit sentences, the score values assigned to each unit sentence are added together. A facility-related information search method, comprising: a score value summation step that sets a score value of the keyword in document information.
前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたことを特徴とする請求項1記載の施設関連情報検索方法。   In the score assigning step, each keyword in which the score value is assigned to each document information in the score value adding step is collected in each facility ID, and if there is a keyword that appears redundantly in different document information, 2. The score value selecting step of selecting a score value that has the highest degree of relevance from the assigned score values and setting it as the score value of the keyword in the facility ID is provided. Facility related information search method. 文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、
前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、
前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与することを特徴とする請求項1記載の施設関連情報検索方法。
When the number of sentences constituting the document information is less than the number of divisions set in advance in the sentence information dividing step,
The sentence information dividing step treats document information from the beginning to the back as one unit sentence,
In the score value calculating step, a uniform score value that is lower in relevance than a case where the number of sentences constituting the document information is equal to or more than a predetermined number of divisions with respect to the keyword that appears in the unit sentence. The facility related information search method according to claim 1, wherein the facility related information search method is provided.
コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、
文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、
前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、
前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、
前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、
前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、
前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、
前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は前記施設種別が付与された前記施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられていることを特徴とする施設関連情報検索システム。
In a facility search system configured by a computer system, extracting a facility that matches a request input by a search user, and providing the facility and facility related information,
An information collection device that collects and organizes facility-related information including document information, a facility information database that stores each of the collected facility-related information, an input / output terminal operated by a search user, and the search user's An information search device that extracts the facility and the facility related information that are suitable for request input from the facility information database and sends them to the input / output terminal, and the facility that is referred to when the information search device searches the facility information database. A facility information index and a dictionary database storing information related to
In the information collection device, information collection means for collecting the facility-related information including the document information, and a keyword expressing the contents and characteristics of the facility are extracted from the document information included in the collected facility-related information. To each of the facility-related information, a facility ID for identifying a facility that is a subject of the facility-related information and a facility type indicating a classification of the facility, and for each of the keywords And an information organizing means for performing processing for associating the facility ID of the facility corresponding to the document information,
The facility information database includes individual facility information including at least the document information, the individual facility IDs assigned to the document information, and the facility type among the information organized by the information organizing unit. Stored in correspondence,
Of the information organized by the information organizing means, the facility information index stores the keyword and the facility ID associated with the keyword in association with each other.
In the dictionary database, feature words expressing the contents and features of the facility are preset, and the information organizing unit defines a dictionary in which the facility ID related to each feature word is defined, or is associated with each feature word. A dictionary in which the facility type is defined, or both are provided,
The input / output terminal comprises input means for inputting a request sentence in free text format, and output means for outputting or displaying a search result sent from the information search device,
The information retrieval device refers to a word division unit that obtains word information by dividing and analyzing the request sentence sent from the input / output terminal, matches the word information with reference to a dictionary of the dictionary database and the facility information index The facility ID or the facility type defined as related to the feature word or keyword is acquired, and the facility information to which the acquired facility ID or the facility type is assigned is acquired as the facility information. A facility-related information search system, comprising: search means for extracting from an information database and sending it to the input / output terminal.
前記施設情報インデックスに格納された前記キーワードには、前記情報整理手段によって、対応する施設IDごとに関連度を示すスコア値が付与され、
前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示することを特徴とする請求項4記載の施設関連情報検索システム。
The keyword stored in the facility information index is given a score value indicating the degree of association for each corresponding facility ID by the information organizing means,
The search means, for the facility information extracted from the facility information database, calculates the degree of match indicating the suitability for the request sentence by counting the score values for each facility ID,
5. The facility related information search system according to claim 4, wherein the output means preferentially outputs or displays the facility information to which the facility ID having a high degree of match is assigned.
前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されることを特徴とする請求項5記載の施設関連情報検索システム。   The score value given to the keyword by the information organizing means includes the number of times the keyword appears in each document information, the appearance position in the document information, and the keyword in the document information. The keyword is determined based on the number of modifiers depending on the number of occurrences, the number of appearances is large, the position of the sentence relatively appears at the front position of the sentence information, and the keyword having a large number of modifiers has a higher degree of association The facility related information search system according to claim 5, wherein the score value weighted as follows is assigned. 前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、
前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
The dictionary database is a verb facility type dictionary in which feature words made up of verbs representing actions of users of the facilities are preset, and the facility types related to each feature word are individually defined by the information organizing means. Prepared,
7. The facility-related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the verb facility type dictionary and acquires the corresponding facility type.
前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、
前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
The dictionary database includes a place name dictionary in which feature words including place names representing the addresses of the facilities and related areas are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. ,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the place name dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、
前記検索手段は、少なくとも前記外部知識語辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
The dictionary database is an external knowledge word dictionary in which feature words including nouns that the user is interested in regarding the facility are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. Prepared,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the external knowledge word dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、
前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。
In the dictionary database, feature words made up of modifiers expressing the user's evaluation of the facility are set in advance, and the facility ID related to each feature word is individually defined by the information organizing means. With a dictionary,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the previous external evaluation dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、
前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示することを特徴とする請求項5又は6記載の施設関連情報検索システム。

In the dictionary database, feature words composed of modifiers expressing the evaluation of users of the facility are set in advance, and the facility ID associated with the information processing unit is individually defined in each feature word, and And an external evaluation word dictionary to which an evaluation value indicating the degree of association with the facility ID is individually given by the information organizing means,
The search means refers to at least the inside of the external evaluation dictionary, acquires the corresponding facility ID, and obtains the score value and the evaluation value for each facility ID for the facility information extracted from the facility information database. Aggregate to calculate the degree of match that indicates the appropriateness of the request statement,
7. The facility related information search system according to claim 5, wherein the output means preferentially outputs or displays the facility related information corresponding to the facility ID having a high degree of match.

JP2008263039A 2008-10-09 2008-10-09 Facility related information search database formation method and facility related information search system Active JP5302614B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008263039A JP5302614B2 (en) 2008-10-09 2008-10-09 Facility related information search database formation method and facility related information search system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008263039A JP5302614B2 (en) 2008-10-09 2008-10-09 Facility related information search database formation method and facility related information search system

Publications (2)

Publication Number Publication Date
JP2010092357A true JP2010092357A (en) 2010-04-22
JP5302614B2 JP5302614B2 (en) 2013-10-02

Family

ID=42254989

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008263039A Active JP5302614B2 (en) 2008-10-09 2008-10-09 Facility related information search database formation method and facility related information search system

Country Status (1)

Country Link
JP (1) JP5302614B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013186766A (en) * 2012-03-09 2013-09-19 Fujitsu Ltd Information retrieval method, program and information retrieval device
JP5792871B1 (en) * 2014-05-23 2015-10-14 日本電信電話株式会社 Representative spot output method, representative spot output device, and representative spot output program
KR20160002944A (en) * 2013-04-17 2016-01-08 톰톰 네비게이션 비.브이. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
JP2016524736A (en) * 2013-04-17 2016-08-18 トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. Method, apparatus and computer software for facilitating search and display of locations associated with a digital map
US10281295B2 (en) 2013-04-17 2019-05-07 Tomtom Navigation B.V. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
JP2019204445A (en) * 2018-05-25 2019-11-28 シャープ株式会社 Information processing apparatus, information processing method, and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281565A (en) * 1991-03-08 1992-10-07 Toshiba Corp Document retrieving device
JPH11328223A (en) * 1998-05-19 1999-11-30 Toshio Yamazaki Information collection and retrieval device
JP2002334107A (en) * 2001-03-07 2002-11-22 Nippon Telegr & Teleph Corp <Ntt> Device, method for searching information, information search program and recording medium in which the same program is stored
JP2006301718A (en) * 2005-04-15 2006-11-02 Pioneer Electronic Corp Information processor, information processing system, information processing method, information processing program, and recording medium recorded with its program
JP2006331117A (en) * 2005-05-26 2006-12-07 Ricoh Co Ltd Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program
JP2007293567A (en) * 2006-04-25 2007-11-08 Matsushita Electric Ind Co Ltd Retrieval device and retrieval program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281565A (en) * 1991-03-08 1992-10-07 Toshiba Corp Document retrieving device
JPH11328223A (en) * 1998-05-19 1999-11-30 Toshio Yamazaki Information collection and retrieval device
JP2002334107A (en) * 2001-03-07 2002-11-22 Nippon Telegr & Teleph Corp <Ntt> Device, method for searching information, information search program and recording medium in which the same program is stored
JP2006301718A (en) * 2005-04-15 2006-11-02 Pioneer Electronic Corp Information processor, information processing system, information processing method, information processing program, and recording medium recorded with its program
JP2006331117A (en) * 2005-05-26 2006-12-07 Ricoh Co Ltd Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program
JP2007293567A (en) * 2006-04-25 2007-11-08 Matsushita Electric Ind Co Ltd Retrieval device and retrieval program

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013186766A (en) * 2012-03-09 2013-09-19 Fujitsu Ltd Information retrieval method, program and information retrieval device
KR20160002944A (en) * 2013-04-17 2016-01-08 톰톰 네비게이션 비.브이. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
JP2016522922A (en) * 2013-04-17 2016-08-04 トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. Method, apparatus and computer software for facilitating search and display of locations associated with a digital map
JP2016524736A (en) * 2013-04-17 2016-08-18 トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. Method, apparatus and computer software for facilitating search and display of locations associated with a digital map
US10281295B2 (en) 2013-04-17 2019-05-07 Tomtom Navigation B.V. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
US10733219B2 (en) 2013-04-17 2020-08-04 Tomtom Navigation B.V. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
KR102193465B1 (en) * 2013-04-17 2020-12-22 톰톰 네비게이션 비.브이. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
US11720574B2 (en) 2013-04-17 2023-08-08 Tomtom Navigation B.V. Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
JP5792871B1 (en) * 2014-05-23 2015-10-14 日本電信電話株式会社 Representative spot output method, representative spot output device, and representative spot output program
JP2019204445A (en) * 2018-05-25 2019-11-28 シャープ株式会社 Information processing apparatus, information processing method, and program
JP7091146B2 (en) 2018-05-25 2022-06-27 シャープ株式会社 Information processing equipment, information processing methods, and programs

Also Published As

Publication number Publication date
JP5302614B2 (en) 2013-10-02

Similar Documents

Publication Publication Date Title
CN101495955B (en) Mobile device retrieval and navigation
JP5281405B2 (en) Selecting high-quality reviews for display
US10552467B2 (en) System and method for language sensitive contextual searching
US20160147866A1 (en) Processing user profiles
US20150379018A1 (en) Computer-generated sentiment-based knowledge base
JP4368336B2 (en) Category setting support method and apparatus
JP5083669B2 (en) Information extraction system, information extraction method, information extraction program, and information service system
JP5379138B2 (en) Creating an area dictionary
US8332208B2 (en) Information processing apparatus, information processing method, and program
CN104933081A (en) Search suggestion providing method and apparatus
WO2008022581A1 (en) Method and device for obtaining the new words and input method system
CN107408107A (en) Text prediction is integrated
JP5302614B2 (en) Facility related information search database formation method and facility related information search system
CN103870000A (en) Method and device for sorting candidate items generated by input method
WO2014040521A1 (en) Searching method, system and storage medium
US20120317141A1 (en) System and method for ordering of semantic sub-keys
US20090144222A1 (en) Chart generator for searching research data
JP5345987B2 (en) Document search apparatus, document search method, and document search program
US20120323904A1 (en) Automatic generation of a search query
JP4883644B2 (en) RECOMMENDATION DEVICE, RECOMMENDATION SYSTEM, RECOMMENDATION DEVICE CONTROL METHOD, AND RECOMMENDATION SYSTEM CONTROL METHOD
US20090144318A1 (en) System for searching research data
US20090144241A1 (en) Search term parser for searching research data
CN111737607A (en) Data processing method, data processing device, electronic equipment and storage medium
US20090144265A1 (en) Search engine for searching research data
US20090144242A1 (en) Indexer for searching research data

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20110809

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130621

R150 Certificate of patent or registration of utility model

Ref document number: 5302614

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250