JP2010092357A - Facility-related information retrieval method and facility-related information retrieval system - Google Patents
Facility-related information retrieval method and facility-related information retrieval system Download PDFInfo
- Publication number
- JP2010092357A JP2010092357A JP2008263039A JP2008263039A JP2010092357A JP 2010092357 A JP2010092357 A JP 2010092357A JP 2008263039 A JP2008263039 A JP 2008263039A JP 2008263039 A JP2008263039 A JP 2008263039A JP 2010092357 A JP2010092357 A JP 2010092357A
- Authority
- JP
- Japan
- Prior art keywords
- facility
- information
- search
- keyword
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 239000000284 extract Substances 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 43
- 239000003607 modifier Substances 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 6
- 230000010365 information processing Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000002452 interceptive effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Abstract
Description
本発明は、インターネット上のWebサイトや市販の雑誌等に公開されている各種の施設関連情報を収集する施設関連情報検索方法、及び検索ユーザのリクエスト入力に適合した施設関連情報を提供する施設関連情報検索システムに関する。 The present invention relates to a facility-related information search method for collecting various facility-related information published in a website on the Internet, a commercial magazine, and the like, and facility-related information that provides facility-related information suitable for a search user's request input The present invention relates to an information retrieval system.
近年、買い物、食事、観光旅行等する機会に、例えばパソコンからインターネット等のネットワークを通じて所定のデータベースにアクセスし、目的に合った施設(例えば、デパート、レストラン、遊園地、景勝地など)を検索することは一般的に行われている。この種の情報検索においては、検索ユーザの要求に適合した施設情報を的確に抽出することが求められ、それに応えるべく様々な形態の検索装置又は検索方法が提案されている。 In recent years, on occasions such as shopping, eating, sightseeing, etc., a predetermined database is accessed from a personal computer through a network such as the Internet, and facilities (for example, department stores, restaurants, amusement parks, scenic spots, etc.) suitable for the purpose are searched. Things are generally done. In this type of information search, it is required to accurately extract facility information that meets the search user's request, and various forms of search devices or search methods have been proposed in response to this requirement.
例えば、特許文献1に開示されているように、情報提供者端末から提供される施設識別情報と、施設や商品等及びそれらの価値よりなる内容情報とを個別情報としてデータベースに記憶させる記憶手段と、個別情報のうちの内容情報を、予め設定された基本分類に関連付けて識別コードを発生する関連付け手段と、消費者端末から入力されるキーワードによりデータベースを検索し、それに適合する識別コードを有する個別情報を読み出して消費者端末の表示装置に供給する手段とを備えた情報収集検索装置がある。これは、商品コード、特性・価値コード、行動コード等の識別コードを体系的に定義し、収集した施設情報ごとに適合する識別コードを付与した特定フォーマットによるデータの一つのセットである個別データセットを整備し、コード体系に従って施設情報を検索するものである。また、消費者による検索は、消費者端末の画面を用いて、対話形式の下に進められる。
For example, as disclosed in
また、特許文献2に開示されているように、電話帳情報等の情報検索装置に係り、問合せ文を入力し、その入力情報に合致した情報を出力する入出力装置と、被検索情報として少なくとも名義、職業名、商品名を含む情報が格納されたデータベースと、データベース中の所定の単語と各単語の属性を対の形で記憶した単語辞書記憶装置と、問合せ文に現れる職業に関する文言を商品名と動詞に変換する変換テーブルが定義付けられた知識ベース記憶装置と、制御装置とを備え、問合せ文中の曖昧な職業情報から職業分類名を推定してデータベース検索を行うことができる情報検索装置がある。
しかし、特許文献1の情報収集検索装置は、施設情報は所定のコード体系によって識別され、検索ユーザ(消費者)が入力するキーワードに対応した識別コードを有する施設情報を抽出するものであり、施設情報が検索ユーザの要求に対してどの程度適合しているかを評価する機能を備えていない。従って、検索条件に適合するとして抽出された施設情報が多数あると、施設情報の適合度の高い低いに関係なく羅列して出力されるため、検索ユーザにとっては、その中から要求に近い施設情報を見つけ出すのが面倒であった。
However, the information collection and retrieval apparatus of
また、検索ユーザは、施設等を調査するときに「有名な」とか「人気の」といった施設利用者等の評価や口コミ等の評判情報を重視する場合が多い。しかし、特許文献1の情報収集検索装置では、施設利用者の評価等について考慮されておらず、検索ユーザの要求に適合した施設情報を抽出できない場合があった。
In addition, when searching for facilities or the like, search users often place importance on evaluations of facility users such as “famous” or “popular” and reputation information such as word-of-mouth. However, the information collection / retrieval device of
さらに、特許文献1の情報収集検索装置は、検索は対話形式の下で行われるため、検索ユーザは事前に自己の要求を明確にしておく必要がある。従って、検索ユーザはいろいろな施設の情報を気楽に検索することができず、使い難い検索装置であった。
Furthermore, since the information collection / retrieval apparatus of
一方、特許文献2の情報検索装置においても、検索ユーザの要求に対する出力情報の適合度について評価する機能を備えておらず、特許文献1と同様に、多数の出力結果から要求に近い情報を見つけ出すのが面倒であった。
On the other hand, the information search apparatus of
また、検索ユーザが自由文形式の問合せ文を入力しても、特定の名詞(商品名)と動詞のみが検索条件として採り上げられ、それ以外の語句については考慮されてない。従って、例えば、この情報検索装置を娯楽・観光施設等を検索する用途に用いた場合、「有名な」や「人気の」といった形容詞や副詞等の抽象的な語句を含んだ問合せ文が入力されても、適合する施設情報を抽出することができないことがあった。 Even if the search user inputs a query sentence in free text format, only specific nouns (product names) and verbs are taken up as search conditions, and other words are not considered. Therefore, for example, when this information search device is used for searching for entertainment / tourism facilities, etc., an inquiry sentence including abstract phrases such as adjectives and adverbs such as “famous” and “popular” is inputted. However, it was not possible to extract suitable facility information.
この発明は、上記背景技術に鑑みて成されたもので、多くの施設関連情報を収集し、様々な観点の検索条件に基づく情報の選択を可能にする施設関連情報検索方法と、抽象的な語句を含んだ自由文形式による検索条件にも対応でき、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができる施設関連情報検索システムを提供することを目的とする。 The present invention has been made in view of the above-described background art, and collects a lot of facility-related information and makes it possible to select information based on search conditions from various viewpoints. It is an object of the present invention to provide a facility-related information search system that can cope with a search condition in a free text format including words and that can be output preferentially from facility information having a high degree of suitability for a search user's request.
この発明は、施設に関する情報を収集してデータベースを作成し、検索サーバにより検索可能にする施設関連情報検索方法において、文書情報を有した施設関連情報を収集する情報収集工程と、前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章に算出するスコア値算出工程と、各単位文章に出現したキーワードを、その単位文章を含む各文書情報に取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えた施設関連情報検索方法である。
The present invention relates to a facility-related information search method that collects information about a facility, creates a database, and makes a search possible by a search server, an information collecting step of collecting facility-related information having document information, and the information collecting step For each facility-related information collected in
前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたものである。 In the score assigning step, each keyword in which the score value is assigned to each document information in the score value adding step is collected in each facility ID, and if there is a keyword that appears redundantly in different document information, Among the assigned score values, a score value selecting step that selects the score value having the highest degree of relevance and sets the score value of the keyword in the facility ID is provided.
文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与するものである。 When the number of sentences constituting the document information is less than the number of divisions set in advance in the sentence information dividing step, the sentence information dividing step treats the document information from the beginning to the back as one unit sentence, and the score In the value calculation step, a uniform score value is assigned to the keyword appearing in the unit sentence, which is less relevant than when the number of sentences constituting the document information is equal to or greater than a preset number of divisions. Is.
またこの発明は、コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は施設種別が付与された施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられている施設関連情報検索システムである。 Further, the present invention is a facility search system that is configured by a computer system, extracts a facility suitable for a request input by a search user, and provides the facility and the facility related information, and collects facility related information including document information. An information collection device for organizing, a facility information database for storing each of the facility-related information collected and organized, an input / output terminal operated by a search user, the facility suitable for the search user's request input, and the facility-related An information search device that extracts information from the facility information database and sends the information to the input / output terminal, and a facility information index that stores information related to the facility that is referred to when the information search device searches the facility information database And the dictionary database, and the information collection device includes the document information. Information collecting means for collecting facility-related information, keyword extracting means for extracting a keyword expressing the contents and characteristics of the facility from the document information included in the collected facility-related information, and individual facility-related information. On the other hand, a facility ID for identifying a facility that is the subject of the facility-related information and a facility type indicating the classification of the facility are given, and the facility ID of the facility corresponding to the document information is assigned to each keyword. An information organizing unit for performing an association process, and the facility information database includes at least the document information and the individual facility IDs assigned to the document information among the information organized by the information organizing unit. And each facility information including the facility type is stored in association with each other, and the facility information index stores information organized by the information organizing means. Are stored in association with the keyword and the facility ID associated with the keyword, and in the dictionary database, feature words representing the contents and features of the facility are set in advance. A dictionary in which the facility ID associated with each feature word is defined, or a dictionary in which the facility type associated with each feature word is defined, or both. An input means for inputting a sentence; and an output means for outputting or displaying a search result sent from the information search apparatus, wherein the information search apparatus divides and analyzes the request sentence sent from the input / output terminal. Word dividing means for obtaining word information, a dictionary of the dictionary database and the facility information index with reference to a feature word or keyword that matches the word information Extract the facility ID or the facility type defined to be related to the feature word or keyword, and extract the facility information to which the acquired facility ID or facility type is assigned from the facility information database A facility-related information search system provided with search means for sending to the input / output terminal.
前記施設情報インデックスに格納された前記キーワードには、前記情報整理手段によって、対応する施設IDごとに関連度を示すスコア値が付与され、前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示するものである。 The keyword stored in the facility information index is given a score value indicating the degree of association for each corresponding facility ID by the information organizing unit, and the search unit extracts the facility information extracted from the facility information database. For each facility ID, the score value is aggregated to calculate the degree of match indicating the suitability for the request sentence, and the output means prioritizes the facility information to which the facility ID having a high match degree is assigned. Are output or displayed.
前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されるものである。 The score value given to the keyword by the information organizing means includes the number of times the keyword appears in each document information, the appearance position in the document information, and the keyword in the document information. The keyword is determined based on the number of modifiers depending on the number of occurrences, the number of appearances is large, the position of the sentence relatively appears at the front position of the sentence information, and the keyword having a large number of modifiers has a higher degree of association. The score value weighted as follows is given.
前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得するものである。 The dictionary database is a verb facility type dictionary in which feature words made up of verbs representing actions of users of the facilities are preset, and the facility types related to each feature word are individually defined by the information organizing means. The search means refers to at least the verb facility type dictionary and acquires the corresponding facility type.
前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得するものである。 The dictionary database includes a place name dictionary in which feature words including place names representing the addresses of the facilities and related areas are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. The search means refers to at least the place name dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、前記検索手段は、少なくとも前記外部知識語辞書を参照し、該当する前記施設IDを取得するものである。 The dictionary database is an external knowledge word dictionary in which feature words made up of nouns that the user is interested in regarding the facility are preset, and the facility ID related to each feature word is individually defined by the information organizing means. The search means refers to at least the external knowledge word dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得するものである。 In the dictionary database, feature words made up of modifiers expressing the user's evaluation of the facility are set in advance, and the facility ID related to each feature word is individually defined by the information organizing means. A dictionary is provided, and the search means refers to at least the previous external evaluation dictionary and acquires the corresponding facility ID.
前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示するものである。 In the dictionary database, feature words composed of modifiers expressing the evaluation of users of the facility are set in advance, and the facility ID associated with the information processing unit is individually defined in each feature word, and And an external evaluation word dictionary to which an evaluation value indicating the degree of association with the facility ID is individually given by the information organizing unit, and the search unit refers to at least the inside of the external evaluation dictionary, and the corresponding facility ID For the facility information extracted from the facility information database, the score value and the evaluation value are aggregated for each facility ID, and a matching degree indicating suitability for the request sentence is calculated, and the output means Is to output or display the facility related information corresponding to the facility ID having a high degree of match with priority.
この発明の施設関連情報検索方法は、Webサイト等に公開された膨大な量の施設関連情報を収集し、少なくとも施設ID、キーワード、スコア値からなるインデックス情報を付与して検索サーバ内に格納することによって、様々な観点の検索条件に基づき情報選択をすることができるよう整理格納することができる。 The facility-related information search method according to the present invention collects a huge amount of facility-related information disclosed on a website and the like, assigns at least index information including a facility ID, a keyword, and a score value and stores the index information in a search server. Thus, information can be organized and stored so that information can be selected based on search conditions from various viewpoints.
また、この発明の施設情報検索システムは、上記の施設関連情報検索方法等によって施設関連情報を収集及び整理格納する情報収集装置、施設情報データベース、施設情報インデックスを備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベースを備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設情報を的確に抽出することができる。 The facility information retrieval system of the present invention further comprises an information collection device that collects and organizes facility-related information by the facility-related information retrieval method described above, a facility information database, a facility information index, and further includes a place name / verb / modifier. Since a dictionary database in which feature words such as words and facilities are associated with each other is provided, it is possible to interpret a search user's request from various viewpoints and accurately extract facility information that meets the request.
さらに、情報検索装置は、抽象的な語句を含んだ自由文形式による検索条件にも対応できるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができるので、検索ユーザにとって非常に利便性が高い。 Furthermore, since the information search apparatus can cope with a search condition in a free sentence format including an abstract word / phrase, the search user can easily perform a search without preparing in advance. In addition, the information search device weights each facility related information using an evaluation value indicating the evaluation of the facility user or the like, a score value indicating the degree of association between the facility and the keyword, and the degree of conformity to the request of the search user Since it is possible to preferentially output high facility information, it is very convenient for search users.
以下、本発明の施設関連情報検索システムの一実施形態について、図に基づいて説明する。施設関連情報検索システム10はコンピュータシステムにより構成され、図1に示すように、文書情報を含む施設関連情報を収集して整理する情報収集装置12と、収集整理された施設関連情報を格納する施設情報データベース14と、検索ユーザが操作する入出力端末16とを備えている。さらに、検索ユーザのリクエスト入力に該当する施設及び施設関連情報を施設情報データベース14から抽出して入出力端末16へ送る情報検索装置18と、情報検索装置18が施設情報データベース14を検索するときの検索効率を良くし、検索の的確性等を高める施設情報インデックス20及び辞書データベース22とを備えている。
Hereinafter, an embodiment of a facility-related information search system of the present invention will be described with reference to the drawings. The facility related information search system 10 is configured by a computer system, and, as shown in FIG. 1, an
情報収集装置12には、インターネット上のWebサイトや市販の雑誌等に公開された文書情報を含む施設関連情報を自動収集又はシステム管理者による手動入力が可能な情報収集手段12aが設けられている。また、収集した施設関連情報に含まれる文書情報を形態素解析等を用いて単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段12bが設けられている。さらに、個々の施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与するとともに、各キーワードに対して、分割前の個々の文書情報に付与された施設IDを対応付ける処理を行う情報整理手段12cが設けられている。
The
施設情報データベース14には、情報整理手段12cで整理された情報のうち、少なくとも、文書情報とそれに対応した施設ID及び施設種別との組み合わせで成る個々の施設情報が格納されている。
The
施設情報インデックス20には、情報整理手段12cで整理された情報のうち、個々のキーワードとそのキーワードに対応付けられた施設IDに、そのキーワードと施設IDとの関連度を示すスコア値が付与されて格納されている。スコア値は、そのキーワードが個々の文書情報の中に出現する回数と、出現位置と、そのキーワードに係り受けする修飾語の数とに基づいて決定される。そして、出現回数が多く、文書の先頭から後方寄りの位置に出現し、修飾語数が多いキーワードほど関連度が高いとするスコア値が付与される。
The
なお、情報収集装置12、施設情報データベース14及び施設情報インデックス20によって、本発明の施設関連情報検索方法の一実施形態に該当する動作が行われる。詳細については、後の施設情報検索システム10の動作説明の中で述べる。
In addition, the operation | movement applicable to one Embodiment of the facility relevant-information search method of this invention is performed by the
辞書データベース22は、図8に示すように、動詞施設種別辞書22a、地名辞書22b、外部知識語辞書22c及び外部評価語辞書22dを備えている。動詞施設種別辞書22aは、施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設種別が定義されている。地名辞書22bは、施設の住所や関係する地域等を現す名詞である地名からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部知識語辞書22cは、施設に関し利用者が興味を示す名詞からなる特徴語が予め設定され、情報整理手段12cによって各特徴語に関連する施設IDが個々に定義されている。外部評価語辞書22dは、施設の利用者の評価を表現する形容詞または形容動詞である修飾語からなる特徴語が予め設定され、各特徴語には、前記情報整理手段12cによって関連する施設IDが個々に定義され、且つ、前記情報処理手段12cによって施設IDごと関連度を示す評価値が個々に付与されている。
As shown in FIG. 8, the
入出力端末16は、検索ユーザによって自由文形式のリクエスト文が入力される入力手段16aと、情報検索装置18から送られた検索結果を検索ユーザに対して出力又は表示する出力手段16bとを備えている。
The input /
情報検索装置18には、入出力端末16に入力されたリクエスト文を形態素解析等の解析方法を用いて単語情報に分割する単語分割手段18aと、辞書データベース22が有する各辞書と施設情報インデックス20を参照し、その単語情報と一致する特徴語又はキーワードを抽出し、該当する特徴語又はキーワードに関連すると定義された施設ID又は施設種別を取得し、取得した施設ID及び施設種別が付与された施設情報を施設情報データベース14の中から抽出し、出力手段16bへ送る検索手段18bとが設けられている。
The
なお、施設情報検索システム10は、入出力端末16を除く各装置によって構成される検索サーバに、インターネット等の通信回線を通じて入出力端末16が接続され、入出力端末16の操作によって、不特定多数の検索ユーザが検索サーバにアクセスすることができるよう構成されている。
The facility information search system 10 includes an input /
次に、施設関連情報検索システム10の動作について説明する。まず、情報収集装置12、施設情報データベース14及び施設情報インデックス20が行う、本発明の一実施形態の施設関連情報検索方法24に該当する動作を、図2の処理工程図に基づいて説明する。
Next, the operation of the facility related information search system 10 will be described. First, operations corresponding to the facility-related
まず、情報収集工程S1で、インターネット上のWebサイトや市販の雑誌等に公開された施設関連情報であって、少なくとも文書情報を含み、その他画像や図表等が付加された施設関連情報を収集し、コンピュータ上に取り込む。次に、施設ID等付与工程S2で、収集した個々の施設関連情報に、その情報の主体である施設を識別する施設IDと、施設の分類を示す施設種別を付与する。そして、施設情報格納工程S3で、施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を、施設情報データベース14に格納する。
First, in the information collection step S1, facility-related information published on a website on the Internet, a commercial magazine, etc., which includes at least document information, and other facility-related information to which images, diagrams, etc. are added is collected. , Capture on the computer. Next, in the facility ID etc. granting step S2, a facility ID for identifying the facility that is the subject of the information and a facility type indicating the facility classification are assigned to the collected individual facility related information. Then, in the facility information storage step S3, among the facility related information, at least the facility related information including the facility information in which the individual document information, the facility ID, and the facility type are associated is stored in the
例えば、図3に示すように、イギリスの有名な教会であるウェストミンスター寺院に関する施設関連情報が2件あれば、1件目については、その文書情報「英国で最も美しい・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報1として施設情報データベース14に格納される。同様に、2件目については、その文書情報「中世のゴシック建築で・・・」と文施設ID「1」と施設種別「寺社」とが対応付けられ、施設情報2として施設情報データベース14に格納される。
For example, as shown in FIG. 3, if there are two pieces of facility-related information related to Westminster Abbey, a famous British church, the document information “the most beautiful in the UK…” The ID “1” is associated with the facility type “Temple” and stored in the
一方、情報収集工程S1の後、施設ID等付与工程S2の処理とともに、キーワード抽出工程S4において、施設関連情報に含まれる文書情報を形態素解析等によって単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出する。そして、スコア付与工程S5で、抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与する。 On the other hand, after the information collecting step S1, the document information included in the facility related information is divided into words by morphological analysis or the like in the keyword extracting step S4 along with the processing of the facility ID etc. granting step S2, and Extract keywords that express content and features. Then, in the score assignment step S5, a score value indicating the degree of association is assigned to each extracted facility ID for the extracted keyword.
以下、スコア付与工程S5について、図4〜図6に基づいて詳しく説明する。スコア付与工程S5は、文章情報分割工程S51と、スコア値算出工程S52と、スコア値合算工程S53と、スコア値選択工程S54とで成る。まず、文書情報分割工程S51では、個々の施設関連情報が有する1または複数の文書から成る情報を、一つの文章を最小単位として、文書情報の先頭から後方までを単位文章に分割する。例えば、図4に示す例の場合、ウェストミンスター寺院に関する1件目の施設関連情報に含まれる文書情報1は、3つの文章で構成されている。ここでは、説明の便宜のため、文書情報を3つの単位文章に分割することとし、文書情報1は、第1,2,3文が個々に1つの単位文章を構成するものとする。
Hereinafter, the score provision process S5 will be described in detail with reference to FIGS. The score providing step S5 includes a sentence information dividing step S51, a score value calculating step S52, a score value adding step S53, and a score value selecting step S54. First, in the document information dividing step S51, information consisting of one or a plurality of documents included in each facility related information is divided into unit sentences from the beginning to the back of the document information with one sentence as a minimum unit. For example, in the case of the example shown in FIG. 4, the
なお、この文書情報1は、上記キーワード抽出工程S4によって、既にキーワードが抽出されている。図4に示す例では、第1文にあっては、「お勧め」「世界遺産」「ウェストミンスター寺院」がキーワードとして抽出され、助詞等である「の」「は」「である」は重要な語句ではないと判断して抽出されない。同様に、第2文にあっては、「ウェストミンスター寺院」「中世」「美しい」「建築物」がキーワードとして抽出されている。「ウェストミンスター寺院」は、第1文と重複するが、第2文においてもキーワードとして取り扱う。第3文についても同様である。
In this
次に、スコア値算出工程S52で、キーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、キーワードと施設IDとの関連度を算出する。一般に、施設を紹介する文書情報にあっては、文書長が短いものが多く、重要な語が繰り返し使用されるという傾向が当てはまらない場合がある。そこで、キーワードの出現回数以外の要素にも着眼するものである。 Next, in the score value calculation step S52, the number of times the keyword appears in each unit sentence, the position of the unit sentence in which the keyword appears, and the number of modifiers that depend on the keyword in each unit sentence And the degree of association between the keyword and the facility ID is calculated. In general, in document information that introduces facilities, there are many cases in which the document length is short, and the tendency that important words are used repeatedly may not apply. Therefore, attention is also paid to elements other than the number of occurrences of the keyword.
まず、出現回数が多いキーワードほど重要な情報であり、関連度が高いと判断する。ただし、図4に示す例の場合、各キーワードが各文章群内で出現する回数は各々1回ずつと同じのため、ここでは、出現回数Aは全て「1」という値が付与される。 First, it is determined that a keyword having a higher number of appearances is more important information and has a higher degree of relevance. However, in the example shown in FIG. 4, since the number of times each keyword appears in each sentence group is the same as each time, the value “1” is assigned to all the appearance times A here.
次に、キーワードが出現した文章群が、文書情報の先頭に近いときほど重要度高く、後方寄りのときほど重要度が低いと判断する。これは、検索ユーザの興味を惹く内容や第三者の感想等の重要な情報は先頭寄りの単位文章に記載される傾向があるという経験則に基づいている。例えば、図4に示す例では、キーワードの出現位置による重み付けBは、先頭に近い第1文には「3」、中盤の第2文には「2」、後方の第3文には「1」という値が付与される。 Next, it is determined that the importance of the sentence group in which the keyword appears is closer to the head of the document information, and the importance is lower as it is closer to the back. This is based on an empirical rule that important information such as content that attracts the search user's interest and impressions of third parties tend to be written in unit sentences near the top. For example, in the example shown in FIG. 4, the weight B based on the keyword appearance position is “3” for the first sentence near the top, “2” for the second sentence in the middle, and “1” for the third sentence behind. "Is given.
さらに、キーワードに係り受けする修飾語の数が多いほど重要度が高いと判断する。例えば、図4に示す例の場合、第1文の「お勧め」というキーワードには修飾語が係っていないので、修飾語の数Cには「0」が、「ウェストミンスター寺院」というキーワードに係る修飾語は「お勧め」と「世界遺産」の2つなので、修飾語の数Cには「2」が各々付与される。その他のキーワードについても、同じ要領で修飾語の数Cが付与される。 Further, it is determined that the importance is higher as the number of modifiers depending on the keyword is larger. For example, in the case of the example shown in FIG. 4, since the keyword “recommended” in the first sentence is not related to the modifier, “0” is used for the number C of modifiers and the keyword “Westminster Abbey”. Since there are two modifiers “recommended” and “world heritage”, “2” is assigned to the number C of modifiers. For other keywords, the number C of modifiers is given in the same manner.
そして、出現回数Aと重み付けBを積算し、さらに修飾語の数Cを加算することによって、単位文章ごとのキーワードのスコア値である小計(A×B+C)を算出する。 Then, by adding up the number of appearances A and the weight B, and further adding the number C of modifiers, a subtotal (A × B + C) that is a keyword score value for each unit sentence is calculated.
次に、スコア値合算工程S53で、各単位文章に出現したキーワードを、各文書情報の単位で取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算し、そのキーワードのスコア値とする。例えば、図4に示す例の場合、「ウェストミンスター寺院」というキーワードは、第1,2,3文に重複して出現し、各々「5」「5」「3」という小計(A×B+C)が算出されている。従って、文章情報1による「ウェストミンスター寺院」のスコア値D(1)は、それらを合算した「13」と決定する。なお、「ウェストミンスター寺院」以外のキーワードは重複していないので、スコア値を合算することなく、単位文章ごとに算出された小計(A×B+C)の値を、そのまま文章情報1によるスコア値D(1)と決定する。
Next, in the score value summarizing step S53, the keywords appearing in each unit sentence are collected in units of each document information, and if there are keywords that appear redundantly in different unit sentences, the score value assigned to each unit sentence is given. Are combined to obtain the score value of the keyword. For example, in the example shown in FIG. 4, the keyword “Westminster Abbey” appears in duplicate in the first, second, and third sentences, and subtotals (A × B + C) of “5”, “5”, and “3”, respectively. Is calculated. Therefore, the score value D (1) of “Westminster Abbey” based on the
また、スコア付与工程S5の対象がウェストミンスター寺院に関する2件目の施設関連情報であって、図5に示すように、その文書情報2が1つの文章で構成されている場合の取り扱いについて説明する。ここでは文書情報の重み付けの分割数は3に設定してあるが、一つの文章を最小単位とするため、文書情報2を分割することができない。そこで、スコア値算出工程S52では、文書情報2全体を1つの単位文章として取り扱う。
Further, the handling in the case where the object of the score giving step S5 is the second facility related information related to Westminster Abbey and the
また、文章情報2の場合、各キーワードの出現回数Aは、文書情報1の場合と同様に、実際の出現回数である「1」が付与される。しかし、キーワードの出現位置による重み付けBは、一律「0.9」が付与される。文章情報の長さが短い文書情報は質の悪い情報であることが多いという経験則に基づき、文章の長さが長い文書情報よりも重要度が低いと判断するものである。さらに、修飾語の数Cは、スコア値に反映させない。そして、各キーワードのスコア値である小計(A×B)が算出される。なお、次のスコア値合算工程S53では、文章情報2の文章群の数が1つであるため、各キーワードについて算出された小計(A×B)の値を、そのまま文章情報2によるスコア値D(2)と決定する。
In the case of the
次に、スコア値選択工程S54で、文書情報ごとにスコア値が決定された各キーワードを、各施設IDごとに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択してそのキーワードのスコア値とする。例えば、図6に示す例の場合、文書情報1,2は、共にウェストミンスター寺院を示す施設ID「1」が付与されている。そして、文書情報1,2において、キーワード「ウェストミンスター寺院」と「建築物」が各々重複している。重複する場合は、文書情報1によるスコア値D(1)と文書情報2によるスコア値D(2)を比較し、関連度が高い方のスコア値を選択して施設ID「1」のスコア値に決定する。また、重複しないキーワードについては、スコア値D(1),D(2)を施設ID「1」のスコア値と決定する。
Next, in the score value selection step S54, the keywords whose score values are determined for each document information are collected for each facility ID, and if there are keywords that appear redundantly in different document information, the keywords are assigned to each document information. Among the score values, the score value having the highest degree of relevance is selected and set as the score value of the keyword. For example, in the case of the example shown in FIG. 6, the
そして、上記スコア付与工程S5の後、インデックス情報格納工程S6で、キーワード、施設ID及びスコア値からなるインデックス情報を、データベースである施設情報インデックス20に格納する。その結果、施設情報インデックス20には、例えば図7に示すように、全ての施設IDに係るインデックス情報が格納される。
Then, after the score assigning step S5, in the index information storing step S6, the index information including the keyword, the facility ID, and the score value is stored in the
以上説明したように、情報収集装置12、施設情報データベース14及び施設情報インデックス20は、情報収集工程S1、施設ID等付与工程S2、施設情報格納工程S3、キーワード抽出工程S4、スコア値付与工程S5及びインデックス情報格納工程S6からなる施設関連情報検索方法24に従って動作する。そして、施設関連情報検索方法24によれば、多くの施設関連情報を、様々な観点の検索条件に該当する情報選択を行うことができるように整理格納される。また、後述する施設関連情報検索システム10のように、検索ユーザの要求に適合した施設情報を的確に抽出することができる検索システムを容易に構築することができ、さらに、スコア値を利用すれば、関連度の高い施設関連情報から順番に提供することも可能になる。
As described above, the
次に、情報検索装置18の検索効率を良くし検索の的確性等を高めるための辞書データベース22を整備する動作について、図2の処理工程図に戻って説明する。工程S7では、施設ID等付与工程S2の後、辞書データベース22の各辞書に設定された特徴語ごとに関連する施設を定義し、関連する施設に該当する施設ID又は施設種別を各特徴語に対応付けて格納する。
Next, the operation of preparing the
辞書データベース22の動詞施設種別辞書22aは、「観る」「遊ぶ」のように、施設の利用者の動作を表現する動詞からなる特徴語があらかじめ設定されている(図8(a))。一般に、施設の管理者等が作成した施設紹介文には、施設の利用者を動作の主体とする動詞があまり使用されない。一方、検索ユーザが入力するリクエスト文は、施設の利用者の動作や行動を表す動詞を使用されることが多い。従って、検索ユーザが入力した動詞を用いて文字列一致による検索を行っても、必ずしも検索ユーザが目的とする施設関連情報を抽出することができないときある。そこで、利用者の動作を表現する動詞からなる特徴語を設定し、それに関連する施設種別を定義した動詞施設種別辞書22aを設けることによって、上記検索漏れ等が生じないようにすることができる。
In the verb facility type dictionary 22a of the
具体的には、施設ID等付与工程S2で、新規な施設関連情報に対して施設種別が付与され、その施設種別が新規である場合、工程S7で、動詞施設種別辞書22aに設定されている特徴語(動詞)の中のいずれかに、その新規の施設種別が対応する旨を定義する動作を行う。また、既存の特徴語(動詞)の中に適切なものがないときは、新たな特徴語を設定し、その新規の施設種別に対応する旨を定義する動作を行ってもよい。例えば、「観る」は「美術館」「博物館」等に、「遊ぶ」は「遊園地」等に対応する施設種別とする。 Specifically, when the facility type is assigned to the new facility-related information in the facility ID etc. assigning step S2, and the facility type is new, it is set in the verb facility type dictionary 22a in step S7. An operation is performed to define that the new facility type corresponds to any of the feature words (verbs). In addition, when there is no appropriate feature word (verb), a new feature word may be set and an operation may be performed to define that it corresponds to the new facility type. For example, “watch” is a facility type corresponding to “art museum”, “museum”, etc., and “play” is a facility type corresponding to “amusement park”.
辞書データベース22の地名辞書22bは、「ロンドン」「△△府××市」のように、施設の住所や関係する地域等を現す名詞である地名からなる特徴語があらかじめ設定されている(図8(b))。一般に、施設紹介文には、施設の住所等が記載されていない場合が少なくない。従って、例えば、検索ユーザがイタリアに在る施設を検索する目的で「イタリア」の語句を入力して文字列一致による検索を行っても、イタリアに住所を有する施設の情報を抽出することができず、目的に合致しない日本のイタリア料理店が多数抽出されることがある。そこで、施設の住所や関係する地域などを現す地名からなる特徴語を設定し、それに関連する施設IDを定義する地名辞書22bを設けることによって、上記検索漏れが生じないようにすることができる。
In the place name dictionary 22b of the
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、地名辞書22bに設定されている特徴語(地名)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作をする。また、既存の特徴語(地名)の中に適切なものがないときは、新たに特徴語(地名)を設定し、その新規の施設IDが対応する旨を定義する動作を行ってもよい。 Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the place name dictionary 22b in step S7. An operation is performed to define that the new facility ID corresponds to any one of the feature words (place names). In addition, when there is no appropriate feature word (place name), a new feature word (place name) may be set, and an operation of defining that the new facility ID corresponds may be performed.
辞書データベース22の外部知識語辞書22cは、「世界遺産」「戯曲作家」「シェークスピア」のように、施設に関して利用者が興味を示す名詞からなる特徴語があらかじめ設定されている(図8(c))。一般に、施設の紹介文には、シェークスピアに縁のある施設である旨の記載があっても、シェークスピアが戯曲作家である旨が記載されていない場合がある。すると、検索ユーザが入力した「戯曲作家」用いた文字列一致による検索が行われても、シェークスピアに縁のある施設の情報を抽出できないという問題が生じる。そこで、利用者が興味を示す名詞からなる特徴語を設定し、その特徴語に関連する施設IDを定義する外部知識語辞書22cを設けることによって、上記検索漏れが生じないようにすることができる。
In the external knowledge word dictionary 22c of the
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部知識語辞書22cに設定されている特徴語(名詞)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(名詞)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院の施設ID「1」は、「世界遺産」「史跡」等に関連する旨が定義される。 Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the external knowledge word dictionary 22c in step S7. An operation is performed to define that the new facility ID corresponds to any of the feature words (nouns). In addition, when there is no appropriate feature word (noun) in the existing feature word, a new feature word may be set and an operation for defining that the new facility type corresponds may be performed. For example, the facility ID “1” of Westminster Abbey is defined to be related to “World Heritage”, “Historic Site”, and the like.
辞書データベース22の外部評価語辞書22dは、「有名な」「楽しい」のように、施設の利用者の評価を表現する修飾語からなる特徴語があらかじめ設定されている(図8(d))。なお、この特徴語は形容詞や形容動詞等が該当する。一般に、施設の管理者等が作成した施設の紹介文には、施設の利用者の感想や評価、口コミで広がった評判を表す修飾語はほとんど使用されない。特に、悪い評判は皆無に等しい。従って、これらを適切に検索するには、各施設の知名度や、人気度に関する知識を検索システムに与える必要がある。そこで、利用者の評価等を表現する修飾語からなる特徴語を設定し、それに関連する施設IDを定義する外部評価辞書22dを設けることによって、適切な検索を行うことを可能にする。さらに、ここでは、特徴語(修飾語)と施設IDとの関連度を示す評価値も同時に付与する。
In the external evaluation word dictionary 22d of the
具体的には、施設ID等付与工程S2で新規の施設関連情報に対して施設IDが付与されると、その施設IDが新規である場合に、工程S7で、外部評価語辞書22dに設定されている特徴語(修飾語)の中のいずれかに、その新規の施設IDが対応する旨を定義する動作を行う。また、既存の特徴語(修飾語)の中に適切なものがないときは、新たに特徴語を設定し、その新規の施設種別が対応する旨を定義する動作を行ってもよい。例えば、ウェストミンスター寺院を現す施設ID「1」は、修飾語「有名な」に関連し、その関連度は「5」と定義される。一方、○○動物園を現す施設ID「2」も修飾語「有名な」に関連するが、ウェストミンスター寺院ほど有名ではないので、関連度は「2」と定義されている。このように、評価値の定義方法は任意であり、例えば、文書情報を所定の方法で解析して知名度や人気度を自動的に算出したり、施設関連情報検索システム10の管理者等の独自の調査に基づいて決定し、手動で登録する方法等がある。 Specifically, when a facility ID is assigned to new facility-related information in the facility ID etc. granting step S2, if the facility ID is new, it is set in the external evaluation word dictionary 22d in step S7. An operation is performed to define that the new facility ID corresponds to one of the feature words (modifiers). In addition, when there is no appropriate feature word (modifier), a new feature word may be set, and an operation may be performed to define that the new facility type corresponds. For example, the facility ID “1” representing Westminster Abbey is associated with the modifier “famous”, and the degree of association is defined as “5”. On the other hand, the facility ID “2” representing the OO zoo is also related to the modifier “famous”, but is not as famous as Westminster Abbey, so the degree of association is defined as “2”. As described above, the evaluation value can be defined by any method. For example, the document information is analyzed by a predetermined method to automatically calculate the degree of popularity and popularity, or the administrator of the facility-related information search system 10 or the like is unique. There is a method of making a decision based on the survey and manually registering.
なお、個々の施設IDに評価値を付与することによって、検索ユーザの要求に適合する施設関連情報を、関連度の高いものから順番に提供する動作が可能になる。この動作については、後で詳しく述べる。 In addition, by assigning an evaluation value to each facility ID, it is possible to perform an operation of providing facility-related information that meets the search user's request in descending order of relevance. This operation will be described in detail later.
次に、検索ユーザが入出力端末16を操作して、所望の施設関連情報を検索する動作について、図9のフローチャートに基づいて説明する。まず、工程S10で、検索ユーザが、入出力端末16の入力手段16aにリクエスト文を入力する。ここでは、例えば「ロンドンで有名な教会の建築物を観たい。」のように、目的がやや曖昧に表現された自由文形式のリクエスト文でよい。
Next, an operation in which the search user operates the input /
次に、工程S11で、単語分割手段18aで形態素解析等を行い、リクエスト文を品詞ごとの単語情報に分割する。このとき、シソーラスを用いて同義語や類義語も合わせて単語情報としてもよい。また、リクエスト文に「国立公園」のような複合名詞が含まれるとき、「国立」「公園」「国立公園」について各々シソーラス検索を行い、各検索結果を集計して「国立公園」についての単語情報としてもよい。すなわち、単語分割手段18aによる単語情報の抽出方法は、検索ユーザの目的を適切に認識できるように適宜設定される。
Next, in step S11, morphological analysis is performed by the word dividing means 18a, and the request sentence is divided into word information for each part of speech. At this time, synonyms and synonyms may be combined into word information using a thesaurus. In addition, when the request sentence contains a compound noun such as “National Park”, the thesaurus is searched for “National”, “Park”, and “National Park”, and the search results are aggregated to create a word for “National Park”. It may be information. That is, the method of extracting word information by the
次に、工程S12で、検索手段18bが、辞書データベース22内の各辞書と施設情報インデックス20とを参照し、単語分割手段18で得られた単語情報に該当する施設ID、評価値、施設種別、スコア値を取得する。以下、この検索手段18bの動作について、図10のフローチャートに基づいて詳しく説明する。
Next, in step S12, the search means 18b refers to each dictionary in the
単語情報が動詞の場合、検索手段18bは、動詞施設種別辞書22aを参照してその単語情報と一致する特徴語(動詞)を調べ、該当する施設種別を所得する(工程S121)。例えば、単語分割手段18で「観る」という単語情報が得られた場合、図8(a)の動詞施設種別辞書22aを参照して、「美術館」「博物館」等の施設種別を取得する。 If the word information is a verb, the search means 18b refers to the verb facility type dictionary 22a for a feature word (verb) that matches the word information, and obtains the corresponding facility type (step S121). For example, when the word information “view” is obtained by the word dividing means 18, the facility type such as “museum” or “museum” is acquired with reference to the verb facility type dictionary 22 a of FIG.
単語情報が地名の場合、検索手段18bは、地名辞書22bを参照してその単語情報と一致する特徴語(地名)を調べ、該当する施設IDを所得する(工程S122)。例えば、単語分割手段18で「ロンドン」という単語情報が得られた場合、図8(b)の地名辞書22bを参照して、「1」等の施設IDを取得する。 When the word information is a place name, the search means 18b refers to the place name dictionary 22b, searches for a feature word (place name) that matches the word information, and obtains the corresponding facility ID (step S122). For example, when word information “London” is obtained by the word dividing means 18, a facility ID such as “1” is acquired with reference to the place name dictionary 22 b of FIG.
単語情報が名詞の場合、検索手段18bは、外部知識語辞書22cを参照してその単語情報と一致する特徴語(名詞)が在るか否かを判断する(S123)。そして、一致する特徴語(名詞)があれば、検索手段18bは、その単語情報に該当する施設IDを取得する(工程S124)。例えば、単語分割手段18で「世界遺産」という単語情報が得られた場合、図8(c)の外部知識語辞書22cを参照して、「1」等の施設IDを取得する。
When the word information is a noun, the
一方、一致する特徴語(名詞)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を取得する(工程S125)。例えば、単語分割手段18で「教会」という単語情報が得られた場合、図7の施設情報インデックス20を参照して、施設ID「1」及びスコア値「2」を取得する。
On the other hand, when there is no matching feature word (noun), the
単語情報が修飾語の場合、検索手段18bは、外部評価語辞書22dを参照してその単語情報と一致する特徴語(修飾語)が在るか否かを判断する(S126)。そして、一致する特徴語(修飾語)があれば、検索手段18bは、その単語情報に該当する施設IDとそれに対応する評価値を取得する(工程S127)。例えば、単語分割手段18で「有名な」という単語情報が得られた場合、図8(d)の外部知識語辞書22dを参照して、施設ID「1」及び評価値「5」を取得する。
If the word information is a modifier, the
一方、一致する特徴語(修飾語)がないとき、検索手段18bは、施設情報インデックス20を参照してその単語情報と一致するキーワードを調べ、該当する施設IDとそれに対応するスコア値を所得する(工程S128)。
On the other hand, when there is no matching feature word (modifier), the search means 18b refers to the
次に、検索手段18bは、工程S12を経て、施設ID又は施設種別を取得したかどうか判断する(工程13)。工程S12で、各辞書と施設情報インデックス20から施設IDと施設種別を全く取得することができなかったときには、検索手段18bは「リクエスト文に適合する施設関連情報が見当たらない」と判断し、その旨を出力手段16bから出力させ、検索動作が終了する(S14)。
Next, the search means 18b determines whether the facility ID or the facility type has been acquired through step S12 (step 13). When the facility ID and the facility type cannot be acquired from each dictionary and the
一方、施設ID又は施設種別を取得したときは、検索手段18bは、施設情報データベース14内を検索し、取得した施設IDや施設種別に該当する施設情報を抽出する(工程S15)。
On the other hand, when the facility ID or the facility type is acquired, the
次に、検索手段18bが、工程S15で抽出された施設情報に付与されているスコア値や評価値に基づき、施設IDごとに、リクエスト文に対する適切性を表すマッチ度を算出する(S16)。例えば、図11に示すように、ウェストミンスター寺院の施設ID「1」が抽出された場合、施設ID「1」には、修飾語「有名な」に対する評価値「5」、キーワード「建築物」に対するスコア値「4」、キーワード「教会」に対するスコア値「2」が付与されている。ここでは、これらを加算して、施設ID「1」のマッチ度「11」を算出する。工程S15で抽出された他の施設ID「7」「12」等についても、同様の方法でマッチ度を算出する。 Next, the search means 18b calculates the degree of match representing the suitability for the request sentence for each facility ID based on the score value and evaluation value given to the facility information extracted in step S15 (S16). For example, as shown in FIG. 11, when the facility ID “1” of Westminster Abbey is extracted, the facility ID “1” has an evaluation value “5” for the modifier “famous” and a keyword “building”. Is assigned a score value “4” and a score value “2” for the keyword “church”. Here, these are added together to calculate the degree of match “11” of the facility ID “1”. For the other facility IDs “7” and “12” extracted in step S15, the matching degree is calculated by the same method.
そして、検索手段18bは、工程S15で抽出した施設情報を施設IDごとにマッチ度が高いものから順番に出力手段16bから出力させる(S17)。出力手段16bは、紙に印刷したり、ディスプレイ表示などによって検索結果を検索ユーザに提供する。そして、出力形式としては、例えば、図12に示すようなレイアウトでディスプレイに表示する方法等が考えられる。ただし施設関連情報に含まれる文書情報、施設ID、マッチ度等の情報のうち、いずれの情報を表示するかは、システム管理者が自由に設定すればよく、あるいは、検索ユーザが選択できるようにしてもよい。
And the search means 18b makes the facility information extracted by process S15 output from the output means 16b in an order with a high matching degree for every facility ID (S17). The
以上説明したように、施設関連情報検索システム10は、膨大な施設関連情報を収集、整理格納する情報収集装置12、施設情報データベース14、施設情報インデックス20を備え、さらに、地名・動詞・修飾語等の特徴語と施設とを関連付けた辞書データベース22を備えているので、検索ユーザの要求を様々な観点から解釈し、要求に適合した施設関連情報を的確に抽出することができる。
As described above, the facility-related information search system 10 includes the
さらに、情報検索装置18は、抽象的な語句を含んだ自由文形式によるリクエスト文の入力ができるので、検索ユーザは事前の準備等することなく、気軽に検索を行うことができる。また、情報検索装置18は、施設の利用者等の評価を示す評価値や施設とキーワードとの関連度を示すスコア値などを用いて施設関連情報ごとに重み付けを行い、検索ユーザの要求に対する適合度の高い施設情報から優先的に出力することができ、検索ユーザにとって非常に利便性が高い。
Furthermore, since the
なお、本発明は上記実施形態に限定されるものではなく、例えば、検索対象が一定の施設種別に限定されているなどの事情に応じて、辞書データベース22内に設ける辞書の種類を増減させることができる。
Note that the present invention is not limited to the above embodiment. For example, the number of types of dictionaries provided in the
また、各辞書に設定する特徴語や、特徴語に付与されるスコア値及び評価値については、時代の流れとともに適切性を失うことが考えられるので、必要に応じてメンテナンス(再登録又は修正)を行う必要がある。その場合、辞書データベース、施設情報インデックスなどの登録データを修正する作業は、図示しないシステム管理者用端末装置を操作することによって行われる。この場合、蓄積されたすべての施設関連情報に対して、施設ID、施設種別などのインデックス情報が付与されているため、例えば、特定の施設種別の情報を一括して修正する等の処理も容易に行うことができるので、手間がかからず、メンテナンス性にも優れている。 Also, feature words set in each dictionary, and score values and evaluation values assigned to feature words may lose their appropriateness with the passage of time, so maintenance (re-registration or correction) as necessary Need to do. In that case, the operation of correcting registration data such as a dictionary database and a facility information index is performed by operating a terminal device for a system manager (not shown). In this case, since index information such as a facility ID and a facility type is assigned to all the facility-related information accumulated, for example, processing such as correcting the information of a specific facility type at once is easy. Therefore, it is easy and easy to maintain.
また、例えば、施設関連情報の蓄積件数が少ない施設情報検索システムでは、必ずしもスコア値や評価値を用いたマッチ度計算を行う機能を設けずに、工程S15で抽出された施設関連情報が任意の順番で出力されるものであってもよい。 Further, for example, in a facility information retrieval system with a small number of facility-related information accumulated, the facility-related information extracted in step S15 is not necessarily provided with a function for calculating the degree of match using score values and evaluation values. It may be output in order.
また、上記の実施形態のような一連の処理動作をプログラムとして構築し、施設関連情報検索システムとして利用されるサーバーコンピュータにインストールし、CPUなどの制御手段によって実行させる他、そのプログラムをネットワークを介して流通させるようにしてもよい。また、構築されたプログラムを、施設関連情報検索システムとして利用される各種のコンピュータに接続されるハードディスク装置、DVD−ROM、CD−ROMなどの可搬記憶媒体に格納し、コンピュータにインストールして実行させるようにしてもよい。 In addition to constructing a series of processing operations as in the above embodiment as a program, installing it in a server computer used as a facility-related information retrieval system, and executing it by a control means such as a CPU, the program is also transmitted via a network. May be distributed. In addition, the constructed program is stored in a portable storage medium such as a hard disk device, DVD-ROM, or CD-ROM connected to various computers used as a facility-related information retrieval system, and installed in the computer for execution. You may make it make it.
10 施設関連情報検索システム
12 情報収集装置
12a 情報収集手段
12b キーワード抽出手段
12c 情報整理手段
14 施設情報データベース
16 入出力端末
18 情報検索装置
18a 単語分割手段
18b 検索手段
20 施設情報インデックス
22 辞書データベース
22a 動詞施設種別辞書
22b 地名辞書
22c 外部知識語辞書
22d 外部評価語辞書
24 施設関連情報検索方法
S1 情報収集工程
S2 施設ID等付与工程
S3 施設情報格納工程
S4 キーワード抽出工程
S5 スコア付与工程
S51 文章情報分割工程
S52 スコア値算出工程
S53 スコア値合算工程
S54 スコア値選択工程
S6 インデックス情報格納工程
DESCRIPTION OF SYMBOLS 10 Facility related
Claims (11)
文書情報を有した施設関連情報を収集する情報収集工程と、
前記情報収集工程で収集した施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、
前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、
施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、
抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、
キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、
前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、
前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章ごとに算出するスコア値算出工程と、
各単位文章に出現したキーワードを、その単位文章を含む各文書情報ごとに取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えたことを特徴とする施設関連情報検索方法。 In a facility-related information search method that collects information about facilities, creates a database, and enables search by a search server,
An information collection process for collecting facility-related information with document information;
For each facility related information collected in the information collecting step, a facility ID etc. granting step for assigning a facility ID for identifying a facility that is a subject of the facility related information and a facility type indicating a classification of the facility,
Facility information storage that stores, in the storage device of the search server, facility related information including at least facility information associated with individual document information, facility ID, and facility type, among the facility related information to which the facility ID and the like are assigned Process,
A keyword extraction step of dividing the document information included in the facility-related information into words, and extracting keywords expressing the contents and features of the facility from the words;
A score giving step for giving a score value indicating a degree of association for each extracted facility keyword for each corresponding facility ID;
An index information storage step of storing index information including a keyword, a facility ID, and a score value in a storage device of a search server,
The score assigning step is a document information dividing step for dividing the document information of each facility-related information into a predetermined number of unit sentences from the beginning to the back of the document information;
Recognizes the number of times the keyword extracted in the keyword extraction step appears in each unit sentence, the position of the unit sentence in which the keyword appears, and the number of modifiers that depend on the keyword in each unit sentence And weighting that the degree of relevance of the extracted keyword to the corresponding facility ID is high with reference to at least one of the number of appearances and the position of the unit sentence in front and the number of modifiers A score value calculating step for calculating the score value for each unit sentence;
The keywords that appear in each unit sentence are compiled for each document information that includes the unit sentence. If there are keywords that appear in different unit sentences, the score values assigned to each unit sentence are added together. A facility-related information search method, comprising: a score value summation step that sets a score value of the keyword in document information.
前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、
前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与することを特徴とする請求項1記載の施設関連情報検索方法。 When the number of sentences constituting the document information is less than the number of divisions set in advance in the sentence information dividing step,
The sentence information dividing step treats document information from the beginning to the back as one unit sentence,
In the score value calculating step, a uniform score value that is lower in relevance than a case where the number of sentences constituting the document information is equal to or more than a predetermined number of divisions with respect to the keyword that appears in the unit sentence. The facility related information search method according to claim 1, wherein the facility related information search method is provided.
文書情報を含む施設関連情報を収集して整理する情報収集装置と、収集整理された個々の前記施設関連情報を格納する施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、
前記情報収集装置には、前記文書情報を含む前記施設関連情報を収集する情報収集手段と、収集した前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、
前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、
前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードとそのキーワードに関連付けられた前記施設IDとが対応付けて格納され、
前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、
前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、
前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は前記施設種別が付与された前記施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられていることを特徴とする施設関連情報検索システム。 In a facility search system configured by a computer system, extracting a facility that matches a request input by a search user, and providing the facility and facility related information,
An information collection device that collects and organizes facility-related information including document information, a facility information database that stores each of the collected facility-related information, an input / output terminal operated by a search user, and the search user's An information search device that extracts the facility and the facility related information that are suitable for request input from the facility information database and sends them to the input / output terminal, and the facility that is referred to when the information search device searches the facility information database. A facility information index and a dictionary database storing information related to
In the information collection device, information collection means for collecting the facility-related information including the document information, and a keyword expressing the contents and characteristics of the facility are extracted from the document information included in the collected facility-related information. To each of the facility-related information, a facility ID for identifying a facility that is a subject of the facility-related information and a facility type indicating a classification of the facility, and for each of the keywords And an information organizing means for performing processing for associating the facility ID of the facility corresponding to the document information,
The facility information database includes individual facility information including at least the document information, the individual facility IDs assigned to the document information, and the facility type among the information organized by the information organizing unit. Stored in correspondence,
Of the information organized by the information organizing means, the facility information index stores the keyword and the facility ID associated with the keyword in association with each other.
In the dictionary database, feature words expressing the contents and features of the facility are preset, and the information organizing unit defines a dictionary in which the facility ID related to each feature word is defined, or is associated with each feature word. A dictionary in which the facility type is defined, or both are provided,
The input / output terminal comprises input means for inputting a request sentence in free text format, and output means for outputting or displaying a search result sent from the information search device,
The information retrieval device refers to a word division unit that obtains word information by dividing and analyzing the request sentence sent from the input / output terminal, matches the word information with reference to a dictionary of the dictionary database and the facility information index The facility ID or the facility type defined as related to the feature word or keyword is acquired, and the facility information to which the acquired facility ID or the facility type is assigned is acquired as the facility information. A facility-related information search system, comprising: search means for extracting from an information database and sending it to the input / output terminal.
前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示することを特徴とする請求項4記載の施設関連情報検索システム。 The keyword stored in the facility information index is given a score value indicating the degree of association for each corresponding facility ID by the information organizing means,
The search means, for the facility information extracted from the facility information database, calculates the degree of match indicating the suitability for the request sentence by counting the score values for each facility ID,
5. The facility related information search system according to claim 4, wherein the output means preferentially outputs or displays the facility information to which the facility ID having a high degree of match is assigned.
前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。 The dictionary database is a verb facility type dictionary in which feature words made up of verbs representing actions of users of the facilities are preset, and the facility types related to each feature word are individually defined by the information organizing means. Prepared,
7. The facility-related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the verb facility type dictionary and acquires the corresponding facility type.
前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。 The dictionary database includes a place name dictionary in which feature words including place names representing the addresses of the facilities and related areas are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. ,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the place name dictionary and acquires the corresponding facility ID.
前記検索手段は、少なくとも前記外部知識語辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。 The dictionary database is an external knowledge word dictionary in which feature words including nouns that the user is interested in regarding the facility are set in advance, and the facility IDs related to the feature words are individually defined by the information organizing unit. Prepared,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the external knowledge word dictionary and acquires the corresponding facility ID.
前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4,5又は6記載の施設関連情報検索システム。 In the dictionary database, feature words made up of modifiers expressing the user's evaluation of the facility are set in advance, and the facility ID related to each feature word is individually defined by the information organizing means. With a dictionary,
The facility related information search system according to claim 4, 5 or 6, wherein the search means refers to at least the previous external evaluation dictionary and acquires the corresponding facility ID.
前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示することを特徴とする請求項5又は6記載の施設関連情報検索システム。
In the dictionary database, feature words composed of modifiers expressing the evaluation of users of the facility are set in advance, and the facility ID associated with the information processing unit is individually defined in each feature word, and And an external evaluation word dictionary to which an evaluation value indicating the degree of association with the facility ID is individually given by the information organizing means,
The search means refers to at least the inside of the external evaluation dictionary, acquires the corresponding facility ID, and obtains the score value and the evaluation value for each facility ID for the facility information extracted from the facility information database. Aggregate to calculate the degree of match that indicates the appropriateness of the request statement,
7. The facility related information search system according to claim 5, wherein the output means preferentially outputs or displays the facility related information corresponding to the facility ID having a high degree of match.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263039A JP5302614B2 (en) | 2008-10-09 | 2008-10-09 | Facility related information search database formation method and facility related information search system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263039A JP5302614B2 (en) | 2008-10-09 | 2008-10-09 | Facility related information search database formation method and facility related information search system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010092357A true JP2010092357A (en) | 2010-04-22 |
JP5302614B2 JP5302614B2 (en) | 2013-10-02 |
Family
ID=42254989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008263039A Active JP5302614B2 (en) | 2008-10-09 | 2008-10-09 | Facility related information search database formation method and facility related information search system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5302614B2 (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013186766A (en) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | Information retrieval method, program and information retrieval device |
JP5792871B1 (en) * | 2014-05-23 | 2015-10-14 | 日本電信電話株式会社 | Representative spot output method, representative spot output device, and representative spot output program |
KR20160002944A (en) * | 2013-04-17 | 2016-01-08 | 톰톰 네비게이션 비.브이. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP2016524736A (en) * | 2013-04-17 | 2016-08-18 | トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. | Method, apparatus and computer software for facilitating search and display of locations associated with a digital map |
US10281295B2 (en) | 2013-04-17 | 2019-05-07 | Tomtom Navigation B.V. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP2019204445A (en) * | 2018-05-25 | 2019-11-28 | シャープ株式会社 | Information processing apparatus, information processing method, and program |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04281565A (en) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | Document retrieving device |
JPH11328223A (en) * | 1998-05-19 | 1999-11-30 | Toshio Yamazaki | Information collection and retrieval device |
JP2002334107A (en) * | 2001-03-07 | 2002-11-22 | Nippon Telegr & Teleph Corp <Ntt> | Device, method for searching information, information search program and recording medium in which the same program is stored |
JP2006301718A (en) * | 2005-04-15 | 2006-11-02 | Pioneer Electronic Corp | Information processor, information processing system, information processing method, information processing program, and recording medium recorded with its program |
JP2006331117A (en) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program |
JP2007293567A (en) * | 2006-04-25 | 2007-11-08 | Matsushita Electric Ind Co Ltd | Retrieval device and retrieval program |
-
2008
- 2008-10-09 JP JP2008263039A patent/JP5302614B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04281565A (en) * | 1991-03-08 | 1992-10-07 | Toshiba Corp | Document retrieving device |
JPH11328223A (en) * | 1998-05-19 | 1999-11-30 | Toshio Yamazaki | Information collection and retrieval device |
JP2002334107A (en) * | 2001-03-07 | 2002-11-22 | Nippon Telegr & Teleph Corp <Ntt> | Device, method for searching information, information search program and recording medium in which the same program is stored |
JP2006301718A (en) * | 2005-04-15 | 2006-11-02 | Pioneer Electronic Corp | Information processor, information processing system, information processing method, information processing program, and recording medium recorded with its program |
JP2006331117A (en) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | Document retrieval system, document retrieval apparatus, document retrieval method and document retrieval program |
JP2007293567A (en) * | 2006-04-25 | 2007-11-08 | Matsushita Electric Ind Co Ltd | Retrieval device and retrieval program |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013186766A (en) * | 2012-03-09 | 2013-09-19 | Fujitsu Ltd | Information retrieval method, program and information retrieval device |
KR20160002944A (en) * | 2013-04-17 | 2016-01-08 | 톰톰 네비게이션 비.브이. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP2016522922A (en) * | 2013-04-17 | 2016-08-04 | トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. | Method, apparatus and computer software for facilitating search and display of locations associated with a digital map |
JP2016524736A (en) * | 2013-04-17 | 2016-08-18 | トムトム ナビゲーション ベスローテン フエンノートシャップTomTom Navigation B.V. | Method, apparatus and computer software for facilitating search and display of locations associated with a digital map |
US10281295B2 (en) | 2013-04-17 | 2019-05-07 | Tomtom Navigation B.V. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
US10733219B2 (en) | 2013-04-17 | 2020-08-04 | Tomtom Navigation B.V. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
KR102193465B1 (en) * | 2013-04-17 | 2020-12-22 | 톰톰 네비게이션 비.브이. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
US11720574B2 (en) | 2013-04-17 | 2023-08-08 | Tomtom Navigation B.V. | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP5792871B1 (en) * | 2014-05-23 | 2015-10-14 | 日本電信電話株式会社 | Representative spot output method, representative spot output device, and representative spot output program |
JP2019204445A (en) * | 2018-05-25 | 2019-11-28 | シャープ株式会社 | Information processing apparatus, information processing method, and program |
JP7091146B2 (en) | 2018-05-25 | 2022-06-27 | シャープ株式会社 | Information processing equipment, information processing methods, and programs |
Also Published As
Publication number | Publication date |
---|---|
JP5302614B2 (en) | 2013-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101495955B (en) | Mobile device retrieval and navigation | |
JP5281405B2 (en) | Selecting high-quality reviews for display | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US20160147866A1 (en) | Processing user profiles | |
US20150379018A1 (en) | Computer-generated sentiment-based knowledge base | |
JP4368336B2 (en) | Category setting support method and apparatus | |
JP5083669B2 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
JP5379138B2 (en) | Creating an area dictionary | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
CN104933081A (en) | Search suggestion providing method and apparatus | |
WO2008022581A1 (en) | Method and device for obtaining the new words and input method system | |
CN107408107A (en) | Text prediction is integrated | |
JP5302614B2 (en) | Facility related information search database formation method and facility related information search system | |
CN103870000A (en) | Method and device for sorting candidate items generated by input method | |
WO2014040521A1 (en) | Searching method, system and storage medium | |
US20120317141A1 (en) | System and method for ordering of semantic sub-keys | |
US20090144222A1 (en) | Chart generator for searching research data | |
JP5345987B2 (en) | Document search apparatus, document search method, and document search program | |
US20120323904A1 (en) | Automatic generation of a search query | |
JP4883644B2 (en) | RECOMMENDATION DEVICE, RECOMMENDATION SYSTEM, RECOMMENDATION DEVICE CONTROL METHOD, AND RECOMMENDATION SYSTEM CONTROL METHOD | |
US20090144318A1 (en) | System for searching research data | |
US20090144241A1 (en) | Search term parser for searching research data | |
CN111737607A (en) | Data processing method, data processing device, electronic equipment and storage medium | |
US20090144265A1 (en) | Search engine for searching research data | |
US20090144242A1 (en) | Indexer for searching research data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20110809 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302614 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |