JP5302614B2 - 施設関連情報の検索データベース形成方法および施設関連情報検索システム - Google Patents
施設関連情報の検索データベース形成方法および施設関連情報検索システム Download PDFInfo
- Publication number
- JP5302614B2 JP5302614B2 JP2008263039A JP2008263039A JP5302614B2 JP 5302614 B2 JP5302614 B2 JP 5302614B2 JP 2008263039 A JP2008263039 A JP 2008263039A JP 2008263039 A JP2008263039 A JP 2008263039A JP 5302614 B2 JP5302614 B2 JP 5302614B2
- Authority
- JP
- Japan
- Prior art keywords
- facility
- information
- search
- keyword
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 title claims description 9
- 239000000284 extract Substances 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims description 43
- 239000003607 modifier Substances 0.000 claims description 39
- 230000010365 information processing Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Images
Description
12 情報収集装置
12a 情報収集手段
12b キーワード抽出手段
12c 情報整理手段
14 施設情報データベース
16 入出力端末
18 情報検索装置
18a 単語分割手段
18b 検索手段
20 施設情報インデックス
22 辞書データベース
22a 動詞施設種別辞書
22b 地名辞書
22c 外部知識語辞書
22d 外部評価語辞書
S1 情報収集工程
S2 施設ID等付与工程
S3 施設情報格納工程
S4 キーワード抽出工程
S5 スコア付与工程
S51 文章情報分割工程
S52 スコア値算出工程
S53 スコア値合算工程
S54 スコア値選択工程
S6 インデックス情報格納工程
Claims (10)
- 記憶装置を有した検索サーバを備え、検索ユーザが入力したリクエストに応じて施設関連情報を提供する施設検索システムにおける、前記検索サーバによる施設関連情報の検索データベース形成方法において、
前記検索サーバに集められた前記施設関連情報ごとに、その設備関連情報の主体である施設を識別する施設ID及び施設の分類を示す施設種別を付与する施設ID等付与工程と、
前記施設ID等が付与された施設関連情報のうち、少なくとも、個々の文書情報、施設ID及び施設種別を対応付けた施設情報を含む施設関連情報を検索サーバの記憶装置内に格納する施設情報格納工程と、
施設関連情報に含まれる文書情報を単語に分割し、その単語の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出工程と、
抽出したキーワード対して、対応する施設IDごとに関連度を示すスコア値を付与するスコア付与工程と、
キーワード、施設ID及びスコア値からなるインデックス情報を検索サーバの記憶装置内に格納するインデックス情報格納工程とを備え、
前記スコア付与工程は、個々の施設関連情報が有する文書情報について、前記文書情報の先頭から後方までを所定数の単位文章に分割する文書情報分割工程と、
前記キーワード抽出工程で抽出されたキーワードが各単位文章の中に出現する回数と、そのキーワードが出現する単位文章の位置と、各単位文章の中でそのキーワードに係り受けする修飾語の数を認識し、出現回数の多さと単位文章の位置がより前方であること、及び修飾語の多さのうちの少なくとも一つを基準として、対応する施設IDに対する前記抽出キーワードの関連度が高いとする重み付けがなされたスコア値を、各単位文章ごとに算出するスコア値算出工程と、
各単位文章に出現したキーワードを、その単位文章を含む各文書情報ごとに取りまとめ、異なる単位文章に重複して出現するキーワードがあると、単位文章ごとに付与されたスコア値を合算して、その文書情報におけるそのキーワードのスコア値とするスコア値合算工程とを備えたことを特徴とする施設関連情報の検索データベース形成方法。 - 前記スコア付与工程は、前記スコア値合算工程で各文書情報にスコア値が付与された各キーワードを、各施設IDに取りまとめ、異なる文書情報に重複して出現するキーワードがあると、文書情報ごとに付与されたスコア値のうち、最も関連度が高いとするスコア値を選択して、その施設IDにおけるそのキーワードのスコア値とするスコア値選択工程を備えたことを特徴とする請求項1記載の施設関連情報の検索データベース形成方法。
- 文書情報を構成する文章数が、文章情報分割工程において予め設定されている分割数よりも少ないとき、
前記文章情報分割工程は、文書情報の先頭から後方までを1つ単位文章として取り扱い、
前記スコア値算出工程は、その単位文章に出現したキーワードに対して、文書情報を構成する文章数が予め設定された分割の数以上である場合よりも関連度が低いとする一律のスコア値を付与することを特徴とする請求項1記載の施設関連情報の検索データベース形成方法。 - コンピュータシステムにより構成され、検索ユーザが入力したリクエストに適合した施設を抽出し、その施設及び施設関連情報を提供する施設検索システムにおいて、
文書情報を含む施設関連情報を整理し出力する情報収集装置と、整理された個々の前記施設関連情報が格納された施設情報データベースと、検索ユーザが操作する入出力端末と、前記検索ユーザのリクエスト入力に適合した前記施設及び前記施設関連情報を前記施設情報データベースから抽出して前記入出力端末へ送る情報検索装置と、前記情報検索装置が前記施設情報データベースを検索するときに参照されその施設に関連する情報が格納された施設情報インデックス及び辞書データベースとを備え、
前記情報収集装置には、集められた前記施設関連情報に含まれる前記文書情報の中から施設の内容や特徴を表現するキーワードを抽出するキーワード抽出手段と、個々の前記施設関連情報に対して、その施設関連情報の主体である施設を識別する施設ID及びその施設の分類を示す施設種別を付与するとともに、前記各キーワードに対して、前記文書情報に対応する施設の前記施設IDを関連付ける処理を行う情報整理手段とが設けられ、
前記施設情報データベースには、前記情報整理手段で整理された情報のうち、少なくとも前記文書情報と、前記文書情報に付与された個々の前記施設IDと、前記施設種別とを含む個々の施設情報が対応付けて格納され、
前記施設情報インデックスには、前記情報整理手段で整理された情報のうち、前記キーワードと、そのキーワードに関連付けられた前記施設IDと、その施設IDとの関連度を示すスコア値とが対応付けて格納され、
前記辞書データベースには、前記施設の内容や特徴を表現する特徴語が予め設定され、前記情報整理手段により、各特徴語に関連する前記施設IDが定義された辞書、又は各特徴語に関連する前記施設種別が定義された辞書、又はその両方が設けられ、
前記入出力端末は、自由文形式のリクエスト文が入力される入力手段と、前記情報検索装置から送られた検索結果を出力又は表示する出力手段とを備え、
前記情報検索装置は、前記入出力端末から送られた前記リクエスト文を分割解析して単語情報を得る単語分割手段と、前記辞書データベースの辞書と前記施設情報インデックスを参照してその単語情報と一致する特徴語又はキーワードを抽出し、その特徴語又はキーワードに関連すると定義された前記施設ID又は前記施設種別を取得し、取得した前記施設ID又は前記施設種別が付与された前記施設情報を前記施設情報データベースの中から抽出して前記入出力端末へ送る検索手段とが設けられ、
前記検索手段は、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDが付与された前記施設情報を優先して出力又は表示することを特徴とする施設関連情報検索システム。 - 前記情報整理手段によって前記キーワードに付与される前記スコア値は、そのキーワードが個々の前記文書情報の中に出現する回数と、前記文書情報の中の出現位置と、前記文書情報の中でそのキーワードに係り受けする修飾語の数とに基づいて決定され、出現回数が多く、その文章の位置が相対的に前記文章情報の前方位置に出現し、修飾語数が多い前記キーワードほど、関連度が高いとする重み付けがなされた前記スコア値が付与されることを特徴とする請求項4記載の施設関連情報検索システム。
- 前記辞書データベースは、前記施設の利用者の動作を表現する動詞からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設種別が個々に定義された動詞施設種別辞書を備え、
前記検索手段は、少なくとも前記動詞施設種別辞書内を参照し、該当する前記施設種別を取得することを特徴とする請求項4又は5記載の施設関連情報検索システム。 - 前記辞書データベースは、前記施設の住所や関係する地域等を表す地名からなる特徴語が予め設定され、前記情報整理手段によって各特徴語に関連する前記施設IDが個々に定義された地名辞書を備え、
前記検索手段は、少なくとも前記地名辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4又は5記載の施設関連情報検索システム。 - 前記辞書データベースは、前記施設に関して利用者が興味を示す名詞からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部知識語辞書を備え、
前記検索手段は、少なくとも前記外部知識語辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4又は5記載の施設関連情報検索システム。 - 前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記情報整理手段によって前記各特徴語に関連する前記施設IDが個々に定義された外部評価語辞書を備え、
前記検索手段は、少なくとも前外部評価辞書内を参照し、該当する前記施設IDを取得することを特徴とする請求項4又は5記載の施設関連情報検索システム。 - 前記辞書データベースは、前記施設の利用者の評価を表現する修飾語からなる特徴語が予め設定され、前記各特徴語には、前記情報処理手段によって関連する前記施設IDが個々に定義され、且つ、前記情報整理手段によって前記施設IDとの関連度を示す評価値が個々に付与された外部評価語辞書を備え、
前記検索手段は、少なくとも前記外部評価辞書内を参照し、該当する前記施設IDを取得するとともに、前記施設情報データベースから抽出した前記施設情報について、前記施設IDごとに前記スコア値と前記評価値を集計して前記リクエスト文に対する適切性を示すマッチ度を算出し、
前記出力手段は、前記マッチ度の高い前記施設IDに該当する前記施設関連情報を優先して出力又は表示することを特徴とする請求項5記載の施設関連情報検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263039A JP5302614B2 (ja) | 2008-10-09 | 2008-10-09 | 施設関連情報の検索データベース形成方法および施設関連情報検索システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263039A JP5302614B2 (ja) | 2008-10-09 | 2008-10-09 | 施設関連情報の検索データベース形成方法および施設関連情報検索システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010092357A JP2010092357A (ja) | 2010-04-22 |
JP5302614B2 true JP5302614B2 (ja) | 2013-10-02 |
Family
ID=42254989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008263039A Active JP5302614B2 (ja) | 2008-10-09 | 2008-10-09 | 施設関連情報の検索データベース形成方法および施設関連情報検索システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5302614B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5915274B2 (ja) * | 2012-03-09 | 2016-05-11 | 富士通株式会社 | 情報検索方法、プログラムおよび情報検索装置 |
GB201306944D0 (en) | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
GB201306942D0 (en) * | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
GB201306937D0 (en) | 2013-04-17 | 2013-05-29 | Tomtom Int Bv | Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map |
JP5792871B1 (ja) * | 2014-05-23 | 2015-10-14 | 日本電信電話株式会社 | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム |
JP7091146B2 (ja) * | 2018-05-25 | 2022-06-27 | シャープ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2937519B2 (ja) * | 1991-03-08 | 1999-08-23 | 株式会社東芝 | 文書検索装置 |
JP4439604B2 (ja) * | 1998-05-19 | 2010-03-24 | 敏夫 山崎 | 情報収集検索装置 |
JP3964630B2 (ja) * | 2001-03-07 | 2007-08-22 | 日本電信電話株式会社 | 情報検索装置と情報検索プログラムおよび該プログラムを記録した記録媒体 |
JP2006301718A (ja) * | 2005-04-15 | 2006-11-02 | Pioneer Electronic Corp | 情報処理装置、情報処理システム、情報処理方法、情報処理プログラム、および、そのプログラムを記録した記録媒体 |
JP2006331117A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP2007293567A (ja) * | 2006-04-25 | 2007-11-08 | Matsushita Electric Ind Co Ltd | 検索装置および検索プログラム |
-
2008
- 2008-10-09 JP JP2008263039A patent/JP5302614B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010092357A (ja) | 2010-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5281405B2 (ja) | 表示のための高品質レビューの選択 | |
US9836511B2 (en) | Computer-generated sentiment-based knowledge base | |
CN101495955B (zh) | 移动设备检索与导航 | |
JP4368336B2 (ja) | カテゴリ設定支援方法及び装置 | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
JP5066963B2 (ja) | データベース構築装置 | |
CN104933081A (zh) | 一种搜索建议提供方法及装置 | |
US9754022B2 (en) | System and method for language sensitive contextual searching | |
WO2008022581A1 (fr) | Procédé et dispositif d'obtention de mots nouveaux et système et procédé de saisie | |
CN103092923A (zh) | 搜索引擎的基于菜单的登广告 | |
US20120323905A1 (en) | Ranking data utilizing attributes associated with semantic sub-keys | |
JPWO2007108529A1 (ja) | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム | |
JP5302614B2 (ja) | 施設関連情報の検索データベース形成方法および施設関連情報検索システム | |
WO2014040521A1 (zh) | 搜索方法、系统及存储介质 | |
CN106776860A (zh) | 一种搜索摘要生成方法及装置 | |
JP2007018285A (ja) | 情報提供システム、情報提供方法、情報提供装置並びに情報提供プログラム | |
US20120317141A1 (en) | System and method for ordering of semantic sub-keys | |
JP2006318398A (ja) | ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP4512163B2 (ja) | 文章体特定装置およびコンピュータに文章体を特定させるためのプログラム | |
US20090144222A1 (en) | Chart generator for searching research data | |
JP4883644B2 (ja) | リコメンド装置、リコメンドシステム、リコメンド装置の制御方法、およびリコメンドシステムの制御方法 | |
US20090144318A1 (en) | System for searching research data | |
US20090144241A1 (en) | Search term parser for searching research data | |
CN111737607A (zh) | 数据处理方法、装置、电子设备以及存储介质 | |
US20090144265A1 (en) | Search engine for searching research data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20110809 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5302614 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |