JP5815467B2 - 検索キーワード提示装置及び方法及びプログラム - Google Patents
検索キーワード提示装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5815467B2 JP5815467B2 JP2012108850A JP2012108850A JP5815467B2 JP 5815467 B2 JP5815467 B2 JP 5815467B2 JP 2012108850 A JP2012108850 A JP 2012108850A JP 2012108850 A JP2012108850 A JP 2012108850A JP 5815467 B2 JP5815467 B2 JP 5815467B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- user
- geographic
- mesh
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
・s : 全検索対象文書内での当該キーワードの出現頻度
・k : 当該メッシュ内の全キーワードの出現頻度の合計
・r : 当該メッシュ内での当該キーワードの出現頻度
ただし、当該機能での計算においてn , sは事前に設定しておく。
文書集合中の各文書から固有表現及び地名表現を抽出し、該地名表現に対応する地理情報をメッシュ番号に変換し、該メッシュ番号毎に、各固有表現の数を合計して地理メッシュ・固有表現頻度DBに格納する地理メッシュ・固有表現頻度DB作成手段と、
ユーザが過去に存在していた位置情報をユーザIDと対応付けて保持する位置履歴DBと、
前記位置履歴DBの位置情報を、メッシュ番号に変換し、前記ユーザID毎に地理メッシュ番号と該位置情報の頻度を求め、ユーザ地理メッシュ頻度DBに格納するユーザ・地理メッシュ頻度DB作成手段と、
ユーザからユーザIDと検索対象地理範囲が入力されると、該ユーザIDに基づいて前記ユーザ・地理メッシュ頻度DBから地理メッシュ番号iと頻度fを取得し、取得した地理メッシュ番号iに基づいて前記地理メッシュ・固有表現頻度DBから該地理メッシュに含まれる固有表現と第1の頻度情報を取得し、前記入力された検索対象地理範囲に該当する検索対象地理メッシュに含まれる固有表現と第2の頻度情報を前記地理メッシュ・固有表現頻度DBから取得し、前記頻度f、前記第1の頻度情報、前記第2の頻度情報とからポアソン分布のパラメータλを求め、ポアソン確率により固有表現のスコアを求め、該スコアが高い固有表現を、前記入力されたユーザIDと検索対象地理範囲にとって特徴的なキーワードとして出力するキーワード抽出手段と、を有する。
前記第1の頻度情報におけるスコア算出対象の固有表現の頻度sと前記頻度fとの地理メッシュ番号iにおける積和と、
前記第1の頻度情報から得られる全固有表現の頻度nと前記頻度fとの地理メッシュ番号iにおける積和と、
の比を用いて、前記パラメータλを求める。
前処理として、地理メッシュ・固有表現頻度DB2及びユーザ地理メッシュDB4を作成する。以下、それぞれのDB作成部について説明を記述する。
地理メッシュ番号毎に、各固有表現の数を合計して、地理メッシュ・固有表現頻度DB4に格納する。地理メッシュ・固有表現頻度DB4の例を図2に示す。
次に、キーワード抽出部30の処理について説明する。
・ni :地理メッシュiに含まれる全キーワードの頻度;
・si :地理メッシュiに含まれる当該キーワードの頻度;
・fi :地理メッシュiの頻度;
・k :検索対象地理メッシュ内の全キーワードの出現頻度の合計;
・r :当該メッシュ内での当該キーワードの出現頻度;
検索対象地理メッシュ内の全てのキーワードについてポアソン確率を計算したのち、ポアソン確率が高い上位の語を出力する。
2 ユーザ・地理メッシュ頻度DB
3 検索対象文書群DB
4 地理メッシュ・固有表現頻度DB
10 ユーザ・地理メッシュDB作成部
20 地理メッシュ・固有表現頻度DB作成部
30 キーワード抽出部
Claims (5)
- ユーザから入力された検索対象地理範囲に含まれる地域において該ユーザに特徴的なキーワードを提示する検索キーワード提示装置であって、
文書集合中の各文書から固有表現及び地名表現を抽出し、該地名表現に対応する地理情報をメッシュ番号に変換し、該メッシュ番号毎に、各固有表現の数を合計して地理メッシュ・固有表現頻度DBに格納する地理メッシュ・固有表現頻度DB作成手段と、
ユーザが過去に存在していた位置情報をユーザIDと対応付けて保持する位置履歴DBと、
前記位置履歴DBの位置情報を、メッシュ番号に変換し、前記ユーザID毎に地理メッシュ番号と該位置情報の頻度を求め、ユーザ地理メッシュ頻度DBに格納するユーザ・地理メッシュ頻度DB作成手段と、
ユーザからユーザIDと検索対象地理範囲が入力されると、該ユーザIDに基づいて前記ユーザ・地理メッシュ頻度DBから地理メッシュ番号iと頻度fを取得し、取得した地理メッシュ番号iに基づいて前記地理メッシュ・固有表現頻度DBから該地理メッシュに含まれる固有表現と第1の頻度情報を取得し、前記入力された検索対象地理範囲に該当する検索対象地理メッシュに含まれる固有表現と第2の頻度情報を前記地理メッシュ・固有表現頻度DBから取得し、前記頻度f、前記第1の頻度情報、前記第2の頻度情報とからポアソン分布のパラメータλを求め、ポアソン確率により固有表現のスコアを求め、該スコアが高い固有表現を、前記入力されたユーザIDと検索対象地理範囲にとって特徴的なキーワードとして出力するキーワード抽出手段と、
を有することを特徴とする検索キーワード提示装置。 - 前記キーワード抽出手段は、
前記第1の頻度情報におけるスコア算出対象の固有表現の頻度sと前記頻度fとの地理メッシュ番号iにおける積和と、
前記第1の頻度情報から得られる全固有表現の頻度nと前記頻度fとの地理メッシュ番号iにおける積和と、
の比を用いて、前記パラメータλを求める
請求項1記載の検索キーワード提示装置。 - ユーザから入力された検索対象地理範囲に含まれる地域において該ユーザに特徴的なキーワードを提示する検索キーワード提示方法であって、
コンピュータが、
文書集合中の各文書から固有表現及び地名表現を抽出し、該地名表現に対応する地理情報をメッシュ番号に変換し、該メッシュ番号毎に、各固有表現の数を合計して地理メッシュ・固有表現頻度DBに格納する地理メッシュ・固有表現頻度DB作成ステップと、
ユーザIDに対応付けられて保持されている、ユーザが過去に存在していた位置情報を、メッシュ番号に変換し、前記ユーザID毎に地理メッシュ番号と該位置情報の頻度を求め、ユーザ地理メッシュ頻度DBに格納するユーザ・地理メッシュDB作成ステップと、
ユーザからユーザIDと検索対象地理範囲が入力されると、該ユーザIDに基づいて前記ユーザ・地理メッシュ頻度DBから地理メッシュ番号iと頻度fを取得し、取得した地理メッシュ番号iに基づいて前記地理メッシュ・固有表現頻度DBから該地理メッシュに含まれる固有表現と第1の頻度情報を取得し、前記入力された検索対象地理範囲に該当する検索対象地理メッシュに含まれる固有表現と第2の頻度情報を前記地理メッシュ・固有表現頻度DBから取得し、前記頻度f、前記第1の頻度情報、前記第2の頻度情報とからポアソン分布のパラメータλを求め、ポアソン確率により固有表現のスコアを求め、該スコアが高い固有表現を、前記入力されたユーザIDと検索対象地理範囲にとって特徴的なキーワードとして出力するキーワード抽出ステップと、
を実行することを特徴とする検索キーワード提示方法。 - 前記キーワード抽出ステップは、
前記第1の頻度情報におけるスコア算出対象の固有表現の頻度sと前記頻度fとの地理メッシュ番号iにおける積和と、
前記第1の頻度情報から得られる全固有表現の頻度nと前記頻度fとの地理メッシュ番号iにおける積和と、
の比を用いて、前記パラメータλを求める
請求項3記載の検索キーワード提示方法。 - コンピュータを、
請求項1または2に記載の検索キーワード提示装置の各手段として機能させるための検索キーワード提示プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012108850A JP5815467B2 (ja) | 2012-05-10 | 2012-05-10 | 検索キーワード提示装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012108850A JP5815467B2 (ja) | 2012-05-10 | 2012-05-10 | 検索キーワード提示装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013235516A JP2013235516A (ja) | 2013-11-21 |
JP5815467B2 true JP5815467B2 (ja) | 2015-11-17 |
Family
ID=49761572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012108850A Expired - Fee Related JP5815467B2 (ja) | 2012-05-10 | 2012-05-10 | 検索キーワード提示装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5815467B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4694060B2 (ja) * | 2001-07-27 | 2011-06-01 | 大日本印刷株式会社 | 行動エリア探索サーバ、プログラム及び記録媒体 |
JP2003216613A (ja) * | 2002-01-17 | 2003-07-31 | Fujitsu Ltd | 地域情報提供方法及び地域情報提供装置 |
WO2004013776A2 (en) * | 2002-08-05 | 2004-02-12 | Metacarta, Inc. | Desktop client interaction with a geographic text search system |
US8041730B1 (en) * | 2006-10-24 | 2011-10-18 | Google Inc. | Using geographic data to identify correlated geographic synonyms |
US8275649B2 (en) * | 2009-09-18 | 2012-09-25 | Microsoft Corporation | Mining life pattern based on location history |
JP2011221665A (ja) * | 2010-04-06 | 2011-11-04 | Nippon Telegr & Teleph Corp <Ntt> | ユーザ属性分析装置及び方法及びプログラム |
JP5351123B2 (ja) * | 2010-10-21 | 2013-11-27 | 日本電信電話株式会社 | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
-
2012
- 2012-05-10 JP JP2012108850A patent/JP5815467B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013235516A (ja) | 2013-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Venerandi et al. | Measuring urban deprivation from user generated content | |
US10755178B2 (en) | System and method for determining credibility of information based on many remarks on a network, and non-transitory computer readable storage medium having stored thereon computer program therefor | |
JP6411800B2 (ja) | 情報管理装置、情報管理システム、及び情報管理プログラム | |
Graham et al. | Mapping information wealth and poverty: the geography of gazetteers | |
US20180181609A1 (en) | System for De-Duplicating Job Postings | |
Barbaresi | Collection and indexing of tweets with a geographical focus | |
Restrepo Correa et al. | Exploring palm–insect interactions across geographical and environmental gradients | |
Glomb et al. | Popularity of the cult of Asclepius in the times of the Antonine Plague: Temporal modeling of epigraphic evidence | |
Janc | A global approach to the spatial diversity and dynamics of internet domains | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
AU2018273369A1 (en) | Automated classification of network-accessible content | |
JP5815467B2 (ja) | 検索キーワード提示装置及び方法及びプログラム | |
CN109241395B (zh) | 一种基于关键词解析的试题网络排重检索办法 | |
JP5604406B2 (ja) | 情報検索装置及び方法及びプログラム | |
Johnson et al. | 140 characters or less: How is the twitter mediascape influencing the Egyptian revolution? | |
JP6748474B2 (ja) | 意思決定支援システムおよび意思決定支援方法 | |
JP5798081B2 (ja) | 情報検索装置及び方法及びプログラム | |
JP5801243B2 (ja) | 特徴キーワード推薦装置及び方法及びプログラム | |
Vicol et al. | A biogeographical study of red listed lichen species at temporal and spatial scales within protected and non-protected areas | |
JP5457612B1 (ja) | 情報提供装置、情報提供方法、および情報提供プログラム | |
JP5977199B2 (ja) | 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム | |
JP5090490B2 (ja) | 代表表記抽出装置、方法及びプログラム | |
JP5792871B1 (ja) | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム | |
JP5806974B2 (ja) | 近隣情報検索装置及び方法及びプログラム | |
Kelly | Binford versus Childe: What makes an archaeologist influential? |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150707 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150924 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5815467 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |