JP5325856B2 - 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム - Google Patents
文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム Download PDFInfo
- Publication number
- JP5325856B2 JP5325856B2 JP2010198638A JP2010198638A JP5325856B2 JP 5325856 B2 JP5325856 B2 JP 5325856B2 JP 2010198638 A JP2010198638 A JP 2010198638A JP 2010198638 A JP2010198638 A JP 2010198638A JP 5325856 B2 JP5325856 B2 JP 5325856B2
- Authority
- JP
- Japan
- Prior art keywords
- place name
- expression
- feature expression
- feature
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(地名-特徴表現対応抽出部102)
地名-特徴表現対応抽出部102は、図2のフローチャートに示す手順により、地名と特徴表現、およびその基本スコアの対応を抽出する。図2においてループL10は、以下のステップS11〜S13の処理を文書DB101中の各文書について繰り返し実行する。
文書DB101中の各文書について、文書中に記述された地名と思われる表現を抽出する。地名は必ずしも正規の住所表現でなくとも、断片的な地名(たとえば「浜松」など)でも構わない。これには非特許文献1等で示される従来の手法を用いることができる。
文書から何らかの地名が抽出された場合、該抽出された地名について以下の2つの基準により、特徴表現を抽出する。
(b)地名と近接して出現した名詞・フレーズ・固有表現。
事前に定めた定数α、βより、前記抽出した各特徴表現について、以下の式で基本スコアを算出する。
当該地名-特徴表現の対について既に他の文書によって基本スコアが計算済みであればそれまでの基本スコアに上記基本スコアを足したものを基本スコアとする。
地名-特徴表現スコア改善部103では、ある地名で突出して多く出現している特徴表現には、その地名-特徴表現に対してより大きなスコアを与えるようにスコアを改善する。
全文書数がn,全文書中での当該特徴表現の出現頻度がs,全文書中での当該地名の出現頻度がk,当該地名−特徴表現の全文書中での出現がrであるとき、
出現回数rのポアソン確率
事前に定めた定数γを用いて、以下の式を用いて地名-特徴表現スコアを算出する。
ステップS23:地名-特徴表現対応DBへ格納
上記ステップS22で求めたスコアを図5に示すような地名-特徴表現対応DB104へ格納する。
(端末位置範囲推定部105)
端末位置範囲推定部105では、利用者端末200から入力された軌跡(例えばGPS機能付きの携帯電話機から入力された時刻情報、緯度、経度情報に基づく軌跡)を利用して、図6のフローチャートに示す手順により、次の単位時間内に利用者端末位置が存在する可能性が高い領域を推定する。ここで単位時間はたとえば5分程度を想定することができるが、検索対象の文書の特性に応じて任意の時間に変更しても良い。
直前の単位時間内の利用者の位置の軌跡を求める。
軌跡の描く最小外接矩形を得る。すなわち、その単位時間内での移動範囲における最小緯度、最大緯度、最小経度、最大経度を求め、2点((最小緯度、最小経度)と(最大緯度、最大経度))を結ぶ線を対角線として持つような矩形を求める。
前記ステップS32で求めた最小外接矩形の長さを緯度方向、経度方向ともに2倍に拡大し、中心点を現在の端末の位置(軌跡中の最新の位置)とした範囲を出力する。
位置範囲地名表現変換部106では、端末位置範囲推定部105によって得られた地理範囲を示す矩形を、図7のフローチャートに示す手順により、その地理範囲を含む地名表現に変換する。
矩形の4つの各頂点に対して、対応する地名表現を得る。これには、もっとも頂点に近い点が代表点の座標となっているような地名辞書の地名を得ることによって可能である、
ステップS42:4つの頂点に対応する地名で共通して保持する地名の階層レベルを算出
前記ステップS42で得られた地名で共通して保持する地名の階層レベルを、地名辞書を用いて算出する。
最上位の地名の階層レベル(たとえば国名)から、各頂点に対応する4つの地名どれもが共通する階層のレベルまでを地理範囲を示す矩形の地名表現として出力する。
地名重みDB108は、地名表現毎に、その地名の広さを記したデータベースである。尚、必ずしも広さでなくとも、その地名内での人口あるいは、特許文献2で示されるような「有名度スコア」を用いることも可能である。
特徴表現選出部107では、位置範囲地名表現変換部106で得られた地名表現(ここでは地名表現rと呼ぶ)と、出力すべき特徴表現の件数f(設定した件数)を入力とし、地名-特徴表現対応DB104および地名重みDB108を参照して図9のフローチャートに示す手順により、利用者に提示する特徴表現を選出する。
このステップでは、以下によって得られる各値を足したものを特徴表現のスコアとする。
地名-特徴表現対応DB104中の地名がrの下位の階層あるいはr自身を含んでいればスコア自体、
地名-特徴表現対応DB104中の地名がrより上位の階層であれば、
上記ステップS51の手順によって得られたスコアが上位f件の特徴表現を出力し、キーワードとして利用者端末200に提示する。
101…文書DB
102…地名-特徴表現対応抽出部
103…地名-特徴表現スコア改善部
104…地名-特徴表現対応DB
105…端末位置範囲推定部
106…位置範囲地名表現変換部
107…特徴表現選出部
108…地名重みDB
200…利用者端末
Claims (5)
- 文書集合中から地名と思われる表現および該地名に関する特徴表現を抽出し、抽出された各地名と特徴表現の対について基本スコアを算出する地名-特徴表現対応抽出手段と、
前記地名-特徴表現対応抽出手段によって抽出された地名および特徴表現の対が全文書中に出現する確率と前記基本スコアに基づいて、地名-特徴表現スコアを算出し、該算出されたスコアと地名-特徴表現の対を地名-特徴表現対応データベースに格納する地名-特徴表現スコア改善手段と、
利用者端末から入力された時刻および緯度、経度情報に基づく軌跡を用いて、利用者端末が今後移動する地理範囲を推定する端末位置範囲推定手段と、
前記端末位置範囲推定手段によって推定された地理範囲を、該地理範囲を含む地名表現に変換する位置範囲地名表現変換手段と、
地名とその地名の重みを格納した地名重みデータベースと前記地名-特徴表現対応データベースを参照して、前記位置範囲地名表現変換手段によって変換された地名表現に対応した特徴表現を選出する特徴表現選出手段と、
を備えたことを特徴とする文書検索キーワード提示装置。 - 前記特徴表現選出手段は、前記位置範囲地名表現変換手段によって変換された地名表現と前記地名-特徴表現対応データベース中の地名との関係に基づいて特徴表現のスコアを求め、該スコアの上位設定件数分の特徴表現を選出するものであり、前記地名-特徴表現対応データベース中の地名が、前記位置範囲地名表現変換手段によって変換された地名表現よりも上位の階層である場合は、前記地名重みデータベース中の重みを前記特徴表現のスコアに反映させることを特徴とする請求項1に記載の文書検索キーワード提示装置。
- 地名-特徴表現対応抽出手段が、文書集合中から地名と思われる表現および該地名に関する特徴表現を抽出し、抽出された各地名と特徴表現の対について基本スコアを算出する地名-特徴表現対応抽出ステップと、
地名-特徴表現スコア改善手段が、前記地名-特徴表現対応抽出手段によって抽出された地名および特徴表現の対が全文書中に出現する確率と前記基本スコアに基づいて、地名-特徴表現スコアを算出し、該算出されたスコアと地名-特徴表現の対を地名-特徴表現対応データベースに格納する地名-特徴表現スコア改善ステップと、
端末位置範囲推定手段が、利用者端末から入力された時刻および緯度、経度情報に基づく軌跡を用いて、利用者端末が今後移動する地理範囲を推定する端末位置範囲推定ステップと、
位置範囲地名表現変換手段が、前記端末位置範囲推定手段によって推定された地理範囲を、該地理範囲を含む地名表現に変換する位置範囲地名表現変換ステップと、
特徴表現選出手段が、地名とその地名の重みを格納した地名重みデータベースと前記地名-特徴表現対応データベースを参照して、前記位置範囲地名表現変換手段によって変換された地名表現に対応した特徴表現を選出する特徴表現選出ステップと、
を備えたことを特徴とする文書検索キーワード提示方法。 - 前記特徴表現選出ステップは、前記位置範囲地名表現変換手段によって変換された地名表現と前記地名-特徴表現対応データベース中の地名との関係に基づいて特徴表現のスコアを求め、該スコアの上位設定件数分の特徴表現を選出するものであり、前記地名-特徴表現対応データベース中の地名が、前記位置範囲地名表現変換手段によって変換された地名表現よりも上位の階層である場合は、前記地名重みデータベース中の重みを前記特徴表現のスコアに反映させることを特徴とする請求項3に記載の文書検索キーワード提示方法。
- コンピュータを請求項1又は2に記載の各手段として機能させる文書検索キーワード提示プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010198638A JP5325856B2 (ja) | 2010-09-06 | 2010-09-06 | 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010198638A JP5325856B2 (ja) | 2010-09-06 | 2010-09-06 | 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012058809A JP2012058809A (ja) | 2012-03-22 |
JP5325856B2 true JP5325856B2 (ja) | 2013-10-23 |
Family
ID=46055886
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010198638A Active JP5325856B2 (ja) | 2010-09-06 | 2010-09-06 | 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5325856B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014044661A (ja) * | 2012-08-28 | 2014-03-13 | Nippon Telegr & Teleph Corp <Ntt> | キーワード出力装置、キーワード出力方法及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000020548A (ja) * | 1998-07-07 | 2000-01-21 | Casio Comput Co Ltd | 目的地表示装置、及び行動推測装置 |
JP4349162B2 (ja) * | 2004-03-09 | 2009-10-21 | 日産自動車株式会社 | 車両用情報提示装置 |
JP2007272485A (ja) * | 2006-03-31 | 2007-10-18 | Kddi Corp | 連想検索装置及びコンピュータプログラム |
JP4708319B2 (ja) * | 2006-11-29 | 2011-06-22 | 日本電信電話株式会社 | メタデータ間類似度測定装置及びメタデータ階層化装置、メタデータ間類似度測定方法及びメタデータ階層化方法、メタデータ間類似度測定プログラム及びメタデータ階層化プログラム並びにそれらプログラムを記録した記録媒体 |
JP5235710B2 (ja) * | 2009-02-13 | 2013-07-10 | 日本電信電話株式会社 | 文書検索装置、文書検索方法、文書検索プログラムおよびそのプログラムを記録した記録媒体。 |
JP5164968B2 (ja) * | 2009-12-25 | 2013-03-21 | ヤフー株式会社 | 地域スコアデータベースを作成する装置、方法及びプログラム |
-
2010
- 2010-09-06 JP JP2010198638A patent/JP5325856B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012058809A (ja) | 2012-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10380160B2 (en) | Dynamic language model | |
JP5064388B2 (ja) | 位置識別方法 | |
JP5411159B2 (ja) | 通信ネットワークを介して送信元からコンテンツを受信する位置認識装置、および通信ネットワークを介して位置認識装置により受信されたコンテンツに含まれる情報を特定する方法 | |
US8782041B1 (en) | Text search for weather data | |
US20150363700A1 (en) | Discovering Functional Groups of an Area | |
JP2017510104A (ja) | ワイヤレスネットワークのアクセスポイントに関連したエンティティの識別 | |
JP2015521331A (ja) | 地理的場所に基づいて候補用語を推奨する方法および装置 | |
TW200948098A (en) | System and method for preferred services in nomadic environments | |
CN105187237A (zh) | 查找相关联的用户标识的方法和装置 | |
TW201933879A (zh) | 內容推薦方法及裝置 | |
JP2007219655A (ja) | 施設情報管理システム、施設情報管理方法および施設情報管理プログラム | |
JP7176011B2 (ja) | デジタルアシスタントアプリケーションとナビゲーションアプリケーションとの間のインターフェーシング | |
JP2012089019A (ja) | 文書検索キーワード提示装置および文書検索キーワード提示プログラム | |
JP5235710B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラムおよびそのプログラムを記録した記録媒体。 | |
KR101536933B1 (ko) | 위치 정보 제공 방법 및 장치 | |
JP2013113882A (ja) | 注記表記変換装置、注記表記変換方法および注記表記変換プログラム | |
JP5325856B2 (ja) | 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム | |
JP2009134464A (ja) | 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体 | |
CN113515687A (zh) | 物流信息的获取方法和装置 | |
JP5766104B2 (ja) | 情報提供装置及び情報提供方法 | |
JP5650607B2 (ja) | 文書検索キーワード提示装置及び方法 | |
CN113468299A (zh) | 数据处理方法、装置、电子设备及计算机存储介质 | |
JPWO2009139254A1 (ja) | 検索システム、それに用いる装置、検索方法および検索用プログラム | |
JP5228757B2 (ja) | 位置表現特定装置、位置表現特定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130716 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130722 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5325856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |