JP5351123B2 - 文書検索キーワード提示装置および文書検索キーワード提示プログラム - Google Patents
文書検索キーワード提示装置および文書検索キーワード提示プログラム Download PDFInfo
- Publication number
- JP5351123B2 JP5351123B2 JP2010236654A JP2010236654A JP5351123B2 JP 5351123 B2 JP5351123 B2 JP 5351123B2 JP 2010236654 A JP2010236654 A JP 2010236654A JP 2010236654 A JP2010236654 A JP 2010236654A JP 5351123 B2 JP5351123 B2 JP 5351123B2
- Authority
- JP
- Japan
- Prior art keywords
- mesh
- place name
- feature
- feature expression
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(文書DB101)
文書DB101には前処理において与えられた文書集合が格納される。
地名範囲DB102とは、図2に示すように各地名に対応する最小外接矩形の対角点、すなわちその地名を含むもっとも小さな矩形の対角線の両端の座標を記したものである。
地名−特徴表現対応抽出部103は、図3のフローチャートに示す手順により、地名と特徴表現、およびその基本スコアの対応を抽出する。図3において、ループL10は以下のステップS11〜S13の処理を文書DB101中の各文書について繰り返し実行する。
文書DB101中の各文書について、文書中に記述された地名と思われる表現を抽出する。地名は必ずしも正規の住所表現でなくとも、断片的な地名(たとえば「浜松」など)でも構わない。これには非特許文献3等で示される従来の手法を用いることができる。
前記文書から何らかの地名が抽出された場合、該抽出された地名について以下の2つの基準により、特徴表現を抽出する。
(b)地名と近接して出現した名詞・フレーズ・固有表現
ステップS13:基本スコアの算出
事前に定めた定数α、βより、前記抽出した各特徴表現について、以下の式(1)で基本スコアを算出する。
当該地名−特徴表現の対について既に他の文書によって基本スコアが計算済みであればそれまでの基本スコアに上記基本スコアを足したものを基本スコアとする。
メッシュ-特徴表現スコア算出部104では、地名−特徴表現対応抽出部103によって作成された表(図4)を入力として図5のフローチャートに示す手順により、メッシュと特徴表現の対についてのスコアを算出し出力する。
まず、地名−特徴表現対応抽出部103の出力のうち地名のエントリに対して地名範囲DB102を参照し、その範囲に含まれるメッシュを特定する。
前記ステップS21の処理により特定されたメッシュの個数をMとし、地名−特徴表現対応抽出部103の出力の基本スコアをSとすると、各メッシュの特徴表現のスコアを以下の式(2)を用いて算出する。
もし既に当該メッシュIDと特徴表現の対が図6の表(メッシュ-特徴表現スコアの表)中に含まれれば、そのスコアに上記スコアを追加し、もしまだ当該対が表中に含まれていなければ対応する列を表に追加する。
以上の手順により算出し作成された図6のようなメッシュ−特徴表現スコアの表を、メッシュ−特徴表現対応DB105に格納する。
(地図範囲でのメッシュスコア算出部106)
地図範囲でのメッシュスコア算出部106は、図7のフローチャートに沿って利用者の地図範囲に応じた特徴表現を選出するものであり、利用者が閲覧している地図の範囲(利用者端末200からの、利用者が現在閲覧している地図の緯度、経度情報)を入力とする。
まず、閲覧中の地図範囲に含まれるメッシュの一覧を作成する。この地図範囲に含まれるメッシュの総数をLとする。
まず、地図範囲に含まれるすべてのメッシュについて、前記メッシュ-特徴表現対応DB105を参照してその特徴語(特徴表現)についてのスコアの和を算出する。この和をBとする。
次に前記各メッシュについて以下の式(3)の値(スコアの比率)を算出する。
式(3)が示すスコアの比率は、閲覧地図範囲内において、そのメッシュがどれほどきわだってその特徴語のスコアが高いかを示す値(特定の特徴語のスコアの比率)であると考えられる。この式(3)の値を限定時上昇スコアと呼ぶ。
上記手順により得られた、地図範囲内の各メッシュとすべての特徴語(特徴表現)の組合せについての限定時上昇スコアがもっとも高い上位のD件について、メッシュと特徴表現の対を利用者に対して出力する。
101…文書DB
102…地名範囲DB
103…地名-特徴表現対応抽出部
104…メッシュ-特徴表現スコア算出部
105…メッシュ-特徴表現対応DB
106…地図範囲でのメッシュスコア算出部
Claims (3)
- 地名に対応する最小外接矩形の対角点の情報が地名に対応する範囲として格納された地名範囲データベースと、
文書データベース中に格納された各文書について地名と思われる表現を抽出し、該抽出された地名について特徴表現を抽出し、該抽出した各地名と特徴表現の対について、地名に対する特徴表現の出現頻度を示す基本スコアを算出する地名-特徴表現対応抽出手段と、
日本又は世界全体を緯度経度それぞれ決められた度数で区切った矩形をメッシュとして定義し、前記地名-特徴表現対応抽出手段で抽出された地名に対応する範囲を前記地名範囲データベースから得て、該地名範囲に含まれるメッシュを特定し、前記地名-特徴表現対応抽出手段により算出された基本スコアを前記特定したメッシュの個数で除してメッシュ-特徴表現スコアを算出し、該算出されたメッシュ-特徴表現スコアをメッシュ-特徴表現対応データベースに格納するメッシュ-特徴表現スコア算出手段と、
利用者端末から入力された地図範囲の情報に基づいて、地図範囲に含まれる前記メッシュの一覧を作成し、前記地図範囲に含まれるすべてのメッシュに対して、その特徴表現についてのスコアの和を前記メッシュ-特徴表現対応データベースを参照して算出し、前記地図範囲に含まれる各メッシュでの当該特徴表現のスコアを、前記算出されたスコアの和で除して各特徴表現のスコアの比率を算出し、該算出されたスコアの比率の高い所定件数のメッシュと特徴表現の対を出力する地図範囲でのメッシュスコア算出手段と、
を備えたことを特徴とする文書検索キーワード提示装置。 - 前記地図範囲でのメッシュスコア算出手段における特徴表現についてのスコアの和の算出は、各メッシュで頻出する特徴表現についてのみ行なうことを特徴とする請求項1に記載の文書検索キーワード提示装置。
- コンピュータを請求項1又は2に記載の各手段として機能させる文書検索キーワード提示プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010236654A JP5351123B2 (ja) | 2010-10-21 | 2010-10-21 | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010236654A JP5351123B2 (ja) | 2010-10-21 | 2010-10-21 | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012089019A JP2012089019A (ja) | 2012-05-10 |
JP5351123B2 true JP5351123B2 (ja) | 2013-11-27 |
Family
ID=46260559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010236654A Active JP5351123B2 (ja) | 2010-10-21 | 2010-10-21 | 文書検索キーワード提示装置および文書検索キーワード提示プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5351123B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5639549B2 (ja) * | 2011-08-22 | 2014-12-10 | 日本電信電話株式会社 | 情報検索装置及び方法及びプログラム |
JP5815467B2 (ja) * | 2012-05-10 | 2015-11-17 | 日本電信電話株式会社 | 検索キーワード提示装置及び方法及びプログラム |
JP5798086B2 (ja) * | 2012-06-11 | 2015-10-21 | 日本電信電話株式会社 | 文書からの地名と語の対の抽出装置及び方法及びプログラム |
JP5758943B2 (ja) * | 2013-04-04 | 2015-08-05 | 日本電信電話株式会社 | 情報提供装置、情報提供方法、及びプログラム |
JP7323484B2 (ja) * | 2020-03-19 | 2023-08-08 | ヤフー株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001229186A (ja) * | 2000-02-18 | 2001-08-24 | Dainippon Printing Co Ltd | 地図複合情報作成システム |
JP2002041752A (ja) * | 2000-07-19 | 2002-02-08 | Itochu Techno-Science Corp | 詳細統計データの作成方法 |
JP2004118733A (ja) * | 2002-09-27 | 2004-04-15 | Tokyo Gas Co Ltd | 地図上の任意エリア抽出システム、地図上の任意エリア抽出方法および地図上の任意エリア抽出用プログラム |
JP4812661B2 (ja) * | 2006-03-27 | 2011-11-09 | 株式会社デンソーアイティーラボラトリ | 地図表示システムおよび地図表示方法 |
JP5087377B2 (ja) * | 2007-11-29 | 2012-12-05 | 日本電信電話株式会社 | 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体 |
JP5224453B2 (ja) * | 2008-07-18 | 2013-07-03 | Kddi株式会社 | 地理的特徴情報抽出方法およびシステム |
-
2010
- 2010-10-21 JP JP2010236654A patent/JP5351123B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012089019A (ja) | 2012-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6906419B2 (ja) | 情報提供装置、情報提供方法、およびプログラム | |
JP2017157192A (ja) | キーワードに基づいて画像とコンテンツアイテムをマッチングする方法 | |
JP5371480B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6966158B2 (ja) | 検索データを処理するための方法、装置及びプログラム | |
KR20200091486A (ko) | 동적 언어 모델 | |
JP5351123B2 (ja) | 文書検索キーワード提示装置および文書検索キーワード提示プログラム | |
JP6363682B2 (ja) | 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法 | |
KR20100046586A (ko) | 맵 기반의 웹 검색 방법 및 장치 | |
CN111159431A (zh) | 基于知识图谱的信息可视化方法、装置、设备及存储介质 | |
CN106796599B (zh) | 基于附近位置解释用户查询 | |
CN106462603B (zh) | 对多个实体隐含的查询的歧义消除 | |
JP6079207B2 (ja) | キーワード提示プログラム、キーワード提示方法及びキーワード提示装置 | |
JP2008040869A (ja) | 地点情報評価装置、地点情報評価プログラム | |
US20160055218A1 (en) | Interpreting user queries based on device orientation | |
JP2011039835A (ja) | コンテンツ検索装置 | |
US8005845B2 (en) | System and method for automatically ranking lines of text | |
JP5670944B2 (ja) | 文書要約装置及び方法及びプログラム | |
JP7354019B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP2012058809A (ja) | 文書検索キーワード提示装置、文書検索キーワード提示方法および文書検索キーワード提示プログラム | |
CN114064638B (zh) | 一种信息处理的方法、装置、设备及存储介质 | |
JP5416723B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム | |
JP5766104B2 (ja) | 情報提供装置及び情報提供方法 | |
JP6986055B2 (ja) | コンテンツ制御装置、コンテンツ制御システム、コンテンツ制御方法、及びコンテンツ制御プログラム | |
JP2009064268A (ja) | 検索装置、検索システム、検索方法ならびにそのプログラムと記録媒体 | |
JP5178258B2 (ja) | データ配信装置及びデータ配信方法及びデータ配信プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130822 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5351123 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |