JP5579141B2 - 地域に関する文書専門度判定装置及び方法及びプログラム - Google Patents
地域に関する文書専門度判定装置及び方法及びプログラム Download PDFInfo
- Publication number
- JP5579141B2 JP5579141B2 JP2011193520A JP2011193520A JP5579141B2 JP 5579141 B2 JP5579141 B2 JP 5579141B2 JP 2011193520 A JP2011193520 A JP 2011193520A JP 2011193520 A JP2011193520 A JP 2011193520A JP 5579141 B2 JP5579141 B2 JP 5579141B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- place name
- name expression
- expression
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
前記文書から地名表現と該地名の位置座標を抽出し、文書内地名表現データベースに格納する地名表現抽出手段と、
前記文書内地名表現データベースから前記地名表現を読み込み、地名表現の階層が低いほど地名表現言及専門度を高く設定し、該地名表現毎に該地名表現言及専門度を付与して該文書内地名表現データベースに格納する地名表現言及専門度算出手段と、
前記文書内地名表現データベースから、前記地名表現毎の位置座標を取得して、該位置座標の分布に基づいて、判定対象となる地理範囲を算出する文書内地理範囲算出手段と、
前記地名表現言及専門度算出手段で求められた文書内地名表現の言及専門度の総和Aと、前記判定対象となる地理範囲内の文書内地理表現の言及専門度の総和Bを求め、総和Bを総和Aで除した値を、文書内地理表現密度とする文書内言及地理表現密度算出手段と、
前記文書内地理表現密度を前記地理範囲で除した値を文書専門度とする文書専門度算出手段と、を有する。
前記地名表現言及専門度算出手段に、前記地名表現が前記正規の住所である地名表現について、最上位の都道府県の階層を最上位層とし、どの階層から記述されているかによりレベルを付与する手段を含む。
ノイズとなる地名が取り除かれた地名表現について前記地理範囲を算出する手段を含む。
また、一つの文書中に含まれる座標が多数の場合、それらの座標についてすべて誤りなく住所表現抽出部1によって正しい座標が付与されるわけではない場合には、本来であれば近接した住所についての地名表現であったものが誤って遠方の地名として取り扱われて、遠方の座標が付与されてしまうことがある。このような場合に、本来文書が言及していた地理範囲よりも過大に広い範囲を言及しているかのように取り扱ってしまうことを防ぐため、すべての地名表現を用いて文書内言及地理範囲を算出するのではなく、ノイズと思われる地名を取り除いた上で文書内言及地理範囲を算出してもよい。このようなノイズと見做せるような地名の除去については、文献2「安田宜仁、戸田浩之、"検索位置のごく周辺を対象とした地理情報検索",人工知能学会論文誌,Vol. 23, No.5, pp.364-373, 2008年7月」に示されるような、地名表現のクラスタリング手法による手法を用いることができる。
2 地名表現言及専門度算出部
3 文書内言及地理範囲算出部
4 文書内言及地理表現密度算出部
5 文書専門度算出部
6 文書内地名表現データベース
Claims (7)
- 入力された文書の地域に関する専門度を判定するための地域に関する文書専門度判定装置であって、
前記文書から地名表現と該地名の位置座標を抽出し、文書内地名表現データベースに格納する地名表現抽出手段と、
前記文書内地名表現データベースから前記地名表現を読み込み、地名表現の階層が低いほど地名表現言及専門度を高く設定し、該地名表現毎に該地名表現言及専門度を付与して該文書内地名表現データベースに格納する地名表現言及専門度算出手段と、
前記文書内地名表現データベースから、前記地名表現毎の位置座標を取得して、該位置座標の分布に基づいて、判定対象となる地理範囲を算出する文書内地理範囲算出手段と、
前記地名表現言及専門度算出手段で求められた文書内地名表現の言及専門度の総和Aと、前記判定対象となる地理範囲内の文書内地理表現の言及専門度の総和Bを求め、総和Bを総和Aで除した値を、文書内地理表現密度とする文書内言及地理表現密度算出手段と、
前記文書内地理表現密度を前記地理範囲で除した値を文書専門度とする文書専門度算出手段と、
を有することを特徴とする地域に関する文書専門度判定装置。 - 前記地名表現抽出手段は、
前記地名表現の正規の住所と対応する代表点の座標を取得する手段を含み、
前記地名表現言及専門度算出手段は、
前記地名表現が前記正規の住所である地名表現について、最上位の都道府県の階層を最上位層とし、どの階層から記述されているかによりレベルを付与する手段を含む
請求項1記載の地域に関する文書専門度判定装置。 - 前記文書内地理範囲算出手段は、
ノイズとなる地名が取り除かれた地名表現について前記地理範囲を算出する手段を含む
請求項1記載の地域に関する文書専門度判定装置。 - 入力された文書の地域に関する専門度を判定するための地域に関する文書専門度判定方法であって、
地名表現抽出手段が、前記文書から地名表現と該地名の位置座標を抽出し、文書内地名表現データベースに格納する地名表現抽出ステップと、
地名表現言及専門度算出手段が、前記文書内地名表現データベースから前記地名表現を読み込み、地名表現の階層が低いほど地名表現言及専門度を高く設定し、該地名表現毎に該地名表現言及専門度を付与して該文書内地名表現データベースに格納する地名表現言及専門度算出ステップと
文書内地理範囲算出手段が、前記文書内地名表現データベースから、前記地名表現毎の位置座標を取得して、該位置座標の分布に基づいて、判定対象となる地理範囲を算出する文書内地理範囲算出ステップと、
文書内言及地理表現密度算出手段が、前記地名表現言及専門度算出ステップで求められた文書内地名表現の言及専門度の総和Aと、前記判定対象となる地理範囲内の文書内地理表現の言及専門度の総和Bを求め、総和Bを総和Aで除した値を、文書内地理表現密度とする文書内言及地理表現密度算出ステップと、
文書専門度算出手段が、前記文書内地理表現密度を前記地理範囲で除した値を文書専門度とする文書専門度算出ステップと、
を有することを特徴とする地域に関する文書専門度判定方法。 - 前記地名表現抽出ステップにおいて、
前記地名表現の正規の住所と対応する代表点の座標を取得し、
前記地名表現言及専門度算出ステップにおいて、
前記地名表現が前記正規の住所である地名表現について、最上位の都道府県の階層を最上位層とし、どの階層から記述されているかによりレベルを付与する
請求項4記載の地域に関する文書専門度判定方法。 - 前記文書内地理範囲算出ステップにおいて、
ノイズとなる地名が取り除かれた地名表現について前記地理範囲を算出する
請求項4記載の地域に関する文書専門度判定方法。 - コンピュータを、
請求項1乃至3のいずれか1項に記載の判定装置の各手段として機能させるための地域に関する文書専門度判定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011193520A JP5579141B2 (ja) | 2011-09-06 | 2011-09-06 | 地域に関する文書専門度判定装置及び方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011193520A JP5579141B2 (ja) | 2011-09-06 | 2011-09-06 | 地域に関する文書専門度判定装置及び方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013054620A JP2013054620A (ja) | 2013-03-21 |
JP5579141B2 true JP5579141B2 (ja) | 2014-08-27 |
Family
ID=48131534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011193520A Expired - Fee Related JP5579141B2 (ja) | 2011-09-06 | 2011-09-06 | 地域に関する文書専門度判定装置及び方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5579141B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6136702B2 (ja) * | 2013-07-24 | 2017-05-31 | 富士通株式会社 | 場所推定方法、場所推定装置および場所推定プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4249929B2 (ja) * | 2002-01-31 | 2009-04-08 | 株式会社ゼンリン | 住所情報と位置座標のマッチング方法 |
CN101661461B (zh) * | 2008-08-29 | 2016-01-13 | 阿里巴巴集团控股有限公司 | 确定文档中核心地理信息的方法、系统 |
JP5375056B2 (ja) * | 2008-12-02 | 2013-12-25 | 沖電気工業株式会社 | 位置表現特定装置、位置表現特定方法及びプログラム |
-
2011
- 2011-09-06 JP JP2011193520A patent/JP5579141B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013054620A (ja) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Backes et al. | walk2friends: Inferring social links from mobility profiles | |
He et al. | Using the Baidu search index to predict the incidence of HIV/AIDS in China | |
Drakonakis et al. | Please forget where I was last summer: The privacy risks of public location (meta) data | |
CN110431817A (zh) | 识别恶意网络设备 | |
CN104579773B (zh) | 域名系统分析方法及装置 | |
CN111417954A (zh) | 基于数据去标识过程的可允许配置的检测的数据去标识 | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
JP2010020490A (ja) | 未訪問地の情報提供装置及び未訪問地の情報提供方法 | |
WO2013110357A1 (en) | Social network analysis | |
JP2020201935A (ja) | プライバシ信頼性に基づくapiアクセス | |
Tsou et al. | Identifying data noises, user biases, and system errors in geo-tagged twitter messages (Tweets) | |
JP6988521B2 (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
KR101450453B1 (ko) | 컨텐츠 추천 방법 및 장치 | |
Oku et al. | Tweet-mapping method for tourist spots based on now-tweets and spot-photos | |
Liu et al. | Where are you tweeting? a context and user movement based approach | |
Liu et al. | Enhancing fine-grained intra-urban dengue forecasting by integrating spatial interactions of human movements between urban regions | |
Guo et al. | Cosolorec: Joint factor model with content, social, location for heterogeneous point-of-interest recommendation | |
JP5579141B2 (ja) | 地域に関する文書専門度判定装置及び方法及びプログラム | |
Lin et al. | Linking personally identifiable information from the dark web to the surface web: A deep entity resolution approach | |
Wang et al. | A de-anonymization attack on geo-located data considering spatio-temporal influences | |
JP5903376B2 (ja) | 情報推薦装置、情報推薦方法、及び情報推薦プログラム | |
Zhu et al. | Structural attack to anonymous graph of social networks | |
JP6126516B2 (ja) | 訪問poi推定装置 | |
Risch et al. | Measuring and facilitating data repeatability in web science | |
Routledge et al. | Inference of malaria reproduction numbers in three elimination settings by combining temporal data and distance metrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130910 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20131004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140312 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5579141 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |