JP2009134464A - 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体 - Google Patents

地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2009134464A
JP2009134464A JP2007309282A JP2007309282A JP2009134464A JP 2009134464 A JP2009134464 A JP 2009134464A JP 2007309282 A JP2007309282 A JP 2007309282A JP 2007309282 A JP2007309282 A JP 2007309282A JP 2009134464 A JP2009134464 A JP 2009134464A
Authority
JP
Japan
Prior art keywords
place name
snippet
text
importance
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007309282A
Other languages
English (en)
Other versions
JP4921330B2 (ja
Inventor
Hiroyuki Toda
浩之 戸田
Yoshihito Yasuda
宜仁 安田
Yumiko Matsuura
由美子 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007309282A priority Critical patent/JP4921330B2/ja
Publication of JP2009134464A publication Critical patent/JP2009134464A/ja
Application granted granted Critical
Publication of JP4921330B2 publication Critical patent/JP4921330B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキスト検索を行い、各検索結果の概要を示すスニペットを取得する装置において、テキスト中に存在する位置情報を利用し、ユーザの要求に適用したスニペットを生成することができるようにする。
【解決手段】前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクサ020と、前記各地名が含意する広さを特定する地名含意範囲特定部100と、テキスト中に含まれる地名の緯度経度や含意する広さの情報を元に、テキスト中での地名の重要度を算出する地名重要度決定部220と、テキスト中に含まれる地名の重要度を元に、テキスト中の部分文書であるセンテンスを評価し、重要と考えられるセンテンスを抽出するセンテンス評価部230とを備える。
【選択図】図1

Description

本発明は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合を検索する手法に係り、特に、検索対象のテキスト中や問い合わせ中に位置情報を含む検索において、検索結果のスニペットを出力する、地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体手法に関する。
一般的なテキスト検索システムでは、ユーザの入力する検索キーワードを含む複数のテキストを特定し、それらの一覧を検索結果としてユーザに提示する。その検索結果には、個々のテキストのタイトルやURL等とともに、テキストの概要を示すスニペットが示される。これによりユーザは実際の文書を閲覧しなくともテキストの概要を把握し、所望の文書を選択する事ができる。
最も単純なスニペット生成法は、テキストの先頭から特定の大きさの文書を取得する方法である。ニュース記事等では文頭にその記事の概要が示される事も多いため有益な手段である。しかし、Webに存在する多くのテキストでは、必ずしも文頭に概要が示されないため、スニペットがユーザにとって有益でない場合も多い。
この問題に対処するため、検索結果の各文書から、ユーザにより入力されたキーワードを含む部分文書(KWIC)を抽出し、スニペットとする方法がある(非特許文献1参照)。これによると、ユーザが興味を持つキーワード近傍のテキストを提示できるので、ユーザが検索結果を閲覧する際に個々の検索結果の中から本当に欲しいものを選択する事が容易となる。
現在、Web上には膨大なテキストデータが存在し、その中には特定の場所について言及しているテキストデータが大量に存在している。また、Webサーチエンジンにおける問い合わせのうち約20%が特定の場所や地域についての問合せであると言われている(非特許文献2参照)。
このような状況の中、テキストから地名の表記を抽出し、その地名を緯度経度に変換する事により、テキストを位置に結び付ける技術(非特許文献3参照)が実用的に利用できるようになっている。この技術を利用することによりテキストに緯度経度情報を持たせる事が可能になり、地名キーワードがマッチしなくとも、ユーザの所望する場所に応じたテキスト情報を探すことが可能となる。つまり、「場所:渋谷,キーワード:レストラン」という検索要求に対して、「レストラン」というキーワードを含み、「渋谷」付近について言及しているテキストを取得する検索が可能となる。
尚、本発明の実施形態例で利用する街区レベル位置参照情報は非特許文献4に開示されている。
Drori,O.,The Benefits of Displaying Additional Internal Document Information on Textual Database Search Result Lists,Proc.of ECDL 2000(2000). Zhou,Y.,et al.:"Hybrid Index Structure for Location−based Web Search", Proc.of CIKM2005. Clough,P.:"Extracting Metadata for Spatially−Aware Information Retrieval on the Internet",Proc.of GIR2006 「街区レベル位置参照情報ダウンロードサービス、街区レベル位置参照情報とは」、街区単位(○○町△丁目□番地)の緯度経度を整備したデータ 国土交通省国土計画局 国土情報整備室、[平成19年11月20日検索] インターネット<URL:http://nlftp.mlit.go.jp/isj/about.html>
前記のような地理情報を利用して検索を行う場合、与えられる地理情報は必ずしも地名ではなく、GPSから得られた緯度経度である場合も考えられる。また地名で地理情報が与えられたとしても、一度緯度経度に変換する事により、完全にマッチするキーワードがテキスト中に存在するとは限らない。この場合、上記に示したKWICを利用する従来技術を用いた場合、検索キーワードとして入力されたキーワードを含むスニペットは得ることができるが、位置情報を含める事ができない場合が考えられる。
また、テキスト内に存在する位置情報を全て平等に扱った場合には、ノイズとなる地名やあいまいな地名によりスニペットの精度が低下する恐れがある。
本発明の目的は、上記の問題を鑑み、テキスト中に存在する位置情報を利用し、ユーザの要求に適用したスニペットを生成することができる、地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体を提供することにある。
本発明では、テキスト中に含まれる地名の緯度経度および含意する広さを利用して、テキスト中での地名の重要度を算出し、その重要度を利用したスニペットの生成を行う。
すなわち、請求項1に記載の検索結果スニペットの生成装置は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成装置において、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクス手段と、前記各地名が含意する広さを特定する地名含意範囲特定手段と、前記地理インデクス手段により割り当てられた地名の緯度経度および前記地名含意範囲特定手段により特定された地名が含意する広さの情報を元に、テキスト中での地名の重要度を算出する処理を行う地名重要度決定手段と、前記地名重要度決定手段により算出された地名の重要度を元に、テキスト中の部分文書であるセンテンスを評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価手段と、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得し、該取得した地名の重要度を前記センテンス評価手段に送信し、該センテンス評価手段から出力されたスニペットを受け付けるスニペット問合せ受付手段とを備えたことを特徴としている。
また請求項2に記載の検索結果スニペットの生成装置は、請求項1において、前記センテンス評価手段は、ユーザにより指定されたキーワードを利用して前記処理を行うことを特徴としている。
また請求項3に記載の検索結果スニペットの生成装置は、請求項1または2において、前記地名重要度決定手段は、ユーザにより指定された位置情報を利用して前記処理を行うことを特徴としている。
また請求項4に記載の検索結果スニペットの生成装置は、請求項1ないし3のいずれか1項において、前記地理インデクス手段により抽出された地名および該地名に割り当てられた緯度経度の情報が蓄積された位置情報データベースと、前記地名含意範囲特定手段により特定された地名が含意する広さの情報が蓄積された地名データベースとをさらに備え、前記地名重要度決定手段は、前記位置情報データベースおよび前記地名データベースに蓄積された情報を利用して前記処理を行うことを特徴としている。
また請求項5に記載の検索結果スニペットの生成方法は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成方法において、地理インデクス手段が、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクスステップと、地名含意範囲特定手段が、前記各地名が含意する広さを特定する地名含意範囲特定ステップと、地名重要度決定手段が、前記地理インデクスステップにより割り当てられた地名の緯度経度および前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報を元に、テキスト中での地名の重要度を算出する処理を行う地名重要度決定ステップと、スニペット問合せ受付手段が、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得するステップと、スニペット問合せ受付手段が、前記取得した地名の重要度をセンテンス評価手段に送信するステップと、センテンス評価手段が、前記スニペット問合せ受付手段から送信された地名の重要度を元に、テキスト中の部分文書であるセンテンスを評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価ステップと、スニペット問合せ受付手段が、前記センテンス評価手段から出力されたスニペットを受け付けるステップとを備えたことを特徴としている。
また請求項6に記載の検索結果スニペットの生成方法は、請求項5において、前記センテンス評価ステップは、ユーザにより指定されたキーワードを利用して前記処理を行うことを特徴としている。
また請求項7に記載の検索結果スニペットの生成方法は、請求項5または6において、前記地名重要度決定ステップは、ユーザにより指定された位置情報を利用して前記処理を行うことを特徴としている。
また請求項8に記載の検索結果スニペットの生成方法は、請求項5ないし7のいずれか1項において、前記地名重要度決定ステップは、前記地理インデクスステップにより抽出された地名および該地名に割り当てられた緯度経度の情報が蓄積される位置情報データベースと、前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報が蓄積される地名データベースとに各々蓄積された情報を利用して、前記処理を行うことを特徴としている。
また請求項9に記載の検索結果スニペットの生成プログラムは、コンピュータを、請求項1ないし4のいずれか1項に記載の各手段として機能させるプログラムであることを特徴としている。
また請求項10に記載の記録媒体は、請求項9に記載の検索結果スニペットの生成プログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
上記構成により、ユーザの指定する場所を考慮したスニペットを生成する事が可能となり、検索結果からユーザが所望のテキストを選択する事を支援できる。
請求項1〜10に記載の発明によれば、文書中に出現する地名の重要度を、その地名が含意する広さおよび検索条件として与えられた位置情報を元に推定し、その重要度を利用して検索結果のスニペットを抽出することにより、指定された場所、例えばユーザの指定する場所を考慮したスニペットを生成する事が可能となり、検索結果からユーザが所望のテキストを選択する事を支援できる。
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。図1は本発明のスニペット生成装置を利用した検索システムの構成の一例を示している。
図1において、本実施形態例の検索システムは、テキストデータベース010、地理インデクサ020、位置情報データベース030、地名含意範囲特定部100、地名データベース110、スニペット問合せ受付部210、地名重要度決定部220、センテンス評価部230、検索エンジン310、検索アプリケーション320を備えている。
上記各部は、例えばコンピュータによって実現されるものであり、以下に各機能を説明する。
テキストDB(データベース)010は、コンピュータ中のテキストやネットワークを介してアクセスできるテキスト情報を集めたデータベースである。テキストそのものの情報に加えて、検索エンジン310からアクセスされた際に、指定されたキーワードを含む文書を返却する為のインデクス構造も保持する。
地理インデクサ020は、本発明の地理インデクス手段として機能し、テキスト情報を入力として受け付け、テキスト中に含まれる地名を抽出するとともに、抽出された地名が示す実世界での位置の緯度経度および正規化した地名(都道府県名から始まる正規化された地名)を出力する。
位置情報DB(データベース)030は、個々の文書において、どの様な地名がテキスト中のどの位置で出現し、その地名が示す緯度経度を格納するデータベースである。データベースの内容例を図2に示す。
地名含意範囲特定部100は、本発明の地名含意範囲特定手段として機能し、地名が含意する広さ、すなわち地名が示す範囲を特定し、地名データベース110に登録する。地名が示す範囲としては、緯度幅、経度幅が考えられる。このデータは国土交通省が配布する街区レベル位置参照情報(非特許文献4参照)を元に、構築する事ができる。
例えば、「東京都渋谷区」の示す範囲を取得する場合には、街区レベル位置参照情報のうち、「東京都渋谷区」から始まる街区のデータを取得し、その街区データ中の緯度幅、経度幅を得ることで、該地名が示す範囲とする。
地名DB(データベース)110」は、地名含意範囲特定部100により作成されるデータを管理するデータベースである。データベースの内容例を図3に示す。
スニペット問合せ受付部210は、本発明のスニペット問合せ受付手段として機能し、検索エンジン310から検索キーワードとスニペットを生成する文書のIDを取得し、地名重要度決定部220およびセンテンス評価部230にアクセスし、該センテンス評価部230は生成されたスニペットをスニペット問合せ受付部210に返却する。
また地名重要度決定部220に対しては、文書IDを元にアクセスし、該文書中に含まれる重要度付き地名情報(地名と各地名の該文書内での重要度)を取得する。
またセンテンス評価部230に対しては、検索キーワードと文書IDと地名情報を元にアクセスし、スニペットを取得する。
地名重要度決定部220は、本発明の地名重要度決定手段として機能し、スニペット問合せ受付部210から文書IDを取得し、位置情報DB030および地名DB110にアクセスし、重要度付き地名情報をスニペット問合せ受付部210に返却する。
また位置情報DB030に対しては、文書IDを元にアクセスし、該文書中に含まれる地名情報(地名ワード,地名正規名,文書中での位置,緯度,経度)を取得する。
また地名DB110に対しては、上記で取得した地名情報の地名正規名を元にアクセスし、各地名正規名が含意する広さ(緯度幅、経度幅)を取得する。
この地名重要度決定部220は、上記で得た緯度幅および経度幅を元に各地名の重要度を算出する。重要度の算出方法の一例としては、より特化した場所を示す地名は重要であるとの仮定に基づく方法として、以下の式(1)で表現される重要度が考えられる。
Weightd,g=1/max(緯度幅,経度幅) …(1)
ここで、Weightd,gは、文書dにおける地名gの重要度を示し、max()は入力された値のうち、最大の値を返す関数である。
また、位置情報DB030のデータには、地理インデクサ020による解析誤りや文書中に出現する主題と関係が薄い地名の存在により、ノイズとなる地名情報が含まれている可能性も考えられる。この問題への対処として、各文書に含まれる地名群を一定の距離内に存在する地名同士をグループ化し、最も多くの地名が属するグループの地名だけを利用する事も考えられる。またこの場合のグループの選択法に、ユーザが指定した位置情報と各グループの近さを考慮する事も考えられる。
センテンス評価部230は、本発明のセンテンス評価手段として機能し、スニペット問合せ受付部210より、検索キーワード、文書IDおよび重要度付き地名情報を取得し、指定された文書中で、重要と思われるセンテンスを抽出し、スニペット問合せ受付部210に返却する。
まず、テキストDB010にアクセスして文書を取得し、入力された検索キーワードが文書中のどの位置に出現するかを特定する。
地名重要度決定部220により算出された重要度付き地名情報と検索キーワードの出現位置を元に、文書中の部分文書のうち重要度が高い部分文書を取得する。各部分文書の重要度の一例としては以下の式(2)が挙げられる。
d,s,q,g=FreqOfKeyword(d,s,q)+WeightedFreqOfGeoword(d,s,g) …(2)
ここで、Id,s、q、gは、検索キーワードqおよび地名gで検索された文書d中の部分文書sの重要度、FreqOfKeyword(d,s,q)は検索キーワードqが文書dの部分文書s中で出現する回数を示す関数、WeightedFreqOfGeoword(d,s,g)は、文書dの部分文書s中に出現する地名gの重みをすべて加算する関数である。
式(2)の関数WeightedFreqOfGeoword(d,s,g)は、
Figure 2009134464
である。ここで、Gsはセンテンスs中に含まれる地名の集合、Weightd,gは、上記で示した通り、文書dにおける地名gの重要度を示す。
検索エンジン310は、検索アプリケーション320から検索キーワードおよび位置情報を受け付け、テキストDB010および位置情報DB030にアクセスし検索結果の文書を取得し、検索結果として提示する文書についてスニペット問合せ受付部210に問合せを行い、スニペット問合せ受付部210からのスニペットを、検索結果として検索アプリケーション320に返却する。
検索アプリケーション320は、ユーザとのインタフェースであり、ユーザから検索条件(検索キーワード、位置情報)の入力を受け付け、検索エンジン310にアクセスし、得られた検索結果をユーザに提示する。
前記位置情報DB030および地名DB110の作成は、前処理としてそれぞれ地理インデクサ020および地名含意範囲特定部100により行われる。
本発明の処理プロセスのうち、検索処理についてのフローを図4に示す。図4において、まずステップS1では、検索アプリケーション320を通じて、ユーザから検索キーワードと位置情報が入力される。次にステップS2において、検索アプリケーション320は、検索キーワードと位置情報を検索エンジン310に送信する。次にステップS3において、検索エンジン310は、テキストDB010と位置情報DB030にアクセスし、検索結果の文書を得る。
次にステップS4において、検索エンジン310は、得られた検索結果の文書および検索キーワードをスニペット問合せ受付部210に送信する。次にステップS5においてスニペット問合せ受付部210は、文書IDを地名重要度決定部220に送信する。
次にステップS6において、地名重要度決定部220は、位置情報DB030にアクセスし、該文書IDの文書が持つ位置情報を取得する。次にステップS7いおいて、地名重要度決定部220は、地名DB110にアクセスし、位置情報に含まれる各地名が含意する広さを取得する。
次にステップS8において、地名重要度決定部220は、取得した各地名の含意する広さを元に各地名の重要度を算出する。次にステップS9において、地名重要度決定部220は、重要度付き位置情報をスニペット問合せ受付部210に返却する。次にステップS10において、スニペット問合せ受付部210は、検索キーワード、文書IDおよび重要度付き位置情報をセンテンス評価部230に送信する。
次にステップS11において、センテンス評価部230は、文書IDを元にテキストDB010にアクセスし、該文書IDの文書を取得する。次にステップS12において、センテンス評価部230は、検索キーワードが文書のどの位置に出現するかを特定する。
次にステップS13において、センテンス評価部230は、検索キーワードの出現位置、地名の出現位置および地名の重要度から、部分文書の重要度を算出する。次にステップS14において、全部分文書について重要度を算出したか否かを判定し、算出済みの場合、ステップS15においてセンテンス評価部230が、最も重要度の高い部分文書をスニペットとしてスニペット問合せ受付部210に送信する。
次にステップS16において、全検索結果についてスニペットを取得済みか否かを判定し、取得済みの場合、ステップS17においてスニペット問合せ受付部210が、すべてのスニペットを検索エンジン310に送信する。
次にステップS18において、検索エンジン310は、検索結果にスニペットを加えて検索アプリケーション320に送信する。次にステップS19において、検索アプリケーション320は、受信した検索結果を整形し、ユーザに提示する。
尚、前記ステップS14の判定において算出済みではない場合はステップS13に戻り、ステップS16の判定において取得済みではない場合はステップS4に戻る。
本発明の地名が意味する範囲を考慮した検索結果スニペットの生成方法は、例えば前記図1、図4で述べた各機能、各処理を実行するものである。
また前記本発明の検索結果スニペットの生成方法をコンピュータに実行させるためのプログラムを構築するものである。
また、本実施形態の検索結果スニペットの生成装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態の検索結果スニペットの生成方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R,CD−RW,HDD,リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
以上、本発明を実施形態例に基づき具体的に説明したが、本発明は上述の実施例に限定されるものではなく、幅広く応用することができる。
本発明のスニペット生成装置の一実施形態例を示す構成図。 本発明のスニペット生成装置の一実施形態例における位置情報DBの一例を示す説明図。 本発明のスニペット生成装置の一実施形態例における地名DBの一例を示す説明図。 本発明のスニペット生成方法の一実施形態例を示すフローチャート。
符号の説明
010…テキストデータベース、020…地理インデクサ、030…位置情報データベース、100…地名含意範囲特定部、110…地名データベース、210…スニペット問合せ受付部、220…地名重要度決定部、230…センテンス評価部、310…検索エンジン、320…検索アプリケーション。

Claims (10)

  1. コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成装置において、
    前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクス手段と、
    前記各地名が含意する広さを特定する地名含意範囲特定手段と、
    前記地理インデクス手段により割り当てられた地名の緯度経度および前記地名含意範囲特定手段により特定された地名が含意する広さの情報を元に、テキスト中での地名の重要度を算出する処理を行う地名重要度決定手段と、
    前記地名重要度決定手段により算出された地名の重要度を元に、テキスト中の部分文書であるセンテンスを評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価手段と、
    前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得し、該取得した地名の重要度を前記センテンス評価手段に送信し、該センテンス評価手段から出力されたスニペットを受け付けるスニペット問合せ受付手段と
    を備えたことを特徴とする地名が意味する範囲を考慮した検索結果スニペットの生成装置。
  2. 前記センテンス評価手段は、ユーザにより指定されたキーワードを利用して前記処理を行うことを特徴とする請求項1に記載の地名が意味する範囲を考慮した検索結果スニペットの生成装置。
  3. 前記地名重要度決定手段は、ユーザにより指定された位置情報を利用して前記処理を行うことを特徴とする請求項1または2に記載の地名が意味する範囲を考慮した検索結果スニペットの生成装置。
  4. 前記地理インデクス手段により抽出された地名および該地名に割り当てられた緯度経度の情報が蓄積された位置情報データベースと、
    前記地名含意範囲特定手段により特定された地名が含意する広さの情報が蓄積された地名データベースとをさらに備え、
    前記地名重要度決定手段は、前記位置情報データベースおよび前記地名データベースに蓄積された情報を利用して前記処理を行うことを特徴とする請求項1ないし3のいずれか1項に記載の地名が意味する範囲を考慮した検索結果スニペットの生成装置。
  5. コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成方法において、
    地理インデクス手段が、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクスステップと、
    地名含意範囲特定手段が、前記各地名が含意する広さを特定する地名含意範囲特定ステップと、
    地名重要度決定手段が、前記地理インデクスステップにより割り当てられた地名の緯度経度および前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報を元に、テキスト中での地名の重要度を算出する処理を行う地名重要度決定ステップと、
    スニペット問合せ受付手段が、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得するステップと、
    スニペット問合せ受付手段が、前記取得した地名の重要度をセンテンス評価手段に送信するステップと、
    センテンス評価手段が、前記スニペット問合せ受付手段から送信された地名の重要度を元に、テキスト中の部分文書であるセンテンスを評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価ステップと、
    スニペット問合せ受付手段が、前記センテンス評価手段から出力されたスニペットを受け付けるステップと
    を備えたことを特徴とする地名が意味する範囲を考慮した検索結果スニペットの生成方法。
  6. 前記センテンス評価ステップは、ユーザにより指定されたキーワードを利用して前記処理を行うことを特徴とする請求項5に記載の地名が意味する範囲を考慮した検索結果スニペットの生成方法。
  7. 前記地名重要度決定ステップは、ユーザにより指定された位置情報を利用して前記処理を行うことを特徴とする請求項5または6に記載の地名が意味する範囲を考慮した検索結果スニペットの生成方法。
  8. 前記地名重要度決定ステップは、前記地理インデクスステップにより抽出された地名および該地名に割り当てられた緯度経度の情報が蓄積される位置情報データベースと、前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報が蓄積される地名データベースとに各々蓄積された情報を利用して、前記処理を行うことを特徴とする請求項5ないし7のいずれか1項に記載の地名が意味する範囲を考慮した検索結果スニペットの生成方法。
  9. コンピュータを、請求項1ないし4のいずれか1項に記載の各手段として機能させる、地名が意味する範囲を考慮した検索結果スニペットの生成プログラム。
  10. 請求項9に記載の地名が意味する範囲を考慮した検索結果スニペットの生成プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007309282A 2007-11-29 2007-11-29 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体 Active JP4921330B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007309282A JP4921330B2 (ja) 2007-11-29 2007-11-29 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007309282A JP4921330B2 (ja) 2007-11-29 2007-11-29 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2009134464A true JP2009134464A (ja) 2009-06-18
JP4921330B2 JP4921330B2 (ja) 2012-04-25

Family

ID=40866290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007309282A Active JP4921330B2 (ja) 2007-11-29 2007-11-29 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4921330B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013003670A (ja) * 2011-06-13 2013-01-07 Yahoo Japan Corp 検索サーバ及び方法
JP2013030042A (ja) * 2011-07-29 2013-02-07 Zenrin Co Ltd 電子書籍表示装置
JP2013045435A (ja) * 2011-08-26 2013-03-04 Nippon Telegr & Teleph Corp <Ntt> キーワード関連地名抽出装置及び方法及びプログラム
JP2013228888A (ja) * 2012-04-25 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> 地域推定装置及び方法及びプログラム
CN113626536A (zh) * 2021-07-02 2021-11-09 武汉大学 一种基于深度学习的新闻地理编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207744A (ja) * 2001-01-12 2002-07-26 Nippon Telegr & Teleph Corp <Ntt> 位置関連情報提供装置、方法、プログラム、及びそのプログラムを記録した記録媒体
JP2003202801A (ja) * 2002-01-09 2003-07-18 Nissan Motor Co Ltd 地図画像表示装置、地図画像表示方法及び地図画像表示プログラム
WO2003079229A1 (fr) * 2002-03-15 2003-09-25 Fujitsu Limited Procédé et dispositif de recherche d'informations de régions
JP2004152174A (ja) * 2002-10-31 2004-05-27 Sony Corp コンテンツ再生装置、コンテンツ提供システム、コンテンツ検索方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002207744A (ja) * 2001-01-12 2002-07-26 Nippon Telegr & Teleph Corp <Ntt> 位置関連情報提供装置、方法、プログラム、及びそのプログラムを記録した記録媒体
JP2003202801A (ja) * 2002-01-09 2003-07-18 Nissan Motor Co Ltd 地図画像表示装置、地図画像表示方法及び地図画像表示プログラム
WO2003079229A1 (fr) * 2002-03-15 2003-09-25 Fujitsu Limited Procédé et dispositif de recherche d'informations de régions
JP2004152174A (ja) * 2002-10-31 2004-05-27 Sony Corp コンテンツ再生装置、コンテンツ提供システム、コンテンツ検索方法、およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013003670A (ja) * 2011-06-13 2013-01-07 Yahoo Japan Corp 検索サーバ及び方法
JP2013030042A (ja) * 2011-07-29 2013-02-07 Zenrin Co Ltd 電子書籍表示装置
JP2013045435A (ja) * 2011-08-26 2013-03-04 Nippon Telegr & Teleph Corp <Ntt> キーワード関連地名抽出装置及び方法及びプログラム
JP2013228888A (ja) * 2012-04-25 2013-11-07 Nippon Telegr & Teleph Corp <Ntt> 地域推定装置及び方法及びプログラム
CN113626536A (zh) * 2021-07-02 2021-11-09 武汉大学 一种基于深度学习的新闻地理编码方法
CN113626536B (zh) * 2021-07-02 2023-08-15 武汉大学 一种基于深度学习的新闻地理编码方法

Also Published As

Publication number Publication date
JP4921330B2 (ja) 2012-04-25

Similar Documents

Publication Publication Date Title
JP4909334B2 (ja) サービス提案装置及びその方法、サービス提案システム、ユーザのお気に入りベースに基づくサービス提案装置及びその方法
CN101647020B (zh) 搜索结构化地理数据
US20090119268A1 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US20050004903A1 (en) Regional information retrieving method and regional information retrieval apparatus
KR101274388B1 (ko) 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을수행하기 위한 시스템
JP5087377B2 (ja) 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体
KR100810999B1 (ko) 온라인 이메일 서비스 시스템 및 그 방법
US8150979B1 (en) Supporting multiple landing pages
CN101178728A (zh) 一种网址导航的方法和系统
KR100892842B1 (ko) 사용자 중심 정보탐색 방법 및 시스템
KR20110114055A (ko) 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법
US8099430B2 (en) Computer method and apparatus of information management and navigation
JP4921330B2 (ja) 地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体
JP2010128883A (ja) 地点関連情報提供装置、地点関連情報提供方法およびプログラム
US20090063959A1 (en) Document creation support system
JP5221664B2 (ja) 情報マップ管理システムおよび情報マップ管理方法
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
CN101676901A (zh) 搜索调度方法及搜索服务器
US20130304370A1 (en) Method and apparatus to provide location information
JP5351123B2 (ja) 文書検索キーワード提示装置および文書検索キーワード提示プログラム
JP4921500B2 (ja) テキスト検索結果ランキング装置、テキスト検索結果ランキング方法、テキスト検索結果ランキングプログラムおよびそのプログラムを記録した記録媒体
WO2019069507A1 (ja) 特徴量生成装置、特徴量生成方法および特徴量生成プログラム
JP5639549B2 (ja) 情報検索装置及び方法及びプログラム
KR20100038344A (ko) 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을 수행하기 위한 시스템
KR100943625B1 (ko) 지역 정보와 웹사이트 정보의 통합 관리를 위한 통합데이터베이스 생성 방법 및 시스템과 그에 의해 생성된통합 데이터베이스를 이용한 검색 결과 제공 방법

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090618

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090904

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120124

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120202

R150 Certificate of patent or registration of utility model

Ref document number: 4921330

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350