JP4921330B2 - Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means - Google Patents
Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means Download PDFInfo
- Publication number
- JP4921330B2 JP4921330B2 JP2007309282A JP2007309282A JP4921330B2 JP 4921330 B2 JP4921330 B2 JP 4921330B2 JP 2007309282 A JP2007309282 A JP 2007309282A JP 2007309282 A JP2007309282 A JP 2007309282A JP 4921330 B2 JP4921330 B2 JP 4921330B2
- Authority
- JP
- Japan
- Prior art keywords
- place name
- importance
- snippet
- text
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合を検索する手法に係り、特に、検索対象のテキスト中や問い合わせ中に位置情報を含む検索において、検索結果のスニペットを出力する、地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体手法に関する。 The present invention relates to a method for searching a text set existing in a computer or accessible via a computer network, and outputs a snippet of a search result particularly in a search including position information in a text to be searched or a query. Further, the present invention relates to a search result snippet generation device, a generation method, a generation program, and a recording medium technique in which the generation program is recorded in consideration of a range that a place name means.
一般的なテキスト検索システムでは、ユーザの入力する検索キーワードを含む複数のテキストを特定し、それらの一覧を検索結果としてユーザに提示する。その検索結果には、個々のテキストのタイトルやURL等とともに、テキストの概要を示すスニペットが示される。これによりユーザは実際の文書を閲覧しなくともテキストの概要を把握し、所望の文書を選択する事ができる。 In a general text search system, a plurality of texts including a search keyword input by a user are specified, and a list thereof is presented to the user as a search result. In the search result, a snippet showing an outline of the text is shown together with the title and URL of each text. As a result, the user can grasp the outline of the text without selecting an actual document and can select a desired document.
最も単純なスニペット生成法は、テキストの先頭から特定の大きさの文書を取得する方法である。ニュース記事等では文頭にその記事の概要が示される事も多いため有益な手段である。しかし、Webに存在する多くのテキストでは、必ずしも文頭に概要が示されないため、スニペットがユーザにとって有益でない場合も多い。 The simplest snippet generation method is a method of acquiring a document of a specific size from the beginning of text. News articles are useful tools because they often show the outline of the article at the beginning of the sentence. However, in many texts existing on the Web, the summary is not always shown at the beginning of the sentence, so the snippet is often not useful to the user.
この問題に対処するため、検索結果の各文書から、ユーザにより入力されたキーワードを含む部分文書(KWIC)を抽出し、スニペットとする方法がある(非特許文献1参照)。これによると、ユーザが興味を持つキーワード近傍のテキストを提示できるので、ユーザが検索結果を閲覧する際に個々の検索結果の中から本当に欲しいものを選択する事が容易となる。 In order to cope with this problem, there is a method of extracting a partial document (KWIC) including a keyword input by a user from each document as a search result and making it a snippet (see Non-Patent Document 1). According to this, since the text in the vicinity of the keyword that the user is interested in can be presented, it becomes easy for the user to select what is really desired from the individual search results when browsing the search results.
現在、Web上には膨大なテキストデータが存在し、その中には特定の場所について言及しているテキストデータが大量に存在している。また、Webサーチエンジンにおける問い合わせのうち約20%が特定の場所や地域についての問合せであると言われている(非特許文献2参照)。 Currently, there is an enormous amount of text data on the Web, and there is a large amount of text data that refers to a specific place. Further, it is said that about 20% of inquiries in the Web search engine are inquiries about a specific place or region (see Non-Patent Document 2).
このような状況の中、テキストから地名の表記を抽出し、その地名を緯度経度に変換する事により、テキストを位置に結び付ける技術(非特許文献3参照)が実用的に利用できるようになっている。この技術を利用することによりテキストに緯度経度情報を持たせる事が可能になり、地名キーワードがマッチしなくとも、ユーザの所望する場所に応じたテキスト情報を探すことが可能となる。つまり、「場所:渋谷,キーワード:レストラン」という検索要求に対して、「レストラン」というキーワードを含み、「渋谷」付近について言及しているテキストを取得する検索が可能となる。 Under such circumstances, by extracting the place name notation from the text and converting the place name into latitude and longitude, a technique for linking the text to the position (see Non-Patent Document 3) can be practically used. Yes. By using this technique, it becomes possible to provide latitude and longitude information in the text, and even if the place name keyword does not match, it is possible to search for text information according to the location desired by the user. In other words, in response to a search request “place: Shibuya, keyword: restaurant”, a search including a keyword “restaurant” and referring to the vicinity of “Shibuya” can be performed.
尚、本発明の実施形態例で利用する街区レベル位置参照情報は非特許文献4に開示されている。
前記のような地理情報を利用して検索を行う場合、与えられる地理情報は必ずしも地名ではなく、GPSから得られた緯度経度である場合も考えられる。また地名で地理情報が与えられたとしても、一度緯度経度に変換する事により、完全にマッチするキーワードがテキスト中に存在するとは限らない。この場合、上記に示したKWICを利用する従来技術を用いた場合、検索キーワードとして入力されたキーワードを含むスニペットは得ることができるが、位置情報を含める事ができない場合が考えられる。 When searching using the geographical information as described above, the given geographical information is not necessarily a place name, but may be a latitude and longitude obtained from GPS. Even if geographical information is given by the place name, once it is converted into latitude and longitude, a completely matching keyword is not always present in the text. In this case, when the conventional technique using the KWIC described above is used, a snippet including a keyword input as a search keyword can be obtained, but there may be a case where position information cannot be included.
また、テキスト内に存在する位置情報を全て平等に扱った場合には、ノイズとなる地名やあいまいな地名によりスニペットの精度が低下する恐れがある。 In addition, when all the position information existing in the text is handled equally, there is a risk that the accuracy of the snippet may decrease due to the place name that is noisy or the place name that is ambiguous.
本発明の目的は、上記の問題を鑑み、テキスト中に存在する位置情報を利用し、ユーザの要求に適用したスニペットを生成することができる、地名が意味する範囲を考慮した検索結果スニペットの生成装置、生成方法、生成プログラムおよびその生成プログラムを記録した記録媒体を提供することにある。 An object of the present invention is to generate a search result snippet in consideration of a range that a place name means, which can generate a snippet applied to a user's request using position information existing in text in view of the above problems An apparatus, a generation method, a generation program, and a recording medium on which the generation program is recorded.
本発明では、テキスト中に含まれる地名の緯度経度および含意する広さを利用して、テキスト中での地名の重要度を算出し、その重要度を利用したスニペットの生成を行う。 In the present invention, the importance of the place name in the text is calculated using the latitude and longitude of the place name included in the text and the implication width, and a snippet is generated using the importance.
すなわち、請求項1に記載の検索結果スニペットの生成装置は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成装置において、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクス手段と、前記各地名が含意する広さを特定する地名含意範囲特定手段と、前記地理インデクス手段により割り当てられた地名の緯度経度および前記地名含意範囲特定手段により特定された地名が含意する広さの情報を元に、広さの情報が狭いほどに大きな重要度となる式を用いて、テキスト中での地名の重要度を算出する処理を行う地名重要度決定手段と、与えられた検索キーワード、および地名の重要度を元に、テキスト中の部分文書であるセンテンスを、検索キーワードに依存した重要度と地名の重要度の和でもって評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価手段と、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得し、該取得した地名の重要度、および検索キーワードを前記センテンス評価手段に送信し、該センテンス評価手段から出力されたスニペットを受け付けるスニペット問合せ受付手段とを備えたことを特徴としている。
That is, the search result snippet generation device according to
また請求項2に記載の検索結果スニペットの生成装置は、請求項1において、前記スニペット問合せ受付手段が前記センテンス評価手段に送信する地名の重要度は、指定された位置情報に近く、一定の距離内に存在する1つ以上の地名の重要度である、ことを特徴としている。
The search result snippet generation device according to
また請求項3に記載の検索結果スニペットの生成方法は、コンピュータ内部に存在もしくはコンピュータネットワークを介してアクセスできるテキスト集合から、テキストの内容を指定する検索キーワードと位置情報を指定して、指定された検索キーワードを含み、かつ特定の位置に関係するテキストを検索する場合に、各検索結果の概要を示すスニペットを取得する検索結果スニペットの生成方法において、地理インデクス手段が、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクスステップと、地名含意範囲特定手段が、前記各地名が含意する広さを特定する地名含意範囲特定ステップと、地名重要度決定手段が、前記地理インデクスステップにより割り当てられた地名の緯度経度および前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報を元に、広さの情報が狭いほどに大きな重要度となる式を用いて、テキスト中での地名の重要度を算出する処理を行う地名重要度決定ステップと、スニペット問合せ受付手段が、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得するステップと、スニペット問合せ受付手段が、前記取得した地名の重要度、および検索キーワードをセンテンス評価手段に送信するステップと、センテンス評価手段が、前記スニペット問合せ受付手段から送信された地名の重要度、および検索キーワードを元に、テキスト中の部分文書であるセンテンスを、検索キーワードに依存した重要度と地名の重要度の和でもって評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価ステップと、スニペット問合せ受付手段が、前記センテンス評価手段から出力されたスニペットを受け付けるステップとを備えたことを特徴としている。 The search result snippet generation method according to claim 3 is specified by specifying a search keyword and position information for specifying text contents from a text set existing inside a computer or accessible via a computer network. In a search result snippet generation method for obtaining a snippet indicating an outline of each search result when searching for text including a search keyword and related to a specific position, a geographic index means includes a text index in the text set. Geographic index step of extracting existing place names and assigning latitude and longitude to the extracted place names, place name entailment range specifying means for specifying the area name entailment range specifying step, and location name importance level determination Means of the place name assigned by the geographical index step Based on the information of the size of a place name specified by longitude and the place name implies range identification step implies, using the formula information measuring is great importance to narrower, the importance of the place names in the text A place name importance determining step for performing a process of calculating the place name, and a snippet inquiry accepting means for determining the importance of the place name in the text searched based on the designated search keyword and position information, A step in which the snippet inquiry accepting means sends the importance of the obtained place name and a search keyword to the sentence evaluating means, and the sentence evaluating means sends the place name sent from the snippet inquiry accepting means. the importance of, and on the basis of the search keyword, the sentence is a partial document in the text, depending on the search keyword It was evaluated with the sum of the importance of importance and place names, and sentences evaluation step for performing a process for outputting as snippets extracted sentences are considered to be important, snippets inquiry reception unit, output from the sentence evaluation means And a step of receiving a snippet.
また請求項4に記載の検索結果スニペットの生成方法は、請求項3において、前記スニペット問合せ受付手段が前記センテンス評価手段に送信する地名の重要度は、指定された位置情報に近く、一定の距離内に存在する1つ以上の地名の重要度である、ことを特徴としている。 The search result snippet generation method according to claim 4 is the search result snippet generation method according to claim 3 , wherein the importance of the place name transmitted from the snippet inquiry reception means to the sentence evaluation means is close to the specified position information, and is a fixed distance. It is characterized by the importance of one or more place names existing within .
また請求項5に記載の検索結果スニペットの生成プログラムは、コンピュータを、請求項1又は2に記載の各手段として機能させるプログラムであることを特徴としている。
A search result snippet generation program according to claim 5 is a program that causes a computer to function as each means according to
また請求項6に記載の記録媒体は、請求項5に記載の検索結果スニペットの生成プログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。 A recording medium according to claim 6 is a computer-readable recording medium in which the search result snippet generation program according to claim 5 is recorded.
上記構成により、ユーザの指定する場所を考慮したスニペットを生成する事が可能となり、検索結果からユーザが所望のテキストを選択する事を支援できる。 With the above configuration, it is possible to generate a snippet that takes into account the location specified by the user, and can assist the user in selecting a desired text from the search result.
請求項1〜6に記載の発明によれば、文書中に出現する地名の重要度を、その地名が含意する広さおよび検索条件として与えられた位置情報を元に推定し、その重要度を利用して検索結果のスニペットを抽出することにより、指定された場所、例えばユーザの指定する場所を考慮したスニペットを生成する事が可能となり、検索結果からユーザが所望のテキストを選択する事を支援できる。
According to the first to sixth aspects of the present invention, the importance of the place name appearing in the document is estimated based on the width implied by the place name and the position information given as the search condition, and the importance is calculated. By extracting the search result snippet, it is possible to generate a snippet that takes into account the specified location, for example, the location specified by the user, and assists the user in selecting the desired text from the search result it can.
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。図1は本発明のスニペット生成装置を利用した検索システムの構成の一例を示している。 Hereinafter, embodiments of the present invention will be described with reference to the drawings, but the present invention is not limited to the following embodiments. FIG. 1 shows an example of the configuration of a search system using the snippet generation device of the present invention.
図1において、本実施形態例の検索システムは、テキストデータベース010、地理インデクサ020、位置情報データベース030、地名含意範囲特定部100、地名データベース110、スニペット問合せ受付部210、地名重要度決定部220、センテンス評価部230、検索エンジン310、検索アプリケーション320を備えている。
In FIG. 1, the search system according to the present embodiment includes a text database 010, a geographic indexer 020, a
上記各部は、例えばコンピュータによって実現されるものであり、以下に各機能を説明する。 Each of the above units is realized by a computer, for example, and each function will be described below.
テキストDB(データベース)010は、コンピュータ中のテキストやネットワークを介してアクセスできるテキスト情報を集めたデータベースである。テキストそのものの情報に加えて、検索エンジン310からアクセスされた際に、指定されたキーワードを含む文書を返却する為のインデクス構造も保持する。
A text DB (database) 010 is a database in which text information in a computer and text information accessible via a network are collected. In addition to the information of the text itself, an index structure for returning a document including a specified keyword when accessed from the
地理インデクサ020は、本発明の地理インデクス手段として機能し、テキスト情報を入力として受け付け、テキスト中に含まれる地名を抽出するとともに、抽出された地名が示す実世界での位置の緯度経度および正規化した地名(都道府県名から始まる正規化された地名)を出力する。 The geographic indexer 020 functions as the geographic index means of the present invention, accepts text information as an input, extracts a place name included in the text, and latitude and longitude of the position in the real world indicated by the extracted place name and normalization The place name (normalized place name starting from the prefecture name) is output.
位置情報DB(データベース)030は、個々の文書において、どの様な地名がテキスト中のどの位置で出現し、その地名が示す緯度経度を格納するデータベースである。データベースの内容例を図2に示す。 The position information DB (database) 030 is a database that stores, in each document, what place name appears at which position in the text and the latitude and longitude indicated by the place name. An example of the contents of the database is shown in FIG.
地名含意範囲特定部100は、本発明の地名含意範囲特定手段として機能し、地名が含意する広さ、すなわち地名が示す範囲を特定し、地名データベース110に登録する。地名が示す範囲としては、緯度幅、経度幅が考えられる。このデータは国土交通省が配布する街区レベル位置参照情報(非特許文献4参照)を元に、構築する事ができる。
The place name implication
例えば、「東京都渋谷区」の示す範囲を取得する場合には、街区レベル位置参照情報のうち、「東京都渋谷区」から始まる街区のデータを取得し、その街区データ中の緯度幅、経度幅を得ることで、該地名が示す範囲とする。 For example, when acquiring the range indicated by “Shibuya-ku, Tokyo,” the block level position reference information is acquired for the block starting from “Shibuya-ku, Tokyo”, and the latitude width and longitude in the block data are acquired. By obtaining the width, the range is indicated by the place name.
地名DB(データベース)110」は、地名含意範囲特定部100により作成されるデータを管理するデータベースである。データベースの内容例を図3に示す。
The place name DB (database) 110 ”is a database for managing data created by the place name implication
スニペット問合せ受付部210は、本発明のスニペット問合せ受付手段として機能し、検索エンジン310から検索キーワードとスニペットを生成する文書のIDを取得し、地名重要度決定部220およびセンテンス評価部230にアクセスし、該センテンス評価部230は生成されたスニペットをスニペット問合せ受付部210に返却する。
The snippet
また地名重要度決定部220に対しては、文書IDを元にアクセスし、該文書中に含まれる重要度付き地名情報(地名と各地名の該文書内での重要度)を取得する。
Also, the place name
またセンテンス評価部230に対しては、検索キーワードと文書IDと地名情報を元にアクセスし、スニペットを取得する。 The sentence evaluation unit 230 is accessed based on the search keyword, document ID, and place name information, and a snippet is acquired.
地名重要度決定部220は、本発明の地名重要度決定手段として機能し、スニペット問合せ受付部210から文書IDを取得し、位置情報DB030および地名DB110にアクセスし、重要度付き地名情報をスニペット問合せ受付部210に返却する。
The place name
また位置情報DB030に対しては、文書IDを元にアクセスし、該文書中に含まれる地名情報(地名ワード,地名正規名,文書中での位置,緯度,経度)を取得する。
Further, the
また地名DB110に対しては、上記で取得した地名情報の地名正規名を元にアクセスし、各地名正規名が含意する広さ(緯度幅、経度幅)を取得する。
Further, the
この地名重要度決定部220は、上記で得た緯度幅および経度幅を元に各地名の重要度を算出する。重要度の算出方法の一例としては、より特化した場所を示す地名は重要であるとの仮定に基づく方法として、以下の式(1)で表現される重要度が考えられる。
The place name
Weightd,g=1/max(緯度幅,経度幅) …(1)
ここで、Weightd,gは、文書dにおける地名gの重要度を示し、max()は入力された値のうち、最大の値を返す関数である。
また、位置情報DB030のデータには、地理インデクサ020による解析誤りや文書中に出現する主題と関係が薄い地名の存在により、ノイズとなる地名情報が含まれている可能性も考えられる。この問題への対処として、各文書に含まれる地名群を一定の距離内に存在する地名同士をグループ化し、最も多くの地名が属するグループの地名だけを利用する事も考えられる。またこの場合のグループの選択法に、ユーザが指定した位置情報と各グループの近さを考慮する事も考えられる。
Weight d, g = 1 / max (latitude width, longitude width) (1)
Here, Weight d, g indicates the importance of the place name g in the document d, and max () is a function that returns the maximum value among the input values.
In addition, there is a possibility that the
センテンス評価部230は、本発明のセンテンス評価手段として機能し、スニペット問合せ受付部210より、検索キーワード、文書IDおよび重要度付き地名情報を取得し、指定された文書中で、重要と思われるセンテンスを抽出し、スニペット問合せ受付部210に返却する。
The sentence evaluation unit 230 functions as a sentence evaluation unit of the present invention, acquires a search keyword, a document ID, and place name information with importance from the snippet
まず、テキストDB010にアクセスして文書を取得し、入力された検索キーワードが文書中のどの位置に出現するかを特定する。 First, the text DB 010 is accessed to acquire a document, and the position where the input search keyword appears in the document is specified.
地名重要度決定部220により算出された重要度付き地名情報と検索キーワードの出現位置を元に、文書中の部分文書のうち重要度が高い部分文書を取得する。各部分文書の重要度の一例としては以下の式(2)が挙げられる。
Based on the place name information with importance calculated by the place name importance
Id,s,q,g=FreqOfKeyword(d,s,q)+WeightedFreqOfGeoword(d,s,g) …(2)
ここで、Id,s、q、gは、検索キーワードqおよび地名gで検索された文書d中の部分文書sの重要度、FreqOfKeyword(d,s,q)は検索キーワードqが文書dの部分文書s中で出現する回数を示す関数、WeightedFreqOfGeoword(d,s,g)は、文書dの部分文書s中に出現する地名gの重みをすべて加算する関数である。
I d, s, q, g = FreqOfKeyword (d, s, q) + Weighted FreqOfGeord (d, s, g) (2)
Here, I d, s, q, g is the importance of the partial document s in the document d searched with the search keyword q and the place name g, and FreqOfKeyword (d, s, q) is the search keyword q of the document d. A function indicating the number of appearances in the partial document s, Weighted FreqOfGeord (d, s, g) is a function for adding all the weights of the place names g appearing in the partial document s of the document d.
式(2)の関数WeightedFreqOfGeoword(d,s,g)は、 The function WeightedFreqOfGeoword (d, s, g) in equation (2) is
である。ここで、Gsはセンテンスs中に含まれる地名の集合、Weightd,gは、上記で示した通り、文書dにおける地名gの重要度を示す。 It is. Here, G s represents a set of place names included in the sentence s, and Weight d, g represents the importance of the place name g in the document d as described above.
検索エンジン310は、検索アプリケーション320から検索キーワードおよび位置情報を受け付け、テキストDB010および位置情報DB030にアクセスし検索結果の文書を取得し、検索結果として提示する文書についてスニペット問合せ受付部210に問合せを行い、スニペット問合せ受付部210からのスニペットを、検索結果として検索アプリケーション320に返却する。
The
検索アプリケーション320は、ユーザとのインタフェースであり、ユーザから検索条件(検索キーワード、位置情報)の入力を受け付け、検索エンジン310にアクセスし、得られた検索結果をユーザに提示する。
The search application 320 is an interface with the user, receives input of search conditions (search keywords, position information) from the user, accesses the
前記位置情報DB030および地名DB110の作成は、前処理としてそれぞれ地理インデクサ020および地名含意範囲特定部100により行われる。
The
本発明の処理プロセスのうち、検索処理についてのフローを図4に示す。図4において、まずステップS1では、検索アプリケーション320を通じて、ユーザから検索キーワードと位置情報が入力される。次にステップS2において、検索アプリケーション320は、検索キーワードと位置情報を検索エンジン310に送信する。次にステップS3において、検索エンジン310は、テキストDB010と位置情報DB030にアクセスし、検索結果の文書を得る。
Of the processing processes of the present invention, a flow for search processing is shown in FIG. In FIG. 4, first, in step S <b> 1, a search keyword and position information are input from the user through the search application 320. Next, in step S <b> 2, the search application 320 transmits the search keyword and position information to the
次にステップS4において、検索エンジン310は、得られた検索結果の文書および検索キーワードをスニペット問合せ受付部210に送信する。次にステップS5においてスニペット問合せ受付部210は、文書IDを地名重要度決定部220に送信する。
In step S <b> 4, the
次にステップS6において、地名重要度決定部220は、位置情報DB030にアクセスし、該文書IDの文書が持つ位置情報を取得する。次にステップS7いおいて、地名重要度決定部220は、地名DB110にアクセスし、位置情報に含まれる各地名が含意する広さを取得する。
Next, in step S6, the place name
次にステップS8において、地名重要度決定部220は、取得した各地名の含意する広さを元に各地名の重要度を算出する。次にステップS9において、地名重要度決定部220は、重要度付き位置情報をスニペット問合せ受付部210に返却する。次にステップS10において、スニペット問合せ受付部210は、検索キーワード、文書IDおよび重要度付き位置情報をセンテンス評価部230に送信する。
Next, in step S8, the place name
次にステップS11において、センテンス評価部230は、文書IDを元にテキストDB010にアクセスし、該文書IDの文書を取得する。次にステップS12において、センテンス評価部230は、検索キーワードが文書のどの位置に出現するかを特定する。 Next, in step S11, the sentence evaluation unit 230 accesses the text DB 010 based on the document ID, and acquires a document with the document ID. Next, in step S12, the sentence evaluation unit 230 specifies where in the document the search keyword appears.
次にステップS13において、センテンス評価部230は、検索キーワードの出現位置、地名の出現位置および地名の重要度から、部分文書の重要度を算出する。次にステップS14において、全部分文書について重要度を算出したか否かを判定し、算出済みの場合、ステップS15においてセンテンス評価部230が、最も重要度の高い部分文書をスニペットとしてスニペット問合せ受付部210に送信する。 In step S13, the sentence evaluation unit 230 calculates the importance of the partial document from the appearance position of the search keyword, the appearance position of the place name, and the importance of the place name. Next, in step S14, it is determined whether or not the importance level has been calculated for all the partial documents. If it has been calculated, in step S15, the sentence evaluation unit 230 uses the highest importance partial document as a snippet as a snippet inquiry reception unit. To 210.
次にステップS16において、全検索結果についてスニペットを取得済みか否かを判定し、取得済みの場合、ステップS17においてスニペット問合せ受付部210が、すべてのスニペットを検索エンジン310に送信する。
Next, in step S16, it is determined whether or not snippets have been acquired for all search results. If acquired, the snippet
次にステップS18において、検索エンジン310は、検索結果にスニペットを加えて検索アプリケーション320に送信する。次にステップS19において、検索アプリケーション320は、受信した検索結果を整形し、ユーザに提示する。
In step S <b> 18, the
尚、前記ステップS14の判定において算出済みではない場合はステップS13に戻り、ステップS16の判定において取得済みではない場合はステップS4に戻る。 If it has not been calculated in the determination in step S14, the process returns to step S13. If it has not been acquired in the determination in step S16, the process returns to step S4.
本発明の地名が意味する範囲を考慮した検索結果スニペットの生成方法は、例えば前記図1、図4で述べた各機能、各処理を実行するものである。 The search result snippet generation method that takes into account the scope of the place name of the present invention executes, for example, the functions and processes described in FIGS.
また前記本発明の検索結果スニペットの生成方法をコンピュータに実行させるためのプログラムを構築するものである。 In addition, a program for causing a computer to execute the search result snippet generation method of the present invention is constructed.
また、本実施形態の検索結果スニペットの生成装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態の検索結果スニペットの生成方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R,CD−RW,HDD,リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。 Also, the present invention can be realized by configuring a part or all of the functions of each means in the search result snippet generation device of the present embodiment by a computer program and executing the program using the computer. It goes without saying that the procedure in the search result snippet generation method of the embodiment can be configured by a computer program and the program can be executed by the computer, and the computer can read the program for realizing the function on the computer. Recording media such as FD (Floppy (registered trademark) Disk), MO (Magneto-Optical disk), ROM (Read Only Memory), memory card, CD (Compact Disk) -ROM, DVD (Dig) It is possible to record and save or distribute it in (Versatile Disk) -ROM, CD-R, CD-RW, HDD, removable disk or the like. It is also possible to provide the above program through a network such as the Internet or electronic mail.
以上、本発明を実施形態例に基づき具体的に説明したが、本発明は上述の実施例に限定されるものではなく、幅広く応用することができる。 Although the present invention has been specifically described above based on the embodiments, the present invention is not limited to the above-described embodiments and can be widely applied.
010…テキストデータベース、020…地理インデクサ、030…位置情報データベース、100…地名含意範囲特定部、110…地名データベース、210…スニペット問合せ受付部、220…地名重要度決定部、230…センテンス評価部、310…検索エンジン、320…検索アプリケーション。 010 ... Text database, 020 ... Geographic indexer, 030 ... Location information database, 100 ... Place name implication range specifying part, 110 ... Place name database, 210 ... Snippet inquiry reception part, 220 ... Place name importance determination part, 230 ... Sentence evaluation part, 310 ... Search engine, 320 ... Search application.
Claims (6)
前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクス手段と、
前記各地名が含意する広さを特定する地名含意範囲特定手段と、
前記地理インデクス手段により割り当てられた地名の緯度経度および前記地名含意範囲特定手段により特定された地名が含意する広さの情報を元に、広さの情報が狭いほどに大きな重要度となる式を用いて、テキスト中での地名の重要度を算出する処理を行う地名重要度決定手段と、
与えられた検索キーワード、および地名の重要度を元に、テキスト中の部分文書であるセンテンスを、検索キーワードに依存した重要度と地名の重要度の和でもって評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価手段と、
前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得し、該取得した地名の重要度、および検索キーワードを前記センテンス評価手段に送信し、該センテンス評価手段から出力されたスニペットを受け付けるスニペット問合せ受付手段と
を備えたことを特徴とする地名が意味する範囲を考慮した検索結果スニペットの生成装置。 Search a text set that contains the specified search keyword and related to a specific location by specifying a search keyword and location information that specify the content of the text from a set of text that exists inside the computer or that can be accessed via a computer network In the search result snippet generation device that acquires a snippet showing an overview of each search result,
Geographic index means for extracting a place name existing in the text of the text set and assigning latitude and longitude to the extracted place name;
A place name entailment range specifying means for specifying an area implied by the place name;
Based on the latitude / longitude of the place name assigned by the geographical index means and the information on the area implied by the place name specified by the place name implication range specifying means , an expression having a greater importance as the area information becomes narrower with a place name importance degree determination unit that performs processing for calculating the importance of the place names in the text,
Based on the importance of the given search keyword and place name, the sentence that is a partial document in the text is evaluated with the sum of the importance depending on the search keyword and the importance of the place name. Sentence evaluation means for performing processing to extract and output as a snippet;
The importance of the place name in the text searched based on the designated search keyword and position information is obtained by inquiring the place name importance determining means , and the importance of the obtained place name and the search keyword are obtained. A search result snippet generation device that takes into account a range meant by a place name, comprising: a snippet inquiry reception unit that transmits to a sentence evaluation unit and receives a snippet output from the sentence evaluation unit.
ことを特徴とする請求項1に記載の地名が意味する範囲を考慮した検索結果スニペットの生成装置。 The importance of the place name transmitted by the snippet inquiry reception means to the sentence evaluation means is the importance of one or more place names that are close to the specified position information and exist within a certain distance.
An apparatus for generating a search result snippet in consideration of a range implied by a place name according to claim 1.
地理インデクス手段が、前記テキスト集合のテキスト中に存在する地名を抽出し、抽出された地名に緯度経度を割り当てる地理インデクスステップと、
地名含意範囲特定手段が、前記各地名が含意する広さを特定する地名含意範囲特定ステップと、
地名重要度決定手段が、前記地理インデクスステップにより割り当てられた地名の緯度経度および前記地名含意範囲特定ステップにより特定された地名が含意する広さの情報を元に、広さの情報が狭いほどに大きな重要度となる式を用いて、テキスト中での地名の重要度を算出する処理を行う地名重要度決定ステップと、
スニペット問合せ受付手段が、前記指定された検索キーワードと位置情報に基づいて検索されたテキスト中での地名の重要度を、前記地名重要度決定手段に問い合わせて取得するステップと、
スニペット問合せ受付手段が、前記取得した地名の重要度、および検索キーワードをセンテンス評価手段に送信するステップと、
センテンス評価手段が、前記スニペット問合せ受付手段から送信された地名の重要度、および検索キーワードを元に、テキスト中の部分文書であるセンテンスを、検索キーワードに依存した重要度と地名の重要度の和でもって評価し、重要と考えられるセンテンスを抽出してスニペットとして出力する処理を行うセンテンス評価ステップと、
スニペット問合せ受付手段が、前記センテンス評価手段から出力されたスニペットを受け付けるステップと
を備えたことを特徴とする地名が意味する範囲を考慮した検索結果スニペットの生成方法。 Search a text set that contains the specified search keyword and related to a specific location by specifying a search keyword and location information that specify the content of the text from a set of text that exists inside the computer or that can be accessed via a computer network In the search result snippet generation method to obtain a snippet that shows an overview of each search result,
Geographic index means for extracting a place name existing in the text of the text set and assigning latitude and longitude to the extracted place name;
The place name implication range specifying means specifies a place name entailment range specifying step for specifying an area implied by the local name,
The place name importance degree determination means is configured such that, based on the latitude / longitude of the place name assigned by the geo index step and the area information implied by the place name specified by the place name implication range specifying step, the area information becomes narrower. A place name importance determination step for calculating the importance of the place name in the text using an expression that has a large importance ;
A snippet inquiry accepting unit inquires and acquires the importance of the place name in the text searched based on the designated search keyword and position information to the place name importance degree determining means;
A snippet inquiry accepting unit transmitting the importance of the acquired place name and a search keyword to the sentence evaluating unit;
Based on the importance of the place name transmitted from the snippet inquiry acceptance means and the search keyword , the sentence evaluation means determines the sentence that is a partial document in the text as the sum of the importance depending on the search keyword and the importance of the place name. a sentence evaluating step tHAT have evaluated, performs processing for output as snippets extracted sentences are considered to be important,
A method for generating a search result snippet in consideration of a range meant by a place name, characterized in that: a snippet inquiry receiving unit includes a step of receiving a snippet output from the sentence evaluating unit.
ことを特徴とする請求項3に記載の地名が意味する範囲を考慮した検索結果スニペットの生成方法。 The importance of the place name transmitted by the snippet inquiry reception means to the sentence evaluation means is the importance of one or more place names that are close to the specified position information and exist within a certain distance.
A method of generating a search result snippet in consideration of a range meant by a place name according to claim 3.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007309282A JP4921330B2 (en) | 2007-11-29 | 2007-11-29 | Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007309282A JP4921330B2 (en) | 2007-11-29 | 2007-11-29 | Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009134464A JP2009134464A (en) | 2009-06-18 |
JP4921330B2 true JP4921330B2 (en) | 2012-04-25 |
Family
ID=40866290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007309282A Active JP4921330B2 (en) | 2007-11-29 | 2007-11-29 | Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4921330B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5331166B2 (en) * | 2011-06-13 | 2013-10-30 | ヤフー株式会社 | Search server and method |
JP5886558B2 (en) * | 2011-07-29 | 2016-03-16 | 株式会社ゼンリン | Electronic book display device |
JP5528402B2 (en) * | 2011-08-26 | 2014-06-25 | 日本電信電話株式会社 | Keyword-related place name extraction apparatus, method, and program |
JP5806971B2 (en) * | 2012-04-25 | 2015-11-10 | 日本電信電話株式会社 | Region estimation apparatus, method, and program |
CN113626536B (en) * | 2021-07-02 | 2023-08-15 | 武汉大学 | News geocoding method based on deep learning |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3519369B2 (en) * | 2001-01-12 | 2004-04-12 | 日本電信電話株式会社 | Position-related information providing apparatus, method, program, and recording medium recording the program |
JP3572402B2 (en) * | 2002-01-09 | 2004-10-06 | 日産自動車株式会社 | Map image display device, map image display method, and map image display program |
JP4199671B2 (en) * | 2002-03-15 | 2008-12-17 | 富士通株式会社 | Regional information retrieval method and regional information retrieval apparatus |
JP4403357B2 (en) * | 2002-10-31 | 2010-01-27 | ソニー株式会社 | CONTENT REPRODUCTION DEVICE, CONTENT PROVIDING SYSTEM, AND PROGRAM |
-
2007
- 2007-11-29 JP JP2007309282A patent/JP4921330B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2009134464A (en) | 2009-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4909334B2 (en) | Service proposal apparatus and method, service proposal system, service proposal apparatus and method based on user's favorite base | |
US8195653B2 (en) | Relevance improvements for implicit local queries | |
KR101274388B1 (en) | Method for advertising local information based on location information and system for executing the method | |
US20090119268A1 (en) | Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis | |
US20050004903A1 (en) | Regional information retrieving method and regional information retrieval apparatus | |
JP5087377B2 (en) | SEARCH DEVICE, SEARCH METHOD, SEARCH PROGRAM, AND RECORDING MEDIUM CONTAINING THE PROGRAM | |
KR100810999B1 (en) | On-line e mail service system, and service method thereof | |
US8150979B1 (en) | Supporting multiple landing pages | |
CN101178728A (en) | Web side navigation method and system | |
JP4921330B2 (en) | Search result snippet generation device, generation method, generation program and recording medium on which the generation program is recorded in consideration of the range that the place name means | |
CN101647020A (en) | Searching structured geographical data | |
KR100892842B1 (en) | Method and system for user centered information searching | |
JP2011034399A (en) | Method, device and program for extracting relevance of web pages | |
KR101011726B1 (en) | Apparatus and method for providing snippet | |
JP5221664B2 (en) | Information map management system and information map management method | |
CN101676901A (en) | Search dispatching method and search server | |
WO2005106714A1 (en) | Method and system for providing popular information on area | |
US20130304370A1 (en) | Method and apparatus to provide location information | |
KR101670700B1 (en) | Domain status, purpose and categories | |
KR100557874B1 (en) | Method of scientific information analysis and media that can record computer program thereof | |
US20080215597A1 (en) | Information processing apparatus, information processing system, and program | |
JP2004280569A (en) | Information monitoring device | |
JP4921500B2 (en) | Text search result ranking apparatus, text search result ranking method, text search result ranking program, and recording medium recording the program | |
KR20170132376A (en) | Method and Apparatus for Recommending Service Provider Using Social Data | |
KR20100038344A (en) | Method for advertising local information based on location information and system for executing the method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090618 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090904 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100528 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111007 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111025 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111220 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120202 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4921330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |