JP5792871B1 - 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム - Google Patents
代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム Download PDFInfo
- Publication number
- JP5792871B1 JP5792871B1 JP2014106781A JP2014106781A JP5792871B1 JP 5792871 B1 JP5792871 B1 JP 5792871B1 JP 2014106781 A JP2014106781 A JP 2014106781A JP 2014106781 A JP2014106781 A JP 2014106781A JP 5792871 B1 JP5792871 B1 JP 5792871B1
- Authority
- JP
- Japan
- Prior art keywords
- spot
- representative
- document
- score
- representative score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】キーワードに対応する代表的なスポットを検索する。【解決手段】代表スポット出力装置は、キーワードに関連する複数の文書を取得するS1文書取得手段と、各文書において含まれる各スポットの名称の包含数をカウントしてS2、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたスポット包含数データを生成するスポット包含数算出手段と、スポット包含数データを参照して、各スポットの代表スコアを算出するS4代表スコア算出手段と、代表スコアの高いスポットの識別子を、代表スポットとして出力するS6代表スポット出力手段と、を備える。代表スコア算出手段は、各文書において比較の対象とされるスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。【選択図】図1
Description
本発明は、キーワードに対応する代表的なスポットを検索する代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラムに関する。
一般的に店舗などのスポットを検索する際、検索サイトを利用する方法が知られている。ユーザは、検索サイトにおいて、地域とキーワードを入力することにより、所定の地域における所定のキーワードに関連するスポットを検索することができる。
この検索サイトにおいて、評判に基づいて店舗を検索する方法や、文書頻度に基づいて店舗を検索する方法が知られている。評判に基づいて店舗を検索する方法としては、グルメサイトのように、人手で付与された評価を元に各店舗のスコアを算出し、算出したスコアを元に店舗をランキングして出力する方法が考えられる。また特許文献1に示されるように、評判情報を機械的に抽出した結果を元に、店舗を出力する方法もある。文書頻度に基づいて店舗を検索する方法としては、地域とキーワードに関連する文書のうち、スポット名が出現する文書数を算出し、文書数の多い店舗をランキングして出力する方法が考えられる。
しかしながら、従来の検索方法においては、地域とキーワードに対し、それに関連する代表的なスポットを知ることはできない。
例えば、宇都宮に出張に出る場合、宇都宮では餃子が名物であることを知っていても、宇都宮の餃子を食べたいと考え、店舗を検索する場合を想定する。宇都宮で餃子を提供する店舗は多数あるところ、最初に宇都宮で餃子を食べるには、評判が良い店や店舗数の多い店ではなく、代表的なスポットを選択して、その代表的なスポットに足を運びたいユーザもいる。しかしながら、一般的な検索サイトでは、代表的なスポットを検索することができないため、ユーザは、適切な情報が得られず、どの店舗に足を運ぶべきかを決定できない場合がある。
例えば、評判に基づいて店舗を検索する方法においては、評判の良いスポットを選択することしかできず、評判のよいスポットが必ずしもその地域を代表するスポットであるとは限らない問題がある。例えば、ある地域において、味付けや麺の太さに特徴があるラーメンが名物である場合であっても、その地域で評判の良い店舗のラーメンが、その特徴を持っていない場合も考えられる。従って、評判の良いスポットが、代表的なスポットであるとは限らない。
また文書頻度に基づいて店舗を検索する方法においては、よく話題にされるスポットの文書頻度が高くなるため、チェーン店のようなスポットが地域に関係なく選択されてしまう問題がある。
従って本発明の目的は、キーワードに対応する代表的なスポットを検索する代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラムを提供することである。
上記課題を解決するために、本発明の第1の特徴は、代表スポット出力装置が、キーワードに対応する代表的なスポットを検索する代表スポット出力方法に関する。本発明の第1の特徴に係る代表スポット出力装置は、代表スポット出力装置が、前記キーワードに関連する複数の文書を取得するステップと、代表スポット出力装置が、各文書において含まれる各スポットの名称の包含数をカウントして、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたスポット包含数データを生成するステップと、代表スポット出力装置が、前記スポット包含数データを参照して、各スポットの代表スコアを算出するステップと、代表スポット出力装置が、前記代表スコアの高いスポットの識別子を、代表的なスポットとして出力するステップと、を備える。代表スコアを算出するステップは、2以上のスポット名が含まれる文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。
代表スコアを算出するステップは、各文書に含まれる各スポット名の種別数をカウントし、2以上のスポット名が含まれる文書かつ前記種別数の少ない文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出しても良い。
文書がタイトルおよび本文を含む場合、前記代表スコアを算出するステップは、タイトルに含まれるスポットの名称の代表スコアより、本文に含まれるスポットの名称の代表スコアが高くなるように、各スポットの代表スコアを算出してもよい。
本発明の第2の特徴は、キーワードに対応する代表的なスポットを検索する代表スポット出力装置に関する。本発明の第2の特徴に係る代表スポット出力装置は、キーワードに関連する複数の文書を取得する文書取得手段と、各文書において含まれる各スポットの名称の包含数をカウントして、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたスポット包含数データを生成するスポット包含数算出手段と、スポット包含数データを参照して、各スポットの代表スコアを算出する代表スコア算出手段と、代表スコアの高いスポットの識別子を、代表的なスポットとして出力する代表スポット出力手段と、を備える。代表スコア算出手段は、2以上のスポット名が含まれる文書において、包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。
代表スコア算出手段は、各文書に含まれるスポット名の種別数をカウントし、2以上のスポット名が含まれる文書かつ種別数の少ない文書において、包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出しても良い。
文書がタイトルおよび本文を含む場合、代表スコア算出手段は、タイトルに含まれるスポットの名称の代表スコアより、本文に含まれるスポットの名称の代表スコアが高くなるように、各スポットの代表スコアを算出しても良い。
本発明の第3の特徴は、コンピュータに本発明の第1の特徴に記載のステップを実行させるための代表スポット出力プログラムに関する。
本発明によれば、キーワードに対応する代表的なスポットを検索する代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラムを提供することができる。
次に、図面を参照して、本発明の実施の形態を説明する。以下の図面の記載において、同一または類似の部分には同一または類似の符号を付している。
(実施の形態)
本発明の実施の形態に係る代表スポット出力装置1は、地域およびキーワードに関連する文書から、その地域およびキーワードに対応する代表的なスポットを検索する。ここで「代表的なスポット」とは、この地域で、このキーワードといえば、地元の人がすぐに連想するようなスポットであって、地域およびキーワードに関連する発祥の元となった権威と呼ばれうるものである。このスポットは、典型的には店舗であると考えられるが、店舗に限るものではない。
本発明の実施の形態に係る代表スポット出力装置1は、地域およびキーワードに関連する文書から、その地域およびキーワードに対応する代表的なスポットを検索する。ここで「代表的なスポット」とは、この地域で、このキーワードといえば、地元の人がすぐに連想するようなスポットであって、地域およびキーワードに関連する発祥の元となった権威と呼ばれうるものである。このスポットは、典型的には店舗であると考えられるが、店舗に限るものではない。
図1を参照して、代表スポット出力装置1による代表スポット出力方法を説明する。
まずステップS1において、地域およびキーワードに関連する複数の文書を含む文書群を取得する。取得した文書群の各文書について、ステップS2およびステップS3を実行する。
ステップS2において代表スポット出力装置1は、文書の文字列において含まれる各スポットの名称の包含数をカウントして、出力する。ここでは、文書の文字中に、あるスポットの名称が3回登場する場合、この文書およびこのスポットに対する包含数は「3」となる。ステップS3において代表スポット出力装置1は、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたレコードを、スポット包含数データ24に挿入して、スポット包含数データ24を更新する。
ステップS1で取得した各文書について、ステップS2およびステップS3の処理が終了すると、ステップS2でカウントされた各スポットについて、ステップS4およびステップS5の処理を実行する。ステップS4において代表スポット出力装置1は、あるスポットについて代表スコアを算出し、スポットの識別子と算出した代表スコアとを対応付けたレコードを、代表スコアデータ25に挿入して、代表スコアデータ25を更新する。
ステップS2でカウントされた各スポットについてステップS4およびステップS5の処理が終了すると、ステップS6に進む。ステップS6において代表スポット出力装置1は、代表スコアデータ25を参照して、代表スコアの高いスポットを代表スコアとして出力する。
(代表スコア出力装置)
図1を参照して、本発明の実施の形態に係る代表スポット出力装置1を説明する。代表スポット出力装置1は、処理装置10、記憶装置20、入力装置30および出力装置40を備える一般的なコンピュータにおいて実現される。一般的なコンピュータが所定の処理を実行するための代表スポット出力プログラムを実行することにより、図2に示す各機能が実現される。
図1を参照して、本発明の実施の形態に係る代表スポット出力装置1を説明する。代表スポット出力装置1は、処理装置10、記憶装置20、入力装置30および出力装置40を備える一般的なコンピュータにおいて実現される。一般的なコンピュータが所定の処理を実行するための代表スポット出力プログラムを実行することにより、図2に示す各機能が実現される。
入力装置30は、キーボード、マウスなどであって、処理装置10に地域やキーワードを入力する。出力装置40は、ディスプレイなどであって、処理装置10によって算出された代表スポットを表示する。入力装置30および出力装置40は、通信ネットワークおよびこの通信ネットワークに接続するコンピュータを介して情報を入出力する、入力装置および出力装置であっても良いし、他の情報処理システムであっても良い。
処理装置10は、記憶装置20に記憶されたデータを読み出したり、作業データを記憶装置20に記憶したりして、入力装置30から入力された地域やキーワードに従って代表スコアを算出して、代表スポットを出力装置40に出力する。記憶装置20は、ROM、RAM、ハードディスクなどのデータを記憶する媒体である。
記憶装置20は、検索インデックスデータ21、文書群データ22、スポット名データ23、スポット包含数データ24および代表スコアデータ25を記憶する。文書群データ22、スポット包含数データ24および代表スコアデータ25は、処理装置10の処理により記憶されるデータである。
文書取得手段11は、地域やキーワードに関連する複数の文書を取得し、文書群データ22として記憶装置20に記憶する。ここで地域やキーワードは、入力装置30からユーザの操作によって入力されても良いし、他のシステム等から入力されても良い。文書取得手段11は、検索インデックスデータ21を参照して、地域やキーワードに対するインデックスを取得し、取得したインデックスを用いて、ウェブや文書データベースなどから、インデックスに対応する複数の文書を取得する。検索インデックスデータ21は、入力装置30から入力される地域やキーワードと、これらに対する検索インデックスとを対応づけたデータである。
文書の取得方法としては、キーワードと地域とをクエリとして文書を検索する。キーワードと地域をクエリとして文書を検索する方法として、文書中に含まれる地域表現の広さを考慮して地名にスコアを付与し、検索結果に反映させる方法が考えられる(安田宜仁,戸田浩之、検索位置のごく周辺を対象とした地理情報検索、人工知能学会論文誌、Vol.23,No.5、pp.364−373、2008)。また文書の取得方法はこれに限るものではなく、インデックスを用いることなく、文書本文にキーワードと地名を表す文字列が含まれる文書を取得する方法が考えられる。また地域の指定方法として、「横浜」などのように文字列をクエリとして指定しても良い。
このように文書取得手段11によって取得された文書の文書群データ22の一例を図3に示す。文書群データ22の各文書は、入力装置30から入力された地域に関連する文書である。文書群データ22は、文書の識別子、タイトルおよび本文を対応づけたデータである。この文書群のタイトルおよび本文には、スポットの名称「AAA」、「BBB」、「CCC」、「DDD」および「EEE」の、5種別のスポットの名称が含まれる。
スポット包含数算出手段12は、各文書において含まれる各スポットの名称の包含数をカウントして、スポット包含数データ24を生成する。スポット包含数データ24は、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたデータである。
スポット包含数算出手段12は、スポット名データ23を参照して、各文書のタイトルおよび文書におけるスポットの名称をカウントする。スポット名データ23は、例えば図4に示すように、スポットの識別子と、スポットの名称とを対応づけたデータである。スポット包含数算出手段12は、文書のタイトルおよび本文を結合した文字列の中にスポット名データ23中のスポットの名称を表す文字列が含まれている場合、そのスポットの名称を抽出し、抽出した文字列の包含数を算出する。
ここで、図3に示す文書の識別子D4の文書について、各スポットの名称の包含数をカウントする処理を説明する。文書の識別子D4の文書のタイトルと本文を連結した文字列は、「DDD DDDのラーメンはAAAのラーメンとCCCのラーメンを足して2で割ったような味でした。」となる。この文字列から、スポット名データ23のスポットの名称を表す文字列を抽出すると、「DDD」「DDD」「AAA」「CCC」が抽出される。抽出した文字列における各スポット名称の包含数を算出すると、スポットの識別子P1の「AAA」の包含数が「1」、スポットの識別子P3の「CCC」の包含数が「1」、スポットの識別子P4の「DDD」の包含数が「2」となる。各文書について、同様に各スポットの包含数を算出する。
各スポットの包含数を算出すると、図5に示すスポット包含数データ24が生成される。スポット包含数データ24は、文書の識別子と、スポットの識別子と、この文書において含まれるこのスポットの名称の包含数を対応づける。
ここでスポット包含数算出手段12の処理はこれに限らない。例えば、スポット名データ23において、スポットの名称を形態素列として格納し、文書を形態素解析した結果の形態素列の中にスポット名を表す形態素列が含まれる場合に、スポット包含数算出手段12は、スポットの名称が含まれていると判定しても良い。また、スポットの名称の表記だけでなく、品詞も一致する場合に、スポット包含数算出手段12は、スポットの名称が含まれていると判定しても良い。
代表スコア算出手段13は、スポット包含数データ24を参照して、各スポットの代表スコアを算出する。ここで代表スコア算出手段13は、各文書において比較の対象とされるスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。また代表スコア算出手段13は、2以上のスポット名が含まれる文書において、包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。また代表スコア算出手段13は、各文書に含まれるスポット名の種別数をカウントし、2以上のスポット名が含まれる文書かつ種別数の少ない文書において、包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する。
本発明の実施の形態において「代表的なスポット」は、その地域のほかのスポットと比較されやすいこと、比較される場合に文書の中でそのスポットはあまり多く言及されないこと、比較される場合に文書の中であまり多くのスポットは言及されないことに着目する。すなわち、一つの文書において、複数のスポットの名称が含まれる場合、そのいずれかは、代表的なスポットの可能性がある。また、一つの文書において、複数のスポットの名称の種別が含まれ、かつ、包含数の少ないスポットは、比較の対象とされるスポットと考えられ代表的なスポットの可能性がある。さらに、一つの文書において複数のスポットの名称が含まれ、なおかつ各スポットの種別数が少ない場合、そのいずれかのスポットは、代表的なスポットの可能性がある。
なお、この式(1)による代表スコアの算出する方法はこれに限らない。複数のスポットが含まれる文書における各スポットの包含数と種別数を用いて、ほかのスポットと多く比較されているほどスコアが高くなるように算出されるものであれば、これに限るものではない。
式(1)による代表スコアを算出する一例を説明する。ここでは、文書に対する重みは一定とし、α(r)=1とする。例として、スポットの識別子P1の「AAA」に関して代表スコアを算出する。
・r=1のとき、δ(r,x)=1、c(r,x)=4、Σyc(r,y)=4あるから、Σ内の値は0
・r=2のとき、δ(r,x)=0であるので、Σ内の値は0
・r=3のとき、δ(r,x)=1、n(r)=5、c(r,x)=1、Σyc(r,y)=1+1+1+1+1=5であるので、Σ内の値は、1×1×(5−1)/5/5=0.16
・r=4のとき、δ(r,x)=1、n(r)=3、c(r,x)=1、Σyc(r,y)=1+1+2=4であるので、Σ内の値は、1×1×(4−1)/3/4=0.25
・r=5のとき、δ(r,x)=0であるので、Σ内の値は0
以上より、S(P1)=0+0+0.16+0.25+0=0.41となる。
・r=1のとき、δ(r,x)=1、c(r,x)=4、Σyc(r,y)=4あるから、Σ内の値は0
・r=2のとき、δ(r,x)=0であるので、Σ内の値は0
・r=3のとき、δ(r,x)=1、n(r)=5、c(r,x)=1、Σyc(r,y)=1+1+1+1+1=5であるので、Σ内の値は、1×1×(5−1)/5/5=0.16
・r=4のとき、δ(r,x)=1、n(r)=3、c(r,x)=1、Σyc(r,y)=1+1+2=4であるので、Σ内の値は、1×1×(4−1)/3/4=0.25
・r=5のとき、δ(r,x)=0であるので、Σ内の値は0
以上より、S(P1)=0+0+0.16+0.25+0=0.41となる。
代表スコア算出手段13は、他のスポットの識別子P2ないしP5についても同様に算出する。これにより代表スコア算出手段13は、図6に示すように、スポットの識別子と、そのスポットの代表スコアとを対応づけた代表スコアデータ25を出力し、記憶装置20に記憶する。
代表スポット出力手段14は、代表スコアの高いスポットの識別子を、代表的なスポットとして出力する。本発明の実施の形態においては、代表スコアの最も高いスポットが、代表的なスポットとなるが、代表的なスポットの決定方法はこれに限らない。例えば、代表スコアの高い上位N件までを代表的なスポットとして決定しても良いし、代表スコアの高い上位X%までを代表的なスポットとして決定しても良い。図6に示す例では、スポットの識別子P3の代表スコアが0.74であるので、スポットの識別子P3のスポット「CCC」が代表的なスポットとなる。
また本発明の実施の形態において、スポットの識別子P1とP3とは、ともに包含数「3」である。しかしながらスポットの識別子P3は、多くの文書でほかのスポットとより比較されているので、スポットの識別子P3は、代表スコアが高く算出され、スポットの識別子P1と比べて代表的なスポットになりうる。
このように本発明の実施の形態に係る代表スポット出力装置1は、地域およびキーワードに対し、それに関連する代表的なスポットを出力することができる。
なお、代表スポット出力装置における処理の順序はこれに限るものではない。例えば、本発明の実施の形態においては、検索インデックスを使って文書を抽出した後、スポットの包含数を算出したが、予め各文書に対して、スポットの包含数を算出しても良い。この場合、スポットの識別子とスポットの包含数を、メタデータとして各文書に対応づけて検索インデックスデータ21等に格納し、スポット包含数算出手段12が、各文書に対応づけられたスポットの識別子とスポットの包含数から、スポット包含数データ24を生成しても良い。
(変形例)
本発明の実施の形態においては、文書のタイトルと本文で包含されるスポットの名称に同じ比重をかけて算出したが、これに限られない。代表的なスポットが比較対象として記載される場合、本文において、タイトルに登場するスポットの名称と比較されることが一般的である。従って、タイトルに含まれるスポットについて、代表スコアが低くなり、タイトルに含まれず、本文にのみ含まれるスポットについて、代表スコアが高くなるように、代表スコアを算出しても良い。
本発明の実施の形態においては、文書のタイトルと本文で包含されるスポットの名称に同じ比重をかけて算出したが、これに限られない。代表的なスポットが比較対象として記載される場合、本文において、タイトルに登場するスポットの名称と比較されることが一般的である。従って、タイトルに含まれるスポットについて、代表スコアが低くなり、タイトルに含まれず、本文にのみ含まれるスポットについて、代表スコアが高くなるように、代表スコアを算出しても良い。
すなわち、文書がタイトルおよび本文を含む場合、代表スコア算出手段13は、タイトルに含まれるスポットの名称の代表スコアより、本文に含まれるスポットの名称の代表スコアが高くなるように、各スポットの代表スコアを算出する。
このような変形例に係る代表スポット算出装置は、より適切に比較対象を特定として、代表的なスポットを出力することができる。
(その他の実施の形態)
上記のように、本発明の実施の形態とその変形例によって記載したが、この開示の一部をなす論述および図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例および運用技術が明らかとなる。
上記のように、本発明の実施の形態とその変形例によって記載したが、この開示の一部をなす論述および図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施の形態、実施例および運用技術が明らかとなる。
例えば、本発明の実施の形態に記載した代表スポット出力装置1は、図2に示すように一つのハードウェア上に構成されても良いし、その機能や処理数に応じて複数のハードウェア上に構成されても良い。また、既存の情報処理システム上に実現されても良い。
本発明はここでは記載していない様々な実施の形態等を含むことは勿論である。従って、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。
1 代表スポット出力装置
10 処理装置
11 文書取得手段
12 スポット包含数算出手段
13 代表スコア算出手段
14 代表スポット出力手段
20 記憶装置
21 検索インデックスデータ
22 文書群データ
23 スポット名データ
24 スポット包含数データ
25 代表スコアデータ
10 処理装置
11 文書取得手段
12 スポット包含数算出手段
13 代表スコア算出手段
14 代表スポット出力手段
20 記憶装置
21 検索インデックスデータ
22 文書群データ
23 スポット名データ
24 スポット包含数データ
25 代表スコアデータ
Claims (7)
- 代表スポット出力装置が、キーワードに対応する代表的なスポットを検索する代表スポット出力方法であって、
代表スポット出力装置が、前記キーワードに関連する複数の文書を取得するステップと、
前記代表スポット出力装置が、各文書において含まれる各スポットの名称の包含数をカウントして、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたスポット包含数データを生成するステップと、
前記代表スポット出力装置が、前記スポット包含数データを参照して、各スポットの代表スコアを算出するステップと、
前記代表スポット出力装置が、前記代表スコアの高いスポットの識別子を、代表的なスポットとして出力するステップと、を備え、
前記代表スコアを算出するステップは、2以上のスポット名が含まれる文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする代表スポット出力方法。 - 前記代表スコアを算出するステップは、各文書に含まれる各スポット名の種別数をカウントし、2以上のスポット名が含まれる文書かつ前記種別数の少ない文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする請求項1に記載の代表スポット出力方法。 - 前記文書がタイトルおよび本文を含む場合、前記代表スコアを算出するステップは、タイトルに含まれるスポットの名称の代表スコアより、本文に含まれるスポットの名称の代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする請求項1または2に記載の代表スポット出力方法。 - キーワードに対応する代表的なスポットを検索する代表スポット出力装置であって、
前記キーワードに関連する複数の文書を取得する文書取得手段と、
各文書において含まれる各スポットの名称の包含数をカウントして、文書の識別子と、スポットの識別子と、当該文書において含まれる当該スポットの名称の包含数を対応づけたスポット包含数データを生成するスポット包含数算出手段と、
前記スポット包含数データを参照して、各スポットの代表スコアを算出する代表スコア算出手段と、
前記代表スコアの高いスポットの識別子を、代表的なスポットとして出力する代表スポット出力手段と、を備え、
前記代表スコア算出手段は、2以上のスポット名が含まれる文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする代表スポット出力装置。 - 前記代表スコア算出手段は、各文書に含まれるスポット名の種別数をカウントし、2以上のスポット名が含まれる文書かつ前記種別数の少ない文書において、前記包含数の少ないスポットの代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする請求項4に記載の代表スポット出力装置。 - 前記文書がタイトルおよび本文を含む場合、前記代表スコア算出手段は、タイトルに含まれるスポットの名称の代表スコアより、本文に含まれるスポットの名称の代表スコアが高くなるように、各スポットの代表スコアを算出する
ことを特徴とする請求項4または5に記載の代表スポット出力装置。 - コンピュータに、請求項1ないし請求項3のいずれか1項に記載のステップを実行させるための代表スポット出力プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014106781A JP5792871B1 (ja) | 2014-05-23 | 2014-05-23 | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014106781A JP5792871B1 (ja) | 2014-05-23 | 2014-05-23 | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5792871B1 true JP5792871B1 (ja) | 2015-10-14 |
JP2015222515A JP2015222515A (ja) | 2015-12-10 |
Family
ID=54330125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014106781A Active JP5792871B1 (ja) | 2014-05-23 | 2014-05-23 | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5792871B1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109791563B (zh) | 2016-09-26 | 2023-06-06 | 日本电气株式会社 | 信息收集系统、信息收集方法和记录介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006048998A1 (ja) * | 2004-11-05 | 2006-05-11 | Intellectual Property Bank Corp. | キーワード抽出装置 |
JP2006331117A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP2010092357A (ja) * | 2008-10-09 | 2010-04-22 | Intec Systems Institute Inc | 施設関連情報検索方法および施設関連情報検索システム |
-
2014
- 2014-05-23 JP JP2014106781A patent/JP5792871B1/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006048998A1 (ja) * | 2004-11-05 | 2006-05-11 | Intellectual Property Bank Corp. | キーワード抽出装置 |
JP2006331117A (ja) * | 2005-05-26 | 2006-12-07 | Ricoh Co Ltd | 文書検索システム、文書検索装置、文書検索方法および文書検索プログラム |
JP2010092357A (ja) * | 2008-10-09 | 2010-04-22 | Intec Systems Institute Inc | 施設関連情報検索方法および施設関連情報検索システム |
Also Published As
Publication number | Publication date |
---|---|
JP2015222515A (ja) | 2015-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5550669B2 (ja) | 検索装置、検索方法およびプログラム | |
JP6728178B2 (ja) | 検索データを処理するための方法及び装置 | |
US10353956B2 (en) | Identifying merchant data associated with multiple data structures | |
JP2010049473A (ja) | リンク情報抽出装置、リンク情報抽出方法およびプログラム | |
JP6662689B2 (ja) | 単語判定装置 | |
JP2015203961A (ja) | 文書抽出システム | |
JP5345987B2 (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP5792871B1 (ja) | 代表スポット出力方法、代表スポット出力装置および代表スポット出力プログラム | |
JP2011100208A (ja) | 行動推定装置、行動推定方法および行動推定プログラム | |
JP6163143B2 (ja) | 情報提供装置、情報提供方法、および情報提供プログラム | |
JP2010123036A (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2014174781A (ja) | アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム | |
JP5127553B2 (ja) | 情報処理装置、情報処理方法、プログラム及び記録媒体 | |
JP6488399B2 (ja) | 情報提示システム、及び情報提示方法 | |
JP5826148B2 (ja) | 図面管理サーバ及びこれを用いた図面管理システム | |
JP5544003B2 (ja) | 情報検索装置、情報検索システム、及び情報検索方法 | |
JP6034584B2 (ja) | 特許調査支援装置、特許調査支援方法、およびプログラム | |
JP2016192067A (ja) | 検索装置 | |
JP2014229231A (ja) | 地域連想語抽出装置、地域連想語抽出方法及び地域連想語抽出プログラム | |
JP2013125429A (ja) | 分析対象決定装置 | |
JP2011013969A (ja) | リンク作成支援装置、リンク作成支援方法およびプログラム | |
JP2013242620A (ja) | 近隣情報検索装置及び方法及びプログラム | |
JP5583107B2 (ja) | キーワード地名ペア抽出装置及び方法及びプログラム | |
JP4049543B2 (ja) | 文書検索装置、文書検索プログラム、記録媒体 | |
JP2005141449A (ja) | 情報フィルタリング用プロファイル作成装置、情報フィルタリング用プロファイル作成方法および記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150804 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150806 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5792871 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |