JP6556660B2 - 特性理解装置、方法、及びプログラム - Google Patents

特性理解装置、方法、及びプログラム Download PDF

Info

Publication number
JP6556660B2
JP6556660B2 JP2016101881A JP2016101881A JP6556660B2 JP 6556660 B2 JP6556660 B2 JP 6556660B2 JP 2016101881 A JP2016101881 A JP 2016101881A JP 2016101881 A JP2016101881 A JP 2016101881A JP 6556660 B2 JP6556660 B2 JP 6556660B2
Authority
JP
Japan
Prior art keywords
word
road
characteristic
unit
spot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016101881A
Other languages
English (en)
Other versions
JP2017208045A (ja
Inventor
拓哉 西村
拓哉 西村
京介 西田
京介 西田
浩之 戸田
浩之 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016101881A priority Critical patent/JP6556660B2/ja
Publication of JP2017208045A publication Critical patent/JP2017208045A/ja
Application granted granted Critical
Publication of JP6556660B2 publication Critical patent/JP6556660B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Instructional Devices (AREA)
  • Navigation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、特性理解装置、方法、及びプログラムに関する。
経路探索などの各種サービス実現のために道路の特性を理解したいというニーズがある。例えば、どの道がにぎやかか、明るいかといった特性を理解し、それらの道路を優先的に探索することで、にぎやかな道を通りたい、明るい道を通りたいといったユーザのニーズに応えた経路探索を実現できる。
実世界において地理的に分布する多様な特性を理解するための、いくつかの既存の取り組みがある。
一つの取り組みは、人手で、各道路にその特性の情報を付与することに取り組むものである(非特許文献1)。これらの取り組みは、クラウドソーシングなどを用いてあらかじめ指定された特徴が各道路にあてはまるかを人手で評価し、その結果を道路ネットワーク上の各道路に付与して経路探索などに用いるものである。ここでいう道路ネットワークとは、交差点をノード、道路をエッジとして道路網をグラフの形式で表現したデータ形式のことであり、経路探索などに一般に用いられるものである。
もう一つの取り組みは統計情報から各道路の特性を推定するものである(非特許文献2)。政府の公開しているオープンデータや車などの移動軌跡情報を基に、各道路の安全度やグリーンガス排出量などを推定する取り組みである。
またもう一つの取り組みは、ソーシャルメディアなどのWeb上の情報を用いて地域の情報を理解しようとする取り組みである(非特許文献3)。これらの取り組みは、緯度経度の紐付いたテキストデータを元に、POI(Point of Interest)単位ないし円状やセル上のエリア単位でどのように特性が分布しているかを理解しようとするものである。ここでいうPOIとは、店舗や観光地など人が興味を持って訪問するスポットのことである。
Daniele Quercia, Rossano Schifanella and Luca Maria Aiello "The shortest path to happiness: recommending beautiful, quiet, and happy routes in the city", in Proc. of Hypertext,2014. B. Yang et al, "Using incomplete information for complete weight annotation of road networks", in IEEE Transactions on Knowledge and Data Engineering,2011. Zhijun Yin et al, "Geographical topic discovery and comparison", in Proc. of WWW,2011.
しかしながら、上記の非特許文献に係る従来技術においても以下の問題がある。
一つ目の問題は、人手での情報付与や指定した情報を抽出する手法はコストが大きく、広範なエリアや様々な情報の取得に適用することが出来ないという点である。
二つ目の問題は、統計情報から特性を推定する取り組みでは収集可能な情報の種類が限定的であり、人の主観に関する特性などを推定することは出来ないという点である。
三つ目の問題は、ソーシャルメディアなどのWeb上の情報を用いた地域の情報理解の取り組みではPOI単位やエリア単位での特性理解への取り組みは存在し、その結果を道路に割り当てる取り組みも存在するが、それらは道路とPOIやエリアとの関係性を考慮していないという点である。
POI単位の特性理解を利用して道路の特性を理解する手法の一つとしては、POIの情報を近隣の道路に付与する手法が考えられる。図13に模式図を示す。図13に示す手法では、各POIの特性を最近傍の道路に割り当てる。しかし、この手法では道路とPOIとの関係性を正しく考慮しておらず、正しく特性を推定することは出来ない。
POIの特性は、そのPOI接する道路から影響を受ける部分と、POI独自の部分との組み合わせになっていると考えられる。例えばにぎやかな道の近くにある飲食店はにぎやかな雰囲気だと考えられるが、どういった料理が出るか、といった特性は道路とは無関係である。
また、POIが道路から影響を受けるような特性は、同一の道路に接する他のPOIにも影響していると考えられる。これらを考慮しなければ道路自体の特性を推定することは出来ない。また道路の構造関係を考慮して推定することも同時に行う必要がある。なぜなら上記図13に示すように特性についてのデータが得られない道路も存在するためである。
また、エリア単位の特性理解を利用して道路の特性を理解する手法としてはそのエリア内の道路にその特性を付与する手法も考えられる。図14に模式図を示す。しかしこの手法ではそのエリア内の道路の特性は一律になってしまい、例えば経路探索においてはそのエリアにある道路のうちどれがユーザのニーズに合致したものであるか分からないという問題がある。
本発明は、上記の事情に鑑みてなされたもので、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる特性理解装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る特性理解装置は、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成する関係構造化部と、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する特性推定部と、を含んで構成されている。
第2の発明に係る特性理解方法は、関係構造化部及び特性推定部を含む特性理解装置における特性理解方法であって、前記関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成するステップと、前記特性推定部が、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定するステップと、を含む。
第1及び第2の発明によれば、関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ道路の情報がグラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成する。
そして、特性推定部が、スポット毎に紐付けられた単語情報を含むデータ集合と、関係構造化部によって得られた、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する。
このように、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、スポット毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各スポットの特性と、各道路の特性とを推定することにより、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる。
本発明の前記目的関数は、前記スポット毎に紐付けられた前記データ集合の単語情報が表す各単語が出現する回数と、前記データ集合の単語情報に含まれる各単語の特性、各スポットの特性、及び各道路の特性を用いて表される、前記道路に割り当てられた前記スポットにおいて各単語が生成される生成確率とを用いて算出される各スポットの前記データ集合の尤度と、前記道路間の関係から得られる接続された道路間の前記道路の特性の類似度を用いて表される各道路の特性に関する制約とを含むようにすることができる。
また、本発明は、前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出する適合度算出部と、を更に含むようにすることができる。
また、本発明は、前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出する適合度算出部と、を更に含むようにすることができる。
また、本発明のプログラムは、コンピュータを、上記特性理解装置を構成する各部として機能させるためのプログラムである。
以上説明したように、本発明の特性理解装置、方法、及びプログラムによれば、道路ネットワークと、スポットの位置情報とに基づいて、道路の各々に対しスポットを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、スポット毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたスポット及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各スポットの特性と、各道路の特性とを推定することにより、スポットと道路との関係及び道路間の関係を考慮して、スポットの特性及び道路の特性を精度よく推定することができる、という効果が得られる。
本実施の形態の概要を説明するための図である。 本実施の形態に係る特性理解装置の機能的構成を示すブロック図である。 POIデータの一例を示す図である。 POIデータの形式を変換した一例を示す図である。 POIの緯度経度情報の一例を示す図である。 道路ネットワークの一例を示す図である。 道路ネットワークの一例を示す図である。 単語の特性、POIの特性、及び道路の特性の一例を示す図である。 単語前処理部の処理の一例を示す図である。 適合度の算出の処理の一例を示す図である。 本実施形態に係る特性理解装置における特性推定処理ルーチンの処理を表すフローチャートである。 本実施形態に係る特性理解装置における適合度算出処理ルーチンの処理を表すフローチャートである。 従来技術の一例を示す図である。 従来技術の一例を示す図である。
以下、図面を参照して、本発明の実施の形態を詳細に説明する。
<本発明の実施の形態の概要>
まず、本発明の実施の形態の概要について説明する。本発明の実施の形態は、ソーシャルメディアなどのWeb上の情報を基に、実世界の状況を理解する手法に関する。本実施の形態においては、データ集合の単位として、スポットの一例であるPOI(Point of Interest)を用いる。POIとは、店舗や観光地など人が興味を持って訪問するスポットのことである。
本発明の実施の形態では、POIと道路との関係性と、道路同士の構造関係とを考慮しながら道路の特性を推定し、同時にPOIの特性も推定する。また、所望の特性を持つPOIや道路を人間が探し出すためには、POIの特性又は道路の特性と照合可能な形の単語の特性も必要になるため、単語の特性も同時に推定する。
図1に、本実施の形態を説明するための図を示す。
まず、POIと道路との関係性をどのように考慮するかについて説明する。上記図1に示すように、POIの特性は、そのPOIが接する道路から影響を受ける部分と、POI独自の部分との組み合わせになっていると考え、本実施の形態では、それらを同時に推定することができる仕組みを考える。
次に、道路同士の構造関係について説明する。上記図1に示すように、道路の特性は、接続した道路は似た特性を持つ、接続しているがその規模が大きく異なる道路では特性の類似度が下がる、などの特徴を持つことが考えられる。
例えば、二つの道路の規模が類似していてまっすぐつながっている場合には、雰囲気などが近く、特性も類似すると考えられる。一方、まっすぐではなく90度に接続されている場合には、特性の類似度は下がると考えられる。
上記の二点を考慮することで、POIが多い道路ではその共通している部分を道路の特性として抽出する、POIのデータが不足している道路については接続された道路の特性を用いることで推定するといったことが可能になり、道路の特性を高精度に推定することができる。
また、上記の推定の結果得られた単語・POI・道路の特性を組み合わせて用いることで、与えられたキーワードに対して、各POIと各道路とが、そのキーワードにどれほど当てはまっているかを示す数値である適合度が算出可能になる。これを用いれば、様々なキーワードを指定しての経路探索や、キーワードに適したPOIの前を通る経路探索などが行えるようになる。
<本発明の実施形態に係る特性理解装置の構成>
次に、本発明の実施形態に係る特性理解装置の構成について説明する。図2に示すように、本発明の実施形態に係る特性理解装置100は、CPUと、RAMと、後述する特性推定処理ルーチン、及び適合度算出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この特性理解装置100は、機能的には図2に示すように入力部10と、演算部20と、出力部50と、を含んで構成されている。なお、本実施の形態に係る特性理解装置は、POIについてのデータと道路ネットワークとを用いて、各単語の特性、各POIの特性、及び各道路の特性を推定する。また、本実施の形態に係る特性理解装置は、各単語の特性、各POIの特性、及び各道路の特性に関する出力結果を利用して、外部から与えられた単語と各道路との適合度及び単語と各POIとの適合度を出力する。
入力部10は、外部から単語を入力として受け付ける。
演算部20は、POIデータ記憶部22と、POIデータ前処理部24と、POI緯度経度記憶部26と、道路ネットワーク記憶部28と、道路POI関係構造化部30と、特性推定部32と、単語特性記憶部40と、位置特性記憶部42と、道路特性記憶部44と、単語前処理部46と、適合度算出部48とを含んで構成されている。
POIデータ記憶部22には、POIの各々に対し、テキストデータが記憶されている。具体的には、POIデータ記憶部22には、ソーシャルメディアなどのWeb上の情報から収集したデータなど、各POIに関するデータ(以後、POIデータとする)が記憶されている。POIデータの例としては、例えば、POI毎に投稿されたテキストデータである。図3にPOIデータの一例を示す。
POIデータ前処理部24は、POIデータ記憶部22に記憶されているPOIデータの各々について、後述する特性推定部32の処理に適した形式にデータを処理し、POIと単語情報を含むデータ集合とが紐付いたスポット情報を出力する。例えば、POIデータ前処理部24は、POIデータのテキストから、テキスト中に各単語が何回出現したかのカウントをまとめたデータ形式であり、単語情報を含むデータ集合の一例であるBag of Wordsを生成する。図4にPOIデータ前処理部24によってPOIデータの形式が変更された例を示す。なお、図4の例においては、入力されるPOIデータは、図3のPOIデータが入力されたものとする。また、POIデータ前処理部24によって、POIデータの形式が変更された情報を以後、スポット情報とする。図4の例に示すように、スポット情報は、POIと、単語情報を含むデータ集合とが紐付けたものである。
POI緯度経度記憶部26には、POIの各々についての緯度経度情報(以後、POIの位置情報)が記憶されている。図5にPOIの位置情報の例を示す。
道路ネットワーク記憶部28には、道路ネットワークが記憶されている。道路ネットワークとは、各道路をエッジ、各交差点をノードとして道路網をグラフの形式で表現し、さらに道路の規模などのメタデータを表す道路の情報が当該グラフに付与されている形式のデータのことである。
具体的なデータ形式の一例としては、各道路が複数の緯度経度を持つ座標点データのリストとして表現されているものが考えられる。この場合、各道路の始点と終点の座標点が道路ネットワークにおけるノードとなり、共通のノードを始点もしくは終点として持つ道路同士が接続されていることになる。また、道路の規模などのメタデータが各道路について保存されている。道路ネットワークの一例を図6に示す。
関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークと、POI緯度経度記憶部26に記憶されているPOIの位置情報の各々とに基づいて、道路の各々に対しPOIを割り当てる。また、関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークに基づいて、道路の各々について、道路網の構造関係を考慮した道路間の関係としてのグラフを生成する。
具体的には、関係構造化部30は、POI緯度経度記憶部26及び道路ネットワーク記憶部28からデータを読み取り、二つのテーブルを出力する。一つ目は、各POIを最近傍の道路に割り当てたテーブルである。二つ目は、道路ネットワークから作成したグラフを表すテーブルである。このグラフは、道路をノードとして、接続された道路の間にエッジを張り、道路間の関係性に応じて重みを設定したものである。この重みは、道路間でどれほど特性が類似すると考えられるかを表すものとする。例えば以下に示す(1)〜(4)のような実現方法が考えられる。
(1)道路が接続されている場合、道路間の重みの初期値を1とする。
(2)規模が異なっていれば0.3をかける。
(3)同じ交差点により規模の大きい道路が存在する場合は0.3をかける。
(4)道路間の角度が180度の場合を1、90度の場合を0.3として、道路間の角度に応じて連続的に変化させた値をかける。
関係構造化部30における入出力例を図7に示す。関係構造化部30に対して実際に入力されるデータは、上記図5及び上記図6に示すデータであるが、それぞれの道路とPOIとを緯度経度座標上に可視化したものを図7の入力例に示している。
図7に示す入力例では、POI1とPOI2とは道路1を最近傍としている。そのため、出力のうち道路とPOIとの関係性テーブルで、道路1とPOI1、POI2が紐付けられることになる。また、道路1は道路2と道路3とが接続されているため、道路1‐道路2と道路1‐道路3にそれぞれエッジが設定され、道路ネットワークを反映したグラフを表すテーブルのように出力される。
また、道路1と道路2とは、まっすぐつながっているために特性の類似度が高いと考えられるため、重みが大きい。一方、道路1と道路3とはまっすぐではないために特性の類似度は低いと考えられるため、重みが小さくなっている。
特性推定部32は、POIデータ前処理部24によって得られた、POI毎の単語情報を含むデータ集合と、関係構造化部30によって得られた、道路の各々に対して割り当てられたPOI及びグラフとに基づいて、データ集合の単語情報に含まれる各単語の特性と、各POIの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、データ集合の単語情報に含まれる各単語の特性と、各POIの特性と、各道路の特性とを推定する。特性推定部32は、単語特性推定部34と、POI特性推定部36と、道路特性推定部38とを備える。
特性推定部32は、POIデータ前処理部24及び道路POI関係構造化部30の出力を受け取り、単語とPOIと道路との特性を同時に推定する。その際、POIと道路の関係性と、道路の構造関係を考慮する。
この機能を実現する方法として、グラフ制約と階層構造を考慮したpLSA(Probabilistic Latent Semantic Analysis)(例えば、参考文献(T. Hofmann. “Probabilistic latent semantic indexing.” in Proc. of SIGIR, 1999)を参照)を利用することなどが考えられる。pLSAはテキストデータから各文書のBag of Wordsを入力として、各単語と各文書に対してその意味を表現するようなベクトルを出力する技術である。pLSAを処理手法として用いる場合は、各POIのテキストを文書とみなし、道路とその近傍POIの階層構造と、道路ネットワークの構造を考慮するように拡張することで実現できる。
階層構造を考慮する場合には、例えば、Sparse Additive Generative Model(例えば、参考文献(J.Eisenstein et al, “Sparse additive generative models of text” in Proc. of ICML, 2011)を参照)などを用いることで実現できる。
次に、テキストを情報として用いる場合についての、具体的な式を示す。全てのテキストデータの集合をC、各道路rの集合をノード集合R、接続された道路同士の間にエッジを張りその集合をEと定義し、GをG=(R,E)とあらわされるグラフとしたとき、全体の目的関数を以下の式(1)のように定義し、これを最小化するように単語・POI・道路の特性を推定する。
(1)
ここでL(C,G)は各単語の生成確率から計算される各POIのデータ集合についての尤度を表す。また、R(G)はグラフ構造に基づく各道路の特性に関する制約を表す。λはこの二項に関する重み項である。
道路rの近傍にあるPOIの集合をPr、各POIpに紐付けられたデータ集合の単語情報が表す単語wが出現した回数をc(w,p)、道路rの近傍のPOIpで単語wが生成される生成確率をp(w|r,p)としたとき、L(C,G)は以下のように定義される。
(2)
また、p(w|r,p)は以下のように定義される。
(3)
上記式(3)に示すように、道路rに割り当てられたPOIpにおいて各単語wが生成される生成確率p(w|r,p)は、テキストデータに含まれる各単語の特性、各POIの特性、及び各道路の特性を用いて表される。
ここで、ψは各道路の持つ特性を表すベクトル、θは各POIの持つ特性を表すベクトル、φは各トピックの持つ単語分布を表す。ψ は道路rの特性を表すベクトルのz次元目の大きさを表し、θ はPOIpの特性を表すベクトルのz次元目の大きさを表す。φ はトピックzにおける単語wの生成確率を表す。また、Kはトピック数を表し、Vは全テキスト中に出てきた語彙の集合を表す。
上記式について詳しく説明する。各単語の生成確率は、あるトピックzのそのPOIにおける生成確率に、トピックzにおけるその単語の生成確率をかけることを全てのトピックについて行い、その和を取ることで算出される。また、あるPOIpにおけるトピックの生成確率は、そのPOIが隣接する道路rにおけるトピックzの生成しやすさを示すパラメータであるψ に、POIpと道路の差分を足し合わせた値から算出される。この式を用いてp(w|r,p)を計算することで、ある道路rの近傍POIで共通して生成されやすい単語があり、またそれぞれのPOIで個別に生成されやすい単語もあることが表現できる。
また、上記式(1)のR(G)は以下のように定義される。
(4)
ここで、w(r,r’)は道路rとr’の特性の類似度の強さを表す。詳細は後述する。diff(ψ,ψr’)は特性ψの一致度を算出する関数であり、内積などによって実現できる。この式の最大化を図ることで、特性の類似度が高いと考えられる道路において、それぞれの特性の推定結果の値が近くなるようにできる。
w(r,r’)について説明する。w(r,r’)は道路間の特性の類似度を表し、道路POI関係構造化部30から出力された重みである。これを用いると、道路の構造関係から来る特性の類似度を考慮しながらψを求めることができる。
従って、上記式(1)のR(G)は、関係構造化部30から出力されたグラフから得られる、接続された道路間の道路の特性の類似度diff(ψ,ψr’)を用いて表される。
以上を考慮しながら、φ,ψ,θを最適化することで単語・POI・道路の特性を推定する。最適化する方法としては、Gibbs Samplingを用いることができる。本実施の形態では、Gibbs Samplingを用いてφ,ψ,θを推定する場合を例に説明する。
具体的には、まず、φ,ψ,θを適当に初期化する。
次に、単語特性推定部34は、初期化された、又は前回推定されたψ,θを固定して、上記式(1)についてφを最適化する。
POI特性推定部36は、初期化された、又は前回推定されたθと、単語特性推定部34によって推定されたφとを固定して、上記式(1)についてψを最適化する。
道路特性推定部38は、単語特性推定部34によって推定されたφと、POI特性推定部36によって推定されたψとを固定して、上記式(1)についてθを最適化する。
そして、予め定められた条件を満たすまで、単語特性推定部34、POI特性推定部36、及び道路特性推定部38の推定処理を繰り返すことで、上記式(1)の目的関数の最適化が実現できる。
単語特性推定部34、POI特性推定部36、及び道路特性推定部38における最適化は、Projected Scaled Sub-Gradient(例えば、参考文献(M. Schmidt, A. Niculescu-Mizil, and K. Murphy, “Learning graphical model structure using l1-regularization paths”, in Proc. of AAAI, 2007.)を参照)などで実現することができる。図8に、出力の例を示す。
単語特性記憶部40には、特性推定部32によって推定された各単語の特性が記憶されている。
位置特性記憶部42には、特性推定部32によって推定された各POIの特性が記憶されている。
道路特性記憶部44には、特性推定部32において推定された各道路の特性が記憶されている。
図8に、単語特性記憶部40に記憶される単語の特性の例、位置特性記憶部42に記憶されるPOIの特性の例、道路特性記憶部44に記憶される道路の特性の例を示す。
単語前処理部46は、単語特性記憶部40に記憶された各単語の特性に基づいて、入力部10から入力された単語を、単語の特性に変換する。具体的には、単語前処理部46は、入力部10において受け付けた単語について、単語特性記憶部40に記憶されている各単語の特性のうち、単語が一致する単語の特性を、当該受け付けた単語の特性として取得する。図9に、受け付けた単語が「喫茶店」である場合において、取得される単語特性の例を示す。
適合度算出部48は、位置特性記憶部42に記憶された各POIの特性と、単語前処理部46により変換された単語の特性とに基づいて、入力された単語とPOIの各々との適合度を算出し、結果を出力部50から出力する。
また、適合度算出部48は、道路特性記憶部44に記憶された各道路の特性と、単語前処理部46により変換された単語の特性とに基づいて、入力された単語と道路の各々との適合度を算出し、結果を出力部50から出力する。
なお、本実施形態においては、各単語の特性、各POIの特性、及び各道路の特性をベクトル表現しているため、単語とPOIとの適合度及び単語と道路との適合度は、各々の特性のベクトルの内積で計算する。図10に、適合度算出部48における入力と出力とのデータの例を示す。
出力部50は、適合度算出部48の出力を受け取り外部へと出力する。
<本発明の実施形態に係る特性理解装置の作用>
次に、本発明の実施形態に係る特性理解装置100の作用について説明する。本発明の実施の形態では、処理プロセスとして、図11に示すように各特性を推定し蓄積する処理フローと、図12に示すように入力された単語と各特性との適合度を算出する処理フローとがある。
まず、特性理解装置100は、POIデータ記憶部22からPOIデータの各々を読み込むと、図11に示す特性推定処理ルーチンを実行する。
まず、ステップS100において、POIデータ前処理部24は、読み込んだPOIデータの各々について後述するステップS102の処理に適した形式にデータを処理し、POIと単語情報を含むデータ集合とが紐付いたスポット情報を取得する。
次に、ステップS102において、関係構造化部30は、道路ネットワーク記憶部28に記憶されている道路ネットワークと、POI緯度経度記憶部26に記憶されているPOIの位置情報の各々とに基づいて、道路の各々に対しPOIを割り当てる。
ステップS104において、特性推定部32は、上記ステップS100で得られた、POI毎の単語情報を含むデータ集合と、上記ステップS102で得られた、道路の各々に対して割り当てられたPOI及びグラフとに基づいて、上記式(1)に示す目的関数を最適化するように、データ集合に含まれる各単語の特性と、各POIの特性と、各道路の特性とを推定する。
そして、ステップS106において、特性推定部32は、上記ステップS104で推定した、各単語の特性を単語特性記憶部40に記憶させ、各POIの特性を位置特性記憶部42に記憶させ、各道路の特性を道路特性記憶部44に記憶させ、特性推定処理ルーチンを終了する。
次に、特性理解装置100は、入力部10において単語を受け付けると、図12に示す適合度算出処理ルーチンを実行する。
まず、ステップS200では、単語特性記憶部40に記憶されている各単語の特性と、位置特性記憶部42に記憶されている各POIの特性と、道路特性記憶部44に記憶されている各道路の特性とを読み込む。
次に、ステップS202では、単語前処理部46は、ステップS200において取得した各単語の特性に基づいて、入力部10において受け付けた単語の特性を取得する。
次に、ステップS204では、適合度算出部48は、ステップS200において取得した各POIの特性と、ステップS202において取得した入力部10において受け付けた単語の特性とに基づいて、当該単語と各POIとの適合度の各々を算出する。また、適合度算出部48は、ステップS200において取得した各道路の特性と、ステップS202において取得した入力部10において受け付けた単語の特性とに基づいて、当該単語と各道路との適合度の各々を算出する。
次に、ステップS206では、ステップS204において取得した入力部10において受け付けた単語と各POIとの適合度の各々、及び入力部10において受け付けた単語と各道路との適合度の各々を、出力部50から出力して、適合度算出処理ルーチンを終了する。
以上説明したように、本発明の実施形態に係る特性理解装置によれば、道路ネットワークと、POIの位置情報とに基づいて、道路の各々に対しPOIを割り当てると共に、道路の各々について、道路網の構造関係を考慮した道路間の関係を生成し、POI毎に紐付けられた単語情報を含むデータ集合と、道路の各々に対して割り当てられたPOI及び道路間の関係とに基づいて、データ集合に含まれる各単語の特性と、各POIの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、各単語の特性と、各POIの特性と、各道路の特性とを推定することにより、POIと道路との関係及び道路間の関係を考慮して、POIの特性及び道路の特性を精度よく推定することができる。
また、記憶された各単語の特性に基づいて、入力された単語を特性に変換し、記憶された各POIの特性及び各道路の特性と、変換された入力された単語の特性とに基づいて、入力された単語とPOIの各々との適合度及び入力された単語と道路の各々との適合度を算出することにより、POIと道路との関係及び道路間の関係を考慮して、単語とPOIの各々との適合度及び単語と道路の各々との適合度を算出することができる。
また、Web上に存在する情報を用いて、道路及びPOIの関係性と、道路同士の関係性とを考慮しながら、各POIと道路とについて、様々なキーワードとの適合度を高精度に算出する仕組みを構築することができる。これにより、人の主観に関するものなど様々なキーワードについて、そのキーワードと適合するPOI又は道路を重視した経路探索などのサービスが実現できる。
また、ソーシャルメディアなどのWeb上の情報を基に、実世界の情報を理解することができる。
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、本実施形態においては、入力された単語とPOIの各々との適合度及び入力された単語と道路の各々との適合度を算出する場合を例に説明したが、これに限定されるものではなく、単語とPOIの各々との適合度及び単語と道路の各々との適合度の何れか一方のみを算出してもよい。
また、本実施形態においてはPOIに関するデータをテキストデータとする場合について説明したが、これに限定されるものではなく、POIに関するデータとして、画像データにメタデータとして単語集合が付加されているものを用いてもよい。この場合、POI毎の1画像データを1テキストとみなして、当該画像データに含まれる単語の集合を上述の1テキストとみなして本実施形態に係る特性理解装置の各処理を行えばよい。
また、本実施形態においては、単語の特性、POIの特性、及び道路の特性を推定する場合に、pLSIを用いる場合について説明したが、これに限定されるものではなく、他の手法を用いてもよい。
また、本実施形態においては、POIデータと、POIの位置情報とが別々に記憶されている場合について説明したが、これに限定されるものではない。例えば、POIデータと、POIの位置情報とを合わせてPOIデータとして記憶していてもよい。当該場合、本実施形態においては、POIの位置情報は、POIデータ記憶部22から取得されることとなる。
また、データ集合の単位を、POIとした場合を例に説明したが、これに限定されるものではない。例えば、POI以外の地点や地域を、データ集合の単位としてもよい。
また、上述の特性理解装置100は、内部にコンピュータシステムを有しているが、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体、例えばCD−ROMやメモリーカード等に格納して提供することも可能である。
10 入力部
20 演算部
22 データ記憶部
24 POIデータ前処理部
26 緯度経度記憶部
28 道路ネットワーク記憶部
30 関係構造化部
32 特性推定部
34 単語特性推定部
36 特性推定部
38 道路特性推定部
40 単語特性記憶部
42 位置特性記憶部
44 道路特性記憶部
46 単語前処理部
48 適合度算出部
50 出力部
100 特性理解装置

Claims (8)

  1. 各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成する関係構造化部と、
    前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定する特性推定部と、
    を含む特性理解装置。
  2. 前記目的関数は、前記スポット毎に紐付けられた前記データ集合の単語情報が表す各単語が出現する回数と、前記データ集合の単語情報に含まれる各単語の特性、各スポットの特性、及び各道路の特性を用いて表される、前記道路に割り当てられた前記スポットにおいて各単語が生成される生成確率とを用いて算出される各スポットの前記データ集合の尤度と、前記道路間の関係から得られる接続された道路間の前記道路の特性の類似度を用いて表される各道路の特性に関する制約とを含む
    請求項1に記載の特性理解装置。
  3. 前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、
    前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、
    前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、
    前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出する適合度算出部と、
    を更に含む請求項1又は請求項2に記載の特性理解装置。
  4. 前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、
    前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、
    前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換する単語前処理部と、
    前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出する適合度算出部と、
    を更に含む請求項1又は請求項2に記載の特性理解装置。
  5. 関係構造化部及び特性推定部を含む特性理解装置における特性理解方法であって、
    前記関係構造化部が、各道路をエッジとし各交差点をノードとして道路網をグラフの形式で表現し、かつ前記道路の情報が前記グラフに付与されている道路ネットワークと、スポットの位置情報とに基づいて、前記道路の各々に対し前記スポットを割り当てると共に、前記道路の各々について、前記道路網の構造関係を考慮した前記道路間の関係を生成するステップと、
    前記特性推定部が、前記スポット毎に紐付けられた単語情報を含むデータ集合と、前記関係構造化部によって得られた、前記道路の各々に対して割り当てられた前記スポット及び前記道路間の関係とに基づいて、前記データ集合の単語情報に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを含む予め定められた目的関数を最適化するように、前記データ集合に含まれる各単語の特性と、各スポットの特性と、各道路の特性とを推定するステップと、
    を含む特性理解方法。
  6. 前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各スポットの特性を記憶した位置特性記憶部と、単語前処理部と、適合度算出部とを更に含み、
    前記単語前処理部が、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換するステップと、
    前記適合度算出部が、前記位置特性記憶部に記憶された各スポットの特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記スポットの各々との適合度を算出するステップと、
    を含む請求項5に記載の特性理解方法。
  7. 前記特性推定部によって推定された、前記データ集合の単語情報に含まれる各単語の特性を記憶した単語特性記憶部と、前記特性推定部によって推定された、各道路の特性を記憶した道路特性記憶部と、単語前処理部と、適合度算出部とを更に含み、
    前記単語前処理部が、前記単語特性記憶部に記憶された各単語の特性に基づいて、入力された単語を前記単語の特性に変換するステップと、
    前記適合度算出部が、前記道路特性記憶部に記憶された各道路の特性と、前記単語前処理部により変換された前記入力された単語の特性とに基づいて、前記入力された単語と前記道路の各々との適合度を算出するステップと、
    を含む請求項5に記載の特性理解方法。
  8. コンピュータを、請求項1〜請求項4の何れか1項に記載の特性理解装置を構成する各部として機能させるためのプログラム。
JP2016101881A 2016-05-20 2016-05-20 特性理解装置、方法、及びプログラム Active JP6556660B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016101881A JP6556660B2 (ja) 2016-05-20 2016-05-20 特性理解装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016101881A JP6556660B2 (ja) 2016-05-20 2016-05-20 特性理解装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2017208045A JP2017208045A (ja) 2017-11-24
JP6556660B2 true JP6556660B2 (ja) 2019-08-07

Family

ID=60415036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016101881A Active JP6556660B2 (ja) 2016-05-20 2016-05-20 特性理解装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6556660B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807070A (zh) * 2019-10-25 2020-02-18 普强信息技术(北京)有限公司 一种基于神经网络的路况信息提取方法
CN110851738B (zh) * 2019-10-28 2021-03-19 百度在线网络技术(北京)有限公司 获取poi状态信息的方法、装置、设备和计算机存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3656964B2 (ja) * 2002-04-10 2005-06-08 松下電器産業株式会社 ナビゲーション装置
JP2010237112A (ja) * 2009-03-31 2010-10-21 Equos Research Co Ltd 情報提供装置
JP4686627B2 (ja) * 2009-09-07 2011-05-25 キャンバスマップル株式会社 ナビゲーション装置、ナビゲーションシステム、およびナビゲーションプログラム
JP2014071011A (ja) * 2012-09-28 2014-04-21 Navitime Japan Co Ltd 情報処理システム、情報処理サーバ、情報処理方法、および、プログラム

Also Published As

Publication number Publication date
JP2017208045A (ja) 2017-11-24

Similar Documents

Publication Publication Date Title
Kurashima et al. Travel route recommendation using geotags in photo sharing sites
Hulden et al. Kernel density estimation for text-based geolocation
US11216499B2 (en) Information retrieval apparatus, information retrieval system, and information retrieval method
JP6788637B2 (ja) 情報検索装置及び情報検索システム
JP6015467B2 (ja) 同乗者検索装置、同乗者検索システムおよび方法
JP5087377B2 (ja) 地理的情報を含む文書群の検索装置、検索方法、検索プログラムおよびそのプログラムを記録した記録媒体
JP6478734B2 (ja) アイテム推薦装置、アイテム推薦方法およびプログラム
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
Zhao et al. Annotating points of interest with geo-tagged tweets
JP6556660B2 (ja) 特性理解装置、方法、及びプログラム
JP2013073626A (ja) コンセプトキーワード拡張データセットを利用した検索方法、装置、及びコンピュータ読み取り可能な記録媒体
Levin et al. TARS: traffic-aware route search
CN106503858A (zh) 一种训练用于预测社交网络用户转发消息的模型的方法
JP6034229B2 (ja) 位置情報処理装置及び位置情報処理方法
Amores et al. A proactive route planning approach to navigation errors
Chakraborty et al. Retrievability based document selection for relevance feedback with automatically generated query variants
JP2017191357A (ja) 単語判定装置
CN107766881B (zh) 一种基于基础分类器的寻路方法、设备及存储设备
JP6649229B2 (ja) 待ち時間予測装置、待ち時間予測方法、及び待ち時間予測プログラム
Pippig et al. Semantic similarity analysis of user-generated content for theme-based route planning
JP6529450B2 (ja) 道路特性理解装置、方法、及びプログラム
Duan et al. Towards building and evaluating a personalized location-based recommender system
Wang et al. Modeling infinite topics on social behavior data with spatio-temporal dependence
JP6942104B2 (ja) 判定装置、判定方法、および判定プログラム
JP2022059497A (ja) 検索装置、検索方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190710

R150 Certificate of patent or registration of utility model

Ref document number: 6556660

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150