JP2012027850A - 情報処理装置、情報処理システム、情報処理方法およびプログラム - Google Patents

情報処理装置、情報処理システム、情報処理方法およびプログラム Download PDF

Info

Publication number
JP2012027850A
JP2012027850A JP2010168507A JP2010168507A JP2012027850A JP 2012027850 A JP2012027850 A JP 2012027850A JP 2010168507 A JP2010168507 A JP 2010168507A JP 2010168507 A JP2010168507 A JP 2010168507A JP 2012027850 A JP2012027850 A JP 2012027850A
Authority
JP
Japan
Prior art keywords
communication terminal
identification information
terminal
blog
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010168507A
Other languages
English (en)
Inventor
Tomoo O
智勇 王
Takeshi Naganuma
武史 長沼
Kozo Noaki
浩三 野秋
Takeshi Ishihara
武 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2010168507A priority Critical patent/JP2012027850A/ja
Publication of JP2012027850A publication Critical patent/JP2012027850A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】実際にその位置に訪れた作者によって書かれた記事である可能性の高低に応じて、その記事に対する評価を行う。
【解決手段】情報処理装置2の制御部21は、通信端末から端末IDと時刻・位置データとの組のデータ受け取って移動履歴DB223に蓄積している。制御部21は、例えば、一定期間周期ごとおきに移動履歴DB223を参照し、いずれかの通信端末の端末IDを選択すると、識別情報対応表221を参照して、選択した端末IDに対応するURLを特定し、このURLが示す格納領域からブログを取得する。そして、制御部21は、このブログについて場所候補を決定し、ブログの場所候補ごとに評価値を生成し、評価値のリストをブログIDに対応付けて評価値DB226に記憶する。
【選択図】図4

Description

本発明は、場所に関連した情報を検索する情報処理装置、情報処理システム、情報処理方法およびプログラムに関するものである。
近年、インターネット上で文章などの文字を含む記事を公開するウェブログ(Weblog)やブログなどと呼ばれるサービスの利用者が急増し、膨大な数の記事が公開されている。記事の作成者は、実際に訪れた場所や施設、店舗などについて記述することもあり、その内容次第によっては、訪問前の情報収集に役立つことがある。
こうした記事を利用すべく、指定した位置に関連した情報をこれらの記事から取得する様々な技術が開発されている。
特許文献1には、ユーザの移動経路に沿って複数設定した所定の領域の地名を含む地域又は当該地名と関連性を有する話題等を含むブログを参照することにより、当該地域において話題性の高いテーマ等に係るブログを、コンテンツとして選択しうるコンテンツの選択方法が記載されている(段落0051)。
特許文献2には、ウェブログに対応付けて記憶されたユーザのプロバイダ情報またはユーザの接続元アドレス情報からユーザの位置情報を推定すること、および、ウェブログに記載された文面からユーザの位置情報を推定することが記載されている(段落0041、請求項3、4)。
特許文献3には、Webページから抽出した形態素と居住カテゴリとの平均相互情報量を算出して、平均相互情報量に基づいてWebページを居住カテゴリに分類することが記載されている(段落0025〜0040、請求項1)。
特開2009−264762号公報 特開2009−116440号公報 特開2008−123062号公報
しかしながら、特許文献1に開示された技術は、場所を示す語句が記述された記事を見つけているに過ぎず、その記事の記載内容が、実際にその場所に訪れた作者によって書かれたものかは不明である。
特許文献2の請求項3に記載の技術は、ユーザのプロバイダ情報またはユーザの接続元アドレス情報からユーザの位置情報を推定するが、ユーザが訪れた場所とウェブログとの関連度を考慮するものではない。
特許文献3は、Webページの文章そのものを形態素解析して、各Webページを居住カテゴリに分類する。しかし、特許文献3の技術もあくまでWebページの文面そのものから居住地を類推しているに過ぎないので、記載内容が、実際にその場所に訪れた作者によって書かれているか不明である点において、特許文献1と同じである。
本発明は、実際にその位置に訪れた作者によって書かれた記事である可能性の高低に応じて、その記事に対する評価を行うことを目的とする。
上述した課題を解決するため、本発明に係る情報処理装置は、通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段と、前記通信端末を識別する端末識別情報ごとに当該通信端末の位置を特定する特定手段と、前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得手段と、取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成手段とを具備することを特徴とする。
好ましくは、前記特定手段は、前記位置に加えて、当該位置に前記通信端末が存在した時刻を特定し、前記生成手段は、前記位置に前記通信端末が存在した時刻が新しいほど、高い評価値を生成するとよい。
また、本発明に係る情報処理システムは、使用者から位置の指定を受け付ける端末と、上述の情報処理装置とを具備し、前記情報処理装置は、前記端末が受け付けた指定に示される位置についての評価値が高い記事ほど優先して前記端末に出力することを特徴とする。
また、本発明に係る情報処理方法は、通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段を具備する情報処理装置が実行する情報処理方法であって、前記通信端末を識別する端末識別情報ごとに当該通信端末の位置を特定する特定ステップと、前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得ステップと、取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成ステップとを具備することを特徴とする。
また、本発明に係るプログラムは、通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段を具備するコンピュータを、前記端末識別情報と、当該端末識別情報によって識別される前記通信端末の位置とを特定する特定手段と、前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得手段と、取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成手段として機能させるためのプログラムである。
本発明によれば、実際にその位置に訪れた作者によって書かれた記事である可能性の高低に応じて、その記事に対する評価を行うことができる。
本実施形態に係る情報処理システムの概要を示す図である。 通信端末の構成を示すブロック図である。 端末IDおよび時刻・位置データのそれぞれの例を示す図である。 情報処理装置の構成を示すブロック図である。 記憶部に記憶される識別情報対応表の一例を示す図である。 記憶部に記憶されるエリアコード変換表を説明するための図である。 移動履歴DBの一例を示す図である。 特徴語DBの一例を示す図である。 単位点数表の一例を示す図である。 評価値DBの一例を示す図である。 情報処理装置の機能的構成を示す図である。 情報処理装置における評価処理の動作を説明するフローチャートである。 情報処理システムにおける検索処理の動作を説明するフローチャートである。 動作例を説明するための図である。
以下、本発明を実施するための形態について説明する。
1.構成
1−1.全体構成
図1は、本実施形態に係る情報処理システム9の概要を示す図である。情報処理システム9は、通信端末1と情報処理装置2、およびこれらを接続する通信回線3を有する。なお、情報処理装置2は、インターネットなどのネットワーク4にアクセス可能である。ネットワーク4には、通信端末1の利用者によって作成された記事の投稿を受け付けるブログサーバ5が接続されている。ブログサーバ5は、受け付けた記事を日記形式でウェブログ(以下、ブログという)として定められた格納領域に格納する。そして、ブログサーバ5は、ネットワーク4を介して情報処理装置2を含む種々の装置から格納領域を示す格納領域識別情報を受け取ると、この格納領域識別情報が示す格納領域に格納されたブログを提供する。
1−2.通信端末1の構成
図2は、通信端末1の構成を示すブロック図である。通信端末1は、制御部11、記憶部12、操作部13、表示部14、音声処理部15、通信部16および測位部17を有し、これらはバスを介して互いに接続されている。この通信端末1は通信部16により図示しない通信回線に接続し、この通信回線を介して他の端末と通信を行う携帯電話機である。つまり、通信端末1は、他の端末との間で、通話や電子メールの遣り取りをすることができる。
制御部11は、CPU(Central Processing Unit)111、ROM(Read Only Memory)112、RAM(Random Access Memory)113およびタイマ114を有する。CPU111は、記憶部12やROM112に記憶されている制御プログラムを読み出して、RAM113にロードして実行することにより、通信端末1の各部について、バスを介して制御し、通話機能や通信機能のほか、後述する機能等を実現する。また、RAM113は、CPU111が各データの加工等を行う際のワークエリアとして機能する。タイマ114は、水晶振動子を有する発振回路を備えており、その発振回路から出力される発振信号に基づいて時間を計測し、現在時刻を算出する。算出された現在時刻を示す情報は、CPU111により利用される。
ROM112には、通信端末1を識別する識別情報である端末ID1121が記憶されている。ROM112は、SIM(Subscriber Identity Module Card)やUIM(User Identity Module Card)と呼ばれる、IC(Integrated Circuit)カードであってもよい。
RAM113には、後述する測位部17が測位した位置の情報である位置データとタイマ114が示した現在時刻を示す時刻データとを一組のデータとしてまとめた時刻・位置データ1131がCPU111の制御の下に記憶される。
記憶部12は、例えば、EEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性の大容量記憶手段である。この記憶部12は、外付けの不揮発性メモリ等の記録媒体であってもよい。この場合、図示しない接続インターフェイス等を介して記憶部12が通信端末1に接続されている。
操作部13は、数字キー等の複数の操作子を有し、利用者がいずれかの操作子を操作するとその操作に応じた操作信号を制御部11へ出力する。利用者は、操作子を操作することによって、後述する各種通信制御、通話、文字入力又は各種設定等の様々な処理についての指示を通信端末1に対して行う。すなわち、操作部13は、複数の操作子を有する操作手段の一例である。
表示部14は、液晶ディスプレイ等の表示デバイスであり、制御部11の制御により画像を表示する。表示部14に表示される画像は、操作に応じた表示やメニュー表示等の各種表示である。
音声処理部15は、マイクロフォン、スピーカおよびDSP(Digital Signal Processor)等の音声処理回路を有し、マイクロフォンによる収音内容を示す収音信号を音声処理回路により生成して出力するとともに、制御部11の制御により入力される音声信号に対し音声処理回路により音声処理を行って、その音声信号に応じた音をスピーカから出力させる。
通信部16は、制御部11の制御に応じて、通信回線3を介して他の通信端末1や情報処理装置2と通信を行う。また、通信部16は、通信端末1がネットワーク4を介してブログサーバ5にブログを投稿する際のインターフェイスとして機能する。
測位部17は、GPS(Global Positioning System)を利用して自装置の位置を特定する。
1−2−1.端末IDおよび時刻・位置データの構成
図3は、端末ID1121および時刻・位置データ1131のそれぞれの例を示す図である。同図に示す端末ID1121は「MP02」である。なお、端末ID1121は、実際には、IMEI(International Mobile Equipment Identifier;国際移動体装置識別番号)などである。
同図の時刻・位置データ1131に含まれる時刻データは「2010年1月1日13:00」であり、位置データは「139.740394,35.673571」である。位置データは、例えば緯度・経度などを示す数値の組である。
1−3.情報処理装置の構成
図4は、情報処理装置2の構成を示すブロック図である。制御部21は、CPU、ROM、RAMなどを備えており、情報処理装置2の各部を制御する。操作部23は、情報処理装置2の管理者による操作を受け付けてその操作内容に応じた信号を制御部21に供給する。表示部24は、制御部21からの指示に応じて、情報処理装置2の管理情報を表示する。通信部26は、制御部21の制御に応じて、通信回線3を介して通信端末1と通信を行う。また、通信部26は、制御部21の制御に応じて、ネットワーク4を介してブログを提供するブログサーバ5と通信を行う。
1−3−1.情報処理装置の記憶部に記憶される各種データの構成
記憶部22は、ハードディスクドライブなどの大容量の記憶手段であり、制御部21に読み込まれるプログラムを記憶する。また、記憶部22は、情報処理装置2の制御に用いる種々のデータを記憶する。
図5は、記憶部22に記憶される識別情報対応表221の一例を示す図である。識別情報対応表221は、通信端末を識別する端末ID1121と、当該通信端末の利用者によって作成されたブログが格納される格納領域を識別するURL(Uniform Resource Locator)とを対応付けた表である。ここで、識別情報対応表221は、各URLが示す格納領域に格納されたブログを識別するための識別情報であるブログIDと、各URLとを対応付ける。同図に示す例において、例えば、ブログID「B01」に対応するURLは「http://www.a**.com/b1.htm」であり、これに対応する端末IDは「MP01」である。識別情報対応表221を記憶する記憶部22は、通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段として機能する。なお、ブログIDは、そのブログのタイトルでもよい。
図6は、記憶部22に記憶されるエリアコード変換表222を説明するための図である。地表のエリアは、複数のさらに小さいエリアに区画され得る。例えば、図6(a)に示すように、X0以上X3未満の範囲の経度を示すX軸をX0以上X1未満、X1以上X2未満、X2以上X3未満の3つに分割し、Y0以上Y3未満の範囲の緯度を示すY軸をY0以上Y1未満、Y1以上Y2未満、Y2以上Y3未満の3つに分割すると、X0以上X3未満の範囲の経度かつY0以上Y3未満の範囲の緯度で現されるエリアは9つのエリアに分割される。同図に示す例においてエリアコード変換表222は、この各エリアにA01〜A09のエリアコードを割り当てる。
図7は、移動履歴DB(Database;データベース)223の一例を示す図である。情報処理装置2の制御部21は、通信端末1から端末ID1121と時刻・位置データ1131との組を受け取って記憶部22の移動履歴DB223に蓄積する。移動履歴DB223は、その端末IDで示される通信端末1がいつ、どのエリアコードが示すエリア内に存在したかを示す移動履歴を、端末IDごとに蓄積するデータベースである。これにより、例えば、「MP02」で識別される通信端末1は、2010年1月1日の13時に、エリアコード「A05」で識別されるエリアに存在したことがわかる。
図8は、特徴語DB224の一例を示す図である。特徴語DB224は、エリアコードが示すエリアごとに、そのエリアに特有のランドマークなどを予め記述するデータベースである。例えば、エリアコード「A01」には、特徴語リストとして「○○映画館、△△公園、ZZハンバーグ、MK(キャラクター名)」が対応づけられている。特徴語リストは読点「、」を区切文字とする文字列であり、この読点で互いに区切られた各語句を特徴語という。これらの特徴語は、対応するエリアコードで示されるエリアに特有のランドマークや地名、レストラン、あるいはそのエリアに関連深いイメージキャラクターの名前などをそれぞれ表している。例えば、エリアコード「A01」で示されるエリアには、「○○映画館」や「△△公園」があり、これらがこのエリアを特徴付けている。ブログの作成者がこのエリアについて言及するとき、このエリアに対応付けられた特徴語リストに含まれる語句をそのブログに記述することが多い。なお、特徴語リストは、1つ以上の特徴語を含むリストであればよく、その形式は上記のものに限られない。例えば、特徴語リストは、区切文字に空白やカンマなど読点以外の文字が用いられていてもよいし、タブや改行などを表すいわゆるコントロール文字などが用いられていてもよい。また、特徴語DB224がエリアコードと特徴語とを対応付けていれば、特徴語リストという形式はなくてもよい。例えば、特徴語DB224に、エリアコードと特徴語との1対1の組が1つ以上記述されていてもよい。
図9は、単位点数表225の一例を示す図である。単位点数表225は、ブログの作成者が或るエリアに訪問してから、そのエリアの特徴語をブログで記述するまでに経過した時間である経過時間と、そのブログにおいてその特徴語が1回出現する度に付与する点数である単位点数とを対応付けて記憶する表である。ブログの作成者が訪問したエリアは、移動履歴DB223のうち、ブログのURLと対応付けられた通信端末1の移動履歴を特定して推測される。
図10は、評価値DB226の一例を示す図である。評価値DB226は、ブログIDごとに付与されるテーブルの集合であり、各テーブルには、そのブログIDで識別されるブログにおいて言及されていると推測される場所の候補である場所候補のリストと、その各場所候補の確からしさを示す評価値とが関連付けられて記述されている。例えば、同図に示すように、ブログID「B01」で識別されるブログには、場所候補としてエリアコード「A01」で識別されるエリアの評価値が「8」であり、エリアコード「A03」やエリアコード「A02」に対応する評価値に比べて高く、このテーブルにおいて最も高い値である。つまり、ブログID「B01」で識別されるブログは、エリアコード「A01」で識別されるエリアについて言及されている可能性が最も高いと推測される。
1−3−2.情報処理装置の機能的構成
図11は、情報処理装置2の機能的構成を示す図である。
移動履歴特定部211、記事取得部212、および生成部213は、いずれも制御部21が制御プログラムを実行することにより実現する。通信端末1の制御部11は、測位部17により測位された位置を示す位置情報にタイマ114が示す時刻情報を組み合わせ、RAM113に時刻・位置データ1131として記憶する。そして、制御部11は、時刻・位置データ1131に端末ID1121を付加して情報処理装置2へ送信する。端末ID1121と時刻・位置データ1131との組は、通信部16および通信回線3を介して情報処理装置2の通信部26により受信される。
移動履歴特定部211は、受信したデータに含まれる位置情報に対応するエリアのエリアコードを、記憶部22に記憶されたエリアコード変換表222を参照して特定して、端末ID1121と時刻情報とエリアコードの組を移動履歴DB223に蓄積する。したがって移動履歴特定部211は、通信端末を識別する端末識別情報ごとに当該通信端末の位置を特定する特定手段として機能する。また、移動履歴特定部211は、この位置に加えて、当該位置に前記通信端末が存在した時刻を特定する特定手段としても機能する。
記事取得部212は、識別情報対応表221に記述されたURLに基づいて、ネットワーク4を介してブログサーバ5にアクセスする。そして、記事取得部212は、ブログサーバ5から、URLが示すブログの内容を取得する。したがって、記事取得部212は、端末識別情報に対応付けて記憶されている格納領域識別情報によって識別される格納領域から、記事を取得する取得手段として機能する。
生成部213は、記事取得部212を介して識別情報対応表221から上述のURLに対応する端末IDを特定し、移動履歴DB223を参照して、その端末IDにより識別される通信端末1の移動履歴を特定し、この移動履歴に記述されているエリアコードを、取得したブログの場所候補とする。
生成部213は、移動履歴DB223を参照して、上記の場所候補ごとに経過時間を算出し、単位点数表225を参照して、算出したそれぞれの経過時間に基づいて各場所候補に対応する単位点数を決定する。
生成部213は、特徴語DB224を参照し、上記の場所候補のそれぞれに対応する特徴語を特定し、取得した上記のブログにこれらの特徴語が記述されている個数をそれぞれ計数する。そして、生成部213は、決定した上記の単位点数に、計数した上記の個数を乗じた数値を場所候補ごとに合計し、合計値を各場所候補の評価値として評価値DB226に記述する。したがって、生成部213は、取得された記事に含まれる語句と特定された通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成手段として機能する。
2.動作
次に、本実施形態に係る情報処理システム9の動作について説明する。情報処理システム9の動作は、大別して、ネットワーク4において公開されているブログに評価値を対応付ける評価処理の動作と、ネットワーク4を介して図示しない情報処理端末から特定の場所の地名などを検索キーとして、その場所に実際に訪問して書かれた可能性の高い順にブログIDを配列する検索処理の動作とがある。
2−1.評価処理の動作
図12は、情報処理装置2における評価処理の動作を説明するフローチャートである。情報処理装置2の制御部21は、通信端末1から端末ID1121と時刻・位置データ1131との組のデータ受け取って移動履歴DB223に蓄積している。制御部21は、例えば、一定周期ごとに移動履歴DB223を参照し(ステップS11)、いずれかの通信端末1の端末ID1121を選択すると、識別情報対応表221を参照して、選択した端末ID1121に対応するURLを特定し、このURLが示す格納領域からブログを取得する(ステップS12)。そして、制御部21は、このブログについて場所候補を決定し、ブログの場所候補ごとに評価値を生成し(ステップS13)、評価値のリストをブログIDに対応付けて評価値DB226に記憶する(ステップS14)。
2−2.検索処理の動作
図13は、情報処理システム9における検索処理の動作を説明するフローチャートである。ネットワーク4を介して図示しない情報処理端末の利用者が、キーボードなどの入力装置を操作して検索したい場所に関連する特徴語を入力すると、情報処理装置2の制御部21は、通信部26を介してこの特徴語を検索キーとして取得するとともに(ステップS21)、内蔵するタイマを参照して現在時刻を取得することで、検索キーが入力された時刻(以下、検索時刻という)を特定する(ステップS22)。
次に、制御部21は、特徴語DB224を参照して、取得した特徴語に対応するエリアコードを特定し(ステップS23)、特定したエリアコードが場所候補に挙げられているブログIDを評価値DB226から抽出する(ステップS24)。そして、制御部21は、識別情報対応表221を参照して、抽出したブログIDに対応するURLを取得し、このURLが示す格納領域に格納されたブログの作成日を特定する。ブログの作成日を特定すると、制御部21は、その特定した作成日に応じて評価値DB226に記載された評価値を補正する(ステップS25)。そして、制御部21は、抽出したブログIDを、エリアコードに対応付けられた補正評価値が高い順に並べて出力する(ステップS26)。
2−3.動作例
上述した2つの動作について、具体的な動作例を挙げて説明する。
(1)評価処理の動作例
例えば、エリアコード「A01」、「A02」、「A03」で示される各エリアのそれぞれの特徴語は、図8で示したとおり特徴語DB224に記憶されている。例えば、情報処理装置2の制御部21が、周期的に評価処理を行う際に、ブログIDが「B01」のブログ(以下、ブログ「B01」という)の記載内容を検査し、「○○映画館」という語句を1回、「△△公園」という語句を1回、「AAビル」という語句を2回、「DD駅」という語句を1回、それぞれ検出したとする。
ブログ「B01」に対応する通信端末1の端末IDは、図5に示した識別情報対応表221に記述されているとおり「MP01」である。制御部21は、端末IDである「MP01」を特定し、移動履歴DB223を参照して、「MP01」に対応する移動履歴を特定する。「MP01」を端末IDとして持つ通信端末1は、ブログ「B01」が作成された日の1日前にエリアコード「A01」で示されるエリアに訪れている。そのため、ブログ「B01」のエリアコード「A01」に関する経過時間は「3日未満」であり、単位点数は「4点」である。ブログ「B01」には、上述したように「○○映画館」と「△△公園」とがそれぞれ1回ずつ現れており、いずれもエリアコード「A01」の特徴語なので、ブログ「B01」におけるエリアコード「A01」の特徴語の出現回数は、合計2回である。したがって、制御部21は、ブログ「B01」の場所候補であるエリアコード「A01」の評価値として、単位点数と出現回数合計との積である、4点×2回=8点を算出する。
一方、「MP01」を端末IDとして持つ通信端末1は、ブログ「B01」が作成された日の7日前にエリアコード「A03」で示されるエリアに訪れている。そのため、ブログ「B01」のエリアコード「A03」に関する経過時間は「3日以上10日未満」であり、単位点数は「2点」となる。ブログ「B01」には、上述したように「AAビル」が2回、「DD駅」が1回、現れており、いずれもエリアコード「A03」の特徴語なので、ブログ「B01」におけるエリアコード「A03」の特徴語の出現回数は、合計3回である。したがって、制御部21は、ブログ「B01」の場所候補であるエリアコード「A03」の評価値として、単位点数と出現回数合計との積である、2点×3回=6点を算出する。
このように、同じブログであっても、異なるエリアコードによって識別されるエリアの特徴語が出現していることがある。従来の技術では、単純に出現回数が多いほど、その語句に関連する事実を記載していると判断して高い評価をしていた。しかし、実際には、そのブログで伝聞や願望を表現するために、その語句を多く記述しているといった場合も多い。つまり、或る場所に関連する特徴語を多く記述しているからといって、そのブログが、その場所に実際に訪れた者によって作成されているとは限らない。
本実施形態に係る情報処理装置2は、検査するブログで出現した特徴語に関連付けられたエリアコードを特定し、そのブログに対応する通信端末1の移動履歴を参照して、そのエリアコードに訪れた時刻のうち最新時刻からブログ作成までの経過時間を特定する。そして、情報処理装置2は、その経過時間に対応する単位点数を用いて評価値を生成する。したがって、ブログに或る場所の特徴語が記載されていても、そのブログに対応づけられている通信端末1がその場所に訪れていない場合には、情報処理装置2は、例えば評価値を0にするなど、そのブログのそのエリアについての評価値を低くするように構成されている。また、その場所に通信端末1が訪れていたとしても、その訪れた時刻から経過している時間が長いほど、その評価値は上がらないようになっている。経過時間が長いほど、記憶は曖昧となる上、その場所の最新情報から離れた内容になるからである。
以上、説明した評価処理により、実際に通信端末1が訪れた場所の位置を考慮して、ブログとその位置との関連度に応じて、ブログIDごとにその位置についての評価値が割り当てられる。
(2)検索処理の動作例
情報処理装置2は、検索処理を行う際に、評価処理においてブログIDごとに割り当てた評価値を用いる。例えば、ネットワーク4に接続された図示しない情報処理端末の利用者が、2010年3月7日午前10時に情報処理端末を操作して、エリアコード「A01」に関連した特徴語として「○○映画館」を入力すると、情報処理装置2の制御部21は、この「○○映画館」を検索キーとして取得し、その検索時刻として「2010年3月7日午前10時」を特定する。そして、制御部21は、検索キーである「○○映画館」に対応するエリアコード「A01」を特定し、評価値DB226において、候補場所にエリアコード「A01」を含むブログのブログIDを抽出する。図14は、この動作例を説明するための図である。このとき、図14(a)に示すように、ブログID「B01」、「B02」、「B03」の3つが上記のブログIDとして抽出されたとする。そして、エリアコード「A01」についての評価値は、同図に示すように、ブログID「B03」、「B01」、「B02」の順にそれぞれ「10」、「8」、「8」であったとする。
制御部21は、検索時刻と抽出したこれらのブログの作成日時とを比較し、その差に応じた補正を評価値に対して行う。具体的には、制御部21は、この経過期間が長いほど評価値が下がるように、補正を行う。例えば、ブログID「B03」については、作成日が2010年3月5日であり、ブログ作成から検索時刻までの間に2日が経過している。そこで、2日に対応する補正値である「−0.2」を評価値に加える。すなわち、10から0.2を減算した値である「9.8」が補正後の評価値である補正評価値として生成される。
制御部21は、補正評価値の高いものから順にブログIDを並べ替えたリストを、検索キーを入力した情報処理端末に向けて出力する。これにより、例えば、図14(b)に示すように、その情報処理端末の利用者には、「○○映画館」に実際に訪問して書かれた可能性が最も高い記事として、ブログIDが「B03」のブログが提示される。すなわち、検索キーを入力した情報処理端末の利用者は、最新、且つ実際にその場所に訪問した上で書かれた可能性の高いブログを優先して閲覧することができる。
3.変形例
以上が実施形態の説明であるが、この実施形態の内容は以下のように変形し得る。また、以下の変形例を組み合わせてもよい。
(1)通信端末に関する変形例
(1−1)実施形態において、測位部17は、GPSを利用して自装置の位置を特定することで測位していたが、他の構成により測位してもよい。例えば、通信端末1は、最寄りの基地局の識別情報を周期的に検知する携帯電話である場合に、測位部17は、その基地局の識別情報に基づいて、通信端末1の位置を特定してもよい。この場合、各基地局の識別情報をエリアコードとしてもよい。なお、通信端末1が接続する通信回線3は、IEEE802.11bの規格に準拠した無線LAN(Local Area Network)であってもよい。
(1−2)また、通信端末1の位置を特定する外部の装置がある場合には、通信端末1は測位部17を具備しなくてもよい。例えば、通信端末1は、ROM112に記憶している端末ID1121を、RFID(Radio Frequency Identification)と呼ばれる、電波による非接触近距離通信で外部の読取装置に送信することができるように構成されている。そして、通信端末1が移動すると、その位置の近くに備えられた読取装置がその通信端末1の端末IDを読み取る。そして読取装置が、読み取った端末IDを、自身の識別情報とともに集計サーバに送ると、この集計サーバは、予め定められた対応表などを参照して、送られた読取装置の識別情報をその読取装置が存在するエリアのエリアコードに変換し、その読取装置が読み取った端末IDをこのエリアコードに関連付ける。情報処理装置2は、この集計サーバから情報を取得して、端末IDが存在したエリアを特定すればよい。
上述の実施形態において、通信端末1は、端末ID1121と時刻・位置データ1131との組を情報処理装置2に送っていたが、通信端末1は、複数の連続する時刻・位置データ1131を蓄積し、移動履歴を示すデータ群として、端末ID1121とともに送るようにしてもよい。
(2)情報処理装置に関する変形例
(2−1)移動履歴特定部に関する変形例
上述の実施形態において、エリアは緯度と経度とに基づいて区画されたが、区画の手法はこれに限られない。例えば、固有の曲線を含んだ境界線によってエリアが区画されてもよい。
また、物理的に共通する場所に対し、その場所に設立されているランドマークの種類ごとに異なるエリアコードを割り当てて区画してもよい。例えば、上述の実施形態では、経度がX1以上X2未満であり、且つ、緯度がY1以上Y2未満であるエリアにはエリアコード「A05」のみが割り当てられていた。しかし、このエリアには、著名なコンサートホールと著名なレストランとがともに存在しているとすると、検索する者が「コンサートを聴くためにこのエリアに実際に訪れて書かれたブログ」を求めているか、「料理を食べるためにこのエリアに実際に訪れて書かれたブログ」を求めているかで検索対象や特徴語を変える必要がある。したがって、こういった緯度、経度がともに共通するエリアに関しても、例えば「A05−1」と「A05−2」といった異なるエリアコードを割り当てればよい。このとき、特徴語DB224には、これら異なるエリアコードにそれぞれ固有の特徴語を登録すればよい。
また、移動履歴DB223は、ブログに対応付けられた写真データであってもよい。例えば、ブログサーバには、これから投稿する記事に組み込む写真の写真データを蓄積しておく蓄積領域を備えたものがある。また、この蓄積領域に蓄積される写真データには、EXIF(Exchangeable image file format)といったメタデータが含まれているものがある。制御部21は、このメタデータにその写真の撮影時刻と撮影位置をそれぞれ示したデータが記述されている場合には、このメタデータをブログサーバ5から取得し、移動履歴DB223に蓄積すればよい。
(2−2)記事取得部に関する変形例
上述の実施形態において、識別情報対応表221は、通信端末を識別する端末ID1121と、当該通信端末の利用者によって作成されたブログが格納される格納領域を識別するURLとを対応付けた表であったが、格納領域を識別する格納領域識別情報はURLに限られない。例えば、情報処理装置2がブログサーバ5を兼ねる場合には、情報処理装置2の記憶部22において記憶される各ブログのメモリアドレスであってもよい。
制御部21は、一定周期ごとに移動履歴DB223を参照していずれかの通信端末1の端末ID1121を選択する度に、端末ID1121に対応するURLが示す格納領域からブログを取得していたが、移動履歴DB223を参照するタイミングは一定周期ごとでなくてもよい。また、制御部21は、例えば、ネットワーク4を介してブログサーバ5から、新たなブログの投稿があった旨の通知を受け取ったタイミングで、ブログを取得してもよい。
(2−3)生成部に関する変形例
上述の実施形態において、特徴語DB224は、エリアコードが示すエリアごとに、そのエリアに特有のランドマーク名などの特徴語を予め記述するデータベースであったが、情報処理装置2は、複数のブログをサンプルとして、このデータベースを構築してもよい。
例えば、情報処理装置2の制御部21は、或る語句が出現する記事の総数で、その語句が、或るエリアの地名や、そのエリアにある施設やランドマークなどの名前とともに出現する記事の数を除算した値を用いて、その語句と、そのエリアとの関連度を決定してもよい。以下に、具体例を挙げて説明する。
例えば、或るエリアに「Dランド」という名の施設があると仮定する。この「Dランド」は、「MK」という名のキャラクターの登場する漫画やアニメーションをテーマとするテーマパークである。情報処理装置2の制御部21は、複数のブログをサンプルとして検索し、ブログ中に「MK」が出現する記事の数m11と、「Dランド」と「MK」とがともに出現する記事の数m12とをそれぞれ数える。数m11は8060000であり、数m12は631000であったとすると、関連点数p1は、m12/m11=631000/8060000=0.078である。ここで、関連点数について例えば閾値が0.01と定められている場合、算出したこの関連点数p1はこの閾値を超えているため、制御部21は、「MK」が「Dランド」と関連のある語句であると判定し、「Dランド」の属するエリアコードに対応する特徴語として「MK」を登録する。
一方、制御部21は、サンプルとなるブログにおける「わたし」という語句についても、「Dランド」との関連性を検査する。制御部21は、「わたし」が出現する記事の数m21と、「Dランド」と「わたし」とがともに出現する記事の数m22とをそれぞれ数える。数m21は36500000であり、数m22は171000であったとすると、関連点数p2は、m22/m21=171000/36500000=0.004である。「わたし」という語句は、「Dランド」とともに出現する記事の数は比較的多いが、一般的な語句であるため、「Dランド」が出現しない記事に出現することも多い。上述したように、関連点数について閾値が0.01と定められている場合、算出したこの関連点数p2はこの閾値未満であるため、制御部21は、「わたし」が「Dランド」と関連のない語句であると判定する。
以上の処理により、制御部21は、ブログからエリアごとの特徴語を決定して特徴語DB224を更新すればよい。なお、この特徴語DB224の更新に用いるブログは、そのブログに対応づけられている通信端末1が、定められた期間に上記のエリアに存在していたものに限定してもよい。この場合、制御部21は、移動履歴DB223を参照して、上記の期間中に対象とするエリアに存在していた通信端末1を特定し、識別情報対応表221を参照して、その通信端末1に対応づけられているブログを抽出すればよい。
また、上述の実施形態では、生成部213は、移動履歴DB223を参照して、場所候補ごとに経過時間を算出し、単位点数表225を参照して、算出したそれぞれの経過時間に基づいて各場所候補に対応する単位点数を決定していたが、ブログの場所候補に対応する単位点数は他の構成により決定されてもよい。
例えば、情報処理装置2の記憶部22には、単位点数表225に代えて、ブログの作成者が或るエリアを訪問した回数と、そのブログにおいてその特徴語が1回出現する度に付与する単位点数とを対応付けて記憶する表である単位点数表225aが記憶されている。生成部213は、移動履歴DB223を参照して、取得したブログに対応する通信端末1が訪問した回数を場所候補ごとに計数する。そして、生成部213は、単位点数表225aを参照して、計数したそれぞれの回数に基づいて各場所候補に対応する単位点数を決定する。
具体的には、単位点数表225aには、回数が「0回」「1回以上3回未満」「3回以上10回未満」「10回以上」の4通りに区分されており、それぞれ順に「0」「1」「4」「8」の点数が割り当てられている。この場合、ブログに対応する通信端末1が、エリアコード「A01」で示されるエリアに1回も存在したことがないのであれば、単位点数は「0」となり、たとえ「A01」の特徴語が含まれたブログが投稿されていたとしても、このブログは検索結果として上位に登場しない。
一方、この通信端末1が、エリアコード「A01」で示されるエリアに13回に亘って入っている場合には、その通信端末1に対応づけられているブログに「A01」の特徴語が1つ記述されるごとに、そのブログに対するエリアコード「A01」についての評価値は「8」点ずつ加算される。これにより、通信端末1が或るエリアに訪問した回数が多いほど、その通信端末1に対応付けられたブログに対するそのエリアについての評価値は高くなる。
なお、単位点数表225aは、ブログの作成者がエリアを訪問した回数ごとに単位点数を対応付けるのではなく、訪問して滞在した総時間数ごとに単位点数を対応付けてもよい。この場合、制御部21は、移動履歴の位置情報により示される通信端末1の位置が、定められたエリアに入ったときから出たときまでのそれぞれの時刻により、その通信端末1がそのエリアに滞在した滞在時間を求め、複数回にわたって通信端末1がそのエリアに入っている場合には、それぞれの滞在時間の合計を算出して上述した総時間数とすればよい。これにより、通信端末1が或るエリアに滞在した時間が長いほど、その通信端末1に対応付けられたブログに対するそのエリアについての評価値は高くなる。
要するに、生成部213は、取得された記事に含まれる語句に対応づけられた位置に、特定された通信端末が存在した回数が多いまたは時間が長いほど、当該記事に対する当該位置について高い評価値を生成する生成手段として機能すればよい。
また、上述の実施形態では、特徴語DB224は、エリアコードと、そのエリアコードが示すエリアに特有の特徴語とを対応付けたデータベースであったが、さらに、そのエリアと特徴語との関連度に応じた重み係数を、そのエリアコードと特徴語との組に対応付けてもよい。この場合、生成部213は、ブログに特徴語が出現した回数に、そのエリアコードおよびその特徴語に対応付けられた重み係数を乗じ、さらに単位点数表225から取得した単位点数を乗じて評価値を算出すればよい。なお、重み係数には、上述した関連度、すなわち、その特徴語が出現する記事の総数で、その特徴語がそのエリアの地名などとともに出現する記事の数を除算した値を用いてもよい。
1…通信端末、11…制御部、111…CPU、112…ROM、113…RAM、1131…時刻・位置データ、114…タイマ、12…記憶部、13…操作部、14…表示部、15…音声処理部、16…通信部、17…測位部、2…情報処理装置、21…制御部、211…移動履歴特定部、212…記事取得部、213…生成部、22…記憶部、221…識別情報対応表、222…エリアコード変換表、223…移動履歴DB、224…特徴語DB、225…単位点数表、226…評価値DB、23…操作部、24…表示部、26…通信部、3…通信回線、4…ネットワーク、5…ブログサーバ、9…情報処理システム。

Claims (5)

  1. 通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段と、
    前記通信端末を識別する端末識別情報ごとに当該通信端末の位置を特定する特定手段と、
    前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得手段と、
    取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成手段と
    を具備することを特徴とする情報処理装置。
  2. 前記特定手段は、前記位置に加えて、当該位置に前記通信端末が存在した時刻を特定し、
    前記生成手段は、前記位置に前記通信端末が存在した時刻が新しいほど、高い評価値を生成する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 使用者から位置の指定を受け付ける端末と、
    請求項1または2に記載の情報処理装置とを具備し、
    前記情報処理装置は、
    前記端末が受け付けた指定に示される位置についての評価値が高い記事ほど優先して前記端末に出力する
    ことを特徴とする情報処理システム。
  4. 通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段を具備する情報処理装置が実行する情報処理方法であって、
    前記通信端末を識別する端末識別情報ごとに当該通信端末の位置を特定する特定ステップと、
    前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得ステップと、
    取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成ステップと
    を具備することを特徴とする情報処理方法。
  5. 通信端末を識別する端末識別情報と、当該通信端末の利用者によって作成された記事が格納される格納領域を識別する格納領域識別情報とを対応付けて記憶する識別情報記憶手段を具備するコンピュータを、
    前記端末識別情報と、当該端末識別情報によって識別される前記通信端末の位置とを特定する特定手段と、
    前記端末識別情報に対応付けて記憶されている前記格納領域識別情報によって識別される格納領域から、前記記事を取得する取得手段と、
    取得された前記記事に含まれる語句と特定された前記通信端末の位置との関連度に応じて、当該記事に対する当該位置についての評価値を生成する生成手段
    として機能させるためのプログラム。
JP2010168507A 2010-07-27 2010-07-27 情報処理装置、情報処理システム、情報処理方法およびプログラム Pending JP2012027850A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010168507A JP2012027850A (ja) 2010-07-27 2010-07-27 情報処理装置、情報処理システム、情報処理方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010168507A JP2012027850A (ja) 2010-07-27 2010-07-27 情報処理装置、情報処理システム、情報処理方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2012027850A true JP2012027850A (ja) 2012-02-09

Family

ID=45780670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010168507A Pending JP2012027850A (ja) 2010-07-27 2010-07-27 情報処理装置、情報処理システム、情報処理方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2012027850A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182422A (ja) * 2012-03-01 2013-09-12 Nikon Corp 電子機器
JP2013196189A (ja) * 2012-03-16 2013-09-30 Ntt Docomo Inc メタデータ候補生成装置及びメタデータ候補生成方法
JP2014215714A (ja) * 2013-04-23 2014-11-17 日本電信電話株式会社 ユーザの位置推定装置及び方法及びプログラム
JP2015005091A (ja) * 2013-06-20 2015-01-08 ヤフー株式会社 情報収集装置及び情報収集プログラム
JP2015528940A (ja) * 2012-06-27 2015-10-01 エンパイア テクノロジー ディベロップメント エルエルシー オンライン投稿の信頼性の判定

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013182422A (ja) * 2012-03-01 2013-09-12 Nikon Corp 電子機器
JP2013196189A (ja) * 2012-03-16 2013-09-30 Ntt Docomo Inc メタデータ候補生成装置及びメタデータ候補生成方法
JP2015528940A (ja) * 2012-06-27 2015-10-01 エンパイア テクノロジー ディベロップメント エルエルシー オンライン投稿の信頼性の判定
US9361378B2 (en) 2012-06-27 2016-06-07 Empire Technology Development Llc Determining reliability of online post
JP2014215714A (ja) * 2013-04-23 2014-11-17 日本電信電話株式会社 ユーザの位置推定装置及び方法及びプログラム
JP2015005091A (ja) * 2013-06-20 2015-01-08 ヤフー株式会社 情報収集装置及び情報収集プログラム

Similar Documents

Publication Publication Date Title
EP2557511B1 (en) Information processing device, information processing method, information processing programme, and recording medium
US11093529B2 (en) Method for displaying landmark data
JP2010009315A (ja) 推薦店舗提示システム
CN108427761B (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
JP6185379B2 (ja) レコメンド装置およびレコメンド方法
JP6728178B2 (ja) 検索データを処理するための方法及び装置
JP2012027850A (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
EP1999645A1 (en) System and method for information retrieval
CN110633438A (zh) 一种新闻事件处理的方法、终端、服务器及存储介质
JP4661159B2 (ja) 情報提供システム,メタデータ収集解析サーバ,およびコンピュータプログラム
KR101682659B1 (ko) 키워드 기반 맞춤 뉴스 알림 방법 및 그를 위한 뉴스 검색 관리 서버
KR20110086233A (ko) 공통 관심 사용자 검색장치 및 방법
KR101508583B1 (ko) 스마트 기기 내 시맨틱 검색 시스템 및 검색방법
JP5980723B2 (ja) 緊急時ノウハウ参照支援方法、緊急時ノウハウ参照支援装置、及び緊急時ノウハウ参照支援プログラム
KR20100117335A (ko) 검색어가 포함된 텍스트를 기초로 검색 사이트를 특정하여 검색 결과를 요청하는 검색 중계 서버 및 그 제어방법
JP6399103B2 (ja) ページ自動編集方法、ページ自動編集プログラムおよびページ自動編集装置
JP2010140355A (ja) 情報検索システム及び情報検索方法
US10083241B2 (en) Sorting method of data documents and display method for sorting landmark data
JP2010181975A (ja) 情報提供装置、情報提供方法、情報提供プログラムおよび記録媒体
KR20180044111A (ko) 데이터 수집 방법 및 그 장치
WO2012077369A1 (ja) サーバ、辞書生成方法、辞書生成プログラム、及びそのプログラムを記録するコンピュータ読み取り可能な記録媒体
JP2006107200A (ja) 検索サービス提供システム
JP2013004013A (ja) プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム
JP2008191894A (ja) Webサーバ