JP6184840B2 - 情報処理装置及び表示優先度決定方法 - Google Patents

情報処理装置及び表示優先度決定方法 Download PDF

Info

Publication number
JP6184840B2
JP6184840B2 JP2013231139A JP2013231139A JP6184840B2 JP 6184840 B2 JP6184840 B2 JP 6184840B2 JP 2013231139 A JP2013231139 A JP 2013231139A JP 2013231139 A JP2013231139 A JP 2013231139A JP 6184840 B2 JP6184840 B2 JP 6184840B2
Authority
JP
Japan
Prior art keywords
information
posted
map
post
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013231139A
Other languages
English (en)
Other versions
JP2015090664A (ja
Inventor
桂一 落合
桂一 落合
大祐 鳥居
大祐 鳥居
悠 菊地
悠 菊地
山田 渉
渉 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2013231139A priority Critical patent/JP6184840B2/ja
Publication of JP2015090664A publication Critical patent/JP2015090664A/ja
Application granted granted Critical
Publication of JP6184840B2 publication Critical patent/JP6184840B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、投稿情報を地図上に表示する技術に関する。
近年、日々の出来事を日記のように書いて投稿するブログサービスが広く普及している。このようなサービスのひとつとして、今していることや感じたことなどを「つぶやき(「つぶやく」は登録商標)(ツイート[登録商標])」と呼ばれる短いメッセージにして投稿するツイッター(TWITTERは登録商標)というサービスがある。このようなブログの形態はマイクロブログと呼ばれ、マイクロブログにメッセージが投稿される度に、投稿者のタイムラインが更新されて、メッセージが閲覧者に共有される。
従来から、マイクロブログのメッセージを地図上に表示するアプリケーションがある(例えば、非特許文献1)。このアプリケーションでは、ツイートを投稿するときに位置情報を付加すると、当該位置情報に対応した地図上の位置にツイートの吹き出しが表示される。
「ツイッターでつぶやくとGoogleマップ上に位置情報が表示される『TwitterMap』」、[online]、平成24年10月4日、Gigazine、[平成25年9月30日検索]、インターネット(URL:http://gigazine.net/news/20121004-twittermap/)
ところで、ブログやマイクロブログへの投稿情報が表示された地図を表示する装置として携帯電話のような携帯端末装置が用いられる場合には画面サイズに制約があるため、多数の投稿情報が表示されると視認性に欠けるという問題がある。また、特に、マイクロブログに投稿された投稿情報をリアルタイムで地図上に表示しようとする場合には、マイクロブログの性質上、特定の場所について新しいメッセージが次々と投稿され、地図上の特定の領域に多数の投稿情報が集中して表示されてしまうことがある。この問題は、携帯端末装置よりも画面サイズが大きなパーソナルコンピュータなどを表示装置として用いる場合にも同様に発生する。
そこで、本発明は、このような事情に鑑みて、ブログやマイクロブログに投稿された投稿情報を地図上に表示しようとする場合に、視認性を十分に確保しつつ、地図の閲覧者にとって情報的価値が高い投稿情報であることが閲覧者に分かり易いように表示させることが可能な情報処理装置などを提供することを解決課題とする。
上記課題を解決するため、本発明は、各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値を算出する投稿情報評価部と、前記投稿情報評価部が決定した評価値に応じて前記複数の投稿情報の優先順位を決定する優先順位決定部と、表示されようとする地図の範囲に属する前記地理的属性を有する複数の投稿情報を前記地図上に表示させるよう表示装置を制御する場合に、前記優先順位決定部が決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で前記地図上に表示された表示情報を生成する表示情報生成部とを有する情報処理装置を提供する。本発明における情報処理装置は、閲覧者が地図を閲覧するための表示装置を有する携帯端末装置やパーソナルコンピュータその他の情報処理端末であってもよく、かかる情報処理端末と通信可能であり、情報処理端末の表示装置に地図を表示させるよう制御するサーバ装置であってもよい。
さらに、本発明は、各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値を算出し、前記評価値に応じて前記複数の投稿情報の優先順位を決定し、表示されようとする地図の範囲に属する前記地理的属性を有する複数の投稿情報を前記地図上に表示させるよう表示装置を制御する場合に、前記決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で前記地図上に表示された表示情報を生成することを特徴とする表示優先度決定方法を提供する。
本発明に係る情報処理装置又は表示優先度決定方法によれば、ブログやマイクロブログに投稿された投稿情報を地図上に表示しようとする場合に、視認性を確保しつつ、地図の閲覧者にとって情報的価値が高い投稿情報であることが閲覧者によって分かり易いように表示することが可能となる。
本発明の第1の実施の形態に係るブログ地図表示システムのブロック図である。 本発明の第1の実施の形態に係る携帯端末装置を示す外観図である。 本発明の第1の実施の形態に係る携帯端末装置の構成を示すブロック図である。 本発明の第1の実施の形態に係るブログ地図提供サーバの構成を示すブロック図である。 本発明の第1の実施の形態に係るブログ地図提供サーバの機能構成を示すブロック図である。 本発明の第1の実施の形態に係る投稿情報解析処理の流れを示すフローチャートである。 本発明の第1の実施の形態に係る解析結果テーブルの記憶内容の一例を示す図である。 本発明の第1の実施の形態に係る付加情報テーブルの記憶内容の一例を示す図である。 本発明の第1の実施の形態に係るブログ地図生成処理の流れを示すフローチャートである。 本発明の第1の実施の形態に係るブログ地図ページの表示例を示す図である。 本発明の第2の実施の形態に係るブログ地図提供サーバの機能構成を示すブロック図である。 本発明の第2の実施の形態に係る解析結果テーブルの記憶内容の一例を示す図である。 本発明の第3の実施の形態に係るブログ地図表示システムのブロック図である。 本発明の第3の実施の形態に係る処理の流れを示すシーケンスチャートである。 本発明の第4の実施の形態に係るブログ地図提供サーバの機能構成を示すブロック図である。 本発明の第4の実施の形態に係る処理の流れを示すフローチャートである。 本発明の第4の実施の形態の変形例に係る処理の流れを示すフローチャートである。 本発明の第4の実施の変形例に縮尺テーブルの記憶内容の一例を示す図である。 本発明の実施の形態の変形例に係るブログ地図ページの表示例を示す図である。
以下、添付の図面を参照しながら本発明に係る実施の形態を説明する。
<第1の実施の形態>
<構成>
図1は、本発明の第1の実施の形態に係るブログ地図表示システム1のブロック図である。図示のように、ブログ地図表示システム1は、移動通信網MNと、移動通信網MNに接続するブログサーバ20、ブログ地図提供サーバ30及び地図情報提供サーバ40と、移動通信網MNに接続する複数の携帯端末装置10とを備える。このブログ地図表示システム1は、携帯端末装置(表示装置)10に表示されようとする地図上に、表示範囲によって画定される地図の範囲に属する地理的属性を有する投稿情報を表示させるものである。投稿情報としては、日々更新されるWeb上の日記(ブログ)や、140文字程度の短い文章で記述されたマイクロブログ(例えば、ツイート)が例示される。本実施形態では、投稿情報としてツイートを例にとって説明する。
1.ブログサーバ
ブログサーバ20は、当該サーバが提供するブログサービスに利用登録したユーザが世界中で投稿した投稿情報を記憶するサーバ装置であり、ブログ地図提供サーバ30に対して投稿情報を提供する。
ここで、投稿情報は、少なくとも、ユーザ名、ユーザが設定した写真画像などのプロフィールアイコン、投稿テキスト(文字列)、及び投稿日時を含むものである。投稿テキストには投稿者の発言に相当する文字列(以下、本文テキスト)に加えて、情報源や追加情報の所在を示すURL(以下、情報URL)や、添付された写真画像データの所在を示す写真URL、「@」で始まる他ユーザのユーザ名(いわゆる「メンション」)が含まれる場合がある。情報URLにはハイパーリンクが設定されており、ユーザが情報URLをタップする操作をするとリンク先のWebページに遷移する。なお、情報URLは通常「http://」や「https://」で始まる文字列であるが、この文字列を所定文字数(例えば、22文字)以下に短縮した短縮URLが表示用URLとして用いられる。写真URLは、投稿者が写真を添付する際に利用した画像添付用API(Application Program Interface)に応じて、所定の文字列を含む。所定の文字列としては、「pic.twitter.com/」、「twitpic.com/」、「p.twipple.jp/」などが例示される。
投稿情報には、さらに、ユーザの自己紹介文であるプロフィールのテキストや、投稿時点に投稿情報に付加されるジオタグが添付される場合がある。プロフィールは、ユーザが自己の名前や職業、居住地、仕事や趣味などを記述したものであり、ユーザが任意に編集可能なものである。ジオタグは、投稿時にユーザが用いた端末の現在位置の緯度経度情報であり、例えば、ユーザがGPS(Global Positioning System)を内蔵した携帯端末装置を用いた場合には、GPSによる端末位置の測位結果がジオタグとして用いられる。
また、ブログサーバ20は、各投稿情報に関連付けて当該投稿情報が再投稿(リツイート)された再投稿回数(リツイート数)などの統計データを記憶しており、この統計データは、投稿情報とともにブログ地図提供サーバ30に対して提供される。
さらに、ブログサーバ20は、各ユーザの属性情報をユーザIDに対応づけて記憶している。ここで、ユーザ属性情報は、年齢、性別、職業、居住地、既婚・未婚の別といった各ユーザのデモグラフィック属性情報であり、ブログサーバ20は、このユーザ属性情報をブログ地図提供サーバ30に対して投稿情報と共に提供する。
2.地図情報提供サーバ
地図情報提供サーバ40は、地図画像データを提供するサーバ装置であり、外部からの要求に応じて、要求された地理的範囲の地図画像データを提供する。本実施形態では、地図画像データは、ラスタ形式又はベクタ形式のいずれの形式の地図画像を用いてもよい。ラスタ形式の地図画像は、格子状のピクセルで表現された画像であり、携帯端末装置10に表示すべき地図の拡大率や表示対象地域が変わると、その都度、新たな地図画像データが地図情報提供サーバ40から提供される。ラスタ画像としては、JPEG、GIF、及びGIFが例示される。これに対して、ベクタ形式の地図画像は、点の座標とそれを結ぶ線や面の方程式のパラメータ及び塗りつぶしなどの描画情報で画像を表現したものであり、表示する都度計算を行って画像を再現する。
3.移動通信網
移動通信網MNは、多数の無線基地局(図示略)及び中継装置(図示略)を有し、携帯端末装置10に対して移動通信サービスを提供する。
図2は、本発明の実施の形態に係る携帯端末装置10の外観を示す正面図であり、図3は、携帯端末装置10の構成を示すブロック図である。携帯端末装置10は、移動通信網MNを介してブログ地図提供サーバ30からブログ地図ページ(表示情報)を受信し、受信したブログ地図ページを表示するものである。
図2及び図3に示されるように、携帯端末装置10は、表示領域12aを含むタッチパネル12、他の携帯端末装置10及びインターネットとの間でデータの送受信を行うための通信インタフェース13と、記憶部14と、通話の際に用いられるマイク15とスピーカ16、及びこれら各部を制御するCPU(Central Processing Unit)11を備える。記憶部14は、主記憶装置としてのRAM(Random Access Memory)及びROM(Read Only Memory)を含み、さらには、着脱可能な記録媒体を含む。ROMには、携帯端末装置10がブログ地図サービスの提供を受ける際に実行されるアプリケーションプログラムとしてブログ地図アプリが記憶されている。
タッチパネル12は、カバーガラスと表示ユニット(例えば、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ等)との間に、タッチ操作を検出可能な透明なタッチセンサユニットが貼り合わされて構成されている。タッチセンサユニットとしては、抵抗膜方式、静電容量方式(表面型又は投影型)、超音波表面弾性波方式、光学方式、その他の検出方式のものが採用され得る。
タッチパネル12としては、好適には、正確な多点検出(マルチタッチの検出)が可能な投影型静電容量方式のタッチセンサユニットが採用される。投影型静電容量方式のタッチセンサユニットは、演算処理回路を搭載した基盤層の上に、特定のパターンで透明電極層を大量に配置し、表面にガラス等の絶縁体を重ねることにより構成される。この方式では表面に指を近づけると複数の電極間の静電容量が同時に変化し、電流量の比率を測定することでタッチした位置の特定が可能となる。この構成により、タッチパネル12は、タップ操作、スライド操作、ピンチアウト操作(2本の指を互いに遠ざける操作)、ピンチイン操作(2本の指を互いに近づける操作)その他のタッチ操作を検出することが可能である。
タッチパネル12はタッチユニットと表示ユニットとが上下に重なるように貼り合わされて構成されているため、ユーザは、表示領域12aに表示されているオブジェクトへのタッチ操作を行うことにより指示入力を行うことが可能である。例えば、ユーザは、オブジェクト(例えば、ブログ地図アプリを含む各種アプリの起動アイコン、投稿情報)を選択する指示入力をタッチ操作により行うことができる。
タッチパネル12は、ホームボタンや戻るボタンその他の指示入力アイコン、通信状態や電池残量等のアイコンを表示する領域のほかに、移動通信網MNを介して取得したWEBページや各種のメニューページ等を表示する表示領域12aを含む。ブログ地図アプリにおいては、ブログ地図ページが表示領域12aに表示される。
4.ブログ地図提供サーバ
ブログ地図提供サーバ30は、ブログサーバ20から提供された、地理的属性を有する投稿情報のうち、ユーザからの表示要求に含まれる地理的範囲に属する複数の投稿情報を地図上に表示したブログ地図ページを生成して、ユーザの携帯端末装置10に対して送信するものである。ブログ地図ページにおいては、投稿情報は、プロフィールアイコン、ユーザ名、投稿日時及び投稿テキストを含む吹き出し画像(投稿情報画像)として地図上に表示され、投稿情報に情報URLが含まれている場合には当該情報URLも吹き出し画像内に表示される。また、写真URLが含まれている場合には、写真画像が写真URLから取り込まれて、当該写真画像が吹き出し画像内に表示される。
ブログ地図提供サーバ30は、投稿された投稿情報を、ブログサーバ20からリアルタイムで取得する。また、ブログ地図提供サービスの利用者であるユーザの携帯端末装置10からブログ地図の表示要求があった場合には、表示要求に含まれる地理的範囲(投稿情報を表示する地図の範囲)で画定される地図の地図画像データを、地図情報提供サーバ40から取得する。ブログ地図提供サービスでは、地理的属性を有する投稿情報が表示対象となる。地理的属性を有する投稿情報とは、投稿された時点の投稿者の現在位置を示すジオタグが添付されている投稿情報、又は投稿テキスト内に地名を含む投稿情報である。具体的には、投稿情報にジオタグが添付されている場合には、ジオタグによって示される緯度経度情報が投稿情報の位置情報となり、ジオタグが添付されていない場合であっても投稿情報に含まれるテキストを解析し地名を導出できる場合には導出された地名の緯度経度情報を投稿情報の位置情報として扱う。すなわち、投稿情報にジオタグが添付されておらず、且つ、当該投稿情報の形態素解析により地名を導出できない場合には、当該投稿情報は地理的属性を有しないので、ブログ地図提供サービスにおける表示対象とはならない。
ここで、ブログサービスでは多数の登録ユーザによってメッセージが時々刻々と投稿されるため、ブログ地図提供サーバ30は、ブログサーバ20から次々と提供される新たな投稿情報を受信すると、ブログ地図ページの地図上に表示する投稿情報をリアルタイムで更新する。しかし、例えば、大勢が集まるお花見などの観光スポットや音楽ライブの会場など、短い期間において大量にメッセージが投稿されるような場合には、多数の投稿情報が地図上の特定の地点周辺に重なって表示されてしまい、視認性が損なわれてしまう。また、携帯端末装置10にブログ地図ページを表示する場合には、画面サイズに制約があるため、視認性の問題は特に顕著である。そこで、本実施形態に係るブログ地図提供サーバ30は、表示されようとする地図の範囲に属する地理的属性を有する複数の投稿情報を地図上に表示させるよう携帯端末装置10(表示装置の一例)を制御する場合に、各投稿情報の情報的価値を表す評価値を算出し、算出した評価値に応じて複数の投稿情報の優先順位を決定し、優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で地図上に表示させる。
図4は、本実施形態に係るブログ地図提供サーバ30の構成を示すブロック図であり、図5は、同サーバの機能構成を示すブロック図である。
図4に示すように、ブログ地図提供サーバ30は、装置全体を制御するCPU(Central Processing Unit)31、CPU31の作業領域として機能するRAM(Random Access Memory)34a、各種プログラムを記憶したROM(Read Only Memory)34b、及び各種のプログラムやデータを記憶する記憶装置34c、キーボードやマウスなどを含む入力部35、画像を表示するディスプレイ32、及び移動通信網MNを介して外部の装置と通信を行う送受信部33を備える。ROM34bには、コンピュータに本実施形態に係る投稿情報解析処理を実行させるための投稿情報解析処理プログラム及びブログ地図生成処理を実行させるためのブログ地図生成プログラムが記憶されており、CPU31はこれらのプログラムを実行することにより、本実施形態に係る各機能を実現する。
4−1.判定用情報記憶部
図5に示すように、ブログ地図提供サーバ30は、CPU11が受信した投稿情報を解析する際に用いられる判定用情報を記憶する判定用情報記憶部ST1を含み、判定用情報記憶部ST1は、不適切情報記憶部ST11、悪質ユーザ情報記憶部ST12、写真URL記憶部ST13、ブログユーザ属性情報記憶部ST14、ユーザ別単語記憶部ST15、及びユーザ別興味ジャンル記憶部ST16を備える。これらの記憶部は記憶装置34cによって実現される。また、記憶装置34cは、各投稿情報の解析結果である解析結果テーブルTBL11及び付加情報テーブルTBL12を記憶する解析結果記憶部ST2をさらに備える。解析結果テーブルTBL11及び付加情報テーブルTBL12はCPU31が新たに受信した投稿情報の解析処理を行う度に、その解析結果で更新される。
不適切用語情報記憶部ST11は、投稿情報の投稿テキストのうち本文テキストが不適切用語を含むか否かを判定するための情報を記憶するものであり、予め選定された不適切用語の一覧をリスト形式で保持している。ここで、不適切用語は、いわゆるNGワード(禁止用語)であり、未成年の閲覧に不適切な用語、他人を誹謗中傷する用語や、差別用語、犯罪に関する用語などが例示される。ブログ地図提供サービスの提供者は、不適切用語のリストを適宜更新する。
悪質ユーザ情報記憶部ST12は、投稿情報の投稿者がいわゆるスパムユーザ(悪質ユーザ)に該当するか否かを判定するための情報を記憶する。例えば、不特定のユーザに同一内容のメッセージを送る投稿者、広告ばかりを投稿する投稿者、未成年の閲覧に不適切な情報を投稿する投稿者は、悪質ユーザリストとして悪質ユーザ情報記憶部ST12に記憶される。悪質ユーザのリストは、ブログサーバ20が提供するブログサービスのユーザからの報告を契機としてブログサーバ20において更新され、ブログ地図提供サーバ30に対して提供される。
写真URL記憶部ST13は、投稿情報に写真画像(付加価値情報)が添付されているか否かを判定するための情報を記憶する。写真画像添付の有無は、投稿情報に特定の写真URLが含まれているか否かで判定される。上述したように、写真URLは、投稿者が写真を添付する際に利用した画像添付用API(Application Program Interface)に応じて所定の文字列を含み、当該所定の文字列としては、「pic.twitter.com/」、「twitpic.com/」、「p.twipple.jp/」などが例示される。よって、写真URL記憶部ST13は、投稿情報に写真画像が添付されているか否かを判定するための情報として、複数組の所定の文字列を写真URLのリストとして記憶する。ブログ地図提供サービスの提供者は、写真URLのリストを適宜更新する。
ブログユーザ属性情報記憶部ST14は、ブログサーバ20に登録している各ユーザのユーザ属性情報を各ユーザのユーザ名に対応付けて記憶している。上述したように、ブログサーバ20に登録している各ユーザのユーザ属性情報はブログサーバ20からブログ地図提供サーバ30に対して投稿情報と共に提供される。ユーザ属性情報がブログサーバ20から提供されない場合、すなわち、ユーザが自己のユーザ属性情報をブログサーバ20に登録していない場合には、ブログ地図提供サーバ30のCPU31は、投稿情報の本文テキストの内容やプロフィールテキストからユーザ属性を推定し、ブログユーザ属性情報記憶部ST14に記憶する。
ユーザ別単語記憶部ST15は、投稿情報の本文テキスト内で使用された単語をユーザごとに記憶する。ブログ地図提供サーバ30のCPU31は、ブログサーバ20から受信した投稿情報の本文テキストを形態素解析し、抽出された単語及び各単語の使用回数を累積し、ユーザごとの使用単語リストとして記憶する。すなわち、ユーザ別単語記憶部ST15は、各ユーザ名に関連付けて、使用単語と累積使用回数とを記憶したテーブルを保持している。
ユーザ別興味ジャンル記憶部ST16は、ブログサービスを利用する各ユーザが興味を持つジャンルをユーザごとに記憶する。ブログ地図提供サーバ30のCPU31は、ブログサーバ20から受信した投稿情報の本文テキスト及びプロフィールテキストを形態素解析して投稿者が興味を持つジャンルを推定し、ユーザ別興味ジャンル記憶部ST16に記憶する。記憶されるジャンル数は少なくとも1つあれば良いが、2個以上あってもよい。ブログ地図提供サーバ30のCPU31は、投稿情報を受け取る度に当該投稿情報についてジャンルを推定してもよいし、所定のタイミングで投稿情報をランダムに選択してジャンルを推定してもよい。あるいは、投稿情報の本文テキスト及びプロフィールテキストからジャンルを推定せずとも、ユーザ自身がブログ地図提供サーバ30に登録したジャンルをユーザ別興味ジャンル記憶部ST16に記憶するようにしてもよい。
また、図5に示すように、ブログ地図提供サーバ30は、さらに、投稿情報解析部31a、トレンド情報生成部31b、情報量算出部(投稿情報評価部)31c、ユーザ類似度算出部(投稿情報評価部)31d、優先順位決定部31e、及びブログ地図ページ生成部(表示情報生成部)31fを備える。これらの機能はCPU31によって実現される。
さらに、ブログ地図提供サーバ30は、ブログサーバ20から投稿情報を受信する投稿情報受信部33a、携帯端末装置10から受信した表示要求に含まれる地理的範囲の地図の地図画像データを地図情報提供サーバ40に対して要求するとともに、地図情報提供サーバ40から地図画像データを受信する地図情報要求部・受信部33b、携帯端末装置10からブログ地図ページの表示要求を受信する表示要求受信部33c、及びブログ地図ページ生成部31fが生成したブログ地図ページを携帯端末装置10へ送信するブログ地図ページ送信部33dを備える。これらの機能は、CPU31の制御のもと送受信部33によって実現される。
4−2.解析結果テーブルTBL11
図7に、解析結果テーブルTBL11の記憶内容の一例を示す。図示のように、解析結果テーブルTBL11には、各投稿情報のIDである投稿IDに対応付けて、ユーザ名、投稿日時、及び、緯度経度情報を含む基本項目が記憶され、さらに、複数種類の解析項目について投稿情報解析部31aが解析した結果が数値で記憶されている。
複数種類の解析項目(情報量の指標)は、(1)再投稿数(リツイート数又はRT数)、(2)投稿情報の本文テキストの文字数、(3)本文テキストがメンション(@)を含まないか、(4)投稿テキストが情報URLを含むか、(5)投稿情報に写真画像が添付されているか、(6)投稿情報の投稿者がスパムユーザでないか、(7)本文テキストが不適切用語を含まないか、(8)本文テキストに含まれる地名の特徴語数、(9)本文テキストに含まれるHOTキーワードの数、(10)投稿テキストが話題のニュースのURLを含むか、(11)本文テキストが話題の路線名を含むか、及び(12)本文テキストが地名を含むかの計12項目ある。ここで、再投稿数は、解析対象の投稿情報がその閲覧者に再投稿された回数を示す。地名の特徴語とは、例えば、話題のスポットランキングにおける地名ごとの関連語(例えば、桜の名所である「上野」に関し、「満開」、「七分咲き」等)である。HOTキーワードとは、ブログサービスに登録しているユーザの間で盛り上がっている話題に関連するキーワードである。
解析結果テーブルTBL11に記憶された各項目が示す数値のうち、「RT数」、「文字数」「地名の特徴語数」、「HOTキーワード数」は、取得した回数又は個数にそのまま対応している。一方、「メンション(@)を含まない」、「情報URLを含む」、「写真を含む」、「スパムユーザでない」、「不適切用語を含まない」、「話題のニュースのURLを含む」、「話題の路線名を含む」、及び「地名を含む」の各項目については、含むか含まないかに応じて「1」又は「0」で表される数値である。ここで、「1」は対応する投稿情報の情報的価値が高いことを示し、「0」は情報的価値が低いことを示す。具体的には、「メンション(@)を含まない」については、含まない場合に「1」が付与され、含む場合には「0」が付与される。また、「スパムユーザでない」及び「不適切用語を含まない」の各項目についても、同様に、含まない場合に「1」が付与され、含む場合には「0」が付与される。これに対し、「情報URLを含む」、「写真を含む」、「話題のニュースのURLを含む」、「話題の路線名を含む」、及び「地名を含む」の各項目については、含む場合に「1」が付与され、含まない場合には「0」が付与される。
「ユーザ名」及び「投稿日時」はブログサーバ20から投稿情報が提供されるときに、当該投稿情報の一部として、又は当該投稿情報に関連付けて提供されるものであり、投稿情報解析部31aは、投稿情報受信部33aを介して投稿情報を受信すると、各投稿情報のIDである投稿IDに、「ユーザ名」及び「投稿日時」を対応付けた新規レコードを解析結果テーブルTBL11に追加する。そして、投稿情報にジオタグが添付されている場合には、さらに、当該ジオタグが示す緯度経度情報を同レコード内に記憶する。また、投稿情報解析部31aは、受信した投稿情報の本文テキストを形態素解析し、地名辞書の地名と一致するものがあれば当該地名の緯度経度情報を同レコードに記憶するとともに、同レコード内の項目「地名を含む」に「1」を付与する。一方、地名辞書の地名と一致するものがなければ、同レコード内の項目「地名を含む」に「0」を付与する。地名辞書は記憶装置34cに記憶されているものを参照してもよいし、任意の外部のサーバに記憶されているものを参照してもよい。
投稿情報にジオタグが添付されておらず、且つ、当該投稿情報の形態素解析により地名を導出できない場合には、解析結果テーブルTBL11における「緯度経度情報」フィールドは空欄となる。なお、投稿情報の緯度経度情報が取得できない場合には、投稿情報解析部31aは、当該投稿情報について一度は作成したレコードを解析結果テーブルTBL11から削除し、それ以上の解析処理は行わないようにしてもよい。
4−3.付加情報テーブルTBL12
図8に、付加情報テーブルTBL12の記憶内容の一例を示す。図示のように、付加情報テーブルTBL12には、各投稿情報のIDである投稿IDに対応付けて、投稿者のユーザ属性として、投稿者の年齢、性別、職業、居住地、及び既婚又は未婚の別が記憶される。さらに、付加情報テーブルTBL12には、各投稿IDに対応付けて、投稿者が興味があるジャンル、投稿した頻度が高い単語が記憶される。
なお、本実施形態では、解析結果テーブルTBL11と付加情報テーブルTBL12をそれぞれが独立した2つのテーブルとして記憶装置34cに保持させる態様について説明したが、1つのテーブルとして構成してもよい。
次に、図5に戻り、CPU31によって実現される各機能ブロックの詳細について説明する。
4−4.投稿情報解析部
図5に示すように、投稿情報解析部31aは、特定文字列有無判定部31a1、情報URL有無判定部31a2、悪質ユーザ該当判定部31a3、写真画像有無判定部31a4、文字数取得部31a5、再投稿数取得部31a6、流行度情報取得部31a7、及び付加情報取得部31a8を備える。これら各部は、各項目について投稿情報を解析し、各投稿情報の投稿ID及び該当する項目に対応づけて、解析結果を解析結果テーブルTBL11及び付加情報テーブルTBL12に記憶する。
4−4−1.特定文字列有無判定部
特定文字列有無判定部31a1は、投稿情報の投稿テキストが特定の文字列を含むか否かを判定するものである。ここで、特定の文字列とは、情報的価値が少ないことを示す文字列もしくは記号又は不適切用語情報記憶部ST11に記憶されている不適切用語のいずれかである。
ツイッターのようなマイクロブログでは、「@ユーザ名」の形式を含んだ投稿はメンションと呼ばれる。ここで、メンションは、投稿テキストのうち本文テキスト内で他のユーザの名を挙げて簡単に言及するに過ぎないものであるため、情報的価値が少ないと考えられる。そこで、本実施形態では、情報的価値が少ないことを示す記号として、記号「@」の有無を判別する。特定文字列有無判定部31a1は、受信した投稿情報の本文テキストが記号「@」を含むか否かを判定し、「@」を含まない場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、「@」を含む場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「メンション(@)を含まない」に対応付けて記憶する。
また、特定文字列有無判定部31a1は、投稿情報の本文テキストに含まれる文字列を有意語に区切る形態素解析を実行して単語を抽出する。そして、不適切用語情報記憶部ST11を参照することにより、抽出した単語が、不適切用語情報記憶部ST11に記憶されている単語のいずれにも該当しない場合には、情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、該当する単語がある場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「不適切用語を含まない」に対応付けて記憶する。
4−4−2.情報URL有無判定部
情報URL有無判定部31a2は、投稿情報の投稿テキスト内に情報URL(付加価値情報)が含まれているか否かを判定する。具体的には、投稿テキスト内に文字列「http://」又は「https://」が含まれているか否かを判定する。文字列「http://」又は「https://」で始まる形式でない表示用の短縮URLが含まれる場合には、実際のURLを参照して文字列「http://」又は「https://」の有無を判定する。情報URL有無判定部31a2は、投稿テキストが文字列「http://」又は「https://」を含む場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「情報URLを含む」に対応付けて記憶する。情報URLを含む投稿情報であれば、閲覧者はさらに詳細な情報を閲覧することができるため、情報的価値が高いと考えられるためである。
4−4−3.悪質ユーザ該当判定部
悪質ユーザ該当判定部31a3は、投稿情報の投稿者がスパムユーザ(悪質ユーザ)でないかを判定するものである。悪質ユーザ該当判定部31a3は、悪質ユーザ情報記憶部ST12を参照することにより、解析結果テーブルTBL11に記憶された投稿情報の投稿者のユーザ名が、悪質ユーザ情報記憶部ST12に記憶されている悪質ユーザのリスト中のユーザ名のいずれかに一致する否かを判定する。悪質ユーザ該当判定部31a3は、一致するユーザ名がない場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、一致する悪質ユーザ名がある場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「スパムユーザでない」に対応付けて記憶する。悪質ユーザは不特定のユーザに同一内容のメッセージを送る投稿者や、広告ばかりを投稿する投稿者、未成年の閲覧に不適切な情報を投稿する投稿者であるから、情報的価値が低いと考えられるためである。
4−4−4.写真画像有無判定部
写真画像有無判定部31a4は、投稿情報に写真URL(付加価値情報)が含まれているか否かを判定するものである。写真画像有無判定部31a4は、写真URL記憶部ST13を参照することにより、投稿情報の投稿テキストが写真URL記憶部ST13に記憶されている写真URLの文字列のいずれかを含むか否かを判定する。写真画像有無判定部31a4は、投稿テキストが写真URLの文字列のいずれかを含む場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、いずれも含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「写真を含む」に対応付けて記憶する。写真URLを含む投稿情報であれば、閲覧者はさらに詳細な情報を閲覧することができるため、情報的価値が高いと考えられるためである。
4−4−5.文字数取得部
文字数取得部31a5は、投稿情報を解析して、投稿情報の本文テキストの文字数を取得するものである。投稿情報に情報URLや写真URLが含まれている場合には、これらのURLを除いた文字数を本文テキストの文字数として取得する。文字数取得部31a5は、取得した文字数を解析結果テーブルTBL11の「文字数」に対応付けて記憶する。ブログサーバ20が提供するブログサービスでは、ひとつの投稿で最長140字許容される。よって、文字数として解析結果テーブルTBL11に記憶される数値は、0以上140以下の整数となる。投稿情報の文字数が多いこと、すなわち、投稿情報の文書量が多いことは、一般的に情報量が多いことを示す。このため、本実施形態では、投稿情報の文書量が多いほど当該投稿情報の評価値が高くなるように、投稿情報の文字数を解析結果テーブルTBL11に記憶する。
なお、ブログサーバ20から投稿情報が提供されるときに、本文テキストの文字数を示す情報が添付されている場合には、文字数取得部31a5は、自ら投稿情報を解析せずとも、ブログサーバ20から提供された文字数情報を用いてもよい。また、文字数は本文テキストの文字数に限られず、情報URLや写真URLなどを含む投稿テキスト全体の文字列の文字数であってもよい。
4−4−6.再投稿数取得部
再投稿数取得部31a6は、投稿情報がその閲覧者によって再投稿(リツイート)された回数を取得するものである。上述したように、ブログサーバ20は、各投稿情報に関連付けて当該投稿情報がリツイートされたリツイート数などの統計データを記憶しており、この統計データは、投稿情報とともにブログ地図提供サーバ30に提供される。再投稿数取得部31a6は、ブログサーバ20から統計データを参照してリツイート数を取得し、解析結果テーブルTBL11の「RT数」に対応付けて記憶する。リツイート数として解析結果テーブルTBL11に記憶される数値は、0以上の整数となる。リツイート数が多い投稿情報は、多数の閲覧者に読まれた結果有用であると判断された投稿情報であるため、注目度が高く、情報的価値も高いためである。
4−4−7.流行度情報取得部とトレンド情報生成部
流行度情報取得部31a7は、直近の投稿情報から抽出された特徴語への適合度、又は直近の投稿情報で多用される注目語への適合度を示す流行度情報を取得する。具体的には、流行度情報取得部31a7は、トレンド情報生成部31bが生成した情報に基づいて、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」の各項目に関する値を取得するものである。「地名の特徴語数」は、直近の投稿情報から抽出された特徴語にへの適合度を示す情報であり、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」は、直近の投稿情報で多用される注目語への適合度を示す情報である。
図5に示すように、トレンド情報生成部31bは、地域別特徴語情報生成部31b1、HOTキーワード情報生成部31b2、話題のニュース情報生成部31b3、及び話題の路線情報生成部31b4を備える。トレンド情報生成部31bは、投稿情報受信部33aを介して新たな投稿情報を受け取るとこれをRAM34aに蓄積するとともに、現在時刻を起点として所定時間だけ遡った期間(以下、「対象期間」という)内に投稿された複数の投稿情報に基づいて、地域別特徴語情報生成部31b1、HOTキーワード情報生成部31b2、話題のニュース情報生成部31b3、及び話題の路線情報生成部31b4各部によるトレンド情報生成処理を実行する。対象期間は、例えば、現在時刻を起点として過去24時間である。トレンド情報生成部31bは、間欠的(例えば15分ごと)に過去24時間の対象期間についてトレンド情報生成処理を行い、生成したトレンド情報をRAM34aに記憶する。なお、生成する情報の性質に応じて、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」の各項目間で、上記対象期間を相違させてもよい。
地域別特徴語情報生成部31b1は、対象期間内に投稿された複数の投稿情報から地名に関する特徴語を抽出し、地域ごとの特徴語情報を生成する。地名に関する特徴語とは、例えば、話題のスポットランキングにおける地名ごとの関連語(例えば、桜の名所である「上野」に関し、「満開」、「七分咲き」等)である。具体的には、地域別特徴語情報生成部31b1は、複数の投稿情報の本文テキストの各々から地名を抽出し、抽出した地名に関する単語について、tf−idf法を用いて地名に関する特徴語を抽出する。tf−idfは、文書中に出現した特定の単語がどのくらい特徴的であるかを識別する指標であり、複数の投稿情報の各々の本文テキスト内の単語の出現頻度(すなわち、ある単語が文書中に現れる回数を当該文書中の総単語数で割った値)と、対象期間内の複数の投稿情報の全ての本文テキストにおける当該単語の希少さ(ある単語が出現する文書の数の逆数)に応じて定まる値である。そして、地域別特徴語情報生成部31b1は、抽出された特徴語を、地名に紐づけて地域ごとに記憶する。
流行度情報取得部31a7は、投稿情報受信部33aを介して受信した投稿情報の本文テキスト中に、地域別特徴語情報生成部31b1が生成した地名の特徴語がある場合にはその数を取得し、解析結果テーブルTBL11の「地名の特徴語数」に対応付けて記憶する。
なお、投稿情報の本文テキストから地名を抽出できない場合であって、投稿情報にジオタグが添付されている場合には、ジオタグが示す緯度経度情報に基づいて地名を特定してもよい。また、特徴語の抽出には、上述したtf−idf法の代わりに他の公知の方法を用いることができる。
HOTキーワード情報生成部31b2は、対象期間内に投稿された複数の投稿情報からHOTキーワード情報を生成する。ここで、HOTキーワードとは、ブログサービスに登録しているユーザの間で盛り上がっている話題に関連するキーワードである。具体的には、定常期間(例えば、直近72時間)と比べて対象期間(例えば、直近12時間)の出現数が多い単語、すなわち、急に出現数が増加した単語(急上昇度が高い単語)をHOTキーワードとする。HOTキーワード情報生成部31b2は、投稿情報の本文テキストを解析し、抽出された複数の単語の各々について、定常期間の出現頻度に対する対象期間の出現頻度の対数尤度比を示す急上昇スコアSを算出する。そして、急上昇スコアSが所定の値より高い単語(又は上位の所定数の単語)をHOTキーワードとして抽出し、記憶する。
具体的には、HOTキーワード情報生成部31b2は、以下の式(B)に基づいて急上昇スコアSを算出する。
Figure 0006184840

ここで、S(kws,tgt,all)は、その値が小さいほど急上昇度が高いこと示す。ただし、freq(kwd,X)は期間X内のキーワードkwdの出現頻度であり、allは定常期間、tgtは対象期間である。
kはスムージングパラメータであり、出現頻度が小さい単語や絶対数が少ない単語の急上昇度を小さく評価するためのものである。
例えば、k=200とした場合において、単語Aについて、S=−log(100/(200+200))=0.6、単語Bについて、S=−log(100/(800+200))=1、単語Cについて、S=−log(10/(20+200))=1.34が得られたとする。単語Aと単語Bとでは対象期間tgtの出現数は同数(100)であるが、スムージングパラメータの作用により単語Aの方がスコアSの値が小さくなる(すなわち、急上昇度が大きいと評価される)。また、単語CのスコアSは、スムージングパラメータkを用いない場合には単語AのスコアSと同じ値になるが、スムージングパラメータkの作用により、単語AのスコアSよりも高い値となる(すなわち、急上昇度が小さく評価される)。
流行度情報取得部31a7は、投稿情報受信部33aを介して受信した投稿情報の本文テキスト中に、HOTキーワード情報生成部31b2が生成したHOTキーワードがある場合にはその数を取得し、解析結果テーブルTBL11の「HOTキーワード数」に対応付けて記憶する。
なお、HOTキーワードの抽出には、スコアSの代わりに、上述したtf−idf法その他の公知の方法を用いることができる。
話題のニュース情報生成部31b3は、対象期間内に投稿された複数の投稿情報に基づいて話題のニュース情報を生成する。ブログ地図提供サーバ30の記憶装置34cには予め複数のニュースサイトのドメインリストが記憶されている。話題のニュース情報生成部31b3は、対象期間内に投稿された複数の投稿情報のうち、ニュースサイトの各ドメイン名を含むURLが含まれる投稿情報の数(投稿回数)を計数し、投稿回数をニュース記事ごとに記憶する。
流行度情報取得部31a7は、投稿情報受信部33aを介して受信した投稿情報の本文テキストが、投稿回数が一定数以上のニュース記事のURLを含むか否かを判定し、含む場合には当該投稿情報の情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「話題のニュースのURLを含む」に対応付けて記憶する。
話題の路線情報生成部31b4は、対象期間内に投稿された複数の投稿情報に基づいて話題の路線情報を生成する。話題の路線情報生成部31b4は、対象期間内に投稿された複数の投稿情報の本文テキストを解析して路線名を抽出し、抽出した各路線名について、当該路線名を含む投稿情報の数(投稿回数)を計数し、投稿回数を路線名ごとに記憶する。
流行度情報取得部31a7は、投稿情報受信部33aを介して受信した投稿情報の本文テキストが、投稿回数が一定数以上の路線名を含むか否かを判定し、含む場合には当該投稿情報の情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「話題の路線名を含む」に対応付けて記憶する。
4−4−8.付加情報取得部
付加情報取得部31a8は、各投稿情報の投稿者のユーザ属性情報、当該投稿者が興味を有するジャンル、及び当該投稿者が投稿した頻度が高い単語などの付加情報を取得するものである。具体的には、付加情報取得部31a8は、記憶装置34cのブログユーザ属性情報記憶部ST14を参照して、受信した投稿情報のユーザ名のユーザ属性情報(年齢、性別、職業、居住地、及び既婚又は未婚の別)を取得し、取得した情報を付加情報テーブルTBL12(図8)における当該投稿情報の投稿ID及び「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」の各々に対応付けて記憶する。
また、付加情報取得部31a8は、記憶装置34cのユーザ別単語記憶部ST15を参照して、受信した投稿情報のユーザ名に対応付けられた単語のうち累積使用回数が高い単語を上位から所定数取得し、取得した情報を付加情報テーブルTBL12における当該投稿情報の投稿ID及び「投稿した頻度が高い単語」に対応付けて記憶する。
また、付加情報取得部31a8は、記憶装置34cのユーザ別興味ジャンル記憶部ST16を参照して、受信した投稿情報のユーザ名に対応付けられたジャンルを所定数取得し、取得した情報を付加情報テーブルTBL12における当該投稿情報の投稿ID及び「興味があるジャンル」に対応付けて記憶する。
4−5.投稿情報評価部
次に、図5において、情報量算出部(投稿情報評価部)31cについて説明する。
情報量算出部31cは、解析結果テーブルTBL11に記憶された複数の投稿情報のうち、ブログ地図提供サーバ30の表示要求受信部33cを介して携帯端末装置10から受信した表示要求に含まれる地図の範囲に属する緯度経度情報を有する投稿情報(すなわち、携帯端末装置10に表示されようとする地図の範囲に属する地理的属性を有する投稿情報)を特定する。そして、各投稿情報について、解析結果テーブルTBL11における各項目に記憶された数値を読み出して以下の式に代入して、情報量Sを算出する。
S=A×[RT数]+B×[文字数]
+C×[メンション(@)を含まない]
+D×[情報URLを含む]+E×[写真を含む]
+F×[スパムユーザでない]+G×[不適切用語を含まない]
+H×[地名の特徴語数]+I×「HOTキーワード数」
+J×[話題のニュースのURLを含む]+K×「話題の路線名を含む」
+L×[地名を含むか]
・・・(式A)
ここで、A〜Lは重み係数(正の数)である。また、「RT数」として記憶された数値は正規化したものを代入し、その他の項目に関する数値は、記憶値をそのまま用いる。
上述したように、各項目の数値は、その値が大きいほど情報的価値が高いことを示すように設定されている。よって、投稿情報の情報量Sの値が大きいほど、当該投稿情報の情報的価値が高いことを示す。なお、重み係数A〜Lは、対応する項目の重要度に応じて適宜設定され得る。
情報量算出部31cは、算出した情報量Sの値をRAM34aに一旦記憶する。
ユーザ類似度算出部(投稿情報評価部)31dは、解析結果記憶部ST2に記憶された付加情報テーブルTBL12の各項目に記憶された情報と、表示要求受信部33cが受信した表示要求を送信した携帯端末装置10のユーザ(すなわち、ブログ地図ページの閲覧者)の属性を示す閲覧者属性情報との類似度を算出する。
具体的には、ユーザ類似度算出部31dは、携帯端末装置10から受信した、ブログ地図ページの表示要求に含まれる地理的範囲内の緯度経度情報を有する投稿情報を計算対象として選択し、選択した投稿情報のユーザ属性情報(「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」)、「興味があるジャンル」、及び「投稿した頻度が高い単語」を付加情報テーブルTBL12から取得する。また、表示要求を送信した携帯端末装置10のユーザについても、「年齢」、「性別」、「職業」、「居住地」、「既婚又は未婚の別」、「興味があるジャンル」、及び「投稿した頻度が高い単語」に関する情報を取得する。
ここで、携帯端末装置10のユーザに関する情報は、上記表示要求に含めて携帯端末装置10から受信されるものであってもよい。また、携帯端末装置10のユーザが、ブログサーバ20が提供するブログサービスの登録ユーザである場合には、記憶装置34cに記憶されたブログユーザ属性情報記憶部ST14、ユーザ別単語記憶部ST15、及びユーザ別興味ジャンル記憶部ST16から取得してもよい。なお、「投稿した頻度が高い単語」については、携帯端末装置10のユーザがブログサービスの登録ユーザの場合にのみ取得可能な情報であるから、ユーザが登録ユーザでない場合には、「投稿した頻度が高い単語」を類否判断の対象から除外する。
そして、ユーザ類似度算出部31dは、「年齢」、「性別」、「職業」、「居住地」、「既婚又は未婚の別」、「興味があるジャンル」、及び「投稿した頻度が高い単語」の各々について、投稿者と閲覧者とで一致している場合には類似していることを示す「1」を付与し、一致しない場合には類似していないことを示す「0」を付与し、これらの数値を合計して投稿者と閲覧者との間の類似度Rを算出してRAM34aに記憶する。
このように、情報量算出部31c及びユーザ類似度算出部31dは、各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値として情報量S及び類似度Rをそれぞれ算出する投稿情報評価部として機能する。
ここで、投稿情報の投稿者の属性と当該投稿情報の閲覧者の属性とが類似しているほど、閲覧者は、投稿情報の内容に興味を持つ可能性が高いと推定される。例えば、「医師」や「弁護士」など職業が一致していれば共通の話題が多いと推定され、同じ年代や性別、居住地が近い場合にも共通の話題が多いと推定される。また、既婚であれば、子育ての話題などが共通の話題となり得る。また、趣味や興味があるジャンル、多用する単語が似ている場合にも同様である。そこで、本実施形態では、これらのユーザ属性に基づいて、投稿情報の投稿者と当該投稿情報の閲覧者との類似度を算出し、類似度が高いほど評価値が高くなるように、ひいては、優先順位が高くなるように設定している。
なお、以下の説明において、「年齢」、「性別」、「職業」、「居住地」、「既婚又は未婚の別」等の属性をデモグラフィック属性、「興味があるジャンル」、及び「投稿した頻度が高い単語」をサイコグラフィック属性と呼ぶ場合がある。
4−6.優先順位決定部
優先順位決定部31eは、各投稿情報について、RAM34aに記憶された情報量S及び類似度Rに基づいて、表示されようとする地図の範囲に属する緯度経度情報を有する複数の投稿情報の優先順位を決定する。具体的には、優先順位決定部31eは、複数の情報量Sの数値を最大値が1で最小値が0となるように正規化し、複数の類似度Rの数値を最大値が1で最小値が0となるように正規化し、各投稿情報についての正規化後の情報量Sの値と類似度Rの値とを合計する。そして、合計値が大きい投稿情報の優先順位が高くなるように複数の投稿情報の優先順位を決定し、決定した優先順位をRAM34aに記憶する。
なお、優先順位の決定方法は上述したものに限られず、例えば、複数の表示対象について、情報量Sが多いほど優先度が高くなるように情報量のみに基づく優先順位を決定しておき、情報量Sの優先順位が高く、且つ、類似度Rが閾値を超える投稿情報を優先するようにしてもよい。この場合、情報量Sの優先順位が相対的に下位の投稿情報であっても類似度Rが閾値を超える投稿情報の方が、情報量Sの優先順位が上位ではあるが類似度Rが閾値以下の投稿情報よりも優先されることになる。一方、類似度Rを超えている投稿情報同士であれば、情報量順位が高い方が優先される。
このように、優先順位決定部31eは、情報量算出部(投稿情報評価部)31c及びユーザ類似度算出部(投稿情報評価部)31dが決定した評価値に応じて複数の投稿情報の優先順位を決定する。
4−7.ブログ地図ページ生成部
ブログ地図ページ生成部(表示情報生成部)31fは、優先順位決定部31eが選択した複数の投稿情報を地図上に表示したブログ地図ページ(表示情報)を生成するものである。ブログ地図ページ生成部31fは、まず、地図情報要求部・受信部33bにより、携帯端末装置10から受信した表示要求に含まれる地理的範囲の地図の地図画像データを地図情報提供サーバ40に対して要求し、携帯端末装置10に表示されようとする地図の地図画像データを取得する。
次に、ブログ地図ページ生成部31fは、表示対象である各投稿情報のプロフィールアイコン、ユーザ名、投稿日時及び投稿テキストを吹き出し画像内に表示した投稿情報画像を生成し、各投稿情報の緯度経度情報に対応する地点に各投稿情報画像をマッピングしたブログ地図ページを生成する。このとき、複数の投稿情報画像のうち、優先順位が高いものほど前面に表示されるように、複数の投稿情報画像を配置する。また、最前面にある投稿情報のテキストの文字サイズが他の投稿情報の文字サイズよりも大きくなるように設定する。生成されたブログ地図ページは、ブログ地図ページ送信部33dを介して携帯端末装置10に送信され、携帯端末装置10は受信したブログ地図ページをタッチパネル12の表示領域12aに表示する。
このように、ブログ地図ページ生成部(表示情報生成部)31fは、表示されようとする地図の範囲に属する地理的属性を有する複数の投稿情報を地図上に表示させるよう携帯端末装置(表示装置)10を制御する場合に、優先順位決定部31eが決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で地図上に表示された表示情報を生成する表示情報生成部として機能する。
<動作>
次に、本実施形態の動作を説明する。図6は、ブログ地図提供サーバ30によって実行される投稿情報解析処理の流れを示すフローチャートである。投稿情報解析処理は、ブログ地図提供サーバ30がブログサーバ20から新たな投稿情報を受信する度に実行される。
投稿情報解析処理において、CPU31は、ブログサーバ20から送受信部33を介して投稿情報を受信すると(S11:YES)、投稿情報の投稿テキストを形態素解析する(S12)。CPU31は、形態素解析により投稿テキストを有意語に区切り、解析結果をRAM34aに記憶する。また、CPU31は、投稿情報を受信すると、当該投稿情報に投稿IDを付与するとともに、投稿情報から「ユーザ名」及び「投稿日時」を取得し、さらに、ジオタグが投稿情報に添付されている場合には投稿情報の「緯度経度情報」を取得して、これらを対応付けたレコードを解析結果テーブルTBL11に追加する。さらに、CPU31は、RAM34aに記憶した解析結果に基づいて投稿テキストが地名を含んでいるか否かを判定し、地名を含んでいる場合には当該地名の緯度経度情報を取得し、解析結果テーブルTBL11に追加する。また、CPU31は、投稿テキストが地名を含んでいるか否かに応じて、当該投稿情報に「1」又は「0」を付与し、解析結果テーブルTBL11に追加する。
次に、CPU31は、ステップS13において、投稿文書解析処理を行う。投稿文書解析処理では、特定文字列有無判定処理、URL有無判定処理、悪質ユーザ該当判定処理、写真画像有無判定処理、文字数取得処理、再投稿数取得処理、及び、流行度情報取得処理を行う。
上述したように、特定文字列有無判定処理では、RAM34aに記憶された形態素解析結果に基づいて、受信した投稿情報にメンション(@)が含まれていないかを判定するとともに、不適切用語情報記憶部ST11に一致する単語が含まれていないかを判定する。CPU31は、「@」を含まないと判定した場合には、情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、「@」を含むと判定した場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「メンション(@)を含まない」に対応付けて記憶する。
また、CPU31は、形態素解析により抽出した単語のいずれもが、不適切用語情報記憶部ST11に記憶されている単語のいずれにも該当しない場合には、情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、該当する単語がある場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「不適切用語を含まない」に対応付けて記憶する。
URL有無判定処理では、CPU31は、投稿情報の投稿テキスト内に情報URLが含まれているか否かを判定する。具体的には、CPU31は、投稿情報の投稿テキスト内に文字列「http://」又は「https://」が含まれているか否かを判定し、含む場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まないには情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「情報URLを含む」に対応付けて記憶する。
悪質ユーザ該当判定処理では、CPU31は、投稿情報の投稿者が悪質ユーザであるか否かを判定する。具体的には、CPU31は、投稿者のユーザ名(すなわち、解析結果テーブルTBL11に記憶されたユーザ名)が悪質ユーザ情報記憶部ST12に記憶されている悪質ユーザのリスト中のユーザ名のいずれかに一致する否かを判定し、一致するユーザ名がない場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、一致する悪質ユーザ名がある場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「スパムユーザでない」に対応付けて記憶する。
写真画像有無判定処理では、CPU31は、投稿情報の投稿テキスト内に、写真URL記憶部ST13に記憶されている写真URLの文字列のいずれかを含むか否かを判定する。写真画像有無判定部31a4は、投稿テキストが写真URLの文字列のいずれかを含む場合には情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、いずれも含まないには情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「写真を含む」に対応付けて記憶する。
文字数取得処理では、CPU31は、投稿情報の投稿テキストのうち本文テキストの文字数を取得し、取得した文字数を解析結果テーブルTBL11の「文字数」に対応付けて記憶する。また、再投稿数取得処理では、CPU31は、ブログサーバ20から提供された統計データを参照して、当該投稿情報のリツイート数を取得し、解析結果テーブルTBL11の「RT数」に対応付けて記憶する。
流行度情報取得処理では、CPU31は、トレンド情報生成処理によって生成された情報に基づいて、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」の各項目に関する値を取得する。CPU31は、トレンド情報生成処理において、地域別特徴語情報、HOTキーワード情報、話題のニュース情報、及び話題の路線情報の各情報を生成する。
CPU31は、生成した地域別特徴情報を参照して、形態素解析した投稿情報の本文テキスト内に、地名に関する特徴語のリストに一致するものがあればその数を計数し、解析結果テーブルTBL11の「地名の特徴語数」に対応付けて記憶する。
CPU31は、生成したHOTキーワード情報を参照して、解析した投稿情報の本文テキスト内に、HOTキーワードのリストに一致するものがあればその数を計数し、解析結果テーブルTBL11の「HOTキーワード数」に対応付けて記憶する。
CPU31は、生成した話題のニュース情報を参照して、投稿情報の投稿テキストが、投稿回数が一定以上のニュース記事のURLを含むか否かを判定し、含む場合には当該投稿情報の情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「話題のニュースのURLを含む」に対応付けて記憶する。
CPU31は、話題の路線情報を参照して、投稿情報の投稿テキストが、投稿回数が一定数以上の路線名を含むか否かを判定し、含む場合には当該投稿情報の情報的価値が高いことを示す「1」を当該投稿情報に付与する一方、含まない場合には情報的価値が低いことを示す「0」を当該投稿情報に付与し、解析結果テーブルTBL11の「話題の路線名を含む」に対応付けて記憶する。
なお、特定文字列有無判定処理、URL有無判定処理、悪質ユーザ該当判定処理、写真画像有無判定処理、文字数取得処理、再投稿数取得処理、及び、流行度情報取得処理は、上記に記載した順序で実行する必要はなく、いずれの順序で実行してもよい。
CPU31は、このようにして、投稿情報を受信する度に、当該投稿情報について複数の項目について解析処理を行い、解析結果を解析結果テーブルTBL11に記憶する。その結果、例えば、図7に示すように、「投稿ID=0001」について、「ユーザ名=A、投稿日時=20131004 03:05:11(2013年10月4日3時5分11秒)、緯度経度=(x1,y1)、RT数=123、文字数=35、メンション(@)を含まない=0、情報URLを含む=1、写真を含む=1、スパムユーザでない=0、不適切用語を含まない=0、地名の特徴語数=2、HOTキーワード数=1、話題のニュースのURLを含む=0、話題の路線名を含む=0、地名を含む=0」を含むレコードが生成される。
続いて、CPU31は、ステップS14において、付加情報取得処理を行う。付加情報取得処理では、CPU31は、各投稿情報の投稿者のユーザ属性、当該投稿者が興味を有するジャンル、及び当該投稿者が投稿した頻度が高い単語を取得する。具体的には、CPU31は、ブログユーザ属性情報記憶部ST14を参照して、受信した投稿情報のユーザ名のユーザ属性情報(年齢、性別、職業、居住地、及び既婚又は未婚の別)を取得し、取得した情報を付加情報テーブルTBL12(図8)における当該投稿情報の投稿ID及び「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」の各々に対応付けて記憶する。
さらに、CPU31は、ユーザ別単語記憶部ST15を参照して、受信した投稿情報のユーザ名に対応付けられた単語のうち累積使用回数が高い単語を上位から所定数取得し、取得した情報を付加情報テーブルTBL12における当該投稿情報の投稿ID及び「投稿した頻度が高い単語」に対応付けて記憶する。
また、CPU31は、ユーザ別興味ジャンル記憶部ST16を参照して、受信した投稿情報のユーザ名に対応付けられたジャンルを所定数取得し、取得した情報を付加情報テーブルTBL12における当該投稿情報の投稿ID及び「興味があるジャンル」に対応付けて記憶する。
CPU31は、このようにして、投稿情報を受信する度に、当該投稿情報について付加情報取得処理を行い、取得した付加情報を付加情報テーブルTBL12に記憶して、解析処理を終了する。その結果、例えば、図8に示すように、「投稿ID=0001」について、「年齢=27、性別=男、職業=会社員、居住地=東京、既婚又は未婚の別=既婚、興味があるジャンル=音楽、投稿した頻度が高い単語=ライブ、チケット」を含むレコードが生成される。
なお、投稿情報解析処理(S13)は付加情報取得処理(S14)の前に行う必要はなく、付加情報取得処理を行ってから投稿情報解析処理を行ってもよい。
次に、図9を参照して、ブログ地図提供サーバ30によって実行されるブログ地図生成処理について説明する。ブログ地図生成処理は、携帯端末装置10からブログ地図ページの表示要求を受信すると開始される。ブログ地図生成処理は、大別して、投稿情報評価処理(情報量算出処理及びユーザ類似度算出処理)、優先順位決定処理、及びブログ地図ページ生成処理を含む。
ブログ地図ページの表示要求は、携帯端末装置10において、以下のように生成される。携帯端末装置10のCPU11は、タッチパネル12に表示されたブログ地図アプリの起動アイコンへのタッチ操作を検知すると、ブログ地図アプリを起動する。ブログ地図アプリは、起動時においては、携帯端末装置10の現在の位置情報へのアクセス許可をユーザに対して求め、許可が得られた場合又は予め許可が付与されている場合には携帯端末装置10の現在の位置情報を用いてブログ地図ページの表示要求を生成する処理をCPU11に実行させる。具体的には、CPU11は、現在の位置情報を中心とした地図であって、タッチパネル12の表示領域12aの大きさに応じた所定の拡大率の地図の範囲(地理的範囲)の指定を、ブログ地図ページの表示要求に含めて、ブログ地図提供サーバ30に対して送信する。
なお、上記表示要求には、携帯端末装置10の現在の位置情報を含めるのではなく、携帯端末装置10のユーザが指定した任意の場所の指定情報を含めるようにしてもよい。
また、ブログ地図ページの表示要求は、CPU11が、ブログ地図ページの表示中に、表示する地図の範囲を移動するタッチ操作(スライド操作)や拡大率を変更するタッチ操作(ピンチアウト操作やピンチイン操作)を検知すると生成される。
なお、本動作例では、携帯端末装置10のユーザは、ブログサーバ20が提供するブログサービスの登録ユーザであるものとする。
図9において、CPU31は、携帯端末装置10から、ブログ地図ページの表示要求を受信すると(S21:YES)、受信した表示要求に含まれる地理的範囲(表示されようとする地図の範囲)を緯度経度で指定する(S22)。
次に、CPU31は、解析結果テーブルTBL11に記憶された複数の投稿情報のうち、緯度経度情報の記憶値が、指定された地理的範囲内にある投稿情報を表示対象として特定する(S23)。
次に、CPU31は、ステップS24において、解析結果テーブルTBL11のうち、ステップS23で特定した表示対象の各投稿情報の各レコードから、「RT数」、「文字数」、「メンション(@)を含まない」、「情報URLを含む」、「写真を含む」、「スパムユーザでない」、「不適切用語を含まない」、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、「話題の路線名を含む」、及び「地名を含む」の各項目に記憶された数値を取得し、取得した数値を上述した式Aに代入して、各投稿情報の情報量Sを算出する。例えば、解析結果テーブルTBL11に記憶されている複数の投稿情報のうち、投稿ID=0001〜0003が表示対象として特定されたとすると、CPU31は、投稿ID=0001を有する投稿情報、投稿ID=0002を有する投稿情報、投稿ID=0003を有する投稿情報の各々について、情報量S1、S2、S3を算出する。そして、CPU31は、算出した情報量S1、S2、S3をRAM34aに一旦記憶する。
また、CPU31は、ステップS25において、付加情報テーブルTBL12のうち、ステップS23で特定した表示対象の各投稿情報の各レコードから、「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」、「興味があるジャンル」、及び「投稿した頻度が高い単語」の各項目に記憶された情報を取得する。また、CPU31は、記憶装置34cに記憶されたブログユーザ属性情報記憶部ST14、ユーザ別単語記憶部ST15、及びユーザ別興味ジャンル記憶部ST16の各々を参照して、表示要求を送信した携帯端末装置10のユーザの「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」、「興味があるジャンル」、「投稿した頻度が高い単語」、及び「地名を含む」の各項目に記憶された情報を取得する。そして、投稿ID=0001を有する投稿情報の投稿者であるユーザAと携帯端末装置10のユーザとの類似度R1、投稿ID=0002を有する投稿情報の投稿者であるユーザBと携帯端末装置10のユーザとの類似度R2、投稿ID=0003の投稿者であるユーザCと携帯端末装置10のユーザとの類似度R3を算出して、RAM34aに一旦記憶する。
次に、CPU31は、ステップS26において、RAM34aに記憶された情報量Sの値及び類似度Rの値に基づいて、表示対象である複数の投稿情報の表示の優先度を決定する。
具体的には、まず、CPU31は、情報量S1、S2、S3をRAM34aから読み出して最大値が1で最小値が0となるように正規化するとともに、類似度R1、R2、R3をRAM34aから読み出して最大値が1で最小値が0となるように正規化する。そして、投稿ID=0001を有する投稿情報、投稿ID=0002を有する投稿情報、及び投稿ID=0003を有する投稿情報の各々について、正規化後の情報量Sの値と正規化後の類似度Rの値を合計し、合計値が大きい投稿情報の優先度が高くなるように投稿IDが0001〜0003の3つの投稿情報の優先順位を決定する。決定した優先順位はRAM34aに記憶される。
この例において、仮に、正規化後の情報量SがS1=1、S2=0、S3=0.2であり、類似度がR1=0.5、R2=0、R3=1であるとすると、合計値TはT1=1.5、T2=0、T3=1.2となり、優先順位は、[投稿ID=0001]→[投稿ID=0003]→[投稿ID=0002]と決定されたものとする。投稿ID=0001を有する投稿情報は、情報量Sが最も大きく類似度Rが中程度であるので最も優先順位が高く、投稿ID=0003を有する投稿情報は、情報量Sは最小値に近いが類似度Rが最も大きいため2番目に高い優先順位となっている。
次に、CPU31は、ステップS27において、地図情報提供サーバ40に表示されようとする地図の範囲の地図画像データを要求してこれを取得し、選択された投稿情報をブログサーバ20から取得する。そして、各投稿情報のプロフィールアイコン、ユーザ名、投稿日時及び投稿テキストを吹き出し画像内に表示した投稿情報画像を生成し、各投稿情報の緯度経度情報に対応する地図上に各投稿情報画像をマッピングしたブログ地図ページを生成し、携帯端末装置10に対して送信して、ブログ地図ページ生成処理を終了する。
この場合において、CPU31は、複数の投稿情報画像のうち、優先順位が高いものほど前面に表示されるように、複数の投稿情報画像を配置する。また、最前面にある投稿情報の本文テキストの文字サイズを他の投稿情報の文字サイズよりも大きくなるように設定する。すなわち、優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で表示されるように設定する。
携帯端末装置10のCPU11は、ブログ地図ページをブログ地図提供サーバ30から受信すると、タッチパネル12の表示領域12aにこれを表示する。図10に、ブログ地図ページBMの表示例を示す。図示の例では、3つの投稿情報(T1,T2,T3)が優先順位に従って(T1→T3→T2の順に)表示されている。具体的には、優先順位が高い投稿情報がより前面に表示され、且つ、最前面の投稿情報の投稿情報画像内では文字サイズが大きく表示されている。このように、優先順位が最も高い投稿情報T1が、優先順位が低い投稿情報T3及びT2よりも強調された態様で(すなわち、前面に且つ大きな文字サイズで)地図上に表示されている。また、優先順位がT2よりも高い投稿情報T3が、優先順位が低い投稿情報T2よりも強調された態様で(すなわち、前面に)地図上に表示されている。
以上の説明から明らかなように、本実施形態によれば、情報的価値が高い投稿情報がより強調された態様で表示されるため、視認性を向上しつつ、投稿情報が地図の閲覧者にとって情報的価値が高い情報であることが分かり易い態様で携帯端末装置10に表示されるように制御することが可能となる。よって、ユーザは、ブログ地図ページを開くだけで、自己にとって情報的価値が高い情報にまず注目して地図を閲覧することができ、ユーザの利便性が格段に向上する。
より詳細には、情報量S(評価値)の基礎となる「RT数」、「文字数」、「メンション(@)を含まない」、「情報URLを含む」、「写真を含む」、[スパムユーザでない]、「不適切用語を含まない」、「地名の特徴語数」、「HOTキーワード数」、[話題のニュースのURLを含む]、「話題の路線名を含む」、及び「地名を含む」のそれぞれは、情報的価値が高いほどその値が大きくなるように定められているため、情報量Sの値が大きいほど優先順位が高くなる。
すなわち、本実施形態では、情報量算出部(投稿情報評価部)31cは、投稿情報の投稿テキストが付加価値情報(情報URL又は写真URL)を含む場合には当該投稿情報の優先順位が高くなるように評価値を算出し、情報的価値が少ないことを示す文字列もしくは記号又は不適切用語を含む場合には当該投稿情報の優先順位が低くなるように評価値を算出し、投稿情報の文字数が多いほど(すなわち、投稿情報の文書量が多いほど)当該投稿情報の優先順位が高くなるように評価値を算出し、投稿情報の閲覧者に再投稿された回数が多いほど当該投稿情報の優先順位が高くなるように評価値を算出し、投稿情報の投稿者が悪質ユーザに該当する場合には当該投稿情報の優先順位が低くなるように評価値を算出し、直近の投稿情報から抽出された特徴語への適合度、又は直近の投稿情報で多用される注目語への適合度が高いほど投稿情報の優先順位が高くなるように評価値を算出する。
したがって、本実施形態によれば、情報量が多く且つ直近の特徴語や注目語への適合度が高い投稿情報はブロク地図ページの閲覧者にとってより情報的価値が高い情報として優先的に表示するとともに、読む価値が低いか又は閲覧に不適切な投稿情報は情報的価値が低いとして、表示の優先度を下げるので、閲覧者にとって情報的価値が量的に高い投稿情報を表示したブログ地図ページを提供することが可能となる。
また、類似度R(評価値)の基礎となる「年齢」、「性別」、「職業」、「居住地」、「既婚又は未婚の別」、「興味があるジャンル」、及び「投稿した頻度が高い単語」は、投稿者と携帯端末装置10のユーザ(閲覧者)との類似度が大きいほどその値が高くなるように定められているため、類似度Rの値が大きいほど優先順位が高くなる。
すなわち、本実施形態では、ユーザ類似度算出部(投稿情報評価部)31dは、投稿情報の投稿者の属性を示す投稿者属性情報と携帯端末装置(表示装置)10のユーザの属性を示す閲覧者属性情報との類似度が高いほど、投稿情報の優先順位が高くなるように評価値を算出する。投稿情報の投稿者の属性と当該投稿情報の閲覧者の属性とが類似しているほど、閲覧者は、投稿情報の内容に興味を持つ可能性が高いと推定される。よって、閲覧者の個人的又は社会的環境や、興味や嗜好により適合した投稿情報、言い換えるならば、情報的価値が質的に高い投稿情報を表示したブログ地図ページを提供することが可能となる。
<第2の実施の形態>
次に、本発明の第2の実施形態について説明する。
上述した第1実施形態では、ブログ地図提供サーバ30が複数の投稿情報を評価して得た評価値(情報量及び類似度の少なくともいずれかによって定まる評価値)に応じて優先順位を決定し、優先順位が高い投稿情報を優先順位が低い投稿情報よりも強調された態様で携帯端末装置10に表示させるよう制御する。これに対し、第2実施形態に係るブログ地図提供サーバ30Aは、複数の投稿情報の投稿テキストを形態素解析してカテゴリに分類し、ブログ地図ページの閲覧者(携帯端末装置10のユーザ)が指定したカテゴリに属する投稿情報のみを表示対象として決定する点で、第1実施形態に係るブログ地図提供サーバ30と異なる。
なお、以下の説明において、第1実施形態と同様の構成については同一の符号を付し、その説明は適宜省略するものとする。
図11に、第2実施形態に係るブログ地図提供サーバ(情報処理装置)30Aの機能構成を示す。図示のように、ブログ地図提供サーバ30Aは、投稿情報分類部311a、投稿情報選択部(第3投稿情報選択部)311e、及びブログ地図ページ生成部(表示情報生成部)311fを有する。これらの機能はCPU31によって実現される。
また、ブログ地図提供サーバ30Aは、ブログサーバ20から投稿情報を受信する投稿情報受信部33a、携帯端末装置10から受信した表示要求に含まれる地理的範囲の地図の地図画像データを地図情報提供サーバ40に対して要求するとともに、地図情報提供サーバ40から地図画像データを受信する地図情報要求部・受信部33b、携帯端末装置10からブログ地図ページの表示要求を受信する表示要求受信部33c、及びブログ地図ページ生成部311fが生成したブログ地図ページを携帯端末装置10へ送信するブログ地図ページ送信部33dを備える。これらの機能は、CPU31の制御のもと送受信部33によって実現される。表示要求受信部33cが受信する表示要求は、表示されようとする地図の範囲の指定に加えて、カテゴリの指定を含む。
記憶装置34cは、解析結果テーブルTBL13を記憶する解析結果記憶部ST3を備える。図12に、解析結果テーブルTBL13の一例を示す。図示のように、解析結果テーブルTBL13には、各投稿情報のIDである投稿IDに対応付けて、ユーザ名、投稿日時、及び、緯度経度情報を含む基本項目が記憶され、さらに、分類項目が記憶されている。分類項目(カテゴリ)としては、「音楽」、「アウトドア」、及び「観光」のほか、「グルメ」、「写真」、「スポーツ」などが例示される。
投稿情報分類部311aは、投稿情報受信部33aを介してブログサーバ20から投稿情報を受信すると、受信した投稿情報の投稿テキストを形態素解析して複数の分類項目のいずれかに分類し、その分類結果を解析結果テーブルTBL13(図12)における当該投稿情報の投稿ID及び「分類項目」に対応付けて記憶する。具体的には、各分類項目に対応する単語のリストを分類辞書として記憶装置34cに保持しておき、形態素解析により投稿テキストから抽出された有意語が辞書に記憶された単語と一致するか否かを判定する。そして、一致する単語数が最も多い分類項目を、当該投稿情報の分類項目として決定する。
投稿情報選択部311eは、解析結果テーブルTBL13に記憶された投稿情報のうち、表示要求受信部33cを介して携帯端末装置10から受信した表示要求に含まれる地理的範囲内の緯度経度情報を有する複数の投稿情報を特定する。そして、これらの投稿情報のうち、表示要求に含まれるカテゴリの指定に応じた分類項目に属する投稿情報を、表示する投稿情報として決定する。
ブログ地図ページ生成部311fは、投稿情報選択部311eが選択した複数の投稿情報を地図上に表示したブログ地図ページを生成するものである。ブログ地図ページ生成部311fは、まず、地図情報要求部・受信部33bにより、携帯端末装置10から受信した表示要求に含まれる地理的範囲の地図の地図画像データを地図情報提供サーバ40に対して要求し、表示対象の地図画像データを取得する。
次に、ブログ地図ページ生成部311fは、表示する投稿情報として決定された各投稿情報のプロフィールアイコン、ユーザ名、投稿日時及び投稿テキストを吹き出し画像内に表示した投稿情報画像を生成し、各投稿情報の緯度経度情報に対応する地図上に各投稿情報画像をマッピングしたブログ地図ページを生成する。生成されたブログ地図ページは、ブログ地図ページ送信部33dを介して携帯端末装置10に送信され、携帯端末装置10は受信したブログ地図ページをタッチパネル12の表示領域12aに表示する。
以上説明したように、本実施形態によれば、投稿情報の投稿テキストを形態素解析して複数の分類項目のいずれかに分類し、携帯端末10のユーザが指定した分類に属する投稿情報のみを選択して地図上に表示するので、ブログ地図ページの閲覧者が必要とする情報を優先的に表示することが可能となり、ユーザにとっての利便性が向上する。
ところで、ツイッターのようなマイクロブログサービスでは、投稿情報の投稿テキストに「#」で始まるハッシュタグを含めることで、投稿情報をラベリングできる。このため、ハッシュタグを用いて投稿テキストを分類することも考えられる。しかしながら、ハッシュタグは投稿者が任意に意図的に入力するラベルであるため、ハッシュタグを用いて分類するのでは、ハッシュタグを含まない投稿情報が表示対象から除外されてしまい、閲覧者にとって有用な情報が網羅的に表示されないおそれがある。これに対して、本実施形態によれば、投稿テキスト自体を形態素解析した結果を用いて投稿情報を分類するので、表示対象となる投稿情報の母集団が拡大され、閲覧者にとって情報的価値が高い情報が提供できる可能性が増大する。
<第2実施形態の変形例>
(1)本実施形態の変形例として、ブログ地図提供サーバ30Aが備える機能を携帯端末装置に備えさせるようにしてもよい。すなわち、携帯端末装置が、投稿情報分類部311a、投稿情報選択部311e、ブログ地図ページ生成部311f、解析結果記憶部ST3、投稿情報受信部33a、地図情報要求部・受信部33bに対応する機能を備えるようにしてもよい。この態様によれば、ブログ地図提供サーバを介さずとも、携帯端末装置は、ブログ地図ページの視認性を確保しつつ、閲覧者にとって情報的価値が高い情報を優先的に表示することが可能となる。
(2)本実施形態では、投稿情報をカテゴリに分類し、携帯端末10のユーザが指定した分類に属する投稿情報のみを選択して地図上に表示するが、本実施形態のブログ地図提供サーバ30Aに、さらに、上述した第1実施形態に係るブログ地図提供サーバ30と同様の機能を備えさせるように構成し、ブログ地図ページ生成部311fは、投稿情報選択部311eが決定した投稿情報のうち、優先順位決定部31eが決定した優先順位が高い投稿情報を、優先順位が低い投稿情報よりも強調された態様で表示されるようにしてもよい。この態様によれば、携帯端末装置10のユーザは、自己が指定したカテゴリに属する投稿情報のうち、自己にとって情報性が高い情報にまず注目して地図を閲覧することができ、ユーザの利便性が格段に向上する。
<第3の実施の形態>
次に、本発明の第3の実施の形態について説明する。
本実施形態は、ブログ地図提供サーバではなく携帯端末装置が情報量算出処理、ユーザ類似度算出処理、優先順位決定処理、及びブログ地図ページ生成処理を行う点が上述した第1実施形態と相違する。なお、以下の説明において、第1実施形態と同様の構成については同一の符号を付し、その説明は適宜省略するものとする。
図13は、本実施形態に係るブログ地図表示システム2のブロック図である。同図に示すように、本実施形態に係るブログ地図表示システム2は、移動通信網MNと、移動通信網MNに接続するブログサーバ20、ブログ地図提供サーバ30B、及び地図情報提供サーバ40と、移動通信網MNに接続する複数の携帯端末装置10Bとを備える。また、このブログ地図表示システム2は、携帯端末装置(情報処理装置)10Bのタッチパネル12(表示装置)に表示する地図上に、表示範囲によって画定される地理的範囲に属する投稿情報を表示させるものである。
ブログ地図提供サーバ30Bは、図示のように、投稿情報解析部31a、トレンド情報生成部31b、判定用情報記憶部ST1、及び解析結果記憶部ST2を有する。投稿情報解析部31a及びトレンド情報生成部31bは、上記第1実施形態の投稿情報解析部31a及びトレンド情報生成部31bと同様であり、これらの機能はCPU31によって実現される。投稿情報解析部31aは、特定文字列有無判定部31a1、情報URL有無判定部31a2、悪質ユーザ該当判定部31a3、写真画像有無判定部31a4、文字数取得部31a5、再投稿数取得部31a6、流行度情報取得部31a7、及び付加情報取得部31a8を備え、トレンド情報生成部31bは、地域別特徴語情報生成部31b1、HOTキーワード情報生成部31b2、話題のニュース情報生成部31b3、及び話題の路線情報生成部31b4を備える。
また、判定用情報記憶部ST1及び解析結果記憶部ST2は記憶装置34cに保持されるものであり、上記第1実施形態の判定用情報記憶部ST1及び解析結果記憶部ST2と同様である。
ブログ地図提供サーバ30Bは、携帯端末装置10Bからのブログ地図ページの表示要求に応じて、解析結果記憶部ST2に記憶された解析結果テーブルTBL11及び付加情報テーブルTBL12の記憶内容を携帯端末装置10Bに対して送信する。
携帯端末装置10Bは、情報量算出部(投稿情報評価部)11c、ユーザ類似度算出部(投稿情報評価部)11d、優先順位決定部11e、及びブログ地図ページ生成部(表示情報生成部)11fを備える。記憶部14のROMには、コンピュータに本実施形態に係る投稿情報解析処理を実行させるための投稿情報解析処理プログラム及びブログ地図生成処理を実行させるためのブログ地図生成プログラムを含むアプリケーションプログラムとしてブログ地図アプリが記憶されている。情報量算出部11c、ユーザ類似度算出部11d、投稿情報選択部11e、及びブログ地図ページ生成部11fの機能は、携帯端末装置10BのCPU11がこのアプリケーションプログラムを実行することにより実現される。
情報量算出部11c、ユーザ類似度算出部11d、優先順位決定部11e、及びブログ地図ページ生成部11f各部は、上記第1実施形態の情報量算出部31c、ユーザ類似度算出部31d、優先順位決定部31e、及びブログ地図ページ生成部31fとそれぞれ同様である。ただし、情報量算出部11c及びユーザ類似度算出部11dは、ブログ地図提供サーバ30Bから受信した解析結果(解析結果テーブルTBL11及び付加情報テーブルTBL12の記憶内容)に基づいて、情報量S及び類似度Rを算出する。また、ブログ地図ページ生成部11fは、生成したブログ地図ページをタッチパネル12の表示領域12aに表示させるように制御する。
図14は、本実施形態に係る処理の流れを示すシーケンスチャートである。図示のように、ブログサーバ20はユーザから投稿された投稿を受け取る度に、ユーザ名、ユーザが設定した写真画像などのプロフィールアイコン、投稿テキスト、及び投稿日時などを含む投稿情報をブログ地図提供サーバ30Bに送信する(Sb1)。
ブログ地図提供サーバ30BのCPU31は、ブログサーバ20から投稿情報受信部33aを介して新たな投稿情報を受け取ると、投稿情報解析処理(Sb2)を実行し、解析結果を解析結果記憶部ST2の解析結果テーブルTBL11及び付加情報テーブルTBL12に記憶する(Sb3)。
次に、CPU31は、携帯端末装置10Bからブログ地図ページの表示要求を受信すると(Sa1)、これに応じて、地図情報提供サーバ40に対して、受信した表示要求に含まれる地図の範囲に対応する地図画像データを要求する(Sb4)。そして、CPU31は、地図情報提供サーバ40から地図画像データを受信すると(Sb5)、解析結果テーブルTBL11及び付加情報テーブルTBL12に記憶された解析結果データのうち、携帯端末装置10Bから受信した表示要求に含まれる地図の範囲に属する緯度経度情報を有する投稿情報に対応するレコードを、当該範囲内にある全ての投稿情報について取得する。そして、受信した地図画像データ、取得した解析結果データ、及び上記地図の範囲内にある投稿情報(ユーザ名、ユーザが設定した写真画像などのプロフィールアイコン、投稿テキスト、及び投稿日時などを含む)を、携帯端末装置10Bに対して送信する(Sb6)。
携帯端末装置10BのCPU11は、ブログ地図提供サーバ30Bから通信インタフェース13(投稿情報受信部)を介して、地図画像データ、解析結果データ、及び投稿情報を受信すると、受信した情報を記憶部14のRAMに一旦記憶し、表示されようとする地図の範囲に属する投稿情報の各々について、情報量算出処理(Sa2)及びユーザ類似度算出処理(Sa3)を実行する。
ここで、本実施形態では、ブログ地図アプリが最初に起動されると、携帯端末装置10Bのユーザ(すなわち、閲覧者)に関するユーザ属性情報(「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」)及び「興味があるジャンル」の入力をユーザに促すことにより、これらの情報が予め取得されて、記憶部14に記憶される。また、「投稿した頻度が高い単語」については、携帯端末装置10のユーザがブログサービスの登録ユーザである場合には、ブログ地図アプリが起動される度に、ユーザは自己のユーザ名及びパスワードでブログサービスにログインするように促される結果、過去の一定期間における閲覧者の投稿情報から「投稿した頻度が高い単語」が自動的に取得されて、記憶部14に記憶される。
CPU11は、ブログ地図提供サーバ30Bから受信した情報及び記憶部14に記憶されたユーザ属性情報、「興味があるジャンル」、及び「投稿した頻度が高い単語」に基づいて、各投稿情報についての情報量S及び類似度Rを算出して、記憶部14のRAMに一旦記憶する。
次に、CPU11は、各投稿情報について、RAMに記憶された情報量S及び類似度Rに基づいて表示対象である複数の投稿情報の表示の優先度を決定する(Sa4)。続いてCPU11は、優先順位決定部31eが選択した複数の投稿情報を地図上に表示したブログ地図ページを生成し、携帯端末装置10のタッチパネル12に表示させる。
このとき、第1実施形態と同様に、複数の投稿情報画像のうち、優先順位が高いものほど前面に表示されるように、複数の投稿情報画像を配置する。また、最前面にある投稿情報のテキストの文字サイズが他の投稿情報の文字サイズよりも大きくなるように設定する。
以上説明したように、本実施形態では、携帯端末装置(情報処理装置)10Bは、各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値を算出する情報量算出部(投稿情報評価部)11c及びユーザ類似度算出部(投稿情報評価部)11dと、投稿情報評価部が決定した評価値に応じて複数の投稿情報の優先順位を決定する優先順位決定部11eと、表示されようとする地図の範囲に属する地理的属性を有する複数の投稿情報を地図上に表示させるようタッチパネル12(表示装置)を制御する場合に、優先順位決定部11eが決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で地図上に表示された表示情報を生成するブログ地図ページ生成部(表示情報生成部)11fとを有する。
よって、本実施形態によれば、上述した第1実施形態と同様の効果が得られる。すなわち、本実施形態によれば、情報的価値が高い投稿情報がより強調された態様で表示されるため、視認性を向上しつつ、地図の閲覧者にとって情報的価値が高い情報が優先的に携帯端末装置10に表示されるように制御することが可能となる。よって、ユーザは、ブログ地図ページを開くだけで、自己にとって情報性が高い情報にまず注目して地図を閲覧することができ、ユーザの利便性が格段に向上する。
また、本実施形態によれば、ブログ地図提供サーバではなく、携帯端末装置10Bが情報量算出処理、ユーザ類似度算出処理、優先順位決定処理、及びブログ地図ページ生成処理を行うため、ブログ地図提供サーバの負荷が分散されるという利点がある。
<第4の実施の形態>
次に、本発明の第4の実施の形態について説明する。
上述した第1実施形態では、ブログ地図提供サーバ30が複数の投稿情報を評価して得た評価値(情報量及び類似度の少なくともいずれかによって定まる評価値)に応じて優先順位を決定し、優先順位が高い投稿情報を優先順位が低い投稿情報よりも強調された態様で携帯端末装置10に表示させるよう制御する。ところで、携帯端末装置10のタッチパネル12に表示される地図の縮尺は、ユーザが地図の拡大又は縮小を行うことで自由に変更され得る。ところが、地図の縮尺が縮小された場合、すなわち、表示される範囲が拡大された場合、この範囲内の緯度経度情報を有する投稿情報の数が増加してしまう。このため、地図の縮尺が縮小された場合には、表示される投稿情報の数を制限する必要が生ずる。そこで、第4実施形態に係るブログ地図提供サーバは、第1実施形態の構成に加え、表示されようとする地図の縮尺が小さい場合には、表示される投稿情報の数を優先順位決定部31eが決定した優先順位にしたがって制限するものである。
図15は、第4実施形態に係るブログ地図提供サーバ(情報処理装置)30Cの機能構成を示すブロック図である。第4実施形態に係るブログ地図提供サーバ30Cの機能構成は、投稿情報選択部31gを有する点を除いて、第1実施形態と同一である。以下の説明において、第1実施形態と同様の構成については同一の符号を付し、その説明は適宜省略する。
投稿情報選択部(第2投稿情報選択部)31gは、表示されようとする地図の縮尺が閾値よりも小さい場合には、当該地図の範囲に属する地理的属性を有する複数の投稿情報のうち、予め定められた所定数の投稿情報を、優先順位決定部31eが決定した優先順位の高いものから順に選択する。ブログ地図ページ生成部(表示情報生成部)31fは、投稿情報選択部31gが選択した所定数の投稿情報が地図上に表示されたブログ地図ページ(表示情報)を生成する。
図16に、本実施形態に係る動作の流れを示す。ステップS26おいて、CPU31が、表示されようとする地図の範囲に属する複数の投稿情報の優先順位を決定すると、次に、CPU31は、当該表示されようとする地図の縮尺が閾値未満か否かを判定する(ステップS26a)。例えば、東京都心部において2駅から3駅分の範囲をタッチパネル12の表示領域12aに表示可能な程度の縮尺が8千分の1であり、これが閾値として定められているとする。CPU31は、ステップS12の表示要求で受信した地図の範囲から、タッチパネル12に表示されようとする地図の縮尺を取得し、取得した縮尺が8千分の1未満であるか否かを判定する。8千分の1未満である場合(ステップS26a:YES)、すなわち、例えば、東京都心部における2駅から3駅分の範囲よりも大きな範囲の地図が表示されようとしている場合、処理をステップS26bに進める。一方、閾値以上である場合、(ステップS26a:NO)、CPU31は、ステップS26bの処理を実行することなく、処理をステップS27に進める。
ステップS26bにおいて、CPU31は、優先順位決定部31eが決定した優先順位が高いものから順に、所定数p(例えば、p=10、pは自然数)の投稿情報を選択する。次に、ステップS27において、CPU31は、ステップS26bにおいて選択された所定数の投稿情報が表示され、且つ、優先順位が高い投稿情報が、優先度が低い投稿情報よりも強調された態様で表示されたブログ地図ページBMを生成して、携帯端末装置10に送信する。
以上説明したように、本実施形態によれば、表示されようとする地図の縮尺が閾値未満である場合には、地図に表示される投稿情報の数を、情報的価値を示す指標に基づいて定められた優先順位が高いものから順に選択して所定数に制限するので、地図上で投稿情報画像が重なり合う可能性が軽減され、視認性が向上される。
<第4実施形態の変形例>
上述した第4実施形態では、表示されようとする地図の縮尺の閾値未満の場合には、所定数の投稿情報を当該地図の範囲に属する複数の投稿情報のうち予め定められた所定数の投稿情報を、優先順位の高いものから順に選択するが、本発明はこれに限られず、以下の変形が可能である。
(1)表示されようとする地図の範囲に多数の投稿情報が含まれる場合には、地図の縮尺が縮小されたか否かにかかわらず、表示される投稿情報の数を制限する必要が生ずる。よって、表示されようとする地図の縮尺に関わらず、優先順位が高い所定数の投稿情報を選択して表示するようにしてもよい。すなわち、投稿情報選択部(第2投稿情報選択部)31gは、地図の範囲に属する地理的属性を有する複数の投稿情報のうち、縮尺に関わらない所定数の投稿情報を、優先順位決定部31eが決定した優先順位が高いものから順に選択するようにしてもよい。
(2)表示されようとする地図の縮尺に応じて、選択される投稿情報の数を異ならせるようにしてもよい。すなわち、投稿情報選択部(第2投稿情報選択部)31gは、地図の範囲に属する地理的属性を有する複数の投稿情報のうち、地図の縮尺に応じた数の投稿情報を、優先順位決定部31eが決定した優先順位が高いものから順に選択するようにしてもよい。地図の縮尺に応じた数は、演算により求められてもよいし、縮尺の範囲との対応表に予め記憶された値が用いられてもよい。
(3)表示されようとする地図の縮尺に応じて評価値の閾値が可変となるように予め定めておき、地図の縮尺に応じて定められた評価値の閾値を超える投稿情報のみを表示するようにしてもよい。
図17は、本変形例に係る動作の流れを示すフローチャートであり、図18は、本変形例に係る縮尺テーブルTBL14の一例を示す図である。縮尺テーブルTBL14はブログ地図提供サーバ30Cの記憶装置34cに記憶されており、地図の縮尺の範囲ごとに評価値の閾値を予め定めたものである。ここで、評価値の閾値は、正規化された情報量Sの値と正規化された類似度Rの値との合計値である。上述したように、優先順位決定部31eは、正規化後の情報量Sの値と類似度Rの値とを合計して、合計値(すなわち、評価値)が大きいものの優先度が高くなるように複数の投稿情報の優先順位を決定する。縮尺テーブルTBL14は、縮尺が小さいほど評価値の閾値が高くなるように定めたものである。
図17に示すように、ステップS26おいて、CPU31が、表示されようとする地図の範囲に属する複数の投稿情報の優先順位を決定すると、次に、CPU31は、ステップS26cにおいて、縮尺テーブルTBL14を参照して、当該表示されようとする地図の縮尺が属する範囲に対応する評価値の閾値を取得し、閾値を超える投稿情報を全て選択する。次に、ステップS27において、CPU31は、ステップS26cにおいて選択された投稿情報が表示され、且つ、優先順位が高い投稿情報が、優先度が低い投稿情報よりも強調された態様で表示されたブログ地図ページを生成して、携帯端末装置10に送信する。
すなわち、投稿情報選択部(第1投稿情報選択部)31gは、表示されようとする地図の範囲に属する地理的属性を有する複数の投稿情報のうち、表示されようとする地図の縮尺に応じて定められた評価値の閾値を超える投稿情報を選択し、ブログ地図ページ生成部(表示情報生成部)31fは、前記投稿情報選択部が選択した投稿情報が前記地図上に表示された表示情報を生成する。なお、本変形例では、縮尺が小さいほど評価値の閾値が高くなるように定められているが、縮尺が小さいほど評価値の閾値が低くなるように定められてもよい。また、縮尺テーブルTBL14を設ける代わりに、演算により縮尺に応じた閾値を求めてもよい。
本変形によれば、表示されようとする地図の縮尺に応じて、情報的価値を示す指標に基づいて算出した投稿情報の評価値が閾値を超える投稿情報だけを表示対象とすることにより地図の縮尺が縮小された場合の投稿情報の数を制限するので、地図上で投稿情報画像が重なり合う可能性が軽減され、視認性が向上される。
なお、上述した第4実施形態及び本変形例のいずれにおいても、ブログ地図提供サーバ30Cではなく携帯端末装置が、情報量算出処理、ユーザ類似度算出処理、優先順位決定処理、投稿情報選択処理、及びブログ地図ページ生成処理を行うようにしてもよい。すなわち、携帯端末装置が、情報量算出部(投稿情報評価部)、ユーザ類似度算出部(投稿情報評価部)、優先順位決定部、投稿情報選択部(第1投稿情報選択部又は第2投稿情報選択部)、及びブログ地図ページ生成部(表示情報生成部)を備えるようにしてもよい。
<変形例>
本発明は上述した第1〜第4実施形態に限定されるものではなく、以下の変形が可能である。また、各変形例は適宜組み合わせることができる。
(1)上述した第1、第3及び第4実施形態では、複数の投稿情報のうち優先順位が高い投稿情報を、優先順位が低い他の投稿情報よりも強調された態様で表示させる場合に、最前面に表示させる投稿情報の文字サイズが他の投稿情報の文字サイズよりも大きくなるように設定する。しかしながら、本発明はこれに限られない。
図19は、本実施形態施形態の変形例に係るブログ地図ページBMの表示例を示す図である。図示の例では、最前面に表示させる投稿情報T1だけを、プロフィールアイコン、ユーザ名、投稿日時、及びテキストの内容を含む詳細表示画像とし、他の複数の投稿情報(T2〜T5)についてはサイズの小さな吹き出し画像の枠だけを、各投稿情報の緯度経度情報に対応する位置に表示した簡易画像とする。この態様によれば、最も情報的価値が高いと推定される情報だけを可読な状態で表示して視認性を確保しつつ、情報的価値が相対的に低い他の投稿情報についてはそれらの存在を示すだけの簡易表示とすることで投稿情報の数を量的に把握できるという利点がある。
また、さらに別の態様として、投稿情報が表示開始後一定時間で消えるよう設定されている場合に、優先順位が高い投稿情報ほど表示時間を長くするように携帯端末装置10,10Bを制御してもよい。この態様によれば、情報的価値が高い投稿情報ほど画面上に留まる時間が長くなるので、優先度が高い投稿情報の可読性及び視認性が向上するという利点がある。また、優先順位が高い投稿情報の投稿情報画像の色と、優先順位が低い投稿情報の投稿情報画像の色とを相違させてもよい。すなわち、優先順位が高い投稿情報の投稿情報画像の色が、優先順位が低い投稿情報の投稿情報画像の色よりも目立つ色となるようにしてもよい。また、優先順位が高い投稿情報を表示し、優先度が低い投稿情報を表示しないようにしてもよい。すなわち、優先順位が低い投稿情報よりも優先順位が高い投稿情報が強調された態様で地図上に表示される場合に、優先順位が高い投稿情報だけが地図上に表示されるようにしてもよい。
(2)上述した第1、第3及び第4実施形態では、トレンド情報生成部31bが、地域別特徴語情報生成部31b1、HOTキーワード情報生成部31b2、話題のニュース情報生成部31b3、及び話題の路線情報生成部31b4を備え、流行度情報取得部31a7は、各生成部が生成したトレンド情報に基づいて、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」の各項目に関する値を取得するが、本発明はこれに限られない。例えば、移動通信網MN内の他のサーバ装置又は外部のサーバ装置がWebサイトでトレンド情報を提供している場合には、流行度情報取得部31a7は、Webサイトで閲覧可能なトレンド情報に基づいて、「地名の特徴語数」、「HOTキーワード数」、「話題のニュースのURLを含む」、及び「話題の路線名を含む」の各項目に関する値を取得してもよい。すなわち、ブログ地図提供サーバ30は、トレンド情報生成部31bを備えていなくてもよい。なお、この場合には、流行度情報取得部31a7は、トレンド情報が表示されているWebサイトをスクレイピングして、必要な情報を取得することになる。当該変形例によれば、他のWebサイトが提供する情報を用いるので、ブログ地図提供サーバ30の資源が節約できるという利点がある。
一方、本変形例では、投稿情報が話題のニュースのURLを含む否かを判定するに際し、スクレイピングにより投稿回数を取得する必要がある。この意味においては、上述した実施形態のように話題のニュース情報生成部31b3によって生成された情報を参照する方が簡単である。また、上述した実施形態によれば、投稿回数を記憶装置34cから直接取得できるので各ニュース記事の話題の度合いが数値で簡単にわかるという利点がある。
(3)上述した第1、第3及び第4実施形態では、情報量Sと類似度Rの両方を評価値とするが、いずれか一方を評価値として用いるようにしてもよい。情報量Sのみを評価値として用いる場合には、ブログ地図提供サーバ30は、ユーザ類似度算出部31dを備えなくてもよく、CPU31は、ブログ地図ページ生成処理においてステップS25を実行しなくてもよい。一方、類似度Rのみを評価値として用いる場合には、ブログ地図提供サーバ30は、不適切情報記憶部ST11、悪質ユーザ情報記憶部ST12、写真URL記憶部ST13、特定文字列有無判定部31a1、情報URL有無判定部31a2、悪質ユーザ該当判定部31a3、写真画像有無判定部31a4、文字数取得部31a5、再投稿数取得部31a6、流行度情報取得部31a7、トレンド情報生成部31b、及び情報量算出部31cを備えなくてもよく、CPU31は、ブログ地図ページ生成処理においてステップS24を実行しなくてもよい。また、類似度Rのみを評価値として用いる場合には、解析結果テーブルTBL11のうち基本項目を除く項目が不要となる。
(4)上述した第1、第3及び第4実施形態では、類似度Rの算出に際してユーザ属性(デモグラフィック属性及びサイコグラフィック属性)の各指標の一致不一致に応じて、類似度Rを算出するが、これに限られない。
例えば、投稿者及び携帯端末装置10のユーザ(閲覧者)の両方がブログサービスにユーザ登録している場合には、投稿者及び閲覧者ごとに、過去の投稿情報の本文テキストとプロフィールテキストを解析し、本文テキスト又はプロフィールテキストに記載の単語であれば「1」を付与し、なければ「0」というベクトルを作成する。そして、投稿者の単語ベクトルと閲覧者の単語ベクトルの内積を計算して類似度Rとして用いるようにしてもよい。すなわち、ユーザ類似度算出部(投稿情報評価部)31dは、投稿情報の投稿テキスト及び対応する投稿者のプロフィールテキストの少なくともいずれかを解析して単語を抽出し、携帯端末装置10のユーザが投稿した投稿情報の投稿テキスト及び当該ユーザのプロフィールテキストの少なくともいずれかを解析して単語を抽出し、評価対象である投稿情報の投稿者について抽出した単語と携帯端末装置10,10Bのユーザについて抽出した単語との類似度が高いほど、当該投稿情報の優先順位が高くなるように評価値を算出するようにしてもよい。
具体的には、例えば、単語(term1, term2, term3, term4)について、投稿者Aの単語ベクトルが(1,1,1,1)であり、閲覧者の単語ベクトルが(1,0,0,1)であれば、両者の類似度R=(1×1)+(1×0)+(1×0)+(1×1)=2となり、投稿者Bの単語ベクトルが(0,1,1,0)であり、閲覧者のベクトルが(1,0,0,1)であれば、両者の類似度R=(0×1)+(1×0)+(1×0)+(0×1)=0となる。よって、この場合には、投稿者Aの投稿情報が投稿者Bの投稿情報よりも強調された態様で表示される。なお、上述した実施形態と同様に、投稿者の単語ベクトルと閲覧者の単語ベクトルの内積が閾値を超えた投稿者の投稿情報を強調された態様で表示するようにしてもよい。また、単語ベクトルは、上述したtf−idfの値を用いて算出するようにしてもよい。
投稿情報の投稿テキストやプロフィールテキストで用いられる単語には、投稿者や閲覧者の志向が色濃く反映される場合が多い。このため、年齢や性別といったユーザ属性を用いて類似度を算出する場合よりも、きめ細やかなユーザ特性に基づいて類似度を判定することが可能となる。
また、上述した第1、第3及び第4実施形態では、ブログサーバ20から登録ユーザのユーザ属性データが提供される態様について説明したが、登録ユーザによっては、自己の属性データを一切登録しない場合もあり得る。また、ブログサーバ20がユーザ属性データを提供しない場合も考えられる。本変形例によれば、このような場合にも、類似度を評価値として用いることができるという利点がある。
(5)上述した第1、第3及び第4実施形態では、投稿情報解析部が解析した全ての項目の数値を式Aに代入して情報量Sとして算出するが、一部の項目については情報量Sの計算対象から除外してもよい。例えば、投稿情報の投稿者がスパムユーザに該当する場合や、本文テキストに不適切用語を含む場合には、対応する投稿情報を予め算出対象から除外するようにしてもよい。
また、上述した実施形態では情報量Sの算出式として式Aを例示したが、これに限られない。また、情報量の算出に用いる各指標は上記実施形態に例示したものに限られず、各投稿情報の情報的価値(情報量の多寡や情報の適性)を示す他のものを用いてもよい。
(6)上述した第1、第3及び第4実施形態では、不適切用語として、禁止用語を例示するが、本発明はこれに限られず、閲覧目的に応じて選定された特定の単語を不適切用語として用いてもよい。ここで、閲覧目的に応じて選定された不適切用語は、閲覧者が何を目的としてブログ地図ページを閲覧するかに応じて選定された単語である。例えば、閲覧者が観光目的でブログ地図ページを閲覧するには、「事故発生」や「容疑者逮捕」といった用語が不適切用語となり得る。この場合、不適切用語情報記憶部ST11には、禁止用語に加えて、閲覧目的に応じて選定された不適切用語が記憶される。また、ブログ地図提供サービスにおいて、ユーザが特定の閲覧目的でブログ地図ページを閲覧する場合には、その閲覧目的を予め設定可能なように構成すればよい。この態様によれば、例えば、閲覧目的に応じて適切な単語を含む投稿情報が優先的に表示されるので、ユーザの利便性が向上する。
(7)上述した第1〜第4実施形態において、ユーザ属性に応じて投稿情報画像の表示態様を相違させてもよい。例えば、男性と女性とで吹き出し画像の色彩を相違させてもよい。この態様によれば、地図の閲覧者は、特定の地点について男性と女性がどれくらい投稿しているかを一見して把握することが可能となる。
第2実施形態の場合には、第1実施形態の場合と同様に、ブログ地図提供サーバ30Bが付加情報取得部31a8及び付加情報テーブルTBL12を備えるようにし、ユーザ属性に応じて投稿情報画像の表示態様を相違させてもよい。
なお、この態様では、「年齢」、「性別」、「職業」、「居住地」、及び「既婚又は未婚の別」といったデモグラフィック属性だけでなく、「興味があるジャンル」、及び「投稿した頻度が高い単語」などのサイコグラフィック属性に応じて表示態様を相違させてもよい。また、表示態様は、色彩の他に、画像の点滅や模様、形状などでもよい。
(8)上述した第1〜第4実施形態では、投稿情報画像として、吹き出し画像内にプロフィールアイコン、ユーザ名、投稿日時及び投稿テキストを表示するが、これに限られず、これらの要素の少なくとも1つ又は2以上を任意に組み合わせたものを表示するようにしてもよい。
また、上述した第1〜第4実施形態では、吹き出し画像内に投稿情報を表示する際に、投稿情報の投稿テキスト全文をそのまま表示するが、本発明はこれに限られない。例えば、第1実施形態、第3及び第4実施形態の場合には、地域別特徴語情報生成部31b1が生成した特徴語に一致する単語だけを表示してもよいし、地域別特徴語情報生成部31b1が生成した特徴語に一致する単語だけを強調表示してもよい。強調表示の態様としては、例えば、色彩を相違させる、蛍光表示する、文字サイズを大きくするなどの態様がある。また、第2実施形態の場合にも、ブログ地図提供サーバ30Bが表示するカテゴリに応じたカテゴリ別特徴語情報生成部を備えるように構成することによりカテゴリに特有の特徴語を生成して、当該特徴語に一致する単語を単独表示又は強調表示するようにしてもよい。この態様によれば、地図の閲覧者は、一見して投稿情報の主題を把握することが可能となる。
また、別の態様として、投稿情報が写真画像などの添付画像を含む場合には、投稿テキストを表示する代わりに、添付画像だけを表示するようにしてもよい。この態様によれば、地図の閲覧者は、一見して投稿情報の内容を把握することが可能となる。
(9)その他の変形例
上述した第1、第3及び第4実施形態では、投稿情報に付加価値情報として写真画像が添付されている場合に、当該投稿情報の優先順位が高くなるように評価値を算出するが、写真画像に限られず、描画画像や動画像、音声などの付加価値情報であってもよい。
上述した第1〜第4実施形態では、各投稿情報の緯度経度情報を、ジオタグによって示される緯度経度情報と本文テキストの解析により導出される地名の緯度経度情報の両方に基づいて判定していたが、どちらか一方を用いるようにしてもよい。
また、第1〜第4実施形態では、ユーザがブログ地図を閲覧する際に用いる端末は携帯端末装置10であるが、これに限られず、据置型のパーソナルコンピュータ装置であってもよい。また、携帯端末装置10は通信機能を有しているものであれば良く、電話機能を有している必要はない。また、タッチパネルを有している必要はなく、表示部と操作部とが別々に構成されているものでもよい。
1……ブログ地図表示システム、10……携帯端末装置(表示装置)、10B……携帯端末装置(情報処理装置)、11……CPU(投稿情報評価部、優先順位決定部、第1投稿情報選択部、第2投稿情報選択部、表示情報生成部、投稿情報分類部)、12……タッチパネル(表示装置)、13……通信インタフェース、14……記憶部、15……マイク、16……スピーカ、20……ブログサーバ、30,30A,30B,30C……ブログ地図提供サーバ(情報処理装置)、31……CPU(投稿情報評価部、優先順位決定部、第1投稿情報選択部、第2投稿情報選択部、表示情報生成部、投稿情報分類部)、32……ディスプレイ、33……通信インタフェース、34a……RAM、34b……ROM、34c……記憶装置、35……入力部、40……地図情報提供サーバ、BM……ブログ地図ページ、T……投稿情報。

Claims (8)

  1. 各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値を算出する投稿情報評価部と、
    前記投稿情報評価部が決定した評価値に応じて前記複数の投稿情報の優先順位を決定する優先順位決定部と、
    表示されようとする地図の範囲に属する前記地理的属性を有する複数の投稿情報のうち、前記評価値が、前記地図の縮尺に応じて定められた閾値を超える複数の投稿情報を選択する第1投稿情報選択部と、
    前記第1投稿情報選択部が選択した複数の投稿情報を前記地図上に表示させるよう表示装置を制御する場合に、前記優先順位決定部が決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で前記地図上に表示された表示情報を生成する表示情報生成部と、
    を有する情報処理装置。
  2. 前記投稿情報評価部は、前記各投稿情報の投稿テキストの文書量が多いほど当該投稿情報の優先順位が高くなるように前記評価値を算出するとともに、前記投稿テキストに付加価値情報が含まれている場合には、当該投稿情報の優先順位が高くなるように前記評価値を算出する、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記投稿情報評価部は、前記各投稿情報の投稿テキストが情報的価値が少ないことを示す文字列もしくは記号又は不適切用語を含む場合、又は前記各投稿情報の投稿者が悪質ユーザに該当する場合には当該投稿情報の優先順位が低くなるように前記評価値を算出する、
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記投稿情報評価部は、前記各投稿情報が当該投稿情報の閲覧者に再投稿された回数が多いほど、当該投稿情報の優先順位が高くなるように前記評価値を算出する、
    ことを特徴とする請求項1乃至のいずれか一項に記載の情報処理装置。
  5. 前記投稿情報評価部は、前記各投稿情報の、直近の投稿情報から抽出された特徴語への適合度、又は直近の投稿情報で多用される注目語への適合度が高いほど、当該投稿情報の優先順位が高くなるように前記評価値を算出する、
    ことを特徴とする請求項1乃至のいずれか一項に記載の情報処理装置。
  6. 前記投稿情報評価部は、前記各投稿情報の投稿者の属性を示す投稿者属性情報と前記表示装置のユーザの属性を示す閲覧者属性情報との類似度が高いほど、当該投稿情報の優先順位が高くなるように前記評価値を算出する、
    ことを特徴とする請求項1乃至のいずれか一項に記載の情報処理装置。
  7. 前記投稿情報評価部は、前記各投稿情報の投稿テキスト及び前記投稿情報の投稿者のプロフィールテキストの少なくともいずれかを解析して単語を抽出し、前記表示装置の前記ユーザが投稿した投稿情報の投稿テキスト及び当該ユーザのプロフィールテキストの少なくともいずれかを解析して単語を抽出し、前記投稿者について抽出した単語と前記ユーザについて抽出した単語との類似度が高いほど、当該投稿情報の優先順位が高くなるように前記評価値を算出する、
    ことを特徴とする請求項1乃至のいずれか一項に記載の情報処理装置。
  8. 各々が地理的属性を有する複数の投稿情報の各々の情報的価値を表す評価値を算出し、
    前記評価値に応じて前記複数の投稿情報の優先順位を決定し、
    表示されようとする地図の範囲に属する前記地理的属性を有する複数の投稿情報のうち、前記評価値が、前記地図の縮尺に応じて定められた閾値を超える複数の投稿情報を選択し、
    前記選択された複数の投稿情報を前記地図上に表示させるよう表示装置を制御する場合に、前記決定した優先順位が高い投稿情報が、優先順位が低い投稿情報よりも強調された態様で前記地図上に表示された表示情報を生成する、
    ことを特徴とする表示優先度決定方法。
JP2013231139A 2013-11-07 2013-11-07 情報処理装置及び表示優先度決定方法 Active JP6184840B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013231139A JP6184840B2 (ja) 2013-11-07 2013-11-07 情報処理装置及び表示優先度決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013231139A JP6184840B2 (ja) 2013-11-07 2013-11-07 情報処理装置及び表示優先度決定方法

Publications (2)

Publication Number Publication Date
JP2015090664A JP2015090664A (ja) 2015-05-11
JP6184840B2 true JP6184840B2 (ja) 2017-08-23

Family

ID=53194138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013231139A Active JP6184840B2 (ja) 2013-11-07 2013-11-07 情報処理装置及び表示優先度決定方法

Country Status (1)

Country Link
JP (1) JP6184840B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220151296A (ko) * 2021-05-06 2022-11-15 프로젝트 닷츠 아이엔씨. 지도 데이터 제공 방법 및 장치

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6699031B2 (ja) * 2015-05-21 2020-05-27 日本電信電話株式会社 モデル学習方法、説明文評価方法、及び装置
JP6710907B2 (ja) * 2015-07-16 2020-06-17 Tis株式会社 嗜好学習方法、嗜好学習プログラム、及び嗜好学習装置
JP2017037170A (ja) 2015-08-10 2017-02-16 株式会社ぐるなび 情報処理装置、情報処理システム、ナビゲーションシステム、情報処理方法及びプログラム
JP2017199225A (ja) * 2016-04-28 2017-11-02 北九州市 災害情報選択装置およびその方法
JP6763433B2 (ja) * 2016-09-26 2020-09-30 日本電気株式会社 情報収集システム、情報収集方法、及び、プログラム
JP6609592B2 (ja) * 2017-03-31 2019-11-20 株式会社エヌ・ティ・ティ・データ 情報提示装置、情報提示方法、および情報提示プログラム
JP6413035B1 (ja) * 2018-01-18 2018-10-24 株式会社ほぼ日 プログラム、情報処理装置及び情報処理方法
JP6521344B1 (ja) * 2018-10-30 2019-05-29 プロファウンド・デザイン・テクノロジー株式会社 仮想落書処理システム
JP7393923B2 (ja) 2019-11-18 2023-12-07 日本放送協会 情報収集装置およびそのプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006277386A (ja) * 2005-03-29 2006-10-12 Nissan Motor Co Ltd 車両用情報提示装置、情報提示方法および情報提示システム
WO2008026389A1 (fr) * 2006-08-29 2008-03-06 Pioneer Corporation Contrôleur d'affichage, procédé et programme de commande d'affichage, et support d'enregistrement lisible par ordinateur
KR101174213B1 (ko) * 2010-09-30 2012-08-14 엔에이치엔(주) 인맥에 기초한 검색 결과 제공 시스템 및 방법
JP2013073474A (ja) * 2011-09-28 2013-04-22 Ntt Docomo Inc 情報処理装置及び情報処理方法
JP5839978B2 (ja) * 2011-12-19 2016-01-06 アルパイン株式会社 ナビゲーション装置
JP5843197B2 (ja) * 2011-12-28 2016-01-13 アルパイン株式会社 車載用通信サービス利用システムおよび車載用通信サービス利用方法
WO2013136501A1 (ja) * 2012-03-16 2013-09-19 トヨタ自動車 株式会社 情報提示装置及び提示用情報管理システム
JP2014153338A (ja) * 2013-02-14 2014-08-25 Alpine Electronics Inc 地図表示装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220151296A (ko) * 2021-05-06 2022-11-15 프로젝트 닷츠 아이엔씨. 지도 데이터 제공 방법 및 장치
KR102555681B1 (ko) * 2021-05-06 2023-07-14 프로젝트 닷츠 아이엔씨. 지도 데이터 제공 방법 및 장치

Also Published As

Publication number Publication date
JP2015090664A (ja) 2015-05-11

Similar Documents

Publication Publication Date Title
JP6184840B2 (ja) 情報処理装置及び表示優先度決定方法
CN103440286B (zh) 一种基于搜索结果来提供推荐信息的方法及装置
US9390144B2 (en) Objective and subjective ranking of comments
US8996625B1 (en) Aggregate display of messages
US11281725B2 (en) Computerized system and method for automatically generating and providing interactive query suggestions within an electronic mail system
AU2014401785B2 (en) Ranking external content on online social networks
JP6084123B2 (ja) サーバ装置、表示制御方法及びプログラム
US9442903B2 (en) Generating preview data for online content
US8504583B1 (en) Multi-domain recommendations
KR101667344B1 (ko) 검색 결과들을 제공하는 방법 및 시스템
US20170308614A1 (en) Customizable, Real Time Intelligence Channel
US20150220500A1 (en) Generating preview data for online content
US9336285B2 (en) Presenting content in accordance with a placement designation
JP2016525727A (ja) オンライン・ソーシャル・ネットワーク上での画像に対するタグ付けの提案
US20230121471A1 (en) Client-Side Personalization of Search Results
US9826366B2 (en) Low key point of interest notification
US20210173875A1 (en) Computerized system and method for extracting entity information from text communications and displaying content based therefrom
JP5895777B2 (ja) 情報分類プログラム及び情報処理装置
US11269964B2 (en) Field-of-interest based preference search guidance system
JP5734332B2 (ja) 広告情報提供装置
JP6167022B2 (ja) 地図情報提供装置、ユーザ端末、及び地図情報提供方法
JP2014157542A (ja) 端末装置および装置のプログラム
JP2012194783A (ja) アプリケーションマーケットにおいて使用されるサーバ、通信端末、システム及びgui決定方法
JP5766104B2 (ja) 情報提供装置及び情報提供方法
JP5955610B2 (ja) ウェブページ提供装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150413

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170502

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170726

R150 Certificate of patent or registration of utility model

Ref document number: 6184840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250