JP2013134738A - Apparatus, program and method for tagging keyword to position information on the basis of multiple comment sentences - Google Patents

Apparatus, program and method for tagging keyword to position information on the basis of multiple comment sentences Download PDF

Info

Publication number
JP2013134738A
JP2013134738A JP2011286637A JP2011286637A JP2013134738A JP 2013134738 A JP2013134738 A JP 2013134738A JP 2011286637 A JP2011286637 A JP 2011286637A JP 2011286637 A JP2011286637 A JP 2011286637A JP 2013134738 A JP2013134738 A JP 2013134738A
Authority
JP
Japan
Prior art keywords
comment
event position
tagging
sentences
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011286637A
Other languages
Japanese (ja)
Other versions
JP5725619B2 (en
Inventor
Masami Nakazawa
昌美 中澤
Kazufumi Ikeda
和史 池田
Toshihiro Ono
智弘 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2011286637A priority Critical patent/JP5725619B2/en
Publication of JP2013134738A publication Critical patent/JP2013134738A/en
Application granted granted Critical
Publication of JP5725619B2 publication Critical patent/JP5725619B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a device and the like capable of tagging real-time keywords to an event position in which a special trend different from the ordinary can be observed, on the basis of multiple comment sentences.SOLUTION: A tagging apparatus includes: comment collection means for collecting comment sentences including a posting time and position information from a blog server; event position detecting means for detecting an event position in which predetermined number or more comment sentences are concentrated in a predetermined position range, using the multiple comment sentences posted in a predetermined time zone; comment keyword extraction means for extracting words from a group of the comment sentences for every event position, counting an appearance frequency for every word, and extracting a comment keyword the appearance frequency of which becomes a prescribed number or more; and tagging means for associating the comment keyword as a tag with every event position.

Description

本発明は、位置情報にキーワードをタグ付けする技術に関する。   The present invention relates to a technique for tagging position information with a keyword.

近年、インターネットを介して、ブログ(Web log)やミニブログ(mini Web log)(例えばtwitter(登録商標))のようなサイトに対して、不特定多数の第三者からのコメント文章が、活発に発信されている。これらコメント文章は、単に発信するだけでなく、共通の話題に対して議論し合うこともできることに特徴がある。これは、多数のユーザと話題を共有しているという感覚が得られる。例えばtwitterによれば、投稿者は、固有のハッシュタグを含むコメント文章を発信し、閲覧者は、このハッシュタグを含むコメント文章全体を閲覧することができる。例えば、ある地域でお祭りのような地域イベントが開催されている場合、そのお祭りに紐付けられたハッシュタグを用いてコメント文章を発信することができる。一方で、閲覧者は、このハッシュタグを用いて閲覧することによって、そのお祭りに関するtweets全体を閲覧することができる。   In recent years, comment texts from an unspecified number of third parties have become active over sites such as blogs (Web log) and mini blogs (for example, twitter (registered trademark)) via the Internet. Has been sent to. These comment sentences are characterized not only by sending them but also by discussing common topics. This gives the feeling that the topic is shared with many users. For example, according to twitter, a contributor sends a comment sentence including a unique hash tag, and a viewer can browse the entire comment sentence including the hash tag. For example, when a local event such as a festival is held in a certain area, the comment text can be transmitted using a hashtag linked to the festival. On the other hand, the viewer can browse the entire tweets about the festival by browsing using this hashtag.

これに対し、例えばtwitterにおけるジオタグ付きtweetsを用いて、地域イベントを発見することができる技術がある(例えば非特許文献1参照)。ジオタグ付きtweetsとは、GPS(Global Positioning System)機能を用いて、現在位置情報がコメント文章(つぶやき)に自動的に付加されたものをいう。この技術によれば、多くの人々の活動が活発となるお祭りのような地域イベントについて、普段と異なる特別な動向が見られる地域を検知することができる。   On the other hand, for example, there is a technology that can discover a local event using tweets with geotags in twitter (see, for example, Non-Patent Document 1). The geo-tagged tweets means that current position information is automatically added to a comment sentence (tweet) using a GPS (Global Positioning System) function. According to this technology, it is possible to detect a region where a special trend different from usual is observed for a local event such as a festival where many people are active.

藤坂達也、李龍、角谷和俊、「Twitterユーザの集合経験知を用いた地域的ノーマル状態に基づく地域イベントの発見」、WebDBForum 2010、[online]、[平成23年12月27日検索]、インターネット<URL:http://www.shse.u-hyogo.ac.jp/sumiya/japanese/kenkyuu_jyusyou.html>Tatsuya Fujisaka, Ryu Li, Kazutoshi Kakutani, “Discovering regional events based on regional normal conditions using collective experience knowledge of Twitter users”, WebDBForum 2010, [online], [December 27, 2011 search], Internet <URL: http://www.shse.u-hyogo.ac.jp/sumiya/japanese/kenkyuu_jyusyou.html>

しかしながら、非特許文献1に記載の技術によれば、イベント位置を検出できるものの、そのイベントの内容までは検出することができない。即ち、イベント名や、カテゴリ(スポーツ、花火、事故など)、その詳細内容(イベント関連Web情報など)を検出することはできない。特にジオタグ付きtweetsの場合、その位置情報のみがコメント文章に付加されているだけであって、そのイベントの内容まで特定するものではない。結果的に、イベントに基づくコメント文章は、ハッシュタグによって収集する必要がある。但し、ハッシュタグによって収集したコメント文章は、その地域に滞在しないユーザの端末からも投稿することができ、その地域に実際に滞在するユーザの端末から投稿されたコメント文章とは、その性質が異なってくる。   However, according to the technique described in Non-Patent Document 1, although the event position can be detected, the contents of the event cannot be detected. That is, the event name, category (sports, fireworks, accidents, etc.), and detailed contents (event related Web information, etc.) cannot be detected. In particular, in the case of tweets with geotags, only the position information is added to the comment text, and the content of the event is not specified. As a result, comment sentences based on events need to be collected by hashtags. However, comment text collected by hashtags can be posted from the terminal of a user who does not stay in the area, and the nature of the comment text is different from the comment text posted from the terminal of a user who actually stays in that area. Come.

そこで、本発明によれば、多数のコメント文章に基づいて、普段と異なる特別な動向が見られるイベント位置に、リアルタイムなキーワードをタグ付けする装置、プログラム及び方法を提供することを目的とする。   Therefore, an object of the present invention is to provide an apparatus, a program, and a method for tagging a keyword in real time at an event position where a special trend different from usual is seen based on a large number of comment sentences.

本発明によれば、不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積したタグ付け装置であって、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出するイベント位置検出手段と、
イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出するコメントキーワード抽出手段と、
イベント位置毎に、コメントキーワードをタグとして対応付けるタグ付け手段と
を有することを特徴とする。
According to the present invention, a tagging device that accumulates comment text including post time and position information posted from an unspecified number of third parties,
Event position detecting means for detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
Comment keyword extracting means for extracting a word from a group of comment sentences for each event position, counting the appearance frequency for each word, and extracting a comment keyword whose appearance frequency is a predetermined number or more;
There is provided tagging means for associating a comment keyword as a tag for each event position.

本発明のタグ付け装置における他の実施形態によれば、イベント位置検出手段は、イベント位置毎に、コメント文章の全体数に対して、これらコメント文章を投稿したユーザ数が所定割合値以下である場合、当該イベント位置を除外して絞り込むことも好ましい。   According to another embodiment of the tagging device of the present invention, the event position detecting means is configured such that the number of users who have posted these comment sentences is equal to or less than a predetermined ratio value with respect to the total number of comment sentences for each event position. In this case, it is also preferable to narrow down by excluding the event position.

本発明のタグ付け装置における他の実施形態によれば、イベント位置検出手段は、所定時間帯に投稿された多数のコメント文章の中で、位置情報を含むコメント文章のみを抽出し、且つ、投稿者自身が主張する文章が記述されていないコメント文章を除外して絞り込むことも好ましい。   According to another embodiment of the tagging apparatus of the present invention, the event position detecting means extracts only the comment text including the position information from the many comment text posted in the predetermined time zone, and the posting It is also preferable to narrow down by excluding comment sentences in which a sentence claimed by the person himself is not described.

本発明のタグ付け装置における他の実施形態によれば、イベント位置検出手段は、イベント位置毎に、該出現頻度が所定閾値以上となる単語が1語も存在しない場合、当該イベント位置を除外して絞り込むことも好ましい。   According to another embodiment of the tagging device of the present invention, the event position detecting means excludes the event position when there is no word having the appearance frequency equal to or higher than a predetermined threshold value for each event position. It is also preferable to narrow down.

本発明のタグ付け装置における他の実施形態によれば、イベント位置検出手段は、コメント文章に含まれる位置情報を要素として、DBSCAN(Density-Based Spatial Clustering)アルゴリズムを用いて、イベント位置を検出することも好ましい。   According to another embodiment of the tagging device of the present invention, the event position detecting means detects an event position using a DBSCAN (Density-Based Spatial Clustering) algorithm with position information included in the comment text as an element. It is also preferable.

本発明のタグ付け装置における他の実施形態によれば、タグ付け手段によって記憶されたイベント位置を指し示す地図情報と、その地図上の当該イベント位置の部分に記述すべきコメントキーワードとを、ユーザ操作可能な端末へ送信する地図情報送信手段を更に有することも好ましい。   According to another embodiment of the tagging apparatus of the present invention, the map information indicating the event position stored by the tagging means and the comment keyword to be described in the event position portion on the map are operated by the user operation. It is also preferable to further have a map information transmitting means for transmitting to a possible terminal.

本発明のタグ付け装置における他の実施形態によれば、コメントキーワード抽出手段は、複数のコメント文章から形態素解析によって単語を抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的単語を、コメントキーワードとして抽出することも好ましい。   According to another embodiment of the tagging apparatus of the present invention, the comment keyword extracting means extracts a word from a plurality of comment sentences by morphological analysis, and also uses a TF-IDF (Term Frequency-Inverse Document Frequency). It is also preferable to extract a characteristic word as a comment keyword based on (reverse appearance frequency).

本発明のタグ付け装置における他の実施形態によれば、
コメント文章は、ブログ(Web log)サーバ又は掲示板サイトサーバから取得されたものであり、
ブログサーバ又は掲示板サイトサーバから、コメント文章を収集するコメント収集手段を更に有することも好ましい。
According to another embodiment of the tagging device of the present invention,
The comment text is obtained from the blog (Web log) server or the bulletin board site server.
It is also preferable to further include comment collecting means for collecting comment text from the blog server or bulletin board site server.

本発明のタグ付け装置における他の実施形態によれば、
ブログサーバは、ミニブログサーバのtwitter(登録商標)サーバであり、
コメントキーワード抽出手段は、ハッシュタグを、コメントキーワードとして抽出することも好ましい。
According to another embodiment of the tagging device of the present invention,
The blog server is a Twitter (registered trademark) server of a mini blog server,
The comment keyword extracting means preferably extracts the hash tag as a comment keyword.

本発明のタグ付け装置における他の実施形態によれば、
ハッシュタグを含むコメント文章を、twitter(登録商標)サーバを用いて更に検索するコメントキーワード再検索手段を更に有し、
コメントキーワード再検索手段によって取得されたコメント文章を、コメント文章収集手段によって取得されたものとする
ことも好ましい。
According to another embodiment of the tagging device of the present invention,
Comment text re-search means for further searching comment text including a hash tag using a twitter (registered trademark) server,
It is also preferable that the comment text acquired by the comment keyword re-search means is acquired by the comment text collection means.

本発明によれば、不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積した装置に搭載されたコンピュータを機能させるタグ付けプログラムであって、
ブログサーバから、投稿時刻及び位置情報を含むコメント文章を収集するコメント収集手段と、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出するイベント位置検出手段と、
イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出するコメントキーワード抽出手段と、
イベント位置毎に、コメントキーワードをタグとして対応付けるタグ付け手段と
してコンピュータを機能させることを特徴とする。
According to the present invention, there is a tagging program for causing a computer mounted on an apparatus that accumulates comment text including post time and position information posted from an unspecified number of third parties to function,
Comment collecting means for collecting comment text including posting time and position information from the blog server;
Event position detecting means for detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
Comment keyword extracting means for extracting a word from a group of comment sentences for each event position, counting the appearance frequency for each word, and extracting a comment keyword whose appearance frequency is a predetermined number or more;
The computer is caused to function as tagging means for associating a comment keyword as a tag for each event position.

本発明によれば、不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積した装置におけるタグ付け方法であって、
ブログサーバから、投稿時刻及び位置情報を含むコメント文章を収集する第1のステップと、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出する第2のステップと、
イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出する第3のステップと、
イベント位置毎に、コメントキーワードをタグとして対応付ける第4のステップと
を有することを特徴とする。
According to the present invention, there is a tagging method in a device that accumulates comment text including post time and position information posted from an unspecified number of third parties,
A first step of collecting comment text including a posting time and position information from a blog server;
A second step of detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
A third step of extracting a word from a group of comment sentences for each event position, counting an appearance frequency for each word, and extracting a comment keyword having an appearance frequency equal to or greater than a predetermined number;
And a fourth step of associating a comment keyword as a tag for each event position.

本発明のタグ付け装置、プログラム及び方法によれば、多数のコメント文章に基づいて、普段と異なる特別な動向が見られるイベント位置に、リアルタイムなキーワードをタグ付けすることができる。   According to the tagging apparatus, program, and method of the present invention, it is possible to tag a keyword in real time at an event position where a special trend different from usual is seen based on a large number of comment sentences.

本発明におけるシステム構成図である。It is a system configuration diagram in the present invention. 本発明におけるタグ付けサーバの機能構成図である。It is a functional block diagram of the tagging server in this invention. イベント検出部におけるフローチャートである。It is a flowchart in an event detection part. 本発明における地図上のイベント位置にキーワードを表示した画面図である。It is the screen figure which displayed the keyword in the event position on the map in this invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明におけるシステム構成図である。   FIG. 1 is a system configuration diagram according to the present invention.

図1によれば、不特定多数の第三者から投稿されたコメント文章を公開するブログ(Web log)サーバ(又は掲示板サイトサーバ)2が、インターネットに接続されている。ブログサーバ2は、例えばtwitterサーバのようなミニブログサーバである。   According to FIG. 1, a blog (Web log) server (or bulletin board site server) 2 that publishes comment text posted by an unspecified number of third parties is connected to the Internet. The blog server 2 is a mini blog server such as a twitter server.

ここで、図1によれば、特定の地域範囲で、地域イベントが開催されているとする。地域イベントとは、普段と異なる特別な動向が見られる地域、即ち、お祭りのようにその日時間帯だけ人が集中するような地域であるとする。このイベント位置には多数のユーザが滞在しており、各ユーザは、自ら所持する端末3を用いて、ミニブログサーバ2へコメント文章を投稿することができる。端末3は、ユーザと共に移動可能なものであって、携帯電話機やスマートフォンのような携帯端末である。   Here, according to FIG. 1, it is assumed that a regional event is held in a specific region. A regional event is a region where a special trend different from usual is observed, that is, a region where people are concentrated only during the day and time like a festival. Many users are staying at this event position, and each user can post a comment text to the miniblog server 2 using the terminal 3 that the user owns. The terminal 3 is movable with the user and is a mobile terminal such as a mobile phone or a smartphone.

また、図1によれば、本発明を構成するタグ付けサーバ(装置)1が、インターネットに更に接続されている。タグ付けサーバ1は、ミニブログサーバ2から多数のコメント文章を収集する。勿論、ミニブログサーバ2と通信することは必須の構成要素ではなく、タグ付け装置(サーバ)1が、多数のコメント文章を予め蓄積したものであってもよい。そして、タグ付けサーバ1は、これらコメント文章に基づいて、普段と異なる特別な動向が見られるイベント位置に、リアルタイムなキーワードをタグ付けする。また、他のユーザは、自ら所持する端末4を用いて、タグ付けサーバ1へアクセスし、イベント位置とそのキーワードとを紐付けて閲覧することができる。   Moreover, according to FIG. 1, the tagging server (apparatus) 1 which comprises this invention is further connected to the internet. The tagging server 1 collects a large number of comment sentences from the miniblog server 2. Of course, communicating with the mini-blog server 2 is not an essential component, and the tagging device (server) 1 may be one in which a large number of comment texts are stored in advance. Then, the tagging server 1 tags a keyword in real time at an event position where a special trend different from usual is seen based on these comment sentences. Other users can access the tagging server 1 using the terminal 4 that they own, and browse the event position and its keyword in association with each other.

図2は、本発明におけるタグ付けサーバの機能構成図である。   FIG. 2 is a functional configuration diagram of the tagging server in the present invention.

図2によれば、タグ付けサーバ1は、インターネットに接続された通信インタフェース部10と、コメント文章収集部111と、イベント位置検出部112と、コメントキーワード抽出部113と、タグ付け部114と、イベント位置記憶部115と、地図情報送信部116と、コメントキーワード再検索部117とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。   According to FIG. 2, the tagging server 1 includes a communication interface unit 10 connected to the Internet, a comment text collection unit 111, an event position detection unit 112, a comment keyword extraction unit 113, a tagging unit 114, The event location storage unit 115, the map information transmission unit 116, and the comment keyword re-search unit 117 are included. These functional components are realized by executing a program that causes a computer mounted on the server to function.

[コメント文章収集部111]
コメント文章収集部111は、ミニブログサーバ(例えばtwitterサーバ)2から、投稿時刻及び位置情報を含むコメント文章を収集する。これらコメント文章は、ジオタグ付きtweetsであり、ユーザid(user_id)、発信時間(created_at)、位置情報(loc_lat, loc_lng)(緯度・経度情報)、テキスト(texts)を含む。ここで、コメント文章収集部111は、所定時間帯に投稿されたコメント文章のみを収集することも好ましい。地域イベントは、一定の時間帯でのみ開催されるものであるからである。勿論、コメント文章収集部111に代えて、多数のコメント文章を予め蓄積したコメント文章蓄積部であってもよい。
[Comment text collection unit 111]
The comment text collection unit 111 collects comment text including the posting time and position information from the miniblog server (for example, twitter server) 2. These comment sentences are tweets with geotags, and include user id (user_id), transmission time (created_at), location information (loc_lat, loc_lng) (latitude / longitude information), and text (texts). Here, it is also preferable that the comment sentence collection unit 111 collects only comment sentences posted in a predetermined time period. This is because local events are held only during a certain period of time. Of course, instead of the comment text collection unit 111, a comment text storage unit that stores a large number of comment texts in advance may be used.

コメント文章内における位置情報は、例えば以下のように表される。
「I'm at (場所名) http://t.co/BNw9NbL2」
「@XXX http://t.co/3acyFI3K」
「(場所名)にタッチ! http://t.co/4a7dabK」
The position information in the comment text is expressed as follows, for example.
"I'm at (place name) http://t.co/BNw9NbL2"
“@XXX http://t.co/3acyFI3K”
"Touch (location name)! Http://t.co/4a7dabK"

また、コメント文章収集部111は、例えばtwitterサーバに対して、StreamingAPIを用いることも好ましい。twitterのAPIは基本的にpull型であるのに対し、StreamingAPIは、クライアントが、twitterサーバへ接続を開き、リクエストを送信した後、切断されるまで接続を維持することできる。その間、サーバは、レスポンス(投稿されたコメント文章)をリアルタイムに、クライアント(タグ付けサーバ1)へ送信し続けることができる。また、StreamingAPIによれば、位置情報を含むコメント文章のみや、特定キーワードを含むコメント文章のみを収集するよう設定することもできる。そして、コメント文章収集部111によって収集されたコメント文章は、イベント位置検出部112へ出力される。   Moreover, it is also preferable that the comment sentence collection part 111 uses StreamingAPI with respect to a twitter server, for example. The Twitter API is basically a pull type, whereas the Streaming API allows a client to open a connection to a twitter server, send a request, and maintain the connection until disconnected. Meanwhile, the server can continue to send the response (posted comment text) to the client (tagging server 1) in real time. Further, according to the Streaming API, it is possible to set to collect only comment texts including position information or only comment texts including specific keywords. Then, the comment text collected by the comment text collection unit 111 is output to the event position detection unit 112.

[イベント位置検出部112]
イベント位置検出部112は、所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出する。
[Event position detection unit 112]
The event position detection unit 112 detects an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period.

図3は、イベント検出部におけるフローチャートである。   FIG. 3 is a flowchart in the event detection unit.

(S31)イベント位置候補の検出(位置情報のクラスタリング)
イベントが開催されている地域では、投稿数が集中していると想定する。そこで、最初に、イベント位置検出部112は、コメント文章に付加された緯度経度情報を平面上にプロットし、その位置をクラスタリングすることによって、コメント文章が集中するイベント位置(密集地)を検出する。このクラスタリングには、例えばDBSCAN(Density-Based Spatial Clustering)を用いることができる。k-meansによれば、クラスタ数kを事前に与える必要があるのに対し、DBSCANによれば、クラスタ数を事前に与えことなく、比較的に直感的なクラスタを抽出できる。
(S31) Event position candidate detection (position information clustering)
Assume that the number of posts is concentrated in the area where the event is held. Therefore, first, the event position detection unit 112 plots the latitude / longitude information added to the comment text on a plane and clusters the positions to detect an event position (crowded area) where the comment text concentrates. . For this clustering, for example, DBSCAN (Density-Based Spatial Clustering) can be used. According to k-means, the number of clusters k needs to be given in advance, whereas according to DBSCAN, a relatively intuitive cluster can be extracted without giving the number of clusters in advance.

DBSCANは、超球状ではない任意形状のクラスタの抽出を目的としたクラスタリング方法であって、2つの点における直接密度到達可能(directly density-rechable)を導出するものである。あるseed点から、直接密度到達可能な関係を推移的に辿って、到達可能な極大集合を1つのクラスタとして抽出する。   DBSCAN is a clustering method for extracting clusters having an arbitrary shape that is not hyperspherical, and derives directly density-rechable at two points. From a certain seed point, the density reachable relationship is directly traced, and the reachable maximal set is extracted as one cluster.

DBSCANによれば、Eps(epsilon、距離)及びMinPts(minimum points、最低ポイント)の2つのパラメータを用いる。例えばEps=0.0005及びMinPts=10を事前に与えるものであってもよい。また、これらパラメータを、測位の所定時間周期や最終的な住所居所推定の結果によって変更するものであってもよい。   According to DBSCAN, two parameters are used: Eps (epsilon, distance) and MinPts (minimum points). For example, Eps = 0.0005 and MinPts = 10 may be given in advance. Further, these parameters may be changed according to a predetermined time period of positioning or a result of final address location estimation.

(S32)日常的に所定数以上の投稿数がある位置情報の除外
次に、イベント位置検出部112は、S31におけるイベント位置の候補の中から、日常的に、所定数以上の投稿数がある位置情報の除外して絞り込む。常に投稿数が多い場所として、例えば「駅」がある。駅のような場所は、普段と異なる特別な動向が見られるイベント位置ではない。そのために、日常的に投稿数が多い位置は、イベント位置候補からために、除外する。
(S32) Exclusion of position information having a predetermined number of postings on a daily basis Next, the event position detecting unit 112 has a predetermined number of postings on a daily basis from among the candidate event positions in S31. Filter by excluding location information. As a place where the number of postings is always large, for example, there is “station”. A place like a station is not an event location where a special trend different from usual can be seen. For this reason, positions with a large number of postings on a daily basis are excluded from event position candidates.

(S33)所定割合以下のユーザ数しか存在しないイベント位置の除外
イベント位置検出部112は、イベント位置毎に、コメント文章の全体数に対して、これらコメント文章を投稿したユーザ数が所定割合値以下である場合、当該イベント位置を除外して絞り込む。このようなイベント位置では、同一ユーザが多数回、コメント文章を投稿しており、多数のユーザが集まるイベント位置ではないことが多い。そこで、このようなイベント位置の候補は除外する。例えば、その地域における投稿数の半分より少ない場合(10個のコメント文章が投稿された地域について、そのユーザ数が4人以下である場合)、このイベント位置を候補から除外する。
(S33) Exclusion of event positions where only the number of users equal to or less than a predetermined ratio is present The event position detection unit 112 determines that the number of users who posted these comment sentences is equal to or less than a predetermined ratio value for each event position. If it is, the event position is excluded and narrowed down. In such an event position, the same user has posted comment texts many times, and is often not an event position where many users gather. Therefore, such event position candidates are excluded. For example, when the number of posts in the area is less than half (when the number of users in the area where 10 comment sentences are posted is 4 or less), this event position is excluded from the candidates.

(S34)投稿者自身が主張する文章が記述されていないコメント文章の除外
イベント位置検出部112は、所定時間帯に投稿された多数のコメント文章の中で、投稿者自身が主張する文章が記述されていないコメント文章を除外する。例えば、「I'm at (場所)」や「(場所)にタッチ!」など、位置情報登録サイト特有の言い回しのみで構成される場合が多い。このため、このような言い回しのコメント文章のみで、且つ、投稿者自身が主張する文章が記述されていないコメント文章を、除外する。このようなコメント文章は、その地域イベントを特定するに適したキーワードが含まれていないためである。
(S34) Exclusion of comment text in which the sentence claimed by the poster itself is not described The event position detection unit 112 describes the text claimed by the poster himself among a large number of comment sentences posted in a predetermined time period. Exclude comment text that has not been posted. For example, it is often configured only with phrases specific to the location information registration site, such as “I'm at (location)” and “touch (location)!”. For this reason, only comment sentences with such phrases and comment sentences in which the sentences claimed by the posters are not described are excluded. This is because such comment text does not include a keyword suitable for specifying the local event.

×のコメント文章は、投稿者自身が主張する文章が記述されておらず、S33によって除外される。
(コメント文章1)○ 着いた。さっきの学生さん達は、A大でした。@都庁西新宿ビル http://t.co/3acyFI3K
(コメント文章2)○ OSC 2011 Tokyo/Fall にやってまいりました #osc11tk (@ 都庁 西新宿ビル w/ 3 others) http://t.co/BNw9NbL2
(コメント文章3)× I'm at 都庁西新宿ビル 28階http://t.co/v66BR2Iv
(コメント文章4)○ ついた (@都庁西新宿ビル w/ 4 others) http://t.co/RZkmuSG8',
(コメント文章5)× I'm at 都庁西新宿ビル w/ @hirokazu_nishi http://t.co/HdCZoVD4',
(コメント文章6)○ #osc11tkに参加。いやぁしかし、広いキャンパスだなぁ。(@都庁西新宿ビル w/ 7 others) http://t.co/V1YAzqZg
(コメント文章7)× I'm at 都庁西新宿ビル w/ @minky0 http://t.co/5aYa34CN
(コメント文章8)× I'm at 都庁西新宿ビル D2-1-1, C市) w/ 10 others http://t.co/Uxcc0IrB
The comment text of “x” does not describe the text claimed by the poster, and is excluded by S33.
(Comment text 1) ○ I arrived. The previous students were A size. @Tokyo Metropolitan Nishishinjuku Building http://t.co/3acyFI3K
(Comment 2) ○ I went to OSC 2011 Tokyo / Fall # osc11tk (@ Tokyo Metropolitan Government Nishi-Shinjuku Building w / 3 others) http://t.co/BNw9NbL2
(Comment Sentence 3) × I'm at Tochō Nishi-Shinjuku Building, 28th floor http://t.co/v66BR2Iv
(Comment text 4) ○ Tsuita (@ Tocho Nishi-Shinjuku Building w / 4 others) http://t.co/RZkmuSG8 ',
(Comment Sentence 5) x I'm at Toshin Nishishinjuku Building w / @hirokazu_nishi http://t.co/HdCZoVD4 ',
(Comment 6) ○ Participated in # osc11tk. No, but it's a large campus. (@Tokyo Metropolitan Nishi Shinjuku Building w / 7 others) http://t.co/V1YAzqZg
(Comment text 7) x I'm at Tokyo Metropolitan Government Nishi-Shinjuku Building w / @ minky0 http://t.co/5aYa34CN
(Comment Sentence 8) x I'm at Tokyo Metropolitan Government Nishi-Shinjuku Building D2-1-1, City C) w / 10 others http://t.co/Uxcc0IrB

(S35)所定閾値以上の出現頻度のキーワードが検出されないイベント位置の除外
イベント位置検出部112は、イベント位置毎に、該出現頻度が所定閾値以上となる単語が1語も存在しない場合、当該イベント位置を除外して絞り込む。イベント位置である場合、そのイベントの内容に応じて、一定以上の出現頻度のキーワードが必ず検出されると考えられる。即ち、そのキーワードは、そのイベントの内容を表すに適切なものである場合が多い。一方で、一定以上の出現頻度のキーワードが検出されないということは、特定のイベントが開催されていないと考えられる。従って、そのようなイベント位置の候補は、除外する。
(S35) Exclusion of event position in which a keyword with an appearance frequency equal to or higher than a predetermined threshold is not detected The event position detection unit 112 determines that the event is detected when there is no word with the appearance frequency equal to or higher than the predetermined threshold for each event position. Filter by excluding position. When it is an event position, it is considered that a keyword having an appearance frequency of a certain level or more is always detected according to the contents of the event. That is, the keyword is often appropriate for expressing the contents of the event. On the other hand, if a keyword with an appearance frequency of a certain level or more is not detected, it is considered that a specific event is not held. Therefore, such event position candidates are excluded.

[コメントキーワード抽出部113]
コメントキーワード抽出部113は、イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出する。抽出されたコメントキーワードは、タグ付け部114へ出力される。
[Comment keyword extraction unit 113]
The comment keyword extraction unit 113 extracts words from the group of comment sentences for each event position, counts the appearance frequency for each word, and extracts a comment keyword whose appearance frequency is a predetermined number or more. The extracted comment keyword is output to the tagging unit 114.

コメントキーワード抽出部113は、最初に、複数のコメント文章から形態素解析によって単語を抽出する。「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。   The comment keyword extraction unit 113 first extracts words from a plurality of comment sentences by morphological analysis. “Morphological analysis” refers to a technique in which sentences are divided into meaningful words and the part of speech and contents are discriminated using a dictionary. The “morpheme” means the smallest unit having meaning among the elements of the sentence.

ここで、形態素解析には、例えばオープンソースの形態素解析エンジン「MeCab」を用いることができる。このエンジンによれば、階層化された品詞体系を有し、形態素の品詞も解析することができる。形態素毎に、「名詞」「固有名詞」「組織」「地域」「一般」・・・等の品詞も出力される。但し、本発明によれば、コメントキーワードからは、地名や住所を除外することが好ましい。地名自体は、そのイベントの内容を表さないからである。   Here, for example, an open source morphological analysis engine “MeCab” can be used for the morphological analysis. This engine has a hierarchical part-of-speech system and can also analyze morpheme part-of-speech. For each morpheme, parts of speech such as “noun”, “proprietary noun”, “organization”, “region”, “general”, etc. are also output. However, according to the present invention, it is preferable to exclude place names and addresses from the comment keywords. This is because the place name itself does not represent the contents of the event.

次に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的なキーワードを、コメントキーワードとして抽出する。TF−IDFとは、各単語に重みを付けて、クエリから文書をベクトル空間で表し、文書とクエリの類似度でランク付けをする技術である。ランク付けられた値が高いほど、重要キーワードと認識される。   Next, a characteristic keyword is extracted as a comment keyword by TF-IDF (Term Frequency-Inverse Document Frequency). TF-IDF is a technique that weights each word, expresses a document from a query in a vector space, and ranks the documents based on the similarity between the query and the query. The higher the ranked value, the more important keywords are recognized.

また、コメントキーワード抽出部113は、例えばtwitterサーバから収集したコメント文章については、ハッシュタグ(#)を、コメントキーワードとして更に抽出することも好ましい。ハッシュタグは、共通の話題についてコメント文章同士を紐付けるものである。   Moreover, it is preferable that the comment keyword extraction unit 113 further extracts a hash tag (#) as a comment keyword for a comment sentence collected from, for example, a twitter server. The hash tag is used to link comment sentences on a common topic.

[タグ付け部114]
タグ付け部114は、イベント位置毎に、コメントキーワードをタグとして対応付ける。そして、イベント位置(緯度経度情報)+コメントキーワードは、イベント位置記憶部115へ出力される。
[Tagging unit 114]
The tagging unit 114 associates comment keywords as tags for each event position. Then, the event position (latitude / longitude information) + comment keyword is output to the event position storage unit 115.

[イベント位置記憶部115]
イベント位置記憶部115は、イベント位置(緯度経度情報)+コメントキーワードを記憶する。
[Event position storage unit 115]
The event position storage unit 115 stores an event position (latitude / longitude information) + a comment keyword.

[地図情報送信部116]
地図情報送信部116は、地図情報と、その地図に含まれるイベント位置に描画されるコメントキーワードとを、ユーザ操作可能な端末3へ送信する。
[Map information transmission unit 116]
The map information transmission unit 116 transmits map information and a comment keyword drawn at an event position included in the map to the terminal 3 that can be operated by the user.

図4は、本発明における地図上のイベント位置にキーワードを表示した画面図である。   FIG. 4 is a screen diagram in which keywords are displayed at event positions on a map according to the present invention.

図4によれば、地図上のイベント位置に、特徴的なコメントキーワードが表示されている。ここでは、図3のコメント文章に基づいて、都庁西新宿のイベント位置に、コメントキーワード「#osc11tk」「OSC2011 Tokyo/Fall」「A大学」が表示されている。閲覧者は、この地図を見ることによって、都庁西新宿の位置に、コメントキーワードに基づくイベントが開催されていることを、直感的に認識することができる。   According to FIG. 4, characteristic comment keywords are displayed at event positions on the map. Here, the comment keywords “# osc11tk”, “OSC2011 Tokyo / Fall”, and “University A” are displayed at the event location of the Tokyo Metropolitan Government Office Nishi-Shinjuku based on the comment text of FIG. By viewing this map, the viewer can intuitively recognize that an event based on the comment keyword is held at the location of the Tokyo Metropolitan Government Office Nishi-Shinjuku.

[コメントキーワード再検索部117]
コメントキーワード再検索部117は、コメントキーワード抽出部113から出力されたコメントキーワードをキーとして、twitter(登録商標)サーバを用いて更に検索する。コメントキーワードは、例えばハッシュタグ(#)やイベント固有名詞を含み、これらを含むコメント文章を再検索する。
[Comment keyword re-search unit 117]
The comment keyword re-search unit 117 further searches using the twitter (registered trademark) server using the comment keyword output from the comment keyword extraction unit 113 as a key. The comment keyword includes, for example, a hash tag (#) and an event proper noun, and a comment sentence including these is re-searched.

例えばtwitterの場合、ジオタグ付き付きコメント文章は、全体の0.5%程度(日本の2010年統計)しか存在しない。一方で、そのイベント位置から投稿されているにも拘わらず、位置情報が付加されていないコメント文章も数多く存在する。そこで、コメントキーワード再検索部117によって、コメントキーワードを含むコメント文章を更に検索し、これらコメント文章を、コメント文章収集部111へ出力される。これによって、コメント文章収集部111によって収集可能なコメント文章の数を増大させることができる。位置情報が付加されたいないコメント文章からも、そのイベント位置に基づく特徴的なキーワードが更に抽出される。   For example, in the case of twitter, there is only about 0.5% of the comment text with geotag (2010 statistics in Japan). On the other hand, there are many comment sentences to which position information is not added despite being posted from the event position. Therefore, the comment keyword re-search unit 117 further searches for comment sentences including the comment keyword, and these comment sentences are output to the comment sentence collection unit 111. As a result, the number of comment sentences that can be collected by the comment sentence collecting unit 111 can be increased. A characteristic keyword based on the event position is further extracted from the comment text to which position information is not added.

例えばtwitterサーバよれば、以下のように指定したキーワードを含むコメント文章(tweets)を検索することができる。例えば、キーワード"OSC2011
Tokyo/Fall"が含まれるtweetsを検索する場合、以下のURL(Uniform Resource Locator)を指定する。
http://search.twitter.com/search.atom?phrase="OSC2011 Tokyo/Fall"
For example, according to the twitter server, it is possible to search for comment sentences (tweets) including keywords specified as follows. For example, the keyword "OSC2011
When searching for tweets containing “Tokyo / Fall”, the following URL (Uniform Resource Locator) is specified.
http://search.twitter.com/search.atom?phrase="OSC2011 Tokyo / Fall "

また、例えばtwitterによれば、ハッシュタグ(#)が付加されたコメント文章tweetsのみを収集することもできる。twitterの場合、ハッシュタグを用いることで、話題を共通化することできる。例えば、ハッシュタグ"#osc11tk"が付加されたtweetを検索する場合、以下のURLを指定する。
http://search.twitter.com/search.atom?q=%23osc11tk
また、日付を指定することによって、最大1週間分のtweetsを検索することもできる。
For example, according to twitter, it is also possible to collect only comment text tweets with a hash tag (#) added. In the case of twitter, the topic can be made common by using a hash tag. For example, when searching for a tweet to which the hash tag “# osc11tk” is added, the following URL is specified.
http://search.twitter.com/search.atom?q=%23osc11tk
You can also search for tweets for up to one week by specifying the date.

他の実施形態として、コメントキーワードが抽出されたコメント文章について、そのコメント文章を投稿したユーザを検出し、そのユーザから投稿されたコメント文章を更に再検索することも好ましい。このユーザのコメント文章の全体から、当該イベントの終了時刻を抽出することもできる。例えば「終了」「閉館」「閉会」のようなキーワードを検出し、その投稿時刻を抽出することもできる。このようにして抽出された終了時刻に基づいて、イベント位置記憶部115に記憶されたアイテム(イベント位置−キーワード群)を削除することもできる。   As another embodiment, it is also preferable to detect a user who has posted the comment sentence from the comment sentence from which the comment keyword is extracted, and to re-search the comment sentence posted by the user. The end time of the event can also be extracted from the entire comment text of the user. For example, keywords such as “end”, “closed”, and “close” can be detected, and the posting time can be extracted. Based on the end time extracted in this way, the item (event position-keyword group) stored in the event position storage unit 115 can also be deleted.

また、他の実施形態として、コメントキーワードの意味を表すカテゴリを、地図上に更に付与することも好ましい。図4によれば、「OSC2011 Tokyo/Fall」と記述されているが、例えば「OSC2011
Tokyo/Fall(学会)」とカテゴリも加えて記述する。このような記述を実現するためには、イベント毎に、予め準備しておいたイベント関連語リストを作成しておく必要がある。イベント関連語リストには、例えば「OSC -> 学会」が記憶されており、「OSC」を含むことよって、カテゴリ「学会」が検索される。このように、コメントキーワードに加えて、カテゴリも付加することによって、閲覧者に、更に直感的に理解させることができる。
Further, as another embodiment, it is preferable to further add a category representing the meaning of the comment keyword on the map. According to FIG. 4, although “OSC2011 Tokyo / Fall” is described, for example, “OSC2011
“Tokyo / Fall” and the category are also described. In order to realize such a description, it is necessary to create an event-related word list prepared in advance for each event. For example, “OSC-> society” is stored in the event-related word list, and the category “society” is searched by including “OSC”. Thus, by adding a category in addition to the comment keyword, the viewer can be made to understand more intuitively.

以上、詳細に説明したように、本発明のタグ付け装置、プログラム及び方法によれば、多数のコメント文章に基づいて、普段と異なる特別な動向が見られるイベント位置に、リアルタイムなキーワードをタグ付けすることができる。特定の地域について、投稿者が発信した所定のイベントに関する投稿文から、その地域で何が起きているかを検出し、そのキーワードをその位置に付与することができる。そして、閲覧者は、位置(イベント位置)にコメントキーワードが紐付けらえた地図を閲覧することによって、その位置でどのようなイベントが開催されていることを、直感的に認識することができる。   As described above in detail, according to the tagging apparatus, program and method of the present invention, real-time keywords are tagged at event positions where special trends different from usual are observed based on a large number of comment sentences. can do. For a specific area, it is possible to detect what is happening in the area from the posted text related to a predetermined event transmitted by the poster and assign the keyword to the position. The viewer can intuitively recognize what event is being held at the position by browsing the map in which the comment keyword is associated with the position (event position).

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。   Various changes, modifications, and omissions of the above-described various embodiments of the present invention can be easily made by those skilled in the art. The above description is merely an example, and is not intended to be restrictive. The invention is limited only as defined in the following claims and the equivalents thereto.

1 タグ付けサーバ
10 通信インタフェース部
111 コメント文章収集部
112 イベント位置検出部
113 コメントキーワード抽出部
114 タグ付け部
115 イベント位置記憶部
116 地図情報送信部
117 コメントキーワード再検索部
2 ミニブログサーバ
3 投稿者用端末
4 閲覧者用端末
DESCRIPTION OF SYMBOLS 1 Tagging server 10 Communication interface part 111 Comment text collection part 112 Event position detection part 113 Comment keyword extraction part 114 Tagging part 115 Event position memory | storage part 116 Map information transmission part 117 Comment keyword re-search part 2 Miniblog server 3 Contributor Terminal 4 Reader terminal

Claims (12)

不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積したタグ付け装置であって、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出するイベント位置検出手段と、
前記イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出するコメントキーワード抽出手段と、
前記イベント位置毎に、前記コメントキーワードをタグとして対応付けるタグ付け手段と
を有することを特徴とするタグ付け装置。
A tagging device that accumulates comment sentences including posting time and position information posted from an unspecified number of third parties,
Event position detecting means for detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
Comment keyword extraction means for extracting a word from a group of comment sentences for each event position, counting the appearance frequency for each word, and extracting a comment keyword with an appearance frequency equal to or greater than a predetermined number;
A tagging device comprising tagging means for associating the comment keyword as a tag for each event position.
前記イベント位置検出手段は、前記イベント位置毎に、コメント文章の全体数に対して、これらコメント文章を投稿したユーザ数が所定割合値以下である場合、当該イベント位置を除外して絞り込むことを特徴とする請求項1に記載のタグ付け装置。   The event position detecting means excludes the event position and narrows down the event position when the number of users who have posted these comment sentences is equal to or less than a predetermined ratio value with respect to the total number of comment sentences for each event position. The tagging apparatus according to claim 1. 前記イベント位置検出手段は、所定時間帯に投稿された多数のコメント文章の中で、位置情報を含むコメント文章のみを抽出し、且つ、投稿者自身が主張する文章が記述されていないコメント文章を除外して絞り込むことを特徴とする請求項1又は2に記載のタグ付け装置。   The event position detecting means extracts only comment sentences including position information from a large number of comment sentences posted in a predetermined time zone, and extracts comment sentences that do not contain sentences claimed by the posters themselves. 3. The tagging device according to claim 1, wherein the tagging device is narrowed down by exclusion. 前記イベント位置検出手段は、前記イベント位置毎に、該出現頻度が所定閾値以上となる単語が1語も存在しない場合、当該イベント位置を除外して絞り込むことを特徴とする請求項1から3のいずれか1項に記載のタグ付け装置。   4. The event position detection unit according to claim 1, wherein, when there is no word having the appearance frequency equal to or higher than a predetermined threshold for each event position, the event position detection unit excludes the event position and narrows down the event position. 5. The tagging apparatus according to any one of the above. 前記イベント位置検出手段は、前記コメント文章に含まれる位置情報を要素として、DBSCAN(Density-Based Spatial Clustering)アルゴリズムを用いて、前記イベント位置を検出することを特徴とする請求項1から4のいずれか1項に記載のタグ付け装置。   5. The event position detection means detects the event position using a DBSCAN (Density-Based Spatial Clustering) algorithm with position information included in the comment text as an element. 5. The tagging apparatus according to claim 1. 前記タグ付け手段によって記憶された前記イベント位置を指し示す地図情報と、その地図上の当該イベント位置の部分に記述すべき前記コメントキーワードとを、ユーザ操作可能な端末へ送信する地図情報送信手段を更に有することを特徴とする請求項1から5のいずれか1項に記載のタグ付け装置。   Map information transmitting means for transmitting the map information indicating the event position stored by the tagging means and the comment keyword to be described in the part of the event position on the map to a user operable terminal. The tagging device according to claim 1, wherein the tagging device is provided. 前記コメントキーワード抽出手段は、複数のコメント文章から形態素解析によって単語を抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的単語を、前記コメントキーワードとして抽出する
ことを特徴とする請求項1から6のいずれか1項に記載のタグ付け装置。
The comment keyword extraction means extracts a word from a plurality of comment sentences by morphological analysis, and extracts a characteristic word from the comment keyword by TF-IDF (Term Frequency-Inverse Document Frequency). The tagging device according to claim 1, wherein the tagging device is extracted as
前記コメント文章は、ブログ(Web log)サーバ又は掲示板サイトサーバから取得されたものであり、
前記ブログサーバ又は掲示板サイトサーバから、コメント文章を収集するコメント収集手段を更に有することを特徴とする請求項1から7のいずれか1項に記載のタグ付け装置。
The comment text is obtained from a blog (Web log) server or a bulletin board site server,
8. The tagging apparatus according to claim 1, further comprising comment collection means for collecting comment text from the blog server or bulletin board site server.
前記ブログサーバは、ミニブログサーバのtwitter(登録商標)サーバであり、
前記コメントキーワード抽出手段は、ハッシュタグを、前記コメントキーワードとして抽出する
ことを特徴とする請求項8に記載のタグ付け装置。
The blog server is a mini blog server twitter (registered trademark) server,
9. The tagging apparatus according to claim 8, wherein the comment keyword extraction unit extracts a hash tag as the comment keyword.
前記ハッシュタグを含むコメント文章を、前記twitter(登録商標)サーバを用いて更に検索するコメントキーワード再検索手段を更に有し、
前記コメントキーワード再検索手段によって取得されたコメント文章を、前記コメント文章収集手段によって取得されたものとする
ことを特徴とする請求項9に記載のタグ付け装置。
Comment keyword re-search means for further searching the comment text including the hash tag using the twitter (registered trademark) server,
The tagging apparatus according to claim 9, wherein the comment text acquired by the comment keyword re-search means is acquired by the comment text collection means.
不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積した装置に搭載されたコンピュータを機能させるタグ付けプログラムであって、
前記ブログサーバから、投稿時刻及び位置情報を含むコメント文章を収集するコメント収集手段と、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出するイベント位置検出手段と、
前記イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出するコメントキーワード抽出手段と、
前記イベント位置毎に、前記コメントキーワードをタグとして対応付けるタグ付け手段と
してコンピュータを機能させることを特徴とするタグ付けプログラム。
A tagging program that allows a computer mounted on a device that accumulates comment text including post time and position information posted from an unspecified number of third parties to function,
From the blog server, a comment collecting means for collecting comment text including posting time and position information;
Event position detecting means for detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
Comment keyword extraction means for extracting a word from a group of comment sentences for each event position, counting the appearance frequency for each word, and extracting a comment keyword with an appearance frequency equal to or greater than a predetermined number;
A tagging program that causes a computer to function as tagging means for associating the comment keyword as a tag for each event position.
不特定多数の第三者から投稿された投稿時刻及び位置情報を含むコメント文章を蓄積した装置におけるタグ付け方法であって、
前記ブログサーバから、投稿時刻及び位置情報を含むコメント文章を収集する第1のステップと、
所定時間帯に投稿された多数のコメント文章を用いて、所定位置範囲に所定数以上のコメント文章が集中するイベント位置を検出する第2のステップと、
前記イベント位置毎に、コメント文章の群から単語を抽出し、該単語毎に出現頻度を計数し、出現頻度が所定数以上となるコメントキーワードを抽出する第3のステップと、
前記イベント位置毎に、前記コメントキーワードをタグとして対応付ける第4のステップと
を有することを特徴とするタグ付け方法。
A tagging method in a device that accumulates comment text including post time and position information posted from an unspecified number of third parties,
A first step of collecting comment text including posting time and position information from the blog server;
A second step of detecting an event position where a predetermined number or more of comment sentences are concentrated in a predetermined position range using a large number of comment sentences posted in a predetermined time period;
A third step of extracting words from a group of comment sentences for each event position, counting the appearance frequency for each word, and extracting a comment keyword having an appearance frequency equal to or greater than a predetermined number;
And a fourth step of associating the comment keyword as a tag for each event position.
JP2011286637A 2011-12-27 2011-12-27 Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences Active JP5725619B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011286637A JP5725619B2 (en) 2011-12-27 2011-12-27 Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011286637A JP5725619B2 (en) 2011-12-27 2011-12-27 Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences

Publications (2)

Publication Number Publication Date
JP2013134738A true JP2013134738A (en) 2013-07-08
JP5725619B2 JP5725619B2 (en) 2015-05-27

Family

ID=48911355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011286637A Active JP5725619B2 (en) 2011-12-27 2011-12-27 Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences

Country Status (1)

Country Link
JP (1) JP5725619B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015207106A (en) * 2014-04-18 2015-11-19 富士通株式会社 Event occurrence place estimation method, event occurrence place estimation program and event occurrence place estimation apparatus
JP2016045938A (en) * 2014-08-20 2016-04-04 Kddi株式会社 Comment grouping program, server and method extracting area specific comments from many comments
JP2016081509A (en) * 2014-10-17 2016-05-16 富士ゼロックス株式会社 Method for renewing facility characteristics, method for profiling facilities and computer system
CN106934005A (en) * 2017-03-07 2017-07-07 重庆邮电大学 A kind of Text Clustering Method based on density
JP2017216008A (en) * 2017-08-10 2017-12-07 株式会社ニコン Information processing apparatus
CN108153856A (en) * 2017-12-22 2018-06-12 北京百度网讯科技有限公司 For the method and apparatus of output information
CN110750646A (en) * 2019-10-16 2020-02-04 乐山师范学院 Attribute description extracting method for hotel comment text

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128806A (en) * 2008-11-27 2010-06-10 Hitachi Ltd Information analyzing device
JP2011103101A (en) * 2009-11-12 2011-05-26 Shunsuke Tajiri Information providing device and information providing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128806A (en) * 2008-11-27 2010-06-10 Hitachi Ltd Information analyzing device
JP2011103101A (en) * 2009-11-12 2011-05-26 Shunsuke Tajiri Information providing device and information providing method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
岡本 昌之: "ブログからの地域イベント情報抽出", 情報処理, vol. 第51巻 第1号, JPN6015008112, 15 January 2010 (2010-01-15), JP, pages 14 - 17, ISSN: 0003018250 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015207106A (en) * 2014-04-18 2015-11-19 富士通株式会社 Event occurrence place estimation method, event occurrence place estimation program and event occurrence place estimation apparatus
JP2016045938A (en) * 2014-08-20 2016-04-04 Kddi株式会社 Comment grouping program, server and method extracting area specific comments from many comments
JP2016081509A (en) * 2014-10-17 2016-05-16 富士ゼロックス株式会社 Method for renewing facility characteristics, method for profiling facilities and computer system
JP2019117670A (en) * 2014-10-17 2019-07-18 富士ゼロックス株式会社 Program for updating facility characteristic, program for profiling facility, computer system, and method for updating facility characteristic
CN106934005A (en) * 2017-03-07 2017-07-07 重庆邮电大学 A kind of Text Clustering Method based on density
JP2017216008A (en) * 2017-08-10 2017-12-07 株式会社ニコン Information processing apparatus
CN108153856A (en) * 2017-12-22 2018-06-12 北京百度网讯科技有限公司 For the method and apparatus of output information
CN108153856B (en) * 2017-12-22 2022-09-06 北京百度网讯科技有限公司 Method and apparatus for outputting information
CN110750646A (en) * 2019-10-16 2020-02-04 乐山师范学院 Attribute description extracting method for hotel comment text
CN110750646B (en) * 2019-10-16 2022-12-06 乐山师范学院 Attribute description extracting method for hotel comment text

Also Published As

Publication number Publication date
JP5725619B2 (en) 2015-05-27

Similar Documents

Publication Publication Date Title
US11870864B2 (en) System and method for automatic storyline construction based on determined breaking news
Xu et al. Crowdsourcing based description of urban emergency events using social media big data
US11153253B2 (en) System and method for determining and delivering breaking news utilizing social media
US10223465B2 (en) Customizable, real time intelligence channel
JP5725619B2 (en) Apparatus, program, and method for tagging position information with keywords based on a large number of comment sentences
US8805823B2 (en) Content processing systems and methods
US11361029B2 (en) Customized keyword query suggestions on online social networks
Xu et al. Building the multi-modal storytelling of urban emergency events based on crowdsensing of social media analytics
US10176265B2 (en) Awareness engine
CN112486917A (en) Method and system for automatically generating information-rich content from multiple microblogs
JP6130270B2 (en) Comment list public server, program and method for sorting and specifying comment sets corresponding to media contents
Troudi et al. A new mashup based method for event detection from social media
Pereira et al. The role of context in transport prediction
Jaiswal et al. Predicting time-sensitive user locations from social media
Kim et al. TwitterTrends: a spatio-temporal trend detection and related keywords recommendation scheme
JP6147629B2 (en) Page site server, program, and method for immediately displaying a point of interest for page content
KR102195686B1 (en) Apparatus and method of recommending items based on areas
Devkota et al. Utilizing user generated contents to describe tourism areas of interest
JP5836892B2 (en) Apparatus, program, and method for tagging identification name of geographical feature to event location
Xu et al. Crowd sensing of urban emergency events based on social media big data
JP5836902B2 (en) Event comment text detection device, program and method for detecting only comment text related to an event
JP6152333B2 (en) Apparatus, server, program, and method for specifying summary word corresponding to media content
KR20110039120A (en) Content recommendation list providing system based on location or social relationship
KR102279125B1 (en) Terminal and apparatus for providing recommendation information based on preference filter
Sueda et al. Social life logging: can we describe our own personal experience by using collective intelligence?

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150327

R150 Certificate of patent or registration of utility model

Ref document number: 5725619

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150