JP5102883B2 - ユーザ発言抽出装置とその方法と、プログラム - Google Patents
ユーザ発言抽出装置とその方法と、プログラム Download PDFInfo
- Publication number
- JP5102883B2 JP5102883B2 JP2011019782A JP2011019782A JP5102883B2 JP 5102883 B2 JP5102883 B2 JP 5102883B2 JP 2011019782 A JP2011019782 A JP 2011019782A JP 2011019782 A JP2011019782 A JP 2011019782A JP 5102883 B2 JP5102883 B2 JP 5102883B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- microblog
- utterance
- storage unit
- hash tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000000605 extraction Methods 0.000 title claims description 24
- 230000008569 process Effects 0.000 claims description 13
- 239000000284 extract Substances 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 10
- 230000001364 causal effect Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 3
- 240000005809 Prunus persica Species 0.000 description 2
- 235000006040 Prunus persica var persica Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 208000003443 Unconsciousness Diseases 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 229940025703 topical product Drugs 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
図3に、より具体的なイベント名マイクロブログ検索部114の機能構成例を示す。その動作フローを図4に示す。イベント名マイクロブログ検索部114は、イベント名マイクロブログ検索手段1140と、イベント名ハッシュタグ検出手段1141と、イベント名ハッシュタグ登場頻度保存手段1142と、イベント名ハッシュタグマイクロブログ検索手段1143と、を備える。
図6に、より具体的な個別要素マイクロブログ検索部116の機能構成例を示す。個別要素マイクロブログ検索部116は、個別要素マイクロブログ検索手段1160と、個別要素ハッシュタグ検出手段1161と個別要素ハッシュタグ登場頻度保存部1162と、個別要素ハッシュタグマイクロブログ検索手段1163と、を備える。
図7に、関係性計算部119のより具体的な機能構成例を示す。その動作フローを図8に示す。関係性計算部119は、関係性計算手段1190と、発言時間帯判定手段1191と、関連発言キーワード類似度計算手段1192と、同一ユーザイベント言及判定手段1193と、同一イベント個別要素包含判定手段1194と、を備える。
イベント起因性推定部117は、上記した4つの特徴量t,w,u,rを用いて、この発言がイベントに起因して成されたものか、それ以外が起因して成されたものなのかを推定し、イベント起因性と非起因性を計算する。イベント起因性の推定は、関係性計算部119で計算された事前確率と条件付確率を用いて行う。イベント起因性を推定するには様々な方法が考えられるが、この実施例では周知の単純ベイズ分類器と呼ばれる方法を使ってイベント起因性と、非起因性を推定する。
イベント起因性フィルタ部118は、イベント起因性推定部117によって計算された個別のマイクロブログ発言のイベント起因性と非起因性をもとに、イベント起因性よりも非起因性が大きいマイクロブログ発言に対し、非表示フラグを付与し、イベントメタデータ関連付けマイクロブログ発言保存部115に保存する。
ユーザインターフェース提供部120は、イベントメタデータ関連付けマイクロブログ発言保存部115から情報を取り出し、クライアント端末40に、要求された単位でマイクロブログ発言を通知する、クライアント端末40はユーザからの操作を受付、マイクログログ発言を取り出したいイベント名や個別要素の指定を受けてマイクロブログ発言をマイクロブログ検索サーバ30から取り出しユーザに提示する。イベントに関係するマイクロブログ発言は図9に示す通り、そのイベント名そのものに対応しているマイクロブログ発言と、各個別要素に対応しているマイクロブログ発言を合わせたものになる。個別要素に関係するマイクロブログ発言は、個々の個別要素に関係するもので且つ非表示フラグが付けられていないものだけを利用する。
Claims (7)
- イベントメタデータ提供サーバから少なくともイベントの識別子、イベント名称、イベントの時間帯、イベントに含まれる構成要素が対応付けて記録されているイベントメタデータを取得するイベントメタデータ取得部と、
上記イベントメタデータを保存するイベントメタデータ保存部と、
新たに保存されたイベントメタデータ及びイベント名とそれに対応付けられた個別要素を取得するイベント名・個別要素取得部と、
上記イベント名でマイクロブログ検索サーバを検索した検索結果のマイクロブログ発言をイベントメタデータ関連付けマイクロブログ発言保存部に保存すると共に、上記検索結果に含まれるハッシュタグの登場頻度とそれ以外のイベント名で検索した場合のハッシュタグの登場頻度とから当該イベント名に対応するハッシュタグを検出し、当該ハッシュタグで上記マイクロブログ検索サーバを検索したマイクロブログ発言も上記イベントメタデータ関連付けマイクロブログ発言保存部に保存するイベント名・マイクロブログ検索部と、
上記個別要素を検索キーにしてマイクロブログ検索サーバを検索した検索結果のマイクロブログ発言をイベントメタデータ関連付けマイクロブログ発言保存部に保存すると共に、上記マイクロブログ発言に含まれるハッシュタグの登場頻度と、それ以外の個別要素で検索した場合のハッシュタグの登場頻度を比較することにより上記個別要素に対応するハッシュタグを検出し、その検出したハッシュタグを検索キーにして上記マイクロブログ検索サーバを検索して検索したマイクロブログ発言も上記イベントメタデータ関連付けマイクロブログ発言保存部に保存する個別要素マイクロブログ検索部と、
上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されたマイクロブログ発言の中から上記イベント名のハッシュタグと個別要素のハッシュタグの両方を含むマイクロブログ発言を正解データとし、上記正解データ以外のマイクロブログ発言を不正解データとし、上記イベントメタデータを用いて上記マイクロブログ発言がイベントに起因するものである度合いを示す特徴量を計算し、上記正解データ及び上記不正解データと、上記特徴量との関係性を計算する関係性計算部と、
上記正解データ及び上記不正解データと上記特徴量との関係性とを入力として、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存された各々のマイクロブログ発言に対するイベント起因性及びイベント非起因性を計算するイベント起因性推定部と、
イベントメタデータ関連付けマイクロブログ発言保存部に保存された各々のマイクロブログ発言について、上記イベント起因性及びイベント非起因性の値に基づいてそのマイクロブログ発言を表示するか否かを判断した情報を付与して上記イベントメタデータ関連付けマイクロブログ発言保存部に保存するイベント起因性フィルタ部と、
上記イベントメタデータ関連付けマイクロブログ発言保存部からイベント名又は個別要素に対応するマイクロブログ発言をクライアント端末からの要求に応じて提供するユーザインターフェース提供部と、
を具備するユーザ発言抽出装置。 - 請求項1に記載したユーザ発言抽出装置において、
上記関係性計算部は、
上記特徴量と上記正解データ及び上記不正解データとの関係性として、上記正解データ及び上記不正解データの事前確率を計算すると共に、上記正解データ及び不正解データに対応する特徴量の条件付確率を計算するものであり、
上記イベント起因性推定部は、
上記特徴量と上記関係性計算部で計算された事前確率と条件付き確率とを用い、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されたマイクロブログ発言が、イベントに起因して成されたものかそれ以外が起因して成されたものなのかを推定し、イベント起因性と非起因性を計算するものであることを特徴とするユーザ発言抽出装置。 - 請求項1又は2に記載したユーザ発言抽出装置において、
上記イベント名・マイクロブログ検索部は、
上記イベント名で検索されたマイクロブログ発言にハッシュタグが出現する頻度を示すTF値と、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されている全てのイベント名に対応するマイクロブログ発言にハッシュタグが出現する頻度の逆数であるIDF値と、に基づいて算出されるTF−IDF値が基準値以上であるハッシュタグを上記イベント名に対応するハッシュタグとして検出することを特徴とするユーザ発言抽出装置。 - 請求項1乃至3の何れかに記載したユーザ発言抽出装置において、
上記個別要素マイクロブログ検索部は、
上記個別要素で検索されたマイクロブログ発言にハッシュタグが出現する頻度を示すTF値と、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されている全ての個別要素に対応するマイクロブログ発言にハッシュタグが出現する頻度の逆数であるIDF値と、に基づいて算出されるTF−IDF値が基準値以上であるハッシュタグを上記個別要素に対応するハッシュタグとして検出することを特徴とするユーザ発言抽出装置。 - 請求項1乃至4の何れかに記載したユーザ発言抽出装置において、
上記関係性計算部は、
上記イベントメタデータ関連付けマイクロブログ発言保存部に保存される各々の個別要素を含むマイクロブログ発言が、与えられたイベントの時間帯に成された発言か否かという情報を判断して特徴量tを出力する発言時間帯判定手段と、
上記マイクロブログ発言に含まれる単語の分布と、イベント名に対応する全てのマイクロブログ発言に含まれる単語の分布とから、各単語の有無を要素とするベクトル表現をそれぞれの単語集合について求め、その内積を類似度wとするイベント関連発言キーワード類似度計算手段と、
上記マイクロブログ発言と異なる他の発言をイベントメタデータ関連付けマイクロブログ発言保存部から取り出し、その中に同じユーザによる発言が含まれるか否かを判定して特徴量uを出力する同一ユーザイベント言及判定手段と、
上記マイクロブログ発言は、同じイベント名に含まれる別の個別要素を含んでいるか否かを判定して特徴量rを出力する同一イベント個別要素包含判定手段と、
上記した特徴量を入力として、上記マイクロブログ発言がイベントに起因したものである場合の事前確率とその条件付き確率と、上記マイクロブログ発言がイベントに起因したものでない場合の事前確率とその条件付き確率を計算する関係性計算手段と、
を備え、
上記イベント起因性推定部は、
上記した4つの特徴量t,w,u,rと関係性計算部で計算された事前確率と条件付き確率とを用い、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されたマイクロブログ発言が、イベントに起因して成されたものかそれ以外が起因して成されたものなのかを推定し、イベント起因性と非起因性を計算するものであることを特徴とするユーザ発言抽出装置。 - イベントメタデータ提供サーバから少なくともイベントの識別子、イベント名称、イベントの時間帯、イベントに含まれる構成要素が対応付けて記録されているイベントメタデータを取得するイベントメタデータ取得過程と、
イベントメタデータ保存部に新たに保存されたイベントメタデータからイベント名とそれに対応付けられた個別要素を取得するイベント名・個別要素取得過程と、
上記イベント名でマイクロブログ検索サーバを検索した検索結果のマイクロブログ発言をイベントメタデータ関連付けマイクロブログ発言保存部に保存すると共に、上記検索結果に含まれるハッシュタグの登場頻度とそれ以外のイベント名で検索した場合のハッシュタグの登場頻度とから当該イベント名に対応するハッシュタグを検出し、当該ハッシュタグで上記マイクロブログ検索サーバを検索したマイクロブログ発言も上記イベントメタデータ関連付けマイクロブログ発言保存部に保存するイベント名・マイクロブログ検索過程と、
上記個別要素を検索キーにしてマイクロブログ検索サーバを検索した検索結果のマイクロブログ発言をイベントメタデータ関連付けマイクロブログ発言保存部に保存すると共に、上記マイクロブログ発言に含まれるハッシュタグの登場頻度と、それ以外の個別要素で検索した場合のハッシュタグの登場頻度を比較することにより上記個別要素に対応するハッシュタグを検出し、その検出したハッシュタグを検索キーにして上記マイクロブログ検索サーバを検索して検索したマイクロブログ発言も上記イベントメタデータ関連付けマイクロブログ発言保存部に保存する個別要素マイクロブログ検索過程と、
上記イベントメタデータ関連付けマイクロブログ発言保存部に保存されたマイクロブログ発言の中から上記イベント名のハッシュタグと個別要素のハッシュタグの両方を含むマイクロブログ発言を正解データとし、上記正解データ以外のマイクロブログ発言を不正解データとし、上記イベントメタデータを用いて上記マイクロブログ発言がイベントに起因するものである度合いを示す特徴量を計算し、上記正解データ及び上記不正解データと、上記特徴量との関係性を計算する関係性計算過程と、
上記イベントメタデータと、上記正解データ及び上記不正解データと上記特徴量との関係性とを入力として、上記イベントメタデータ関連付けマイクロブログ発言保存部に保存された各々のマイクロブログ発言に対するイベント起因性及びイベント非起因性を計算するイベント起因性推定過程と、
イベントメタデータ関連付けマイクロブログ発言保存部に保存された各々のマイクロブログ発言について、上記イベント起因性及びイベント非起因性の値に基づいてそのマイクロブログ発言を表示するか否かを判断した情報を付与して上記イベントメタデータ関連付けマイクロブログ発言保存部に保存するイベント起因性フィルタ過程と、
上記イベントメタデータ関連付けマイクロブログ発言保存部からイベント名又は個別要素に対応するマイクロブログ発言をクライアント端末からの要求に応じて提供するユーザインターフェース提供過程と、
を備えるユーザ発言抽出方法。 - 請求項1乃至5の何れかに記載したユーザ発言抽出装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011019782A JP5102883B2 (ja) | 2011-02-01 | 2011-02-01 | ユーザ発言抽出装置とその方法と、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011019782A JP5102883B2 (ja) | 2011-02-01 | 2011-02-01 | ユーザ発言抽出装置とその方法と、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012160062A JP2012160062A (ja) | 2012-08-23 |
JP5102883B2 true JP5102883B2 (ja) | 2012-12-19 |
Family
ID=46840532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011019782A Expired - Fee Related JP5102883B2 (ja) | 2011-02-01 | 2011-02-01 | ユーザ発言抽出装置とその方法と、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5102883B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5836902B2 (ja) * | 2012-09-04 | 2015-12-24 | Kddi株式会社 | イベントに関するコメント文章のみ検出するイベントコメント文章検出装置、プログラム及び方法 |
WO2014097936A1 (ja) * | 2012-12-20 | 2014-06-26 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム、および情報処理システム |
JP2014175902A (ja) * | 2013-03-11 | 2014-09-22 | Nec Personal Computers Ltd | 情報処理システム、情報処理装置、情報処理方法、及び、プログラム |
-
2011
- 2011-02-01 JP JP2011019782A patent/JP5102883B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012160062A (ja) | 2012-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6449351B2 (ja) | ブロードキャストメッセージに対するオンラインユーザの反応を特定するためのデータマイニング | |
CN106331778B (zh) | 视频推荐方法和装置 | |
US11190821B2 (en) | Methods and apparatus for alerting users to media events of interest using social media analysis | |
US10521484B1 (en) | Typeahead using messages of a messaging platform | |
US11971925B2 (en) | Predicting topics of potential relevance based on retrieved/created digital media files | |
KR102112973B1 (ko) | 컴퓨터 실행 방법, 시스템 및 컴퓨터 판독 가능 매체 | |
US20130283303A1 (en) | Apparatus and method for recommending content based on user's emotion | |
US9059882B2 (en) | Information presentation control device and information presentation control method | |
US20130305280A1 (en) | Web Identity to Social Media Identity Correlation | |
CN112486917A (zh) | 从多个微博自动生成信息丰富的内容的方法以及系统 | |
US20160210367A1 (en) | Transition event detection | |
CN109255036B (zh) | 用于输出信息的方法和装置 | |
CN109255037B (zh) | 用于输出信息的方法和装置 | |
US20210365511A1 (en) | Generation and delivery of content curated for a client | |
CN110019948B (zh) | 用于输出信息的方法和装置 | |
JP5952711B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
CN110737845A (zh) | 一种实现信息分析的方法、计算机存储介质及系统 | |
US9020863B2 (en) | Information processing device, information processing method, and program | |
JP2014153977A (ja) | コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム | |
JP5102883B2 (ja) | ユーザ発言抽出装置とその方法と、プログラム | |
JP2015097026A (ja) | トレンド分析装置、トレンド分析方法およびトレンド分析プログラム | |
JP6036331B2 (ja) | 管理方法、管理装置および管理プログラム | |
TWI575391B (zh) | 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體 | |
JP6040137B2 (ja) | アイテム推薦装置、アイテム推薦方法およびアイテム推薦プログラム | |
US9886415B1 (en) | Prioritized data transmission over networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120918 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120928 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5102883 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |