JP2014130445A - 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム - Google Patents

情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム Download PDF

Info

Publication number
JP2014130445A
JP2014130445A JP2012287137A JP2012287137A JP2014130445A JP 2014130445 A JP2014130445 A JP 2014130445A JP 2012287137 A JP2012287137 A JP 2012287137A JP 2012287137 A JP2012287137 A JP 2012287137A JP 2014130445 A JP2014130445 A JP 2014130445A
Authority
JP
Japan
Prior art keywords
keyword
user
interest
local
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2012287137A
Other languages
English (en)
Inventor
Kenta Sasaki
健太 佐々木
Shinichi Nagano
伸一 長野
Akitsugu Ueno
晃嗣 上野
Kenta Cho
健太 長
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2012287137A priority Critical patent/JP2014130445A/ja
Priority to US14/138,759 priority patent/US9195735B2/en
Publication of JP2014130445A publication Critical patent/JP2014130445A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】テキストからユーザが関心のある情報を抽出できる情報抽出サーバを提供する。
【解決手段】関心キーワードが出現するテキストと、前記関心キーワードと、前記テキストの作成時刻を収集し、前記テキストに含まれる前記関心キーワード以外のキーワードと、前記作成時刻を抽出し、出現期間における前記キーワードの出現頻度から求めた時間スコアが第1閾値を超え、かつ、予め定めたローカルエリアにおける前記キーワードの出現頻度から求めたローカルスコアが第2閾値を超える前記キーワードを、ローカルホットワードとして抽出すると共に、抽出した前記キーワードの前記出現期間、前記キーワードに対応した前記関心キーワードを抽出し、抽出した前記ローカルホットワード、前記出現期間、前記関心キーワードを格納する。
【選択図】 図1

Description

本発明の実施形態は、関心情報を推定する情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラムに関するものである。
GPSを搭載した携帯端末では、GPSが常時稼働しているとは限らず、位置情報が部分的にしか記録されないことがあり、また、GPSを搭載しない携帯端末も存在する。そのため、携帯端末に入力したテキストから位置情報を推定する技術が提案されている。この技術は、「鎌倉と江の島あたり」といった位置情報が曖昧な文章に対して、位置情報を可能な限り正確に地図上にマッピングする。
特開2010−128898号公報 特開2010−20731号公報
しかし、上記従来技術では、テキスト中に「鎌倉」「江の島」などの位置キーワードが出現することを前提としており、位置キーワードが出現しないテキストの場合には、位置を特定できない。また、位置キーワードに限らず、テレビの番組キーワードなどのユーザが関心のあるキーワードが登場しないテキストでは、その関心のあるキーワードを特定できない。
そのため、ユーザが携帯端末上で、その関心のあるキーワードを用いてテキストを検索したり、整理できない。
また、前記テキストを管理するサーバにおいても、前記関心のあるキーワードが特定されていないため、そのテキストを前記関心のあるキーワードに基づいて整理できない。
そこで本発明の実施形態は、テキストからユーザが関心のある情報を抽出できる情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラムを提供することを目的とする。
本発明の実施形態は、ユーザが関心のある関心情報を示す関心キーワードが出現するテキストと、前記関心キーワードと、前記テキストの作成時刻とを収集する収集部と、
前記テキストに含まれる前記関心キーワード以外のキーワードと、前記作成時刻とを抽出するキーワード抽出部と、前記作成時刻から直近T1時間前までの出現期間における前記キーワードの出現頻度に基づく時間スコアが第1閾値を超え、かつ、特定の話題の範囲を示すローカルエリアにおける前記キーワードの出現頻度に基づくローカルスコアが第2閾値を超える前記キーワードを、ローカルホットワードとして抽出すると共に、抽出した前記キーワードの前記出現期間と、前記キーワードに対応した前記関心キーワードとを抽出するローカル抽出部と、抽出した前記ローカルホットワードと、前記出現期間と、前記関心キーワードとを格納するローカル格納部と、を備える情報抽出サーバである。
また、本発明の実施形態は、特定の話題の範囲を示すローカルエリア内で、かつ、特定の出現期間内のキーワードであるローカルホットワードを格納したローカル格納部を有する情報抽出サーバと通信を行うことができる情報抽出クライアントであって、ユーザが生成したユーザテキストを受け付ける受け付け部と、前記ユーザテキストに含まれるユーザキーワードと、前記ユーザテキストのユーザ作成時刻とを抽出するユーザワード抽出部と、前記ユーザキーワードと、前記情報抽出サーバの前記ローカル格納部に格納された前記ローカルホットワードとが一致し、かつ、前記ユーザ作成時刻が前記ローカルホットワードの前記出現期間に含まれる場合、前記ローカルホットワードに対応する前記関心情報を、前記ユーザテキストに対応する前記関心情報として特定する特定部と、前記関心情報を前記ユーザテキストに付与する付与部と、を有する情報抽出クライアントである。
第1の実施形態の情報抽出システムのブロック図。 テキスト格納部のデータを示す図。 ローカルワードの抽出例。 ローカル格納部のデータを示す図。 カテゴリ格納部のデータを示す図。 ユーザ格納部のデータを示す図。 クライアントに表示するUIの例。 クライアントのフローチャート。 サーバのフローチャート。 第2の実施形態の情報抽出システムのブロック図。 クライアントのフローチャート。 第3の実施形態の情報抽出システムのブロック図。 クライアントのフローチャート。 第4の実施形態のユーザ格納部のデータを示す図。
以下、一実施形態の情報抽出システム1を図面に基づいて説明する。情報抽出システム1は、ネットワークコミュニケーションを実現するためのシステムであり、情報抽出サーバ(以下、単に「サーバ」という)3と複数の情報抽出クライアント(以下、単に「クライアント」という)2から構成される。
クライアント2は、ユーザが利用する携帯端末などであって、インターネット4などのネットワークを用いて通信を行い、ユーザが作成したテキストをメールやコメントをサーバ3に送信する。
サーバ3は、ネットワークコミュニケーションを運営するサーバであって、クライアント3とインターネット4などのネットワークを介して通信を行い、ユーザが作成したメールやコメントをクライアント2から受信する。
最初に、本明細書で使用する言葉を定義する。
「ネットワークコミュニケーション」とは、例えば、SNS(ソーシャル・ネットワーキング・サービス)、Twitter(登録商標、以下同様)、mixi(登録商標)、facebook(登録商標)である。
「キーワード」とは、地名、人名、イベント名などの名詞である。
「ホットワード」とは、「トレンドワード」とも言い、特定の出現期間において複数のユーザが多く書き込んだキーワード(例えば、一定数以上書き込んだキーワード)、又は、特定のローカルエリアにおいて複数のユーザが多く書き込んだキーワード(例えば、一定数以上書き込んだキーワード)である。
「ローカルエリア」とは、特定の話題の範囲、さらに説明すれば、ユーザが書き込みを行なっている話題の範囲や分野であり、例えば、「地域」、「ジャンル」、「学校」などである。「ローカルエリア」は予め設定されていてよい。
「ローカルホットワード」とは、特定のローカルエリア内で、かつ、特定の出現期間内におけるキーワードを意味し、さらに説明すれば、特定のローカルエリア内で、かつ、特定の出現期間内において複数のユーザが多く書き込んでいるキーワードを意味する。以下、単に「ローカルワード」という。
「関心キーワード」とは、ユーザが関心のあるキーワードであって「関心情報」とも言い、例えば、「位置キーワード」「番組キーワード」である。
「位置キーワード」とは、位置に関するキーワードであり、位置情報を表し、例えば、「川崎」「浜松町」などの実在の地名、又は、「渋谷駅」「東京タワー」などのランドマークのように、位置を特定できる名称からなるキーワードである。これについては、第1〜第3の実施形態で説明する。
「番組キーワード」とは、放送局が放送している番組に関するキーワードであり、例えば、ドラマの場合には、出演者、登場人物名などである。これについては、第4の実施形態で説明する。
第1の実施形態
第1の実施形態の情報抽出システム1について図1〜図9に基づいて説明する。本実施形態では、ユーザの関心事が「位置」である。
情報抽出システム1の構成について図1に基づいて説明する。図1は、情報抽出システム1のブロック図を示す。
情報抽出システム1は、サーバ3と複数のクライアント2から構成される。クライアント2は、文字入力が可能な携帯端末であり、携帯電話、スマートフォン、タブレットPCなどであって、サーバ3へテキストをメールやコメントとして送信できる。サーバ3は、複数のクライアント2からメールやコメントを用いてユーザからのテキストを受信でき、位置キーワードが出現するテキストを収集すると共に、そのテキストからローカルワードを抽出する。
クライアント2は、受け付け部11、ユーザワード抽出部12、特定部13、付与部14、ユーザ格納部15を有する。
受け付け部11は、ユーザが生成したテキスト(以下、「ユーザテキスト」という)を受け付ける。
ユーザワード抽出部12は、ユーザテキストからキーワード(以下、「ユーザキーワード」という)と、そのユーザテキストの作成時刻を抽出する。なお、ユーザテキストの作成時刻とは、ユーザによりユーザテキストが書き込まれた時刻であってよい。
特定部13は、サーバ3で抽出したローカルワードと、ユーザキーワードに基づいて、位置情報を特定する。
付与部14は、特定した位置情報をユーザテキストに付与する。
ユーザ格納部15は、受け付けたユーザテキストと、付与した位置情報とを対応させて格納するデータベースである。
サーバ3は、収集部21、テキスト格納部22、キーワード抽出部23、ローカル抽出部24、ローカル格納部25、カテゴリ格納部26を有する。
収集部21は、インターネット4上のWebサイトなどから位置キーワードが出現するテキストを収集する。
テキスト格納部22は、収集したテキストを位置情報毎に格納するデータベースである。
キーワード抽出部23は、格納したテキストからキーワード、そのテキストの作成時刻を抽出する。
ローカル抽出部24は、キーワードからローカルワードを抽出する。
ローカル格納部25は、抽出したローカルワードを出現期間、位置情報(位置キーワード)毎に格納するデータベースである。
カテゴリ格納部26は、抽出対象とする位置情報(位置キーワード)、とその位置キーワードが属するカテゴリ分類を定義したデータベースである。
情報抽出システム1のデータについて図2〜図7に基づいて説明する。
図2に示すように、テキスト格納部22に格納されるデータは、収集部21が収集したテキスト、収集したテキストが作成された作成時刻、その収集したテキストに含まれる位置情報(位置キーワード)から構成される。位置情報は、カテゴリ格納部26に格納されているいずれかの位置情報と対応する。例えば、収集したテキストが「渋谷駅のAAAポスターがよい」、作成時刻が「2011年12月11日10時00分」、位置情報が「渋谷駅」である。
図4に示すように、ローカル格納部25に格納されるデータは、ローカルワード、出現期間、位置情報(位置キーワード)から構成される。位置情報は、カテゴリ格納部26に格納される位置情報のいずれかと対応する。例えば、ローカルワードが「AAAポスター」、出現期間が「2011年12月11日00時00分〜23時59分」、位置情報が「渋谷駅」であり、また、ローカルワードが「信号故障」、出現期間が「2011年12月12日00時00分〜23時59分」、位置情報が「渋谷駅」である。
図5に示すように、カテゴリ格納部26に格納されるデータは、カテゴリと位置情報が格納され、各位置情報が属するカテゴリが定義されている。ローカルワードの算出は、位置情報を基本の単位とする。図5に示す例では、位置キーワード(位置情報)が駅名であり、カテゴリが、その駅名を含む路線名である。カテゴリとは、位置情報単位で算出したローカルワードの結果を集約する単位である。また、各カテゴリに対して上位カテゴリ(親カテゴリ)を定義し、カテゴリ間の親子関係を定義してもよい。例えば、「東環状線」の親カテゴリとして「東エリア鉄道会社」と定義し、「西環状線」の親カテゴリとして「西エリア鉄道会社」と定義してもよい。この場合、駅名を表す位置情報毎に算出したローカルワードを、位置情報に対応したカテゴリ(路線名)毎に集計した後、さらに親カテゴリ(例えば、鉄道会社)毎に集計してもよい。
カテゴリには属性を付与してもよい。属性とはカテゴリを特徴付ける付加的な情報である。例えば、図5のカテゴリにおいて、東環状線がサービスを行う地域を矩形で指定し、4角の緯度経度をカテゴリ「東環状線」の属性として持ってもよい。また、上記したカテゴリ間の親子関係の例では、東エリア鉄道会社がサービスを行う地域を同様に矩形で指定し、4角の緯度経度をカテゴリ「東エリア鉄道会社」の属性として持ってもよい。これらの属性は、ユーザテキストから位置情報キーワードを抽出するときに、曖昧性解消、すなわち同名称の位置情報の判別の手がかりとして利用される。例えば、「神戸駅」は、現在、兵庫県、群馬県、愛媛県に存在する。ここで、「神戸駅」が出現するユーザテキストを考える。もし同じユーザテキストに他の駅名が出現していれば、カテゴリ格納部26の位置情報及びカテゴリを参照し、カテゴリの緯度経度を手がかりにして、どの「神戸駅」に該当するかを判定する。例えば、同じユーザテキストに「神戸駅」と「兵庫駅」が出現していれば、「兵庫駅」を含む路線「山陽本線」について言及していると判定し、兵庫県に存在する「神戸駅」であると結論付ける。
図6に示すように、ユーザ格納部15に格納されるデータは、ユーザテキスト、作成時刻、及び、位置情報から構成される。例えば、ユーザテキストが「AAAポスターがよい」、作成時刻が「2011年12月11日13時00分」、位置情報が「渋谷駅」である。但し、ユーザ抽出部12が抽出するのは、ユーザテキストと作成時刻のみであり、位置情報「渋谷駅」は、付与部14によって後から付与される。
クライアント2の表示装置に表示するUI(ユーザインタフェース、User Interface)には、各ユーザテキストに対して、位置情報をメタデータとして付与する。例えば、図7に示すように、ユーザテキストを一つずつ逆時系列順に並べ、書くユーザテキストに続けて、付与した位置情報を「#」の後に表示する。
情報抽出システム1の処理について図8と図9のフローチャートに基づいて説明する。
情報抽出システム1は、サーバ3が、テキストを収集して、この収集したテキストからローカルワードと位置情報を予め抽出しておき、それに基づいて、クライアント2がユーザテキストに位置情報を付与する。
サーバ3の処理について図9に基づいて説明する。下記で説明するサーバ3の処理は、一定期間(例えば、10分)毎に実施しても、又は、リアルタイムに実施してもよい。
ステップs201において、サーバ3の収集部21は、位置キーワードが出現するテキストを収集して、テキスト格納部22に格納する。収集元は、例えば、インターネット4であり、社内イントラネットなどのプライベートな情報源でもよい。収集したテキストは、作成時刻と共に、図2に示すように、位置情報毎に格納する。位置情報は、例えば、東環状線が停車する駅のように予め集合を決めておく。なお、位置情報は、カテゴリ格納部26に格納されている「位置情報」に対応している。例としては、収集したテキストが「渋谷駅のAAAポスターがよい」、作成時刻が「2011年12月11日10時00分」、位置情報が「渋谷駅」である。
ステップs202において、キーワード抽出部23は、収集したテキストからキーワード、位置情報、そのテキストが作成された作成時刻を抽出する。ここで、「位置情報」は、カテゴリ格納部26に格納されている位置情報に対応している。このときに、キーワード抽出部23は、ステップs201において収集対象とした位置キーワードを除くキーワードを抽出する。なお、キーワードは、複数抽出してもよい。収集したテキストが「渋谷駅のAAAポスターがよい」の場合には、「AAAポスター」をキーワードとして収集する。位置キーワード自身は、位置情報であって、ホットワードにはならない。
ステップs203において、ローカル抽出部24は、キーワード抽出部23が抽出したキーワードに関して、図3に示すように、時間軸のホットワードスコア(以下、単に「スコア」という)が閾値を超え、かつ、位置軸のスコアが閾値を超えるキーワードを、ローカルワードを抽出すると共に、そのキーワードの出現期間、位置情報も抽出する。このときに、「位置情報」は、カテゴリ格納部26に格納されている位置情報に対応し、「出現期間」は、作成時刻から直近24時間前の期間を設定する。例えば、作成時刻が2011年12月5日23時59分の場合には、出現期間は、「2011年12月5日00時00分〜2011年12月5日23時59分」である。
具体的には、ローカル抽出部24は、カテゴリ格納部26に格納される各位置情報に対して、式(1)及び式(2)を利用して、スコアを算出する。スコアには、時間スコアTSとローカルスコアLSとがある。時間スコアTSは、時間軸に沿ったキーワードの出現頻度の変化の度合いを数値化したものであり、ローカルスコアLSは、位置軸に沿ったキーワードの出現頻度の変化の度合いを数値化したものである。
下記の式(1)は、時間スコアTSを算出する方法を示している。

TS=(Tf_tgt(KW)/Tf_tgt(ALL))/(Tf_ref(KW)/Tf_ref(ALL))

・・・(1)

ローカル抽出部24は、式(1)に示すように、作成時刻から遡って直近1週間分の中で、出現期間(作成時刻から遡って直近24時間分)に偏って出現したキーワードを、キーワード抽出部23が抽出したキーワードから検出する。
Tf_tgt(KW)は、出現期間内の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)とキーワードKW(例えば、「AAAポスター」)とが同時に出現したテキストの数(出現頻度)である。「同時に出現」とは、共起と同じ意味である。
Tf_tgt(ALL)は、出現期間内の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)が出現したテキストの数(出現頻度)である。
Tf_ref(KW)は、作成時刻から遡って直近1週間分の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)とキーワードKW(例えば、「AAAポスター」)とが同時に出現したテキストの数(出現頻度)である。
Tf_ref(ALL)は、作成時刻から遡って直近1週間分の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)が出現したテキストの数(出現頻度)である。
下記の式(2)は、ローカルスコアLSを算出する方法を示している。

LS=(Lf_tgt(KW)/Lf_tgt(ALL))/(Lf_ref(KW)/Lf_ref(ALL))

・・・(2)

ローカル抽出部24は、式(2)に示すように、カテゴリ格納部26に格納された全ての位置情報に関連して出現するキーワードのうち、特定の位置情報との結びつきが強いものを、キーワード抽出部23が抽出したキーワードから検出する。
Lf_tgt(KW)は、出現期間内の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)とキーワードKW(例えば、「AAAポスター」)とが同時に出現したテキストの数(出現頻度)である。
Lf_tgt(ALL)は、出現期間の全てのテキストの中で特定の位置キーワード(例えば、「渋谷駅」)が出現したテキストの数(出現頻度)である。
Lf_ref(KW)は、出現期間内の全てのテキストの中で、予め設定されたローカルエリア(地域、例えば首都圏)内の全ての位置キーワード(例えば、首都圏の全ての駅)とキーワードKW(例えば、「AAAポスター」)とが同時に出現したテキストの数(出現頻度)である。すなわち、上記したように、ローカルホットワードは、特定の出現期間とこのローカルエリア(例えば、首都圏)内で数多く書き込まれているキーワードである。
Lf_ref(ALL)は、出現期間内の全てのテキストの中で、前記ローカルエリア(例えば、首都圏)内の全ての位置キーワード(例えば、首都圏の全ての駅)が出現したテキストの数(出現頻度)である。
このように、ローカル抽出部24は、キーワードKW毎に、式(1)及び式(2)を利用して時間スコアとローカルスコアをそれぞれ算出する。
上記説明では、テキストの数(出現頻度)をベースに算出しているが、スコアを算出できる方法であれば何でもよい。
また、作成時刻から遡って直近24時間(出現時間、Tf_tgtの時間)、又は、直近1週間の時間(Tf_refの時間)の設定は、本実施形態の適用分野(例えば鉄道情報やテレビ情報)などに応じて、変更してもよい。この場合に、Tf_tgtの時間<Tf_refの時間が条件である。
ステップs204において、ローカル抽出部24は、下記の式(3)、式(4)が示すように時間スコアTSとローカルスコアLSが共にそれぞれの第1閾値Rtime、第2閾値Rlocalを超えるキーワードを、ローカルワードとして抽出する。第1閾値Rtime、第2閾値Rlocalは、予め設定しておく。

TS>Rtime ・・・(3)

LS>Rlocal ・・・(4)

ステップs205において、ローカル抽出部24は、キーワード抽出部23が抽出したキーワードに関して、全ての時刻、全ての位置でローカルワードを抽出したか否かを判定する。
ローカル抽出部24は、全てのローカルワードを抽出した場合には、処理を終了する。抽出したローカルワードは、それが有効である出現期間と共に、図4に示すように、位置情報と関連付けて1つのレコードとしてローカル格納部25に格納される。
一方、ローカル抽出部24が、全てのローカルワードを抽出していない場合には、ステップs203に戻り、スコアを再度算出する。
なお、カテゴリ格納部26に格納されるデータに、カテゴリ間の親子関係を定義されている場合は、ローカル抽出部24は、式(1)及び式(2)のそれぞれで路線毎に算出した結果と、親子関係の定義を参照して、大きなカテゴリ(例えば、鉄道会社)単位に集計してもよい。これにより、ローカル抽出部24は、大きなカテゴリ(例えば、鉄道会社)毎のホットワードを抽出できる。
次に、クライアント2の処理について図8に基づいて説明する。
ステップs101において、クライアント2の受け付け部11は、ユーザが生成したユーザテキストを受け付ける。例えば、受け付け部11は、「AAAポスターの迫力がすごい」をユーザテキストとして受け付ける。なお、受け付け時間が、ユーザテキストのユーザ作成時刻となる。この受け付け方法は、必ずしもテキスト入力である必要はなく、例えば、音声入力を音声認識によりテキスト文書に書き起こしたものでもよい。
ステップs102において、ユーザワード抽出部12は、ユーザテキストからユーザキーワードと、それに対応するユーザ作成時刻を抽出する。この抽出方法は、サーバ3のキーワード抽出部23のキーワード抽出と同一の方法で行い、また、キーワードは複数抽出してもよい。ユーザワード抽出部12は、ユーザキーワードとして「AAAポスター」を抽出し、ユーザ作成時刻として「2011年12月11日13時00分」を抽出する。
ステップs103において、特定部13は、抽出したユーザキーワードが、ローカルワードであるか否かを判定する。
具体的な判定方法について説明する。
まず、特定部13は、サーバ3のローカル格納部25と通信を行い、抽出したユーザキーワードと一致するローカルワードであって、かつ、前記ユーザテキストの作成時刻が出現期間に含まれるローカルワードを特定する。ユーザキーワードが「AAAポスター」、ユーザ作成時刻が「2011年12月11日13時00分」の場合には、図4に示すように、ローカルワードの「AAAポスター」と一致し、ユーザ作成時刻も出現期間に含まれるので、特定部13は、この「AAAポスター」はローカルワードであると判定する。
ステップs104において、特定部13は、抽出したユーザキーワードがローカルワードである場合、そのローカルワードに対応する位置情報をローカル格納部25から取得する。例えば、特定部13は、「AAAポスター」がローカルワードと判定したので、その位置情報「渋谷駅」を取得する。
一方、特定部13は、抽出したキーワードがローカルワードでない場合には、処理を終了する。この場合、ユーザテキストには位置情報が付与されない。
ステップs105において、付与部14は、抽出した位置情報を元のユーザテキストに付与し、図6に示すようにユーザ格納部15に格納する。例えば、付与部14は、「AAAポスターの迫力がすごい」に位置情報「渋谷駅」を付与する。
また、付与部14は、格納した位置情報をメタデータとして、元のユーザテキストと共に、クライアント2のUIに表示してもよい。例えば、図7に示すように、ユーザテキストを一つずつ逆時系列順に並べ、付与した位置情報を「#」の後に表示する。この場合、付与部14は、「AAAポスターの迫力がすごい。#渋谷駅」と表示する。
本実施形態によれば、GPS測位情報なしで、ユーザテキストを受け付けたクライアント2の位置を把握できる。これにより、ユーザの状況により沿った情報配信などの位置情報サービスの実現できる。
また、ユーザがクライアント(携帯端末)2上で、その関心のあるキーワードを用いてテキストを検索したり、整理ができる。
また、テキストを送受信するサーバ3においても、位置キーワードが特定されているので、そのテキストを位置キーワードに基づいて管理、整理ができる。
第1の実施形態の変更例としては、ユーザテキストから推定した位置情報が「首都エリア放送」であったとする。このときに、ユーザがテレビを視聴している場所が含まれる放送局の放送エリアを仮想的な位置と見なすことができる。
第2の実施形態
第2の実施形態の情報抽出システム1について図10〜図11に基づいて説明する。図10は、情報抽出システム1のブロック図であり、図11はクライアント2の処理を示すフローチャートである。
本実施形態のサーバ3の構成と処理は、第1の実施形態と同様であるので説明は省略する。
クライアント2は、第1の実施形態におけるクライアント2の構成に、前後特定部16と判定部17が追加され、その処理としては、前後のユーザテキストの前後の位置情報を抽出するステップs106、前後の位置情報が元の位置情報と同じカテゴリに属しているか否かを判定するステップs107が追加されている。
第1の実施形態において、ユーザテキストがローカルワードを含んでいたとしても、そのローカルワードに対応する位置に必ずしもユーザが居るとは限らない。そこで、本実施形態のクライアント2は、図11のフローチャートに示す処理を行う。
ステップs101〜s104において、クライアント2は、第1の実施形態と同様の処理を行って、位置情報を付与したいユーザテキスト(以下、元のユーザテキストという)の位置情報を求め、ステップs106に進む。
ステップs106において、前後特定部16は、元のユーザテキストの前後に作成されたユーザテキストに関して、ステップs101〜s104と同様の方法を行い、前後の位置情報を抽出して、ステップs107に進む。前後のユーザテキストのユーザ作成時刻の範囲は予め決定しておき、例えば、元のユーザテキストのユーザ作成時刻を中心にして前後30分である。
ステップs107において、判定部17は、元のユーザテキストから判定した元の位置情報と、前後のユーザテキストから判定した前後の位置情報が同じカテゴリに属していれば、その元の位置情報にユーザが居る可能性が高いと判定し、ステップs105に進み(YESの場合)、同じカテゴリに属さない場合は終了する(NOの場合)。
ステップS105において、付与部14は、元のユーザテキストに元の位置情報を付与して、終了する、
例えば、ユーザテキストから判定した位置情報が「渋谷駅」であったとする。前後のユーザテキストから判定した前後(例えば、30分前、又は、30分後)の位置情報が「品川駅」であれば、「渋谷駅」と「品川駅」は、東環状線の駅であり、同じカテゴリに属する。そのため、ユーザは「渋谷駅」に居る可能性が高いので、判定部17は、ユーザテキストに「渋谷駅」という位置情報を付与する(図7参照)。
一方、前後(例えば、30分前、又は、30分後)の位置情報が「大阪駅」であれば、「渋谷駅」と「大阪駅」は同じカテゴリに属さない。そのため、ユーザは「渋谷駅」に居る可能性は低いので、付与部14は、ユーザテキストに「渋谷駅」という位置情報を付与しない。
前後の位置情報は、GPSなどのセンサから推定してもよい。その場合、例えば、最も直近、又は、直後にGPSから取得できた位置情報を前後の位置情報とする。
第2の実施形態の変更例としては、ユーザテキストから推定した位置情報が「首都エリア放送」であったとする。ユーザがテレビを視聴している位置を考えれば、放送局の放送エリアを仮想的な位置と見なすことができる。前後のユーザテキストから推定した前後の位置情報が「東京湾放送」であれば、「首都エリア放送」と「東京湾放送」は同じカテゴリ(放送エリア=位置)で視聴できる。そのため、ユーザは「首都エリア放送」の放送エリアに居る可能性が高いので、前後特定部16は、ユーザテキストに「首都エリア放送」という位置情報を付与する。一方、前後の位置情報が「兵庫エリア放送」であれば、「首都エリア放送」と「兵庫エリア放送」は同じカテゴリ(放送エリア=位置)で視聴することはできない。そのため、ユーザは「首都エリア放送」に居る可能性が低いので、前後特定部16は、ユーザテキストに「首都エリア放送」という位置情報を付与しない。
第3の実施形態
第3の実施形態の情報抽出システム1について図12〜図13に基づいて説明する。図12は情報抽出システム1のブロック図であり、図13はクライアント2の処理を示すフローチャートである。
本実施形態のサーバ3の構成と処理は、第1の実施形態と同様であるので説明は省略する。
クライアント2は、第1の実施形態におけるクライアント2の構成に、発言特定部18が追加され、処理としては、1次発言であるか否かを判定するステップs108が追加されている。なお、「1次発言」とは、ユーザが、ある話題や事例に対して発信した最初の発言である。
第2の実施形態で説明したように、ユーザテキストにローカルワードを含んでいたとしても、そのローカルワードに対応する位置に必ずしもユーザが居るとは限らない。そこで、本実施形態では、第2の実施形態とは異なる観点から上記問題点を解決する。
本実施形態では、ユーザテキストが1次発言である場合、ユーザテキストに位置情報を付与する。1次発言であれば、その位置情報にユーザが居る可能性が高いと判定できるからである。一般に、2次発言に位置キーワードが含まれる場合、2次発言の発言者であるユーザは当該位置には居らず、1次発言に対する意見や感想を述べたものであることが多い。
そこで、発言特定部18は、ユーザテキスト自体の文書構造を解析することにより、そのユーザテキストが他のユーザテキストを引用している場合、又は、他のユーザへの返信である場合には、1次発言ではないと判定し、それ以外の場合、1次発言であると判定する。
例えば、「このAAAポスター、どこで見たの?RT:@taroAAAポスターがよい。」の場合、Twitterでは「RT」より前が2次発言、「RT」より後ろが1次発言である。すなわち、他のユーザテキストを引用しているので、発言特定部18は、1次発言ではないと判定する。
また、「@taro早くAAAポスター見たいよ。」の場合、先頭に返信先のユーザ名を表す「@<ユーザ名>」が含まれている。すなわち、他のユーザへの返信であるので、発言特定部18は、1次発言ではないと判定する。
一方、「AAAポスターがよい。」であれば、「RT」を含まないため、他のユーザテキストの引用もなく、また、返信を表す「@<ユーザ名>」が含まれないため、他のユーザへの返信でもない。これより、発言特定部18は、1次発言であると判定し、元のユーザテキストに位置情報を付与する。
なお、本実施形態で説明した内容は、1次情報が表す内容についての信憑性を判定するものではなく、あくまでもテキストの文書構造を利用して、位置情報が示す場所に所在して言及した可能性が高い発言を抽出する。
1次発言であると判定されたユーザテキストは、第1の実施形態と同様に、クライアント2は、ステップs102以降のステップを実行し、ローカルワードを算出する。一方、1次発言でないと判定されたユーザテキストは、ユーザワード抽出部12によってローカルワードの算出を行わず、以降の処理を終了する。
以上により、本実施形態は、1次発言であるか否かのフィルタ条件が、第1の実施形態の前処理として追加された形となる。
第4の実施形態
第4の実施形態の情報抽出システム1について図14に基づいて説明する。
本実施形態のクライアント2とサーバ3の構成と処理は、第1の実施形態と同様である。第1〜第3の実施形態は、関心キーワード(関心情報)が位置キーワードで説明したが、本実施形態では、関心情報が番組名であり、関心キーワードが番組キーワードの場合について図14に基づいて説明する。
図14に示す例では、番組キーワード(関心情報)が、ある日ある時刻に東京で放送されるテレビの番組名であり、カテゴリが、その番組を放送している放送局名である。以下、情報抽出システム1の処理について説明する。
まず、サーバ3の収集部21は、インターネット4などから番組キーワードが出現するテキストを収集し、収集したテキストを番組情報毎にテキスト格納部22に格納する。
キーワード抽出部23は、格納したテキストから番組キーワード以外のキーワード、そのテキストの作成時刻を抽出する。
カテゴリ格納部26は、抽出対象とする番組情報(番組キーワード)、番組キーワードが属するカテゴリ分類を格納している。
ローカル抽出部24は、キーワードから、第1の実施形態と同様に時間スコアと番組スコアがそれぞれ閾値を超えるキーワードをローカルキーワードとして抽出する。式(1)における時刻は、予め設定した出現期間であり、式(2)におけるローカルエリアは、例えば、番組のジャンル(例えば、ニュース、ドラマ、歌番組、バラエティ)である。
ローカル格納部25は、抽出したローカルワードを出現期間毎、番組毎に格納する。
次に、ユーザは、ある番組をテレビで見ながら、携帯端末であるクライアント2でユーザテキストを入力する。例えば、受け付け部11が「タレントJは、かっこいい」と受け付ける。
ユーザ抽出部12は、「タレントJ」をユーザキーワードとして抽出し、そのユーザテキストの作成時刻も抽出する。
特定部13は、サーバ3で抽出しローカル格納部25で格納されているローカルワードと出現期間に基づき、ユーザキーワードから番組情報を特定する。
付与部14は、特定した番組情報をユーザテキストに付与する。
ユーザ格納部15は、受け付けたユーザテキストと、付与した番組情報とを対応させて格納する。
本実施形態によれば、番組名を入力することなしで、ユーザの番組情報を把握できる。
上記各実施形態の情報抽出システム1のクライアント2とサーバ3とは、CPU(Central Processing Unit)などの制御装置と、ROMやRAMなどの記憶装置と、HDDやSSDなどの外部記憶装置などを備えており、通常のコンピュータを利用したハードウェア構成で実現可能となっている。また上記各実施形態の上述した各部をソフトウェア的に実現してもハードウェア的にも実現してもよい。
変更例
上記各実施形態では、関心情報として「位置情報」「番組情報」で説明したが、これに限らず、例えば、学校の授業情報(例えば、経済学の授業)、歌手の曲名情報、スポーツの選手情報、映画館で上映される映画情報、劇場で公演される公演情報、遊園地の遊技施設情報、飛行機の便名情報、自動車の車種情報などである。
上記では本発明の一実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の主旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると共に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1・・・情報抽出システム、2・・・クライアント、3・・・サーバ、11・・・受け付け部、12・・・ユーザ抽出部、13・・・特定部、14・・・付与部、15・・・ユーザ格納部、21・・・収集部、22・・・テキスト格納部、23・・・キーワード抽出部、24・・・ローカル抽出部、25・・・ローカル格納部、26・・・カテゴリ格納部

Claims (13)

  1. ユーザが関心のある関心情報を示す関心キーワードが出現するテキストと、前記関心キーワードと、前記テキストの作成時刻とを収集する収集部と、
    前記テキストに含まれる前記関心キーワード以外のキーワードと、前記作成時刻とを抽出するキーワード抽出部と、
    前記作成時刻から直近T1時間前までの出現期間における前記キーワードの出現頻度に基づく時間スコアが第1閾値を超え、かつ、特定の話題の範囲を示すローカルエリアにおける前記キーワードの出現頻度に基づくローカルスコアが第2閾値を超える前記キーワードを、ローカルホットワードとして抽出すると共に、抽出した前記キーワードの前記出現期間と、前記キーワードに対応した前記関心キーワードとを抽出するローカル抽出部と、
    抽出した前記ローカルホットワードと、前記出現期間と、前記関心キーワードとを格納するローカル格納部と、
    を備える情報抽出サーバ。
  2. 前記ローカル抽出部は、
    前記出現期間において抽出した全ての前記テキストの中から、前記関心キーワードと前記キーワードとが同時に出現した出現頻度と、前記関心キーワードが出現した出現頻度との第1比率を求め、
    前記キーワードの前記作成時刻から直近T2時間分(但し、T1<T2である)において抽出した全ての前記テキストの中から、前記関心キーワードと前記キーワードが同時に出現した出現頻度と、前記関心キーワードが出現した出現頻度との第2比率を求め、
    前記第1比率と第2比率との比を前記時間スコアとして得る、
    請求項1に記載の情報抽出サーバ。
  3. 前記ローカル抽出部は、
    前記出現期間において抽出した全ての前記テキストの中から、前記関心キーワードと前記キーワードとが同時に出現した出現頻度と、前記関心キーワードが出現した出現頻度との第3比率を求め、
    前記出現期間において抽出した全ての前記テキストの中から、前記ローカルエリアに含まれる全ての前記関心キーワードと前記キーワードとが同時に出現した出現頻度と、前記ローカルエリアに含まれる全ての前記関心キーワードが出現した出現頻度との第4比率を求め、
    前記第3比率と第4比率との比を前記ローカルスコアとする、
    請求項1又は2に記載の情報抽出サーバ。
  4. 前記関心キーワードが、カテゴリ毎に分類されてカテゴリ格納部に格納され、
    前記ローカル抽出部は、前記カテゴリ格納部に格納された前記関心キーワードと前記カテゴリを用いて、抽出した前記ローカルホットワードを前記カテゴリ毎に集計する、
    請求項1乃至3のいずれか一項に記載の情報抽出サーバ。
  5. 前記関心キーワードが、位置キーワードであり、
    前記ローカルエリアが、特定の地域である、
    請求項1に記載の情報抽出サーバ。
  6. 前記関心キーワードが、放送局が放送する番組名を表す番組キーワードであり、
    前記ローカルエリアが、特定のジャンルである、
    請求項1に記載の情報抽出サーバ。
  7. 特定の話題の範囲を示すローカルエリア内で、かつ、特定の出現期間内のキーワードであるローカルホットワードを格納したローカル格納部を有する情報抽出サーバと通信を行うことができる情報抽出クライアントであって、
    ユーザが生成したユーザテキストを受け付ける受け付け部と、
    前記ユーザテキストに含まれるユーザキーワードと、前記ユーザテキストのユーザ作成時刻とを抽出するユーザワード抽出部と、
    前記ユーザキーワードと、前記情報抽出サーバの前記ローカル格納部に格納された前記ローカルホットワードとが一致し、かつ、前記ユーザ作成時刻が前記ローカルホットワードの前記出現期間に含まれる場合、前記ローカルホットワードに対応する前記関心情報を、前記ユーザテキストに対応する前記関心情報として特定する特定部と、
    前記関心情報を前記ユーザテキストに付与する付与部と、
    を有する情報抽出クライアント。
  8. 前記関心情報が付与するための元の前記ユーザテキストの前記ユーザ作成時刻と前後して作成された前後の前記ユーザテキストの前記関心情報を特定する前後特定部と、
    元の前記ユーザテキストの前記関心情報と前記前後関心情報とが同じカテゴリに属するか否かを判定する判定部と、
    をさらに有し、
    前記付与部は、同じカテゴリに属すると判定された場合に、元の前記ユーザテキストに前記関心情報を付与する、
    請求項7に記載の情報抽出クライアント。
  9. 前記ユーザテキストが1次発言であるのか否かを判定する発言特定部と、
    前記付与部は、前記ユーザテキストが前記1次発言であると判定された場合に、前記関心情報を付与する、
    請求項7に記載の情報抽出クライアント。
  10. ユーザが関心のある関心情報を示す関心キーワードが出現するテキストと、前記関心キーワードと、前記テキストの作成時刻とを収集し、
    前記テキストに含まれる前記関心キーワード以外のキーワードと、前記作成時刻とを抽出し、
    前記作成時刻から直近T1時間前までの出現期間における前記キーワードの出現頻度に基づく時間スコアが第1閾値を超え、かつ、特定の話題の範囲を示すローカルエリアにおける前記キーワードの出現頻度に基づくローカルスコアが第2閾値を超える前記キーワードを、ローカルホットワードとして抽出すると共に、抽出した前記キーワードの前記出現期間、前記キーワードに対応した前記関心キーワードとを抽出し、
    抽出した前記ローカルホットワードと、前記出現期間と、前記関心キーワードとを格納する、
    情報抽出方法。
  11. ユーザが生成したユーザテキストを受け付け、
    前記ユーザテキストに含まれるユーザキーワードと、前記ユーザテキストのユーザ作成時刻とを抽出し、
    前記ユーザキーワードと、前記格納された前記ローカルホットワードとが一致し、かつ、前記ユーザ作成時刻が前記ローカルホットワードの前記出現期間に含まれる場合、前記ローカルホットワードに対応する前記関心情報を、前記ユーザテキストに対応する前記関心情報として特定し、
    前記関心情報を前記ユーザテキストに付与する、
    請求項10に記載の情報抽出方法。
  12. ユーザが関心のある関心情報を示す関心キーワードが出現するテキストと、前記関心キーワードと、前記テキストの作成時刻とを収集する収集機能と、
    前記テキストに含まれる前記関心キーワード以外のキーワードと、前記作成時刻とを抽出するキーワード抽出機能と、
    前記作成時刻から直近T1時間前までの出現期間における前記キーワードの出現頻度に基づく時間スコアが第1閾値を超え、かつ、特定の話題の範囲を示すローカルエリアにおける前記キーワードの出現頻度に基づくローカルスコアが第2閾値を超える前記キーワードを、ローカルホットワードとして抽出すると共に、抽出した前記キーワードの前記出現期間と、前記キーワードに対応した前記関心キーワードとを抽出するローカル抽出機能と、
    抽出した前記ローカルホットワードと、前記出現期間と、前記関心キーワードとを格納するローカル格納機能と、
    をコンピュータに実現させるための情報抽出プログラム。
  13. ユーザが生成したユーザテキストを受け付ける受け付け機能と、
    前記ユーザテキストに含まれるユーザキーワードと、前記ユーザテキストのユーザ作成時刻とを抽出するユーザワード抽出機能と、
    前記ユーザキーワードと、前記ローカル格納機能で格納された前記ローカルホットワードとが一致し、かつ、前記ユーザ作成時刻が前記ローカルホットワードの前記出現期間に含まれる場合、前記ローカルホットワードに対応する前記関心情報を、前記ユーザテキストに対応する前記関心情報として特定する特定機能と、
    前記関心情報を前記ユーザテキストに付与する付与機能と、
    を前記コンピュータに実現させるための請求項12に記載の情報抽出プログラム。
JP2012287137A 2012-12-28 2012-12-28 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム Abandoned JP2014130445A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012287137A JP2014130445A (ja) 2012-12-28 2012-12-28 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム
US14/138,759 US9195735B2 (en) 2012-12-28 2013-12-23 Information extracting server, information extracting client, information extracting method, and information extracting program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012287137A JP2014130445A (ja) 2012-12-28 2012-12-28 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム

Publications (1)

Publication Number Publication Date
JP2014130445A true JP2014130445A (ja) 2014-07-10

Family

ID=51018416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012287137A Abandoned JP2014130445A (ja) 2012-12-28 2012-12-28 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム

Country Status (2)

Country Link
US (1) US9195735B2 (ja)
JP (1) JP2014130445A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045882A (zh) * 2015-07-21 2015-11-11 无锡天脉聚源传媒科技有限公司 一种热词处理方法及装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6089808B2 (ja) * 2013-03-11 2017-03-08 ブラザー工業株式会社 情報処理装置及びネットワークシステム
JP6083266B2 (ja) 2013-03-11 2017-02-22 ブラザー工業株式会社 情報処理装置及びネットワークシステム
US9318107B1 (en) * 2014-10-09 2016-04-19 Google Inc. Hotword detection on multiple devices
KR20170140808A (ko) * 2015-03-10 2017-12-21 에이심메트리카 랩스 인코퍼레이티드 단어 사이의 불확실성에 따른 단어 공백의 비대칭 포맷팅을 위한 시스템 및 방법
CN105653705B (zh) * 2015-12-30 2020-07-03 北京奇艺世纪科技有限公司 一种热门事件搜索方法和装置
JP6477648B2 (ja) * 2016-09-29 2019-03-06 トヨタ自動車株式会社 キーワード生成装置およびキーワード生成方法
US10402406B2 (en) * 2016-12-19 2019-09-03 Amadeus S.A.S. Predictive database for computer processes
CN107423444B (zh) * 2017-08-10 2020-05-19 世纪龙信息网络有限责任公司 热词词组提取方法和系统
CN110990708B (zh) * 2019-12-11 2023-05-02 Oppo(重庆)智能科技有限公司 热点事件确定方法、装置、存储介质及电子设备
CN112634904A (zh) * 2020-12-22 2021-04-09 北京有竹居网络技术有限公司 热词识别方法、装置、介质和电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001188987A (ja) 2000-01-05 2001-07-10 Matsushita Electric Ind Co Ltd 渋滞情報生成システムと車載器
JP5243783B2 (ja) 2007-12-27 2013-07-24 インターナショナル・ビジネス・マシーンズ・コーポレーション コミュニティ・システム、コミュニティ・システムの活動記録方法、及びコミュニティ・システムの活動記録用プログラム
JP2010020731A (ja) 2008-07-14 2010-01-28 Datasection Inc 情報分析装置及び情報分析プログラム
JP5185089B2 (ja) 2008-11-28 2013-04-17 株式会社デンソーアイティーラボラトリ コンテンツ位置推定装置
WO2011036754A1 (ja) 2009-09-24 2011-03-31 株式会社 東芝 交通情報提示装置及びプログラム
JP2012230496A (ja) 2011-04-25 2012-11-22 Toshiba Corp 情報処理装置、及び情報処理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045882A (zh) * 2015-07-21 2015-11-11 无锡天脉聚源传媒科技有限公司 一种热词处理方法及装置
CN105045882B (zh) * 2015-07-21 2018-09-25 无锡天脉聚源传媒科技有限公司 一种热词处理方法及装置

Also Published As

Publication number Publication date
US20140188883A1 (en) 2014-07-03
US9195735B2 (en) 2015-11-24

Similar Documents

Publication Publication Date Title
JP2014130445A (ja) 情報抽出サーバ、情報抽出クライアント、情報抽出方法、及び、情報抽出プログラム
US20230334044A1 (en) Retrieving context from previous sessions
CN107251006B (zh) 具有共享兴趣的消息的图库
US9418143B2 (en) Dynamic language model
US10831847B2 (en) Multimedia search using reshare text on online social networks
US10409873B2 (en) Searching for content by key-authors on online social networks
US9059882B2 (en) Information presentation control device and information presentation control method
CN110019645B (zh) 索引库构建方法、搜索方法及装置
JP5817572B2 (ja) サーバ装置、プログラム及び通信システム
JP5839978B2 (ja) ナビゲーション装置
US20200327283A1 (en) Information processing apparatus, computer program product, and computer readable medium
JP5836892B2 (ja) イベント位置に地理的な特徴物の識別名称をタグ付けする装置、プログラム及び方法
JP6586959B2 (ja) 情報処理装置、情報処理方法及びプログラム
Matsuo et al. Twitter photo geo-localization using both textual and visual features
JP2012160062A (ja) ユーザ発言抽出装置とその方法と、プログラム
US20140207915A1 (en) Computerized media information streaming system
US9430447B1 (en) Presenting media content based on parsed text
KR20140054493A (ko) 대화 서비스 제공 방법 및 장치
KR20120092500A (ko) 서버, 사전 생성 방법, 및 사전 생성 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체
TWI697789B (zh) 輿情查詢系統及方法
KR20160131981A (ko) 온라인 상에 게재된 웹 문서 기반 행사 이력 분석 시스템 및 방법
KR101827862B1 (ko) 사운드를 이용한 소셜 네트워크 서비스 제공 장치 및 방법
Lee et al. Design and Implementation of Location-Based Augmented Reality System Using Opinion Mining
JP2019008607A (ja) 映像管理サーバー及び映像管理システム
KR20110103147A (ko) 정규화된 입력폼을 활용한 디지털콘텐츠 등록방법 및 그 장치와 소셜 네트워크 시스템을 활용한 디지털콘텐츠 제공방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160331

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20160331