JP4496900B2 - Event information extraction apparatus and program - Google Patents
Event information extraction apparatus and program Download PDFInfo
- Publication number
- JP4496900B2 JP4496900B2 JP2004263725A JP2004263725A JP4496900B2 JP 4496900 B2 JP4496900 B2 JP 4496900B2 JP 2004263725 A JP2004263725 A JP 2004263725A JP 2004263725 A JP2004263725 A JP 2004263725A JP 4496900 B2 JP4496900 B2 JP 4496900B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- past
- attention
- information
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は、イベント情報抽出装置及びプログラムに係り、特に、季節のイベントやスポーツイベントなど、特定の日時に開始される事象に関する話題を提供する技術において、各種イベントについて記載された文書情報をインターネット等のネットワークに接続された1つ以上の情報提供サーバから取得し、イベントの注目度に応じて話題となる語句を抽出し、提供するためのイベント情報抽出装置及びプログラムに関する。 The present invention relates to event information extracting device及 beauty program, such as the Internet seasonal events, sporting events, in the art of providing a topic of events initiated at a specific date and time, the document information described for various events acquired from one or more information providing servers connected to the network etc., it extracts the phrases become the subject according to the attention level of the event, on the event information extracting device及 beauty program for providing.
近年、インターネットなどのコンピュータネットワークの発達に伴い、大量の電子化された文書情報が次々と蓄積され続けている。特に、掲示板やblogサービスを利用して個人が自分の興味のある事柄に対して感想や意見を発しにすることが容易に行なえるようになってきた。従って、ニュース情報や掲示板、blogなど、次々と発信される情報を数多く収集して解析すれば、最新の話題になっているニュースや出来事を把握することが可能となる。 In recent years, with the development of computer networks such as the Internet, a large amount of electronic document information has been accumulated one after another. In particular, it has become easier for individuals to use their bulletin boards and blog services to express their opinions and opinions on matters that interest them. Therefore, if a large amount of information transmitted one after another, such as news information, bulletin boards, and blogs, is collected and analyzed, it becomes possible to grasp the latest news and events.
従来、複数の情報提供サーバから発信された情報を、話題毎のカテゴリで分類し、その話題の時間遷移を提示・検索する情報潮流検索方法が提案されている(例えば、特許文献1参照)。 Conventionally, an information flow search method has been proposed in which information transmitted from a plurality of information providing servers is classified into categories for each topic, and the time transition of the topic is presented and searched (for example, see Patent Document 1).
この情報潮流検索方法では、ある期間において発信された文書集合から類似した文書同士を集め、カテゴリに割り当てるという処理を行っている。そのため、類似する文書が複数発信されてからしかカテゴリが割り当てられないため、話題となる情報が初めて発信されてから時間が経過した後でしか、話題を提示することができない。 In this information flow search method, processing is performed in which similar documents are collected from a document set transmitted in a certain period and assigned to a category. For this reason, since a category is assigned only after a plurality of similar documents are transmitted, the topic can be presented only after a lapse of time since the information on the topic is transmitted for the first time.
また、個人の興味の中には、イベント等の特定の日時に開始される事象も含まれており、大抵は事象を体験した後に、その感想や意見が記述され、発信される。そのため、イベントが終了した後でしか話題を提示することができない。
しかしながら、前述のように従来技術では、既にイベントが終了した後でしか話題を提供できず、これから話題になる可能性がある最新のイベント情報をいち早く提供することができない。 However, as described above, according to the conventional technology, a topic can be provided only after an event has already ended, and the latest event information that may become a topic cannot be provided quickly.
本発明は、上記の点に鑑みなされたもので、特定の時刻に開始される事象に対して事象が開始される以前に、利用者が興味をひく語句を提供することが可能なイベント情報抽出装置及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and is an event information extractor that can provide a user with an interesting phrase before an event is started for an event that starts at a specific time. and to provide a device及 beauty program.
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明は、季節やイベントやスポーツイベントなどの、特定の日時に開始されるイベントに関する話題を抽出するイベント情報抽出方法において、
イベントの開催日時や概要が記載されたイベント情報集合を蓄積するイベント情報蓄積手段からイベント名と開催期間を取得し(ステップ1)、時刻情報を持つ文書集合を蓄積する文書情報蓄積手段からイベント名を含む文書を検索して抽出し、イベント別にイベント別文書情報蓄積手段に格納する(ステップ2)イベント別文書抽出ステップと、
抽出した文書から指定した集計期間内の時刻情報を持つ文書をイベント毎に定期的に集計し、現在までの文書の集計値の総和を集計日数で除算した値を注目度として算出するイベント注目度算出ステップと(ステップ3)、
所定の条件を満たす注目度の高いイベントを選択し、該イベントの開始前である場合には、時間間隔T1で、該イベントの概要文を形態素解析し語句の出現位置や文字数に基づいて語句を抽出し、該イベントの開始後出る場合には、上記T1よりも小さい時間間隔T2で、イベント別文書情報蓄積手段に格納されている文書を形態素解析し、語句毎に出現する文書数を求め、出現する文書数が多い語句を抽出し、語句蓄積手段に出力する語句抽出ステップ(ステップ4)と、を行なう。
The present invention relates to an event information extraction method for extracting topics related to an event that starts at a specific date and time, such as a season, an event, or a sports event.
The event name and the period of the event are acquired from the event information storage means for storing the event information set in which the event date and time and the outline are described (step 1), and the event name is acquired from the document information storage means for storing the document set having time information. And a document extracting step by event, which is stored in the event-specific document information storage means by event (step 2),
An event attention level that calculates a document that has time information within the specified counting period from the extracted document for each event , and calculates the total value of the documents up to now divided by the total number of days as the attention level Calculating step (step 3);
When an event with a high degree of attention is selected that satisfies a predetermined condition and is before the start of the event, the summary sentence of the event is morphologically analyzed at time interval T1, and the phrase is determined based on the appearance position and the number of characters of the phrase. If the document is extracted and exits after the start of the event, the document stored in the event-specific document information storage means is morphologically analyzed at a time interval T2 smaller than T1, and the number of documents appearing for each word is obtained. A phrase extraction step (step 4) is performed in which phrases with a large number of appearing documents are extracted and output to the phrase storage means.
本発明は、イベント注目度算出ステップ(ステップ3)において、
指定した集計期間内に検索要求され、イベント名に一致する検索語から、検索語を入力した利用者を特定する情報を用いて、同一利用者が短い時間間隔で複数回同じキーワードを入力した場合には1回とカウントすることにより、イベントに関連する検索語の利用人数を集計し、文書からの集計値と検索語からの集計値を加えた合計値を定期的に求め、定期的に求めた合計値の現在までの総和を集計日数で除算した値を注目度として算出する。
The present invention provides an event attention level calculation step (step 3).
When the same user enters the same keyword more than once in a short time interval using information that identifies the user who entered the search term from the search terms that match the event name and requested during the specified aggregation period by counting a one-time, aggregated search terms using the number of which related to the event, regularly seeking the total value obtained by adding the aggregated value of the search words and aggregated value from the document to a regular The value obtained by dividing the total sum obtained up to the present by the total number of days is calculated as the attention level.
本発明は、イベント注目度算出ステップ(ステップ3)において、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値の総和である過去注目度を前記終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を、現在までの文書の集計値の総和に加算し、過去のイベント開催日数と集計日数とを加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける文書からの集計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する。
The present invention provides an event attention level calculation step (step 3).
For the event before the event, the past attention level that is the sum of the total values from the past documents in the past event with the same event name is searched from the end event accumulation means, and the past attention level of the searched past event is determined , Add to the sum of the document totals up to now, and calculate the value of attention divided by the number of days of past event days and the total number of days, and for events after the end, after a preset period, A value obtained by adding all the total values from documents in the event held this time is accumulated in the end event accumulation means as a past attention degree.
本発明は、イベント注目度算出ステップ(ステップ3)において、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値と検索語からの集計値との合計値の総和である過去注目度を終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を定期的に求めた合計値の現在までの総和に加算し、過去のイベント開催日数と集計日数を加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける合計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する。
The present invention provides an event attention level calculation step (step 3).
For events prior to the event, search the past event accumulation means for past attention, which is the sum of the total values from past documents and the total values from the search terms for past events with the same event name. After adding the past attention degree of the past event that has been obtained to the sum of the total values obtained up to the present time, the value obtained by dividing the past event holding days and the total number of days is calculated as the attention degree. For the event, a value obtained by adding all the total values in the event held at this time is stored in the end event storage means as a past attention level after a preset period.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項1)は、季節やイベントやスポーツイベントなどの、特定の日時に開始されるイベントに関する話題を抽出するイベント情報抽出装置100であって、
イベントの開催日時や概要が記載されたイベント情報集合を蓄積するイベント情報蓄積手段201からイベント名と開催期間を取得し、時刻情報を持つ文書集合を蓄積する文書情報蓄積手段202からイベント名を含む文書を検索して抽出し、イベント別にイベント別文書情報蓄積手段103に格納するイベント別文書抽出手段101と、
抽出した文書から指定した集計期間内の時刻情報を持つ文書をイベント毎に定期的に集計し、現在までの文書の集計値の総和を集計日数で除算した値を注目度として算出するイベント注目度算出手段102と、
所定の条件を満たす注目度の高いイベントを選択し、該イベントの開始前である場合には、時間間隔T1で、該イベントの概要文を形態素解析し語句の出現位置や文字数に基づいて語句を抽出し、該イベントの開始後である場合には、上記T1よりも小さい時間間隔T2で、イベント別文書情報蓄積手段103に格納されている文書を形態素解析し、語句毎に出現する文書数を求め、出現する文書数が多い語句を抽出し語句蓄積手段204に出力する語句抽出手段104と、を有する。
The present invention (Claim 1) is an event
The event name and holding period are acquired from the event
An event attention level that calculates a document that has time information within the specified counting period from the extracted document for each event , and calculates the total value of the documents up to now divided by the total number of days as the attention level Calculating means 102;
When an event with a high degree of attention is selected that satisfies a predetermined condition and is before the start of the event, the summary sentence of the event is morphologically analyzed at time interval T1, and the phrase is determined based on the appearance position and the number of characters of the phrase. If it is extracted and after the start of the event, the document stored in the event-specific document information storage means 103 is morphologically analyzed at a time interval T2 smaller than T1, and the number of documents appearing for each phrase is determined. And a
本発明(請求項2)は、イベント注目度算出手段102において、
指定した集計期間内に検索要求され、イベント名に一致する検索語から、検索語を入力した利用者を特定する情報を用いて、同一利用者が短い時間間隔で複数回同じキーワードを入力した場合には1回とカウントすることにより、イベントに関連する検索語の利用人数を集計し、前記文書からの集計値と検索語からの集計値を加えた合計値を定期的に求め、定期的に求めた合計値の現在までの総和を前記集計日数で除算した値を注目度として算出する手段を含む。
According to the present invention (claim 2), the event attention level calculation means 102
When the same user enters the same keyword more than once in a short time interval using information that identifies the user who entered the search term from the search terms that match the event name and requested during the specified aggregation period by counting a one-time, aggregated search terms using the number of which related to the event, regularly seeking the total value obtained by adding the aggregated value of the search words and aggregated value from the document to, Means for calculating as a degree of attention a value obtained by dividing the total sum obtained up to now by the total number of days .
本発明(請求項3)は、過去のイベント名に対応する過去注目度が格納された終了イベント蓄積手段を更に有し、
イベント注目度算出手段102において、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値の総和である過去注目度を終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を、現在までの文書の集計値の総和に加算し、過去のイベント開催日数と集計日数とを加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける文書からの集計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する手段を含む。
The present invention (Claim 3) further includes an end event accumulation unit that stores past attention levels corresponding to past event names,
In event attention level calculation means 102,
For events before the event, search the past attention level from the end event storage means, which is the sum of the aggregated values from past documents for past events with the same event name , added to the sum of the aggregate value of the document up to, to calculate the value obtained by dividing the number of days for which the sum of the aggregate number of days in the past of the event held on the number of days as the degree of attention, for after the end of the event, after a period which is set in advance, this time Means for accumulating in the end event accumulating means as a past attention level a value obtained by adding all the total values from documents in the held event .
本発明(請求項4)は、過去のイベント名に対応する過去注目度が格納された終了イベント蓄積手段を更に有し、
イベント注目度算出手段102において、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値と検索語からの集計値との合計値の総和である過去注目度を前記終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を定期的に求めた合計値の現在までの総和に加算し、過去のイベント開催日数と前記集計日数を加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける合計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する手段を含む。
The present invention (Claim 4) further includes an end event accumulation means in which past attentions corresponding to past event names are stored,
In event attention level calculation means 102,
For the event before the event, the past event degree is searched from the end event accumulation means, which is the sum of the total value of the total value from the past document and the total value from the search word in the past event having the same event name, The past attention degree of the past events searched is added to the total sum obtained up to the present , and the value obtained by dividing the past event holding days and the total number of days is calculated as the attention degree. The event after the end includes means for accumulating a value obtained by adding all the total values of the currently held event as a past attention degree in the end event accumulating means after a preset period.
本発明(請求項5)は、請求項1乃至4のいずれか1項に記載のイベント情報抽出装置の各手段としてコンピュータを機能させるためのイベント情報抽出プログラムである。 The present invention (Claim 5 ) is an event information extraction program for causing a computer to function as each means of the event information extraction apparatus according to any one of Claims 1 to 4 .
上記のように、本発明によれば、特定の期間開催されるイベントの注目度を算出し、これから開始されるイベントについては、内容を紹介したイベント情報(例えば、主催者の案内文)の中から語句を抽出することで、イベントが開始される前に話題になる可能性のある情報を提供することができる。 As described above, according to the present invention, the degree of attention of an event held for a specific period is calculated, and for an event to be started from now on, event information that introduces the content (for example, a guide text of the organizer) is included. By extracting a phrase from, information that may become a topic before the event is started can be provided.
また、イベントが開始されてからは、イベントを見ている人々が発信する文書情報(例えば、クチコミ情報)から話題になっている語句を抽出し、提供することができる。 In addition, after the event is started, it is possible to extract and provide a word / phrase that is a topic from document information (for example, word-of-mouth information) transmitted by people watching the event.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態におけるイベント情報抽出装置の構成を示す。 FIG. 3 shows the configuration of the event information extraction device in one embodiment of the present invention.
同図に示すイベント情報抽出装置100は、イベント情報蓄積部201、文書情報蓄積部202、検索語蓄積部203からの情報を入力とし、語句蓄積部204に抽出した語句を出力する。
The event
イベント情報抽出装置100は、イベント情報抽出部101、イベント注目度算出部102、イベント別文書情報蓄積部103、語句抽出部104、終了イベント蓄積部105から構成される。
The event
イベント情報蓄積部201には、イベント情報が蓄積されている。図4に、イベント情報蓄積部201の例を示す。同図に示すように、イベント情報は、イベント名401、開始日402、終了日403、時刻404、場所405、概要文406などのイベントに関する情報から構成されている。
The event
文書情報蓄積部202には、ホームページやblog、掲示板などのインターネット上で公開されている文書情報から、新しく生成された文書情報や更新された文書情報が収集され、作成日時や更新日時などの時刻情報と共に蓄積されている。これらの文書情報からは、イベントを体験した人々のイベントに対する感想や、イベントの開催状況を紹介したニュース記事などを収集することができる。
The document
検索語蓄積部203には、インターネット上で検索サービスを提供する検索サイトにおいて、利用者により入力された検索語が収集され、検索要求された時刻と共に蓄積されている。検索語は、利用者が関心を持っている情報を探す手掛かりとして入力する語であるから、定期的に検索語を収集し、解析することで、利用者の関心が高かった情報を知ることができる。
The search
イベント注目度算出部102は、定期的にイベント情報蓄積部201からイベント情報を取得し、イベント名別に管理する。イベント情報は短くても開催数日前にイベント情報蓄積部201に登録されると考えられるので、イベント注目度算出部102の処理を1日1回実行したとしても、イベント開催前にイベントの注目度算出することが可能である。
The event attention
また、イベントが終了するとイベントに関する新しい情報は収集できなくなる(イベントに参加した人々の感想や体験談もイベント終了後数日でなくなる傾向にある)ので、管理するイベントから削除する。 Also, when the event ends, new information about the event cannot be collected (the impressions and experiences of people who participated in the event tend to disappear within a few days after the event ends), and are deleted from the managed event.
図5に、イベント注目度算出部102で蓄積される情報の例を示す。同図(a)は、イベント別集計結果テーブル500の構成例であり、イベント情報蓄積部201から新しいイベント情報を取得し、イベント毎にイベントを識別するための一意な番号であるイベントID501を付与し、イベント情報を管理している。
FIG. 5 shows an example of information accumulated in the event attention
イベント名502は、イベントの名称、開始日503はイベントの開始日、終了日504はイベントの終了日であり、時刻505は1日の中でイベントが開催されている開始時刻と終了時刻が記録される。
The
過去注目度506は、過去に同様のイベントが開催されていた際の注目度であり、新しいイベントをイベント別集計結果テーブル500に追加する際に終了イベント蓄積部105を検索して記録される。
The past attention level 506 is the attention level when a similar event has been held in the past, and is recorded by searching the end
次回語句抽出日時507は、イベントに関連する語句を抽出する間隔を制御するための時刻情報であり、語句抽出部104において語句抽出処理が行なわれる際に次回語句抽出日時が更新される。
The next word / phrase extraction date /
集計終了日時508は、イベントが終了した後の日時に設定され、集計終了日時508を過ぎたイベントはイベント別集計結果テーブル500から削除される。
The count end date and
集計値509は、イベントの注目度を算出する際に使用するデータであり、一定期間毎のデータを特定の期間分蓄積することができる。また、集計データ509の値と、過去注目度506の値から同図(b)に示すようなイベント注目度のランキングを生成する。イベント注目度は、あまり短い間隔で算出しても変化がなく、一方、あまり長い間隔で算出すると、注目され始めてから時間が経過してしまうという問題がある。また、新しいイベントが追加されたら、追加されたイベントの注目度を算出する必要がある。そこで、イベント別集計結果テーブルに500に新しいイベントを追加した後で、イベント注目度のランキング生成処理を実行するように構成する。例えば、イベントの追加処理が1日に1回であれば、ランキング生成処理も1日に1回実行する。
The
イベント情報抽出部101は、イベント注目度算出部102における処理とは独立に実行される。検索語蓄積部201には次々と新しい検索語が蓄積され、文書情報蓄積部202にも同様に次々と収集された新しい文書情報が蓄積されている。イベント情報抽出部101は、検索語蓄積部201と文書情報蓄積部202に蓄積されている情報を定期的に取得し、イベントに関連する情報だけを抽出する。ここでの抽出間隔が、利用者に情報を提供する最小の間隔になる。まず、イベント注目度算出部102からイベント名を取得し、検索語蓄積部203から取得した検索語からイベント名に一致する検索語を集計する。また、文書情報蓄積部202から取得した文書情報から、イベント名を含む文書情報をイベント名毎に集計する。そして、検索語から集計した集計値と文書情報から集計した集計値とを加算し、イベント注目度算出部102のイベント別集計結果テーブル500の集計値509欄に記録する。また、イベントに関連した文書情報をイベント毎に整理してイベント別文書情報蓄積部103に記録する。
The event
語句抽出部104は、イベント情報抽出部101の処理終了後、イベント注目度算出部102から注目度の高いイベント名を取得し、注目度の高いイベントが開催前であればイベント情報蓄積部201から概要文を取得し、話題となる語句を抽出して語句蓄積部204に出力する。注目度の高いイベントの開催後は、イベント別文書情報蓄積部103から文書情報を取得し、話題を表す語句を抽出し、語句蓄積部204に出力する。終了したイベントは、数日すると注目度の高いイベントして取得されなくなり、語句の抽出も終了する。
After the processing of the event
イベント開催前において、イベントに関心のある人々が記載した文書情報があったとしても、イベントの概要文より多くの情報が含まれていることはないため、イベント情報蓄積部201の概要文406から語句の抽出を行なう。また、イベント情報蓄積部201におけるイベント情報は頻繁に更新されることはないため(一旦登録された後は、変更があった場合のみ更新される)、イベント開催前の語句抽出処理は頻繁に行なう必要がない。例えば、1日1回程度で充分だと考えられる。より効率的には、イベント情報蓄積部201において登録及び更新されたイベント情報を識別するための識別情報をイベント毎に付与し、識別情報をチェックすることにより登録及び更新時にのみ語句抽出処理を実行するよう構成してもよい。この場合、語句抽出処理が終了した時点で、前述の識別情報をリセットする必要がある。
Even if there is document information written by people who are interested in the event before the event is held, the information does not contain more information than the summary text of the event. Extract words. In addition, since the event information in the event
イベント開催期間中は、イベントに関心のある人々が、次々と新しい文書情報を公開するので、語句抽出処理の間隔を短くし、最新の情報を次々と利用者に提供可能とする。イベント終了後は、新しい情報が少なくなり、イベント終了後にイベントに関する話題を提供しても利用者が次回の参考にするしかない。そのため、イベント終了後の語句抽出処理はイベント開催期間中に比べ長く設定する。このように、イベント開催中は語句抽出処理を頻繁に実行し、常に最新の話題を提供することが可能であり、イベント開催前と終了後の語句抽出処理は間隔を開けて実行することにより、語句抽出処理の負荷を軽減させることが可能となる。 During the event period, people interested in the event release new document information one after another, so the interval of the phrase extraction process is shortened and the latest information can be provided to users one after another. After the event, new information is reduced, and users can only refer to the next time to provide topics about the event after the event. Therefore, the word / phrase extraction process after the end of the event is set longer than during the event holding period. In this way, it is possible to frequently execute the phrase extraction process during the event and always provide the latest topics, and by performing the phrase extraction process before and after the event at intervals, It is possible to reduce the load of the phrase extraction process.
図6に語句蓄積部204に出力される語句の蓄積例を示す。抽出された語句1004は、イベント名1001、イベントの開始日1002、終了日1003に対応付けられて蓄積される。定期的にイベント情報抽出部101と語句抽出部104の処理を実行することにより、注目度の高いイベントと、そのイベントの話題を表す語句が、次々と出力される。語句蓄積部204には、イベントの開始日1002、終了日1003が記録されているので、今開催中の注目イベントでは何が話題になっているか、あるいは、これからどんな注目イベントが開催されるのか、といった情報提供が可能となる。
FIG. 6 shows an example of storage of words output to the
図7に、イベント情報抽出装置100の各処理のタイミングを、イベント名「イベントA」を例として図示している。まず、「イベントA」がイベント情報蓄積部201(図4,401)に登録される。登録後イベント注目度算出部102が起動されると、図5のイベント別集計結果テーブル500に「イベントA」を追加し、イベントID「0000101を付与して管理する。図4における「イベントA」の開始日402、終了日403、時刻404を、図5の開始日503、終了日504、時刻505にコピーする。
In FIG. 7, the timing of each process of the event
続いて「イベントA」に対して終了イベント蓄積部105を検索し、過去に同様のイベントが開催され、どの程度の注目度であったかを調べる。終了イベント蓄積部105は、図8に示すように、イベント名1101、開始日1102、終了日1103、過去注目度1104から構成される。イベント名「イベントA」で終了イベント蓄積部105のイベント名を検索する。この際、「イベントA」に年号などが含まれる場合には、年号を除いた文字列で検索を行ない、終了イベント蓄積部105のイベント名1101の欄から文字列を含むイベント名を取得する。検索の結果、複数のイベント名が取得できた場合は、終了日の新しいイベントを選択し、対応する過去注目度1104を取得する。図5のイベント別集計結果テーブル500の例は、「イベントA」の検索結果として、イベントが取得できなかった例であり、過去注目度は空欄とする。また、「イベントC」については過去イベント蓄積部105を検索した結果「イベントX」が取得された例であり、過去注目度「30」を取得し、イベント別集計結果テーブル500の過去注目度506に「30」を記録している。
Subsequently, the end
新しくイベントを追加した際の次回語句抽出日時507の欄は、空のままにしておく。
The column for the next word extraction date and
集計終了日時508は、イベント終了日時の5日後「2004年9月5日 17:00:00」に設定する。集計終了日時を過ぎたイベントは、イベント別集計結果テーブル500から削除される。集計終了日時508は、イベント終了日時に何日かを加算して設定するが、加算する日数は予めイベントに関連する文書数や検索語数の推移を調査することにより決定しておく。加算する日数は、イベントによらず、全て同じ日数に設定してもよいし、イベントのタイプによって人々の関心が消えるスピードが異なる場合を考慮し、イベントのタイプ別に日数を設定してもよい。例えば、花火大会など1日しか行なわれないイベントの場合は、2日程度で人々の関心がなくなる傾向がある。タイプ別に日数を設定する場合は、タイプを決定するためのルール(例えば、イベント名に「花火」を含む)を定め、ルールにマッチするイベントに対して、タイプ毎に決定した日数を設定する。
The aggregation end date and
続いて、イベント注目度算出部102において、イベント注目度のランキングを生成し、イベント注目度テーブル510に記録する。
Subsequently, the event attention
図9は、本発明の一実施の形態におけるイベント注目度算出部のランキング生成処理の流れを示す図である。 FIG. 9 is a diagram showing a flow of ranking generation processing of the event attention level calculation unit according to the embodiment of the present invention.
まず、イベント別集計結果テーブル500から全てのイベントID集合を取得し(ステップ101)、イベントID集合からイベントを1つ取り出し(ステップ103)、イベントが開催前かどうか調べる(ステップ104)。開催前であれば(ステップ104、Yes),過去注目度506と現在までの集計値を元にイベント注目度を以下の式により算出する(ステップ105)。
First, all event ID sets are acquired from the event totaling result table 500 (step 101), one event is extracted from the event ID set (step 103), and it is checked whether the event is before the event (step 104). If it is before the event (
ステップ101で取得したイベントID集合の全てに対してステップ103〜ステップ109までの条件に一致する処理を実行し、全てのイベントIDに対して処理が終了したら(ステップ102、Yes)、イベントID毎に算出したイベント注目度を注目度の高い順にランクを付け、イベント注目度テーブル510に出力する。この例では、現在のイベント注目度は、1日あたり平均注目数であり、過去注目度は、イベント開催前から終了後までの人々の関心があった期間全体にわたっての注目数である。常に関心が高いイベントについては、1日あたりの平均注目数(=イベント注目度)が略一定になり、イベントが開始された直後にのみ関心が高かったイベントについては、イベント開催期間が長くなるにつれ、1日あたりの平均注目数(=イベント注目度)が低くなる。
When processing that matches the conditions from
イベント情報抽出部101は、常に一定間隔でイベント注目度算出部102からイベント名を取得し、イベントに関連する情報を抽出する。そのため、「イベントA」がイベント注目度算出部102のイベント別集計結果テーブル500に追加後、イベント情報抽出部101の処理が起動されると、「イベントA」に関連した文書情報が抽出され始める。イベント情報抽出部101は、イベント別集計結果テーブル500から「イベントA」が削除されるまでの期間、定期的に(例えば1時間間隔)で処理を実行する。イベント情報抽出部101の処理により、イベント別集計結果テーブル500の集計値509に文書情報と検索語の集計値が1時間おきに記録されていく。また、イベント別文書情報蓄積部103にイベント別に整理された文書情報が蓄積されていく。
The event
イベント情報抽出部101の処理の流れについて図10を用いて説明する。
The process flow of the event
図10は、本発明の一実施の形態におけるイベント情報抽出部の処理の流れを示す図である。 FIG. 10 is a diagram showing a flow of processing of the event information extraction unit in one embodiment of the present invention.
イベント情報抽出部101は、まず、イベント注目度算出部102から、イベントIDとイベント名を取得する(ステップ201)。次に、検索語蓄積部201から時刻範囲を指定して検索語を取得し(ステップ202)、イベント名と一致する検索語を、イベント名毎に集計する(ステップ203)。ここで指定する時刻範囲は、1時間おきに処理が実行される場合であれば、現在時刻よりも前の1時間とし、次回指定する時刻範囲は、今回指定した時刻範囲に連続した1時間とする。
The event
検索語は、同一利用者が複数回入力することが考えられる。そのため、検索語を入力した利用者を特定する情報(例えば、WebブラウザのCookie情報)により、同一利用者が短い時間間隔で複数回同じキーワードを入力した場合は1回とカウントすることにより、検索語毎の入力人数を集計する。 It is conceivable that the same user inputs the search term multiple times. Therefore, if the same user inputs the same keyword a plurality of times at short time intervals based on information (for example, cookie information of the Web browser) that identifies the user who has input the search word, the search is performed by counting once. Aggregate the number of people entering each word.
次に、文書情報蓄積部202からも時刻範囲を指摘して文書情報を取得し(ステップ204)、イベント名を含む文書情報をイベントに関連する文書情報として選び出し、イベント名毎に文書数を集計する。ここで指定する時刻範囲は、ステップ202で指定した時刻範囲と同じ時刻範囲である。イベントに関連した文書情報はイベント毎に整理してイベント別文書情報蓄積部103に記録する(ステップ205)。
Next, the document
イベントに関連する検索語や文書情報を選択する際に、イベント名を使用したが、イベント名に年号や地名(例えば、○○○in Tokyo)が含まれる場合などは、年号や地名を除いた文字列を用いて、関連する検索語や文書情報を選択する。 When selecting a search term or document information related to an event, the event name was used. However, if the event name includes a year or place name (for example, XX in Tokyo), enter the year or place name. Using the excluded character string, a related search term and document information are selected.
また、イベント別文書情報蓄積部103の蓄積方法としては、イベントID毎に文書情報を格納する領域を設定し、その領域内に時刻情報との対応が取れるように文書情報に時刻を含むファイル名を付けるなどして蓄積する。
In addition, as a storage method of the event-specific document
そして、イベントID毎に検索語の集計値と文書情報から集計した文書数集計値とを加算し、イベント注目度算出部102のイベント別集計結果テーブル500の集計値509に記録する(ステップ206)。検索語の集計値は、イベント名で検索要求をした利用者の数であり、イベントに関心をもった人の数と言える。また、文書数の集計値についてもイベントに対する感想や意見を文書にしている点からイベントに関心を持った人の数を表している。つまり、集計データ509には、イベントに関心をもった人の数が期間毎に蓄積されることになる。
Then, for each event ID, the total value of the search terms and the total number of documents calculated from the document information are added and recorded in the
語句抽出部104も、イベント情報抽出部101と同様、常に一定間隔(例えば1時間間隔)で処理を実行している。イベント注目度算出部102のイベント注目度テーブル510から注目度の高いイベントIDをN件取得し、イベントの話題を表す語句(話題語)を抽出する。そのため、「イベントA」がイベント注目度テーブル510において注目度の高いイベントN件にリストアップされてから、語句抽出部104の処理が起動されると、「イベントA」に関する話題語が抽出され始める。「イベントA」が注目度の高いイベントN件に選ばれない場合や、集計終了日時が過ぎて、イベント別集計結果テーブル500からイベントが削除された場合は、「イベントA」についての話題語は抽出されない。
Similarly to the event
語句抽出部104は、実行のたびに注目度の高いN件のイベントに関して話題語を抽出し、語句蓄積部204に出力していく。
The
語句抽出部104の流れについて図11を用いて説明する。
The flow of the
図11は、本発明の一実施の形態における語句抽出部の流れを示す図である。 FIG. 11 is a diagram showing the flow of the phrase extraction unit in one embodiment of the present invention.
語句抽出部104は、イベント情報抽出部101の処理終了後起動される。即ち、イベント情報抽出部101の処理が1時間おきであれば、語句抽出部104の処理も1時間おきに実行される。
The
まず、イベント注目度算出部102のイベント注目度テーブル510から注目度の高いイベントID511を上位N件取得する(ステップ301)。次に、イベントIDを1つ取り出し、イベント別集計結果テーブル500から注目度の高いイベントIDに該当するイベント名502、開始日503、終了日504、時刻505、次回語句抽出日時507、集計終了日時508を取得する(ステップ303)。次回語句抽出日時が空(登録されたイベントで今回初めて処理される)または、現在日時が既に次回語句抽出日時を過ぎているか調べ(ステップ304)、条件に一致する場合は、次にイベント開催前かどうかを調べる(ステップ305)。イベント開催前であれば、現在の時刻に時間T1を加算して次回語句抽出日時を設定し(ステップ306)、イベント情報蓄積部201から概要文を取得し(ステップ307)、語句を抽出して、イベント名、開始日、終了日、と共に語句蓄積部204に出力する(ステップ308)。ここで加算する時間T1は、イベント開催前であるから、ある程度長い時間で十分であり、例えば1日(24時間)とする。また、イベント開催前であるから、イベントに関心のある人々が記載した文書情報があったとしても、イベントの概要以上の詳細な内容が含まれていることはなく、そのためイベント情報蓄積部201の概要文406からの語句の抽出を行なう。
First, the top
次に、イベント開催前ではない場合(ステップ305、No)、イベントが開催期間中かどうか調べ(ステップ309)、開催期間中の場合は(ステップ309、Yes)、語句抽出処理の開始時刻に時間T2を加算して次回語句抽出日時を設定する(ステップ310)。イベント開催期間中は、イベントに関心のある人々が記載した文書情報を次々と収集できるので、イベント別文書情報蓄積部103からイベントに関する文書情報集合を取得し(ステップ311)、文書情報集合から語句を抽出してイベント名、開始日、終了日と共に語句蓄積部294に出力する(ステップ312)。ステップ310で加算する時間T2は、イベント開催期間中であるため、短い時間を設定する。ここでは、イベント情報抽出部101の処理間隔に併せて、例えば1時間とする。イベント情報抽出部101の処理間隔より短い時間で実行しても、新しい文書情報がイベント別文書情報蓄積部103に蓄積されていないので、新しい話題語を抽出することができない。即ち、語句の抽出をもっと短い時間で実行したければ、イベント情報抽出部101の処理間隔をもっと短くする必要ある。
Next, when it is not before the event (step 305, No), it is checked whether the event is being held (step 309), and when it is being held (
次に、イベント開催期間中でない場合(ステップ309、No)は、すでにイベントが終了している場合であり、語句抽出処理の開始時刻に時間T3を加算して次回語句抽出日時を設定する(ステップ313)。この時間T3は、イベントが終了した後であるから、短い時間を設定する必要はなく、例えば、12時間とする。イベントが終了してからも、新しい文書情報が取得できる可能性があるため、イベント終了後もイベント別文書情報蓄積部103から文書情報集合を取得し(ステップ311)、語句の抽出を行なう(ステップ312)。
Next, when the event is not being held (
N件全てのイベントIDについて処理を実行し(ステップ302、Yes)、語句抽出部104の処理を終了する。
The process is executed for all N event IDs (
以上の実施の形態においては、イベントの注目度の違いによらず、語句の抽出を行なっているが、注目度の高いイベントほど語句の抽出間隔を短くし、より短い間隔で最新情報を提供できるように構成してもよい。 In the above embodiment, the phrase is extracted regardless of the difference in the attention level of the event. However, the higher the degree of attention, the shorter the word extraction interval, and the latest information can be provided at a shorter interval. You may comprise as follows.
また、スポーツや格闘など、毎回開催されるたびに新しい情報が生まれるようなイベントについては、開催期間中の語句抽出間隔を短く設定することで、最新情報が提供可能となる。反対に、展示会等のイベントそのものの内容にあまり変化のないイベントについては、開催期間中であっても語句抽出間隔を1日1回程度と長く設定しても問題ない。このようにイベントのタイプに応じて語句抽出間隔を変化させるように構成してもよい。 In addition, for events such as sports and fights where new information is generated each time it is held, the latest information can be provided by setting a short word extraction interval during the holding period. On the other hand, for events such as exhibitions that do not change much in the content of the event itself, it is not a problem to set the word extraction interval as long as about once a day even during the holding period. In this way, the phrase extraction interval may be changed according to the event type.
さらに、開催期間中であっても、実際にイベントが行なわれている時刻情報に基づき、イベントが行なわれている時刻を含む特定期間だけ、語句抽出間隔を短く設定するように構成してもよい。 Furthermore, even during the holding period, the phrase extraction interval may be set to be short only for a specific period including the time when the event is performed, based on the time information when the event is actually performed. .
次に、ステップ308における語句抽出方法についてより詳細に説明する。 Next, the word / phrase extraction method in step 308 will be described in more detail.
ステップ308において、語句抽出部104には、ステップ307で取得した、イベント情報蓄積部201から概要文が入力される。まず、概要文に対して形態素解析処理を行い、個々の品詞や句読点などの形態素に分解する。分解した形態素から、名詞、複数の名詞が連続する複合名詞、「小泉政権の支持率」のように連続した語全体で名詞と同じ働きをする名詞句を抽出する。名詞、複合名詞、名詞句などは、話題を表す言葉として動詞や形容詞などに比べ適しているためでる。以下の説明では、名詞、複合名詞、名詞句を総称して語句と呼ぶ。概要文は文の先頭に伝えたい重要な情報が記載される性質を持っているため、抽出した語句に対して先頭に出現するほど高い評価値Aを与える。また、文字数が多いほど正確な情報を伝えることができるため、文字数が多いほど高い評価値Bを与える。評価値AとBから最も評価値の高い語句を抽出する。
In step 308, the word /
図6は、「2004/07/20 21:00」に処理を開始した語句抽出部104が出力したデータ例である。同図のイベント名「イベントC」が、イベント開催前であり、「イベントC」に対応付けられて蓄積されている「大空中ナイアガラ」、「花火業者絶賛」が、ステップ308で抽出された語句の例である。
FIG. 6 is an example of data output by the
次に、上記のステップ312における語句の抽出方法についても、より詳細に説明する。ステップ312において、語句抽出部104にはステップ311でイベント別情報蓄積部103から取得した文書情報集合が入力される。文書情報集合のそれぞれの文書内容に対して、形態素解析処理を行い、名詞、複合名詞、名詞句(=語句)を抽出する。全ての文書情報から語句を抽出した後、語句毎に出現する文書数を集計する。ここで、タイトルに含まれる語句は、集計の対象から外す。残った語句の中から、より多くの文書情報に出現していた語句M件を、話題を表す語句として抽出する。図6においては、イベント名「イベントA」が、イベント開催期間中であり、「イベントA」に対応付けられて蓄積されている語句「羽毛恐竜」、「先着1000名」などステップ312で抽出された語句の例である。
Next, the phrase extraction method in step 312 will be described in more detail. In step 312, the word /
なお、上記の実施の形態におけるイベント情報抽出装置100のイベント情報抽出部101、イベント注目度算出部102、語句抽出部104の動作をプログラムとして構築し、イベント情報抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
Note that the operations of the event
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、ネットワーク上で、季節のイベントやスポーツイベントなど、特定の日時に開始されるイベントに関する話題を抽出する技術に適用可能である。 The present invention is applicable to a technique for extracting a topic related to an event that starts on a specific date and time, such as a seasonal event or a sports event, on a network.
100 イベント情報抽出供装置
101 イベント別文書抽出手段、イベント情報抽出部
102 イベント注目度算出手段、イベント注目度算出部
103 イベント別文書情報蓄積手段、イベント別文書情報蓄積部
104 語句抽出手段、語句抽出部
105 終了イベント蓄積部
201 イベント情報蓄積手段、イベント情報蓄積部
202 文書情報蓄積手段、文書情報蓄積部
203 検索語蓄積部
204 語句蓄積手段、語句蓄積部
401 イベント名
402 開始日
403 終了日
404 時刻
405 場所
406 概要
500 イベント別集計結果テーブル
501 イベントID
502 イベント名
503 開始日
504 終了日
505 時刻
506 過去注目度
507 次回語句抽出日時
508 集計終了日時
509 集計値
510 イベント注目度テーブル
511 ランク
512 イベントID
513 注目度
1001 イベント名
1002 開始日
1003 終了日
1004 語句
1101 イベント名
1102 開始日
1103 終了日
1104 過去注目度
100 Event
502
513
Claims (5)
イベントの開催日時や概要が記載されたイベント情報集合を蓄積するイベント情報蓄積手段からイベント名と開催期間を取得し、時刻情報を持つ文書集合を蓄積する文書情報蓄積手段からイベント名を含む文書を検索して抽出し、イベント別にイベント別文書情報蓄積手段に格納するイベント別文書抽出手段と、
抽出した前記文書から指定した集計期間内の時刻情報を持つ文書をイベント毎に定期的に集計し、現在までの文書の集計値の総和を集計日数で除算した値を注目度として算出するイベント注目度算出手段と、
所定の条件を満たす注目度の高いイベントを選択し、該イベントの開始前である場合には、時間間隔T1で、該イベントの概要文を形態素解析し語句の出現位置や文字数に基づいて語句を抽出し、該イベントの開始後である場合には、上記T1よりも小さい時間間隔T2で、前記イベント別文書情報蓄積手段に格納されている文書を形態素解析し、語句毎に出現する文書数を求め、出現する文書数が多い語句を抽出し、語句蓄積手段に出力する語句抽出手段と、
を有することを特徴とするイベント情報抽出装置。 An event information extraction device that extracts topics related to events that start at a specific date and time, such as seasons, events, and sports events,
The event name and duration are acquired from the event information storage means that stores the event information set that describes the date and time of the event, and the document including the event name is stored from the document information storage means that stores the document set having time information. An event-specific document extraction unit that searches and extracts and stores the event-specific document information storage unit by event,
Event attention that calculates a document that has time information within the specified aggregation period from the extracted document periodically for each event, and calculates a value obtained by dividing the total of the total values of the document up to the present by the total number of days Degree calculation means;
When an event with a high degree of attention is selected that satisfies a predetermined condition and is before the start of the event, the summary sentence of the event is morphologically analyzed at time interval T1, and the phrase is determined based on the appearance position and the number of characters of the phrase. If it is extracted and after the start of the event, the document stored in the event-specific document information storage means is morphologically analyzed at a time interval T2 smaller than T1, and the number of documents appearing for each word is calculated. A phrase extraction unit that extracts a phrase having a large number of documents that appear and outputs the phrase to the phrase storage unit;
An event information extracting device characterized by comprising:
前記指定した集計期間内に検索要求され、イベント名に一致する検索語から、検索語を入力した利用者を特定する情報を用いて、同一利用者が短い時間間隔で複数回同じキーワードを入力した場合には1回とカウントすることにより、イベントに関連する検索語の利用人数を集計し、前記文書からの集計値と検索語からの集計値を加えた合計値を定期的に求め、定期的に求めた合計値の現在までの総和を前記集計日数で除算した値を注目度として算出する手段を含む
請求項1記載のイベント情報抽出装置。 The event attention degree calculating means includes:
A search request is made within the specified counting period, and the same user inputs the same keyword a plurality of times at short time intervals using information that identifies the user who entered the search term from the search terms that match the event name. by counting and once in the case, aggregate search terms using the number of which related to the event, regularly seeking the total value obtained by adding the aggregated value of the search words and aggregated value from the document The event information extraction device according to claim 1, further comprising means for calculating, as a degree of attention, a value obtained by dividing a total sum obtained up to the present time by the total number of days .
前記イベント注目度算出手段は、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値の総和である過去注目度を前記終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を、前記現在までの文書の集計値の総和に加算し、過去のイベント開催日数と前記集計日数とを加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける文書からの集計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する手段を含む
請求項1記載のイベント情報抽出装置。 It further has an end event storage means in which past attention levels corresponding to past event names are stored,
The event attention degree calculating means includes:
For the event before the event, the past attention level that is the sum of the total values from the past documents in the past event with the same event name is searched from the end event accumulation means, and the past attention level of the searched past event is determined , Add to the total of the total values of the documents up to the present, and calculate the value obtained by dividing the number of days of past event held by the number of days added as the degree of attention. 2. The event information extracting device according to claim 1, further comprising means for accumulating in the end event accumulating means as a past attention level a value obtained by adding all the total values from the documents in the event held this time .
前記イベント注目度算出手段は、
開催前のイベントについては、イベント名が同じ過去のイベントにおける過去の文書からの集計値と検索語からの集計値との合計値の総和である過去注目度を前記終了イベント蓄積手段から検索し、検索した過去のイベントの過去注目度を定期的に求めた合計値の現在までの総和に加算し、過去のイベント開催日数と前記集計日数を加算した日数で除算した値を注目度として算出し、終了後のイベントについては、あらかじめ設定した期間後、今回開催のイベントにおける合計値を全て加算した値を過去注目度として該終了イベント蓄積手段に蓄積する手段を含む
請求項2記載のイベント情報抽出装置。 It further has an end event storage means in which past attention levels corresponding to past event names are stored,
The event attention degree calculating means includes:
For the event before the event, the past event degree is searched from the end event accumulation means, which is the sum of the total value of the total value from the past document and the total value from the search word in the past event having the same event name, The past attention degree of the past events searched is added to the total sum obtained up to the present , and the value obtained by dividing the past event holding days and the total number of days is calculated as the attention degree. The event information extraction device according to claim 2, further comprising means for accumulating a value obtained by adding all of the total values of the currently held event as a past attention degree in the end event accumulating means for the event after the completion after a preset period. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004263725A JP4496900B2 (en) | 2004-09-10 | 2004-09-10 | Event information extraction apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004263725A JP4496900B2 (en) | 2004-09-10 | 2004-09-10 | Event information extraction apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006079412A JP2006079412A (en) | 2006-03-23 |
JP4496900B2 true JP4496900B2 (en) | 2010-07-07 |
Family
ID=36158805
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004263725A Expired - Fee Related JP4496900B2 (en) | 2004-09-10 | 2004-09-10 | Event information extraction apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4496900B2 (en) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5390083B2 (en) * | 2006-10-12 | 2014-01-15 | ヤフー株式会社 | Method, server, and program for searching in conjunction with an event |
US11263543B2 (en) | 2007-11-02 | 2022-03-01 | Ebay Inc. | Node bootstrapping in a social graph |
US8666909B2 (en) | 2007-11-02 | 2014-03-04 | Ebay, Inc. | Interestingness recommendations in a computing advice facility |
US9159034B2 (en) | 2007-11-02 | 2015-10-13 | Ebay Inc. | Geographically localized recommendations in a computing advice facility |
US8494978B2 (en) | 2007-11-02 | 2013-07-23 | Ebay Inc. | Inferring user preferences from an internet based social interactive construct |
JP5143270B1 (en) * | 2011-11-14 | 2013-02-13 | 株式会社東芝 | Image processing apparatus and image processing apparatus control method |
JP5801252B2 (en) * | 2012-05-17 | 2015-10-28 | 日本電信電話株式会社 | Event extracting apparatus, method and program |
JP5806974B2 (en) * | 2012-05-17 | 2015-11-10 | 日本電信電話株式会社 | Neighboring information retrieval apparatus, method and program |
JP5836892B2 (en) * | 2012-06-28 | 2015-12-24 | Kddi株式会社 | Apparatus, program, and method for tagging identification name of geographical feature to event location |
JP5836902B2 (en) * | 2012-09-04 | 2015-12-24 | Kddi株式会社 | Event comment text detection device, program and method for detecting only comment text related to an event |
JP5458163B2 (en) * | 2012-11-16 | 2014-04-02 | 株式会社東芝 | Image processing apparatus and image processing apparatus control method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154150A (en) * | 1996-11-25 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | Information tidal current showing method and device therefor |
JP2000172701A (en) * | 1998-12-04 | 2000-06-23 | Fujitsu Ltd | Document data providing device, document data providing system, document data providing method and storage medium recording program providing document data |
JP2001216311A (en) * | 2000-02-01 | 2001-08-10 | Just Syst Corp | Event analyzing device and program device stored with event analyzing program |
JP2003271611A (en) * | 2002-03-14 | 2003-09-26 | Fujitsu Ltd | Importance level evaluation program |
JP2004185572A (en) * | 2002-12-06 | 2004-07-02 | Nippon Telegr & Teleph Corp <Ntt> | Word-of-mouth information analyzing method and apparatus |
-
2004
- 2004-09-10 JP JP2004263725A patent/JP4496900B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10154150A (en) * | 1996-11-25 | 1998-06-09 | Nippon Telegr & Teleph Corp <Ntt> | Information tidal current showing method and device therefor |
JP2000172701A (en) * | 1998-12-04 | 2000-06-23 | Fujitsu Ltd | Document data providing device, document data providing system, document data providing method and storage medium recording program providing document data |
JP2001216311A (en) * | 2000-02-01 | 2001-08-10 | Just Syst Corp | Event analyzing device and program device stored with event analyzing program |
JP2003271611A (en) * | 2002-03-14 | 2003-09-26 | Fujitsu Ltd | Importance level evaluation program |
JP2004185572A (en) * | 2002-12-06 | 2004-07-02 | Nippon Telegr & Teleph Corp <Ntt> | Word-of-mouth information analyzing method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP2006079412A (en) | 2006-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390144B2 (en) | Objective and subjective ranking of comments | |
US9535911B2 (en) | Processing a content item with regard to an event | |
KR101527259B1 (en) | Providing posts to discussion threads in response to a search query | |
JP4322887B2 (en) | Thread ranking apparatus and method | |
US20100057725A1 (en) | Information retrieval device, information retrieval method, and program | |
US20100125531A1 (en) | System and method for the automated filtering of reviews for marketability | |
US8880390B2 (en) | Linking newsworthy events to published content | |
JP4496900B2 (en) | Event information extraction apparatus and program | |
US20140297628A1 (en) | Text Information Processing Apparatus, Text Information Processing Method, and Computer Usable Medium Having Text Information Processing Program Embodied Therein | |
JP2007018285A (en) | System, method, device, and program for providing information | |
JP2013061756A (en) | Information processing system, information processing method, program, and information storage medium | |
JP4569380B2 (en) | Vector generation method and apparatus, category classification method and apparatus, program, and computer-readable recording medium storing program | |
JP2007256992A (en) | Content specifying method and device | |
JP5952756B2 (en) | Prediction server, program and method for predicting future number of comments in prediction target content | |
JP2011070291A (en) | Device, system and method for extraction of topic word, and program | |
JP2003173352A (en) | Retrieval log analysis method and device, document information retrieval method and device, retrieval log analysis program, document information retrieval program and storage medium | |
KR100900467B1 (en) | Personal media search service system and method | |
KR101132431B1 (en) | System and method for providing interest information | |
JP4396444B2 (en) | Phrase extraction device and program | |
JP5389683B2 (en) | Important keyword extraction apparatus, method and program | |
US20100287136A1 (en) | Method and system for the recognition and tracking of entities as they become famous | |
JP6228425B2 (en) | Advertisement generation apparatus and advertisement generation method | |
JP5346419B2 (en) | User behavior characteristic information generation apparatus, user behavior characteristic information generation method, and program | |
JP2008009623A (en) | Method, device and program for calculating intensity of experience, and computer readable recording medium | |
JP6223301B2 (en) | Program and search device for searching using target numerical value of predetermined target described in content sentence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090714 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100323 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100405 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |