JP2006120048A - テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム - Google Patents

テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム Download PDF

Info

Publication number
JP2006120048A
JP2006120048A JP2004309291A JP2004309291A JP2006120048A JP 2006120048 A JP2006120048 A JP 2006120048A JP 2004309291 A JP2004309291 A JP 2004309291A JP 2004309291 A JP2004309291 A JP 2004309291A JP 2006120048 A JP2006120048 A JP 2006120048A
Authority
JP
Japan
Prior art keywords
identifier
data
row
web page
attention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004309291A
Other languages
English (en)
Other versions
JP4667823B2 (ja
Inventor
Hajime Hattori
元 服部
Kazunori Matsumoto
一則 松本
Fumiaki Sugaya
史昭 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2004309291A priority Critical patent/JP4667823B2/ja
Publication of JP2006120048A publication Critical patent/JP2006120048A/ja
Application granted granted Critical
Publication of JP4667823B2 publication Critical patent/JP4667823B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 特定のデータを格納するセルの位置が変動するテーブルにおいて、特定のデータを一意に同定することができると共に、ユーザに判りやすい識別情報を選択することを可能とする。
【解決手段】 時々刻々と変化又は移動するデータを含むテーブル同士のデータの類似性に着目し、オブジェクト単位で同定を行った後に注目データの同定を行う手段と、Web検索を利用した識別子選択処理を行う検索部17および識別子選択部18とを備える。
【選択図】 図1

Description

本発明は、テーブル監視装置、Webページモニタリングシステム、並びにそのテーブル監視装置をコンピュータを利用して実現するためのコンピュータプログラムに関する。
近年、インターネット上のWebサイトで開設されるWebページによって、金融会社のアカウント情報提供サービスや株式情報提供サービス、天気予報情報提供サービス等の情報提供サービスが行われており、ユーザは時々刻々と変化する所望のデータをタイムリーに取得可能となっている。このような情報提供サービスを受ける場合、ユーザ自らが常時、Webページを閲覧し、提供されるデータの更新の有無をチェックすることは大変な負担である。このため、ユーザが注目する特定のデータを監視し、該特定データの更新有りを自動的に検知してユーザに通知することが要望されている。
従来、Webページ中のテーブル内に含まれる複数のデータを内容ごとに分割する技術として、例えば特許文献1に記載の技術が知られている。この従来技術では、Webページ中のテーブルを解析してデータを格納するセルの位置を示すセル位置データとセルの特徴を表現したセルベクトルとを生成し、テーブルタイプ(表か、レイアウトか)を判別する。そして、テーブルタイプが表の場合は、セル位置データとセルベクトルを参照してテーブルの分割方向(縦分割か横分割か)を決定し、この分割方向を参照してテーブルを分割し、セグメントを生成する。一方、テーブルタイプがレイアウトの場合は、セルベクトルを参照して各セルをクラスタリングし、セル位置データとセルクラスタ情報を参照してセグメントを生成する。これにより、Webページ中のテーブルを内容ごとに分割している。
特開2000−339301号公報
しかし、上述した従来技術では、特定のデータを格納するセルの位置がテーブル内で固定せず変動する場合、特定のデータを格納するセルを一意に同定することは困難であり、テーブル内に含まれる特定のデータを監視する目的に適用することができない。
例えば、株価の値上がり率の順位に従って各銘柄情報(コード、市場、名称、取引値等)を記載する株価ランキングテーブル(図9参照)では、時々刻々と変動する各銘柄の株価の値上がり率の順位に応じて各銘柄情報の記載位置が変動する。したがって、ユーザが注目する特定の銘柄の情報を監視するためには、該特定銘柄のテーブル内記載位置(図9ではテーブル内の記載行)を確実に同定することが求められる。なお、図9に示される銘柄情報(コード、名称、取引値等)は、便宜上のものである。
また、株価ランキングテーブルにおいて複数の銘柄を監視し、該監視対象の複数の銘柄のデータを収集して表示する場合、各表示データがいずれの銘柄のデータであるのかを容易に判別できることが望ましい。例えば、表示データを識別するために表示する情報として、図9の「コード」を使用するよりも、「名称」を使用した方がユーザには判りやすい。
本発明は、このような事情を考慮してなされたもので、その目的は、特定のデータを格納するセルの位置が変動するテーブルにおいて、特定のデータを一意に同定することができると共に、ユーザに判りやすい識別情報を選択することができるテーブル監視装置を提供することにある。
また、本発明の他の目的は、本発明のテーブル監視装置を使用してWebページ中のテーブル内に含まれる特定のデータを監視することにより、ユーザが注目する特定のデータの更新有りを自動的に検知すると共に、該特定データを収集してユーザに対して判りやすい表示を行うことができるWebページモニタリングシステムを提供することにある。
また、本発明の他の目的は、本発明のテーブル監視装置をコンピュータを利用して実現するためのコンピュータプログラムを提供することにある。
上記の課題を解決するために、本発明に係るテーブル監視装置は、各々データを格納する複数のセルにより行列を構成するテーブルを監視するテーブル監視装置であって、例示用テーブル、解析対象テーブル、及び前記例示用テーブル中の注目データを特定する指定データを入力する入力手段と、前記例示用テーブル及び前記解析対象テーブルのデータの類似性に基づいた識別子行或いは識別子列を前記例示用テーブル中から選択し、当該識別子行或いは識別子列のデータを含むオブジェクトを前記例示用テーブル中から抽出するとともに、前記識別子行或いは識別子列のデータを前記オブジェクトの識別子と定める識別子・オブジェクト抽出手段と、前記例示用テーブルから前記注目データを含む正例オブジェクトを抽出し、前記解析対象テーブルから前記正例オブジェクトの識別子と一致する識別子を含む注目オブジェクトを抽出するオブジェクト同定手段と、前記注目オブジェクトから、前記正例オブジェクト中の注目データの位置と同じ位置にあるデータを注目データとして同定する注目データ同定手段と、前記識別子・オブジェクト抽出手段が行う識別子抽出処理において複数の識別子行候補或いは識別子列候補が発見された場合に、該複数の候補のセルに含まれるテキストからキーワードを選択し、該キーワードをWeb検索サイトへ送信し、この応答を受信する検索手段と、前記検索手段が受信した応答に基づき、キーワードごとの検索結果件数を求め、各キーワードの検索結果件数をそれぞれ比較し、この比較結果に基づいて最適な識別子行候補或いは識別子列候補を選択し、この選択結果の識別子行候補或いは識別子列候補を前記識別子・オブジェクト抽出手段に通知する識別子選択手段とを備えたことを特徴とする。
本発明に係るテーブル監視装置においては、前記検索手段は、前記複数の候補のうち、セル内のテキストの文字列の長さが所定の文字数を超えるセルを含む候補をWeb検索対象から除外することを特徴とする。
本発明に係るテーブル監視装置においては、前記検索手段は、前記複数の候補のうち、セル内のテキストが数値のみで且つ所定の桁数を超えるセルを含む候補をWeb検索対象から除外することを特徴とする。
本発明に係るテーブル監視装置においては、前記識別子選択手段は、前記候補ごとに前記検索結果件数の平均値を算出し、各前記候補の検索結果件数の平均値を比較し、最小の平均値となった前記候補を選択することを特徴とする。
本発明に係るテーブル監視装置においては、前記識別子選択手段は、前記検索結果件数の平均値算出処理において、前記検索結果件数の中から最大値および最小値を除外し、残った検索結果件数の平均値を計算することを特徴とする。
本発明に係るWebページモニタリングシステムは、各々データを格納する複数のセルにより行列を構成するテーブルを有するWebページを監視するWebページモニタリングシステムであって、例示用の前記Webページと解析対象の前記Webページを通信ネットワークを介して取得するWebページ取得手段と、前記例示用Webページ中の注目データを指定する注目データ指定入力手段と、前記例示用Webページ中のテーブル、前記解析対象Webページ中のテーブル、及び前記注目データの指定データから、前記解析対象Webページのテーブル中の注目データを同定する請求項1から5のいずれかの項に記載のテーブル監視装置と、前記テーブル監視装置により同定された注目データを記憶する記憶手段と、前記記憶手段に記憶されている注目データと前記テーブル監視装置により得られた注目データとから、解析対象Webページ中の注目データの更新の有無を判定する判定手段と、前記判定手段の判定結果を利用者に対して通知する通知手段と、前記テーブル監視装置により同定された注目データと当該同定に使用された識別子とを対応付けて表示するための表示データを作成する表示データ作成手段とを備えたことを特徴とする。
本発明に係るコンピュータプログラムは、各々データを格納する複数のセルにより行列を構成するテーブルを監視するためのコンピュータプログラムであって、例示用テーブル、解析対象テーブル、及び前記例示用テーブル中の注目データを特定する指定データを入力する機能と、前記例示用テーブル及び前記解析対象テーブルのデータの類似性に基づいた識別子行或いは識別子列を前記例示用テーブル中から選択し、当該識別子行或いは識別子列のデータを含むオブジェクトを前記例示用テーブル中から抽出するとともに、前記識別子行或いは識別子列のデータを前記オブジェクトの識別子と定める機能と、前記例示用テーブルから前記注目データを含む正例オブジェクトを抽出し、前記解析対象テーブルから前記正例オブジェクトの識別子と一致する識別子を含む注目オブジェクトを抽出する機能と、前記注目オブジェクトから、前記正例オブジェクト中の注目データの位置と同じ位置にあるデータを注目データとして同定する機能と、前記識別子・オブジェクト抽出手段が行う識別子抽出処理において複数の識別子行候補或いは識別子列候補が発見された場合に、該複数の候補のセルに含まれるテキストからキーワードを選択し、該キーワードをWeb検索サイトへ送信し、この応答を受信する機能と、前記受信した応答に基づき、キーワードごとの検索結果件数を求め、各キーワードの検索結果件数をそれぞれ比較し、この比較結果に基づいて最適な識別子行候補或いは識別子列候補を選択し、この選択結果の識別子行候補或いは識別子列候補を前記識別子を定める機能に通知する機能とをコンピュータに実現させることを特徴とする。
これにより、前述のテーブル監視装置がコンピュータを利用して実現できるようになる。
本発明によれば、時々刻々と変化又は移動するデータを含むテーブル同士のデータの類似性に着目し、オブジェクト単位で同定を行った後に注目データの同定を行うことにより、例示用テーブル中の注目データの一例を提示するだけで解析対象テーブル中の注目データを同定することができる。これにより、特定のデータを監視して更新有りを自動的に検知することができる。さらに、Web検索を利用した識別子選択処理により、識別子を表示データの表題としてそのまま利用できるような、ユーザに判りやすい意味のある識別子を選択することができる。
また、本発明のテーブル監視装置を使用してWebページ中のテーブル内に含まれる特定のデータを監視することにより、ユーザが注目する特定のデータの更新有りを自動的に検知すると共に、該特定データを収集してユーザに対して判りやすい表示を行うことができる。
初めに本発明が扱うテーブルについての前提条件を説明する。
テーブルは、各々データを格納するセルを複数有し、複数のセルにより行列を構成する。
テーブルには同種のオブジェクトが複数並んでいる。例えば、株式売買高等のランキングや、週間天気予報などが記載されたテーブルを扱う。オブジェクトは複数のセルから構成される。
列方向に同種のデータが並ぶとともに行方向に関連するデータが並んでおり、一つの行には単数又は複数のオブジェクトが並んでいる。或いは、行方向に同種のデータが並ぶとともに列方向に関連するデータが並んでおり、一つの列には単数又は複数のオブジェクトが並んでいる。
オブジェクト単位で生成、削除、及びテーブル内の移動が行われる。
以下、図面を参照し、本発明の一実施形態について説明する。本実施形態では、Webページ中のテーブル内に含まれる特定のデータを監視する装置を例に挙げて説明する。
図1は、本発明の一実施形態に係るテーブル監視装置1の構成を示すブロック図である。図1において、テーブル監視装置1は、入力部11、識別子・オブジェクト抽出部12、オブジェクト同定部13、注目データ同定部14、出力部15、例示用Webページ更新部16、検索部17及び識別子選択部18を備える。
入力部11は、Webページデータを入力する。Webページデータは例えばHTML(HyperText Markup Language)データである。Webページ中にはテーブル形式でデータが格納されている。入力されるWebページには、例示用と解析対象の2種類がある。例示用Webページは、ユーザが注目するデータ(注目データ)を指定するときに用いられたページである。また、入力部11は、その注目データを特定する指定データを入力する。この指定データは、当該注目データであってもよい。解析対象Webページは、実際に注目データを同定する対象となるページである。例示用Webページと解析対象Webページは同一URL(Uniform Resource Locator)のページである。
識別子・オブジェクト抽出部12は、例示用Webページと解析対象Webページの双方のテーブルについて、同一行同士をそれぞれ比較し、また同一列同士をそれぞれ比較し、同一行内または同一列内に完全に一致するテキストが2つ以上存在しない行又は列のいずれか一つを例示用Webページのテーブルから選択する。ここで行が選択されたならば当該行を識別子行とし、一方、列が選択されたならば当該列を識別子列とする。そして、例示用Webページのテーブル中のセルの中から、識別子行ならば列方向、識別子列ならば行方向の全セルまたは一部のセルをオブジェクトとして切り出し、各オブジェクトと識別子行/識別子列が交差する位置のセルをオブジェクトの識別子とする。
検索部17および識別子選択部18は、Web検索を利用した識別子選択処理を行うブロックである。Web検索を利用した識別子選択処理は、識別子・オブジェクト抽出部12が行う識別子抽出処理において複数の識別子行/識別子列候補が発見された場合に、それら複数の候補の中から、ユーザに判りやすい識別子を含む候補を選択するためのものである。
検索部17は、Web検索サイトへクエリ(検索するキーワード)を送信し、その応答を受信する。該キーワードは、識別子・オブジェクト抽出部12によって発見された複数の識別子行/識別子列候補のセルに含まれるテキストから選択される。
識別子選択部18は、検索部17が受信した応答に基づき、キーワードごとの検索結果件数(検索ヒット数)を求める。そして、各キーワードの検索結果件数をそれぞれ比較し、この比較結果に基づいて最適な識別子行/識別子列候補を選択する。この選択結果の識別子行/識別子列候補は、識別子・オブジェクト抽出部12に通知される。
オブジェクト同定部13は、例示用Webページから注目データを含むオブジェクト(正例オブジェクト)を取り出す。そして、解析対象Webページから正例オブジェクトの識別子と一致する識別子を含むオブジェクトを切り出し、このオブジェクトを注目データが含まれるオブジェクト(注目オブジェクト)とする。なお、解析対象Webページ中に正例オブジェクトと一致するオブジェクトがない場合はエラーとし、同定不能とする。
注目データ同定部14は、注目オブジェクトから、正例オブジェクト中の注目データの位置と同じ位置にあるデータを注目データとして同定し切り出す。
出力部15は、注目データ同定部14によって切り出された解析対象Webページ中の注目データを出力する。
例示用Webページ更新部16は、オブジェクト識別子を正しく抽出するために、当該Webページの情報更新の周期(例えば1日や1時間など)の定数倍の周期で上記した処理(識別子・オブジェクトの抽出、オブジェクトの同定、注目データの同定)を繰り返す。そして、注目データの同定が可能であった場合、当該解析対象Webページを新たな例示用Webページとして更新する。なお、上記定数倍をいくつにするかは通信コストや負荷に応じて設定変更する。
上記したようにテーブル監視装置1は、Webページ中のテーブルのデータ構造の特徴を利用して関連するデータの集合(オブジェクト)を抽出し、注目データを含むオブジェクトの同定を行った後に注目データの同定を行う。これにより、ユーザが指定した注目データの値が変化したり、又は注目データの位置がテーブル内で移動したりする場合でも、例示用Webページ中の注目データの一例を提示するだけで、実際の解析対象Webページ中から当該注目データを同定することが可能となり、Webページ中から注目データを自動的かつ継続的に取得することが実現できる。
なお、本実施形態に係るテーブル監視装置は、専用のハードウェアにより実現されるものであってもよく、あるいはパーソナルコンピュータ等の汎用のコンピュータシステムにより構成され、図1に示される装置の各機能を実現するためのプログラムを実行することによりその機能を実現させるものであってもよい。
また、そのテーブル監視装置には、周辺機器として入力装置、表示装置等(いずれも図示せず)が接続されるものとする。ここで、入力装置とはキーボード、マウス等の入力デバイスのことをいう。表示装置とはCRT(Cathode Ray Tube)や液晶表示装置等のことをいう。
また、上記周辺機器については、テーブル監視装置に直接接続するものであってもよく、あるいは通信回線を介して接続するようにしてもよい。
次に、上記した図1に示すテーブル監視装置1の詳細な動作を説明する。図2〜図7は、図1に示すテーブル監視装置1の処理フロー図である。
先ず、図2において、利用者が利用者端末により例示用Webページ(Web1)を見ながら注目データを指定する(ステップS101)。例えば、注目データを有するセルのセル番号をキーボード操作により入力したり、或いはマウス等を操作して当該セルをクリックする。この指定データはテーブル監視装置1に入力される。次いで、テーブル監視装置1は、その入力された指定データに基づき、例示用Webページ(Web1)中から、当該指定された注目データを含むテーブルT1を取り出す(ステップS102)。次いで、テーブル監視装置1は、解析対象Webページ(Web2)を取得する(ステップS103)。次いで、この解析対象Webページ(Web2)中から、テーブルT1と同じテーブルT2を取り出す(ステップS104)。次いで、テーブルT1とテーブルT2からオブジェクトの識別子列、或いは識別子行を抽出する(ステップS105)。
ここで、図4、図5を参照して、ステップS105の識別子抽出処理を説明する。
先ず、識別子が行方向か、列方向かを判定する。
図4において、テーブルT1の「(行,列)=(i,j)」番目のセルとテーブルT2のセルとを比較し(ステップS201)、テーブルT1の「(行,列)=(i,j)」番目のセルの文字列と完全一致するセルがテーブルT2中にいくつあるかを全ての(i,j)について以下の条件A1,A2で算出し、2つのテーブル(行方向テーブル,列方向テーブル)を生成する(ステップS202)。
条件A1;テーブルT1の(i,j)番目のセルの文字列が、テーブルT2のi行目に含まれている個数を計数する。行方向テーブル中の(i,j)番目のセルには条件A1の計数結果を格納する。これにより、テーブルT1と同じ行列数の行方向テーブルが生成される。
条件A2;テーブルT1の(i,j)番目のセルの文字列が、テーブルT2のj列目に含まれている個数を計数する。列方向テーブル中の(i,j)番目のセルには条件A2の計数結果を格納する。これにより、テーブルT1と同じ行列数の行方向テーブルが生成される。
次いで、行方向テーブル又は列方向テーブルのいずれか一方をステップS203〜S209の手順で選択する。ステップS203では、2以上の数値を含むテーブルがあるかを判断する。この判断の結果が「YES」の場合、2以上の数値を含む方のテーブルを選択する(ステップS204)。一方、ステップS203の判断結果が「NO」の場合、テーブル中の数値の合計をテーブル毎に算出し、これら合計値を比較し、合計値が異なるかを判断する(ステップS205)。この判断の結果が「YES」の場合、合計値が大きい方のテーブルを選択する(ステップS206)。
一方、ステップS205の判断結果が「NO」の場合、以下の条件B1〜B4に従ってテーブルの選択を行う。
条件B1;テーブルT1の同一行に同じ文字列を含むセルがある場合は、行方向テーブルを選択する。
条件B2;テーブルT1の同一列に同じ文字列を含むセルがある場合は、列方向テーブルを選択する。
条件B3;テーブルT2の同一行に同じ文字列を含むセルがある場合は、行方向テーブルを選択する。
条件B4;テーブルT2の同一列に同じ文字列を含むセルがある場合は、列方向テーブルを選択する。
上記条件B1〜B4のいずれかに合致するかを判断し(ステップS207)、合致する場合には合致した条件でテーブルを選択する(ステップS208)。
一方、上記条件B1〜B4のいずれにも合致しない場合(ステップS207でNO)、テーブルT1又はT2を用いてテーブル中のセル間の類似度を算出し、類似度の高い方向は行方向であるか、或いは列方向であるかを判定し、この類似度が高い方向と等しい方向のテーブルを選択する(ステップS209)。なお、上記類似度の算出方法については後述する。
上記した手順により行方向テーブル或いは列方向テーブルが選択されると、次に、この選択されたテーブルに基づいて図5の処理により識別子行或いは識別子列を求める。すなわち、行方向テーブルが選択されたならば識別子行を求める。一方、列方向テーブルが選択されたならば識別子列を求める。以下の説明では、行方向テーブルから識別子行を求める場合を例に挙げて説明するが、列方向テーブルから識別子列を求める場合も同様であり、行を列に、上を左に、下を右に、右を下に、左を上に、それぞれ読み替えればよい。なお、図5中のカッコ内の記載は列方向テーブルから識別子列を求める場合に対応している。
図5において、先ず、行方向のテーブルにおいて2以上の値を含む行を識別子行候補から除外する(ステップS210)。この結果、まだ2つ以上の識別子行候補が残っている場合(ステップS211でYES)、テーブルT1の同一行に同じ文字列を含む複数のセルがあるときは当該行をさらに識別子行候補から除外する(ステップS212)。この結果、まだ2つ以上の識別子行候補が残っている場合(ステップS213でYES)、テーブルT2の同一行に同じ文字列を含む複数のセルがあるときは当該行をさらに識別子行候補から除外する(ステップS214)。
この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS215でYES)、複数識別子対応処理を実行する(ステップS216)。この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS217でYES)、注目点(ユーザ指定された注目データ)を含む行をさらに識別子行候補から除外する(ステップS218)。この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS219でYES)、再度、複数識別子対応処理を実行する(ステップS220)。この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS221でYES)、Web検索を利用した識別子選択処理を実行する(ステップS222)。この後、ステップS242へ進む。なお、上記した複数識別子対応処理(S216,S220)およびWeb検索を利用した識別子選択処理(S222,S241)については後述する。
他方、上記ステップS211で識別子行候補が2つ未満であった場合(ステップS211でNO)、識別子行候補が0個であるか判断し(ステップS230)、識別子行候補が0個ならば(ステップS230でYES)、識別子なしとして処理を終了する(ステップS231)。ここで、識別子行候補が1個ならば(ステップS230でNO)、ステップS242へ進む。
また、上記ステップS213,S215,S219のいずれかで識別子行候補が2つ未満であった場合(ステップS213,S215,S219のいずれかでNO)、識別子行候補が0個であるか判断する(ステップS240)。この判断の結果、識別子行候補が0個となっている場合には(ステップS240でYES)、直前の候補除外処理を取り消した状態に戻して、Web検索を利用した識別子選択処理を実行する(ステップS241)。一方、ステップS240でNOならばステップS242へ進む。
また、上記ステップS217,S221のいずれかで識別子行候補が2つ未満であった場合は(ステップS219,S221のいずれかでNO)、ステップS242へ進む。
次いで、ステップS242では、上記した処理の結果として選択された識別子行を設定する。
以上のステップS105の識別子抽出処理によって、識別子行或いは識別子列が抽出される。
説明を図2に戻す。ステップS106では、識別子行或いは識別子列が設定されたかを判断し、設定されていない場合には(ステップS106でNO)、エラーを出力して処理を終了する。一方、識別子行或いは識別子列が設定されている場合には(ステップS106でYES)、ステップS107へ進む。
以下の説明では、上記した識別子抽出処理で識別子列が抽出された場合を例に挙げて説明するが、識別子行が抽出された場合も同様であり、列を行に読み替えればよい。
ステップS107では、テーブルT1から行方向の全部または一部のセルをオブジェクトとして取り出し、各オブジェクトについて識別子列と交差するセルのテキストをそのオブジェクトの識別子(オブジェクト識別子)として割り当てる。
次いで、図3のステップS110では、注目点を含むテーブルT1のオブジェクトのオブジェクト識別子と同じテキストを含む行方向のオブジェクトを、テーブルT2から検索する。この検索の結果、該当するオブジェクトが見つからなかった場合は(ステップS111でNO)、エラーを出力して処理を終了する。一方、該当する行方向のオブジェクトが見つかった場合には、当該オブジェクト中のセルのうち、テーブルT1のオブジェクト中の注目点のセルと同じ位置(同じ列)にあるセルを、テーブルT2の注目点のセル(注目データを含むセル)として利用者端末へ出力する(ステップS112)。
次に、図6を参照して、上記した複数識別子対応処理(図5のステップS216,S220)を説明する。以下の説明では、複数の識別子列候補が存在する場合を例に挙げて説明するが、複数の識別子行候補が存在する場合も同様であり、列を行に、また右を下に、また縦を横にそれぞれ読み替えればよい。なお、図6中のカッコ内の記載は複数の識別子行候補が存在する場合に対応している。
図6において、先ず、全ての識別子列の組み合わせについて各類似度を算出する(ステップS301)。この類似度算出方法は後述する。次いで、類似度と所定の閾値とを比較し、一つでも類似度が閾値以上である場合には(ステップS302でYES)、識別子列同士が類似しており、オブジェクトが複数のオブジェクトに分かれる可能性があるため、ステップS303へ進み、更なる処理を実行する。
一方、全ての類似度が閾値未満である場合には(ステップS302でNO)、識別子列同士が類似していないので、そのまま処理を終了する。
次いで、ステップS303では変数iを初期値“1”に設定する。次いで、類似している各識別子列についてi個右の列との間の類似度を算出し(ステップS304)、この類似度と閾値を比較し、閾値未満ならばそのまま処理を終了する(ステップS305でNO)。一方、閾値以上ならば変数iに1加算する(ステップS306)。そして、i番目の列が識別子列であるか又はi個右の列がないならば(ステップS307でYES)ステップS308へ進み、そうでなければ(ステップS307でNO)ステップS304へ戻る。これにより、類似している各識別子列について、隣り合う識別子列に挟まれた全ての列との間の類似度が算出される。次いで、ステップS308では、それら全ての類似度が閾値以上か否かを判断し、全類似度が閾値以上であればオブジェクトは2つ以上の識別子列によって分割されると設定する。次いで、識別子列から右に(i−1)番目とi番目の間でテーブルT1を分割し、分割された2つのテーブルを左から順に縦方向につなぎ、新たなテーブルT1を生成する(ステップS309)。同様にテーブルT2についても分割後に縦方向につなぎ、新たなテーブルT2を生成する(ステップS309)。
次に、図7を参照して、上記した類似度算出処理を説明する。
図7において、先ず、比較対象の一方について、セル内の文字列を取り出し、変数iに初期値「1」を設定する(ステップS401)。次いで、取り出した文字列中のi番目の文字を取り出し、この文字が、数値ならば“N”に、imgタグならば“I”に、aタグならば“A”に、その他のテキストならば“T”に、それぞれ置換する(ステップS403〜S409)。例えば、文字列“3月23日(火)”は置換列“NTNNTTTT”に変換される。次いで、変数iに1加算し(ステップS410)、i番目の文字が上記取り出した文字列中にあればステップS402に戻り(ステップS411でYES)、無ければ比較対象のもう一方についても上記ステップS401〜S411の処理を行う(ステップS411でNO、ステップS412)。次いで、各比較対象の置換列について、DPマッチングを利用して、記号の組み合わせ方と記号列の長さから類似度を算出する。
次に、図8を参照して、上記したWeb検索を利用した識別子選択処理(図5のステップS222,S241)を説明する。以下の説明では、複数の識別子行候補が存在する場合を例に挙げて説明するが、複数の識別子列候補が存在する場合も同様であり、行を列に、また上を左にそれぞれ読み替えればよい。なお、図8中のカッコ内の記載は複数の識別子列候補が存在する場合に対応している。
図8において、先ず、複数の識別子行候補のうち、セル内のテキストの文字列の長さがL文字を超えるセルを含む行を識別子行候補から除外する(ステップS501)。Lは、制限する文字数の値(例えば10)である。この候補除外処理によって、説明文などの識別子には不適当なテキストを格納するセルの行が識別子行候補から除外される。
この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS502でYES)、セル内のテキストが数値のみで且つM桁を超えるセルを含む行を識別子行候補から除外する(ステップS503)。Mは、制限する桁数の値(例えば5)である。この候補除外処理によって、人には判別し辛く識別子には不適当な桁数の数値を格納するセルの行が識別子行候補から除外される。
この結果、まだ2つ以上の識別子行候補が残っている場合には(ステップS504でYES)、ステップS508へ進む。一方、上記した候補除外処理(S501,S503)によって識別子行候補が2つ未満となった場合(ステップS502またはS504でNO)、識別子行候補が0個であるか判断する(ステップS505)。この判断の結果、識別子行候補が0個となっている場合には(ステップS505でYES)、直前の候補除外処理を取り消した状態に戻して、ステップS508へ進む。一方、ステップS505でNOならば、つまり識別子行候補が一つに絞られたならばステップS507へ進み、当該識別子行候補を選択する(ステップS507)。
ステップS508では、まだ残っている各識別子行候補ごとに、一行に含まれるセル数をカウントする(ステップS508)。次いで、このカウント値nと閾値N(例えばN=10)を比較し、カウント値nが閾値N未満であるか否かを判断する(ステップS509)。この結果に応じて以下の場合分け(ケースA,B)を行い、当該識別子行候補に含まれるセル中のテキストをキーワードとしてWeb検索を行う。
ケースA;
カウント値nが閾値N未満である場合(ステップS509でYES)、当該識別子行候補に含まれる全てのセルをキーワード選択対象とし、キーワード選択対象の一セルに含まれるテキストを一キーワードに選択する。これにより、当該識別子行候補に含まれるセルの個数分のキーワードが選択される。そして、それら選択したセル個数分のキーワードをWeb検索サイトに送信し、各キーワードごとの検索結果(セル個数分)を受信する(ステップS510)。このキーワード検索は識別子行候補ごとに行い、識別子行候補ごとの検索結果を得る。
ケースB;
カウント値nが閾値N以上である場合(ステップS509でNO)、当該識別子行候補に含まれるセルのうち、上から数えてN個のセルをキーワード選択対象とし、キーワード選択対象の一セルに含まれるテキストを一キーワードに選択する。これにより、N個のキーワードが選択される。そして、それら選択したN個のキーワードをWeb検索サイトに送信し、各キーワードごとの検索結果(N個)を受信する(ステップS511)。このキーワード検索は識別子行候補ごとに行い、識別子行候補ごとの検索結果を得る。
次いで、識別子行候補ごとに、検索結果件数の平均値を算出する(ステップS512)。この検索結果件数の平均値算出処理では、一識別子行候補について、各キーワードの検索結果件数(検索ヒット数)の中から最大値および最小値を除外し、残った検索結果件数の平均値を計算する。最大値および最小値を除外することにより、特異な検索結果件数を除き、適切な平均値を求めることができる。
次いで、各識別子行候補の検索結果件数の平均値を比較し、最小の平均値となった識別子行候補を選択する(ステップS513)。ここで、最小の平均値となった識別子行候補を選択する理由は、検索結果件数(検索ヒット数)が少ない方が、当該キーワードの使われ方がより限定されているので、当該キーワードが有する意味の数が少ないからである。つまり、識別子としては、保有する意味の数が少ないものほど、ユーザにとってキーワードの意味を連想しやすく、判別しやすいためである。なお、数値は、使用される場面ごとに意味が異なるので、どのような意味を持ったものであるのかが判別し辛いものである。一方、会社名などの固有名詞は、その意味がほぼ限定されるので、判別しやすいものである。
例えば、図9の株価ランキングテーブルでは、上記した図4、図5の識別子抽出処理において、「コード」の行と「名称」の行とが識別子行候補になる。次いで、上記した図8のWeb検索を利用した識別子選択処理により、各識別子行候補のセル中のテキストをキーワードとしてWeb検索を行う。この結果、検索結果件数(検索ヒット数)は、「コード」をキーワードとするよりも「名称」をキーワードとした方が少ない。これにより、「名称」の行が識別子行に選択されて、「名称」が識別子となる。この結果、銘柄の名称というユーザに判りやすい識別子を選択することができる。
上述したように本実施形態によれば、特定のデータを格納するセルの位置が変動するテーブルにおいて、特定のデータを一意に同定することができる。さらに、Web検索を利用した識別子選択処理により、ユーザに判りやすい識別情報を選択することができる。
図10は、本発明の一実施形態に係るWebページモニタリングシステム20の構成を示すブロック図である。図10において、Webページモニタリングシステム20は、図1のテーブル監視装置1、Webページ取得部21、注目データ指定入力部22、注目データ記憶部23、比較部24、通知部25及び表示データ作成部26を備える。
Webページ取得部21は、ユーザ指定されたURLを使用して例示用Webページと解析対象Webページを通信ネットワークを介して取得する。例示用Webページは、注目データ指定入力部22及びテーブル監視装置1に出力される。解析対象Webページはテーブル監視装置1に出力される。
注目データ指定入力部22は、Webページ取得部21により取得された例示用Webページからユーザ操作により注目データを指定する機能を有し、注目データを指定するデータをテーブル監視装置1へ出力する。
注目データ記憶部23は、テーブル監視装置1により同定された解析対象Webページのテーブル中の注目データを記憶する。
比較部24は、テーブル監視装置1により今回得られた解析対象Webページのテーブル中の注目データと、注目データ記憶部23に前回記憶された注目データとを比較し、この比較結果を通知部25へ出力する。また、注目データに変化があった場合、新しい注目データを表示データ作成部26に出力する。
通知部25は、比較部24の比較結果から、解析対象Webページ中の注目データの更新の有無を利用者に対して通知する。例えば、更新有りの場合に電子メールで通知する。このとき、更新された最新の注目データを電子メールに記載してもよい。これにより、テーブル監視装置1を使用してWebページ中のテーブル内に含まれる特定のデータを監視し、ユーザが注目する特定のデータの更新有りを自動的に検知することができる。
表示データ作成部26は、比較部24から受信した注目データを使用して表示データを作成する。この表示データ作成処理では、ユーザが注目するデータに対応付けて該当する識別子を表示するように表示データを構成する。この識別子は、テーブル監視装置1により注目データの同定に使用されたものであって、ユーザに判りやすいものである。
例えば、図9の株価ランキングテーブルにおいてユーザが指定した注目するセルが「出来高」のセルである場合、注目データは出来高の値となる。そして、識別子と出来高の値の組がテーブル監視装置1から出力される。表示データ作成部26は、比較部24から注目データを受信した時に、この受信日時(データ取得日時)を取得する。そして、識別子とデータ取得日時と出来高の値とを対応付けて表示するための表示データを作成する。図11は、注目データの表示例である。図11の例では、表示データを表示する端末の画面100に、<>内に識別子として銘柄の名称(例えば、○○工業(株))が表示される。そして、識別子(銘柄の名称)に対応付けて、出来高の値とその取得日時が、“○月×日 11:30,12300”のように取得日時,出来高の値の順で表示される。
このように本実施形態では、テーブル監視装置1がユーザに判りやすい識別子(図11では、銘柄の名称)を選択する。そして、例えば図11の例では、その識別子(銘柄の名称)が出来高の値に対応付けられて表示されるので、ユーザは表示されている出来高の値が、どの銘柄のものであるのかを容易に判別することができる。
上述したように本実施形態によれば、図1のテーブル監視装置1を使用してWebページ中のテーブル内に含まれる特定のデータを監視することにより、ユーザが注目する特定のデータの更新有りを自動的に検知することができる。さらに、該特定データを収集してユーザに対して判りやすい表示を行うことができる。
なお、図2〜図8に示す各ステップを実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりテーブル監視処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、本発明の実施形態を図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
本発明の一実施形態に係るテーブル監視装置1の構成を示すブロック図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 図1に示すテーブル監視装置1の処理フロー図である。 監視対象のテーブルの具体例を示す図である。 本発明の一実施形態に係るWebページモニタリングシステム20の構成を示すブロック図である。 図10に示すWebページモニタリングシステム20が作成する表示データによる注目データの表示例である。
符号の説明
1…テーブル監視装置、11…入力部、12…識別子・オブジェクト抽出部、13…オブジェクト同定部、14…注目データ同定部、15…出力部、16…例示用Webページ更新部、17…検索部、18…識別子選択部、20…Webページモニタリングシステム、21…Webページ取得部、22…注目データ指定入力部、23…注目データ記憶部、24…比較部、25…通知部、26…表示データ作成部。

Claims (7)

  1. 各々データを格納する複数のセルにより行列を構成するテーブルを監視するテーブル監視装置であって、
    例示用テーブル、解析対象テーブル、及び前記例示用テーブル中の注目データを特定する指定データを入力する入力手段と、
    前記例示用テーブル及び前記解析対象テーブルのデータの類似性に基づいた識別子行或いは識別子列を前記例示用テーブル中から選択し、当該識別子行或いは識別子列のデータを含むオブジェクトを前記例示用テーブル中から抽出するとともに、前記識別子行或いは識別子列のデータを前記オブジェクトの識別子と定める識別子・オブジェクト抽出手段と、
    前記例示用テーブルから前記注目データを含む正例オブジェクトを抽出し、前記解析対象テーブルから前記正例オブジェクトの識別子と一致する識別子を含む注目オブジェクトを抽出するオブジェクト同定手段と、
    前記注目オブジェクトから、前記正例オブジェクト中の注目データの位置と同じ位置にあるデータを注目データとして同定する注目データ同定手段と、
    前記識別子・オブジェクト抽出手段が行う識別子抽出処理において複数の識別子行候補或いは識別子列候補が発見された場合に、該複数の候補のセルに含まれるテキストからキーワードを選択し、該キーワードをWeb検索サイトへ送信し、この応答を受信する検索手段と、
    前記検索手段が受信した応答に基づき、キーワードごとの検索結果件数を求め、各キーワードの検索結果件数をそれぞれ比較し、この比較結果に基づいて最適な識別子行候補或いは識別子列候補を選択し、この選択結果の識別子行候補或いは識別子列候補を前記識別子・オブジェクト抽出手段に通知する識別子選択手段と、
    を備えたことを特徴とするテーブル監視装置。
  2. 前記検索手段は、前記複数の候補のうち、セル内のテキストの文字列の長さが所定の文字数を超えるセルを含む候補をWeb検索対象から除外することを特徴とする請求項1に記載のテーブル監視装置。
  3. 前記検索手段は、前記複数の候補のうち、セル内のテキストが数値のみで且つ所定の桁数を超えるセルを含む候補をWeb検索対象から除外することを特徴とする請求項1に記載のテーブル監視装置。
  4. 前記識別子選択手段は、前記候補ごとに前記検索結果件数の平均値を算出し、各前記候補の検索結果件数の平均値を比較し、最小の平均値となった前記候補を選択することを特徴とする請求項1に記載のテーブル監視装置。
  5. 前記識別子選択手段は、前記検索結果件数の平均値算出処理において、前記検索結果件数の中から最大値および最小値を除外し、残った検索結果件数の平均値を計算することを特徴とする請求項4に記載のテーブル監視装置。
  6. 各々データを格納する複数のセルにより行列を構成するテーブルを有するWebページを監視するWebページモニタリングシステムであって、
    例示用の前記Webページと解析対象の前記Webページを通信ネットワークを介して取得するWebページ取得手段と、
    前記例示用Webページ中の注目データを指定する注目データ指定入力手段と、
    前記例示用Webページ中のテーブル、前記解析対象Webページ中のテーブル、及び前記注目データの指定データから、前記解析対象Webページのテーブル中の注目データを同定する請求項1から5のいずれかの項に記載のテーブル監視装置と、
    前記テーブル監視装置により同定された注目データを記憶する記憶手段と、
    前記記憶手段に記憶されている注目データと前記テーブル監視装置により得られた注目データとから、解析対象Webページ中の注目データの更新の有無を判定する判定手段と、
    前記判定手段の判定結果を利用者に対して通知する通知手段と、
    前記テーブル監視装置により同定された注目データと当該同定に使用された識別子とを対応付けて表示するための表示データを作成する表示データ作成手段と、
    を備えたことを特徴とするWebページモニタリングシステム。
  7. 各々データを格納する複数のセルにより行列を構成するテーブルを監視するためのコンピュータプログラムであって、
    例示用テーブル、解析対象テーブル、及び前記例示用テーブル中の注目データを特定する指定データを入力する機能と、
    前記例示用テーブル及び前記解析対象テーブルのデータの類似性に基づいた識別子行或いは識別子列を前記例示用テーブル中から選択し、当該識別子行或いは識別子列のデータを含むオブジェクトを前記例示用テーブル中から抽出するとともに、前記識別子行或いは識別子列のデータを前記オブジェクトの識別子と定める機能と、
    前記例示用テーブルから前記注目データを含む正例オブジェクトを抽出し、前記解析対象テーブルから前記正例オブジェクトの識別子と一致する識別子を含む注目オブジェクトを抽出する機能と、
    前記注目オブジェクトから、前記正例オブジェクト中の注目データの位置と同じ位置にあるデータを注目データとして同定する機能と、
    前記識別子・オブジェクト抽出手段が行う識別子抽出処理において複数の識別子行候補或いは識別子列候補が発見された場合に、該複数の候補のセルに含まれるテキストからキーワードを選択し、該キーワードをWeb検索サイトへ送信し、この応答を受信する機能と、
    前記受信した応答に基づき、キーワードごとの検索結果件数を求め、各キーワードの検索結果件数をそれぞれ比較し、この比較結果に基づいて最適な識別子行候補或いは識別子列候補を選択し、この選択結果の識別子行候補或いは識別子列候補を前記識別子を定める機能に通知する機能と、
    をコンピュータに実現させることを特徴とするコンピュータプログラム。

JP2004309291A 2004-10-25 2004-10-25 テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム Expired - Fee Related JP4667823B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004309291A JP4667823B2 (ja) 2004-10-25 2004-10-25 テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004309291A JP4667823B2 (ja) 2004-10-25 2004-10-25 テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006120048A true JP2006120048A (ja) 2006-05-11
JP4667823B2 JP4667823B2 (ja) 2011-04-13

Family

ID=36537854

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004309291A Expired - Fee Related JP4667823B2 (ja) 2004-10-25 2004-10-25 テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4667823B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09154112A (ja) * 1995-12-01 1997-06-10 Matsushita Electric Ind Co Ltd 変化情報収集方法、変化情報収集装置、情報収集装置、および文字放送受信装置
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000180374A (ja) * 1998-12-15 2000-06-30 Matsushita Electric Ind Co Ltd 欠陥検出方法
JP2001202283A (ja) * 1999-11-09 2001-07-27 Fujitsu Ltd コンテンツ更新状況監視システム
JP2003150486A (ja) * 2001-11-08 2003-05-23 Hitachi Ltd 情報取得システム
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09154112A (ja) * 1995-12-01 1997-06-10 Matsushita Electric Ind Co Ltd 変化情報収集方法、変化情報収集装置、情報収集装置、および文字放送受信装置
JPH1153384A (ja) * 1997-08-05 1999-02-26 Mitsubishi Electric Corp キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2000180374A (ja) * 1998-12-15 2000-06-30 Matsushita Electric Ind Co Ltd 欠陥検出方法
JP2001202283A (ja) * 1999-11-09 2001-07-27 Fujitsu Ltd コンテンツ更新状況監視システム
JP2003150486A (ja) * 2001-11-08 2003-05-23 Hitachi Ltd 情報取得システム
JP2004206521A (ja) * 2002-12-26 2004-07-22 Nec Corp 文書検索装置および文書検索プログラム

Also Published As

Publication number Publication date
JP4667823B2 (ja) 2011-04-13

Similar Documents

Publication Publication Date Title
CA2578513C (en) System and method for online information analysis
US8355997B2 (en) Method and system for developing a classification tool
CN100485677C (zh) 搜索结果中放置内容排序的个性化
US8037064B2 (en) Method and system of selecting landing page for keyword advertisement
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US20190318407A1 (en) Method for product search using the user-weighted, attribute-based, sort-ordering and system thereof
USRE47167E1 (en) Predictive publishing of internet digital content
KR101274388B1 (ko) 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을수행하기 위한 시스템
JP5786718B2 (ja) 動向情報検索装置、動向情報検索方法およびプログラム
US20090150827A1 (en) System and method for searching for documents
US20190220902A1 (en) Information analysis apparatus, information analysis method, and information analysis program
US8572024B2 (en) Systems and methods for extracting information from structured documents
JP2009503751A (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
KR20140119269A (ko) 소셜 미디어 분석을 기반으로 복합이슈를 탐지하기 위한 장치, 시스템 및 그 방법
KR20150059208A (ko) 소셜 웹 미디어의 이벤트 시공간 연관성 분석 장치 및 그 방법
CN117668373B (zh) 一种级联标签推荐方法、装置、电子设备及存储介质
US20160034915A1 (en) Document performance indicators based on referral context
US20080103882A1 (en) Method for cost-sensitive autonomous information retrieval and extraction
Fernandes et al. Automated disaster news collection classification and geoparsing
JP2015194955A (ja) 入札情報検索システム
CN116450924A (zh) 智慧环保平台生态环境舆情监控系统的分析模块和方法
JP2020091539A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5068358B2 (ja) 回答者抽出装置及びその方法
JP4667823B2 (ja) テーブル監視装置、Webページモニタリングシステム、コンピュータプログラム
KR20100038344A (ko) 위치정보를 기반으로 한 지역정보 광고 방법과 상기 방법을 수행하기 위한 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070905

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071011

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100629

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100817

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110112

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140121

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4667823

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees