JP3476185B2 - 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体 - Google Patents

情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体

Info

Publication number
JP3476185B2
JP3476185B2 JP37134799A JP37134799A JP3476185B2 JP 3476185 B2 JP3476185 B2 JP 3476185B2 JP 37134799 A JP37134799 A JP 37134799A JP 37134799 A JP37134799 A JP 37134799A JP 3476185 B2 JP3476185 B2 JP 3476185B2
Authority
JP
Japan
Prior art keywords
web
information
web content
client
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP37134799A
Other languages
English (en)
Other versions
JP2001188792A (ja
Inventor
嘉徳 土方
義則 青木
周 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP37134799A priority Critical patent/JP3476185B2/ja
Priority to US09/746,236 priority patent/US6934750B2/en
Publication of JP2001188792A publication Critical patent/JP2001188792A/ja
Application granted granted Critical
Publication of JP3476185B2 publication Critical patent/JP3476185B2/ja
Priority to US11/175,095 priority patent/US7490090B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9577Optimising the visualization of content, e.g. distillation of HTML documents

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コンピュータのユ
ーザによるディスプレイ装置の画面上での操作を監視し
て情報を取得する情報処理方法に関する。
【0002】
【従来の技術】近年、オンラインショッピング、バナー
広告等のようなインターネットの商用的な利用が盛んに
なりつつある。そこで、この種のインターネットの利用
方法の効果を上げるため、ウェブサイトの運営者は、ウ
ェブコンテンツに対するユーザの反応(ウェブ視聴率)
の調査を行い、ウェブコンテンツやウェブサイトのデザ
インに反映させたり、One-to-Oneマーケティングに活用
するといったことを行っている。既存のウェブ視聴率調
査の手法では、ウェブサイトの中でユーザがどのような
話題やテーマに注目したかという情報を獲得しようとす
る場合、ユーザからアンケートを取る方法や、ページの
表示時間及びページの訪問回数等のアクセス情報を取得
して、得られた情報を基に推定する方法があった。ここ
で用いられるアクセス情報としては、サーバ側で得られ
るHTTP要求の数(ヒット数)や、クライアント側で
得られる特定のウェブコンテンツの閲覧に関する情報が
ある。
【0003】ウェブ視聴率調査を行うためにアンケート
を取る方法では、ユーザに明示的な入力をしてもらうこ
とによって調査を実施する。具体的には、例えば、ウェ
ブコンテンツに予めアンケートのページを用意して、興
味のあるトピックやキーワードについて答えてもらった
り、ウェブページに「面白かった」「つまらなかった」
などの感想を示すボタンを設けておき、ユーザにクリッ
クしてもらうといった方法が採られる。この方法では、
ユーザによる明示的な入力操作の結果として情報を得ら
れるため、ユーザの抱く興味の傾向などに関して、得ら
れた情報に高い信頼性を期待できる。
【0004】ウェブ視聴率調査で用いるためにサーバ側
で取得できる情報としては、ウェブコンテンツへのHT
TP要求の数(ヒット数)がある。ウェブブラウザでウ
ェブページの1ページを読む場合、当該ウェブページ中
に画像などが埋め込まれたり、フレームが使われている
場合は、当該1ページに対するヒット数は複数となる。
また、ウェブサーバは、当該ウェブコンテンツから他の
ウェブコンテンツへ遷移したときのHTTP要求は受け
取らない。この方法では、ユーザがどの資源(ウェブコ
ンテンツ)にアクセスしたかについては全て記録でき
る。そして、資源の種別(HTML、画像などの別)等
の情報と組み合わせることにより、所定のウェブコンテ
ンツへの滞在時間を推測することができる。
【0005】クライアント側では、ウェブブラウザにて
表示されたウィンドウの状態を監視することができるた
め、サーバに比べて更に詳細な情報を取得することがで
きる。例えば、ページ単位で表示時間を測定したり、ウ
ィンドウの位置、大きさやフォーカスの変化を調べた
り、ユーザによるキー入力からキーワードを記録したり
することができる。また、特定のウェブサイトに縛られ
ることなくユーザの閲覧履歴を記録することができる。
これらの手法で得られた情報に基づいて、ユーザの抱く
興味の傾向などに関して、ある程度推測することができ
る。
【0006】また、ユーザが必要とする情報の獲得を支
援するサービスとして検索エンジンがある。検索エンジ
ンでは、ユーザがキーワードを入力することにより、当
該キーワードを含むページが検索され、提示される。し
かし、検索エンジンで索引可能なページ数は膨大である
ため、適切に検索数を絞り込むことが重要である。検索
数の絞り込みの技術として、検索結果に対してユーザに
自分の興味に適合するページを指摘させ、指摘されたペ
ージの中のキーワードを用いて再度検索を行う手法が取
られていた。この場合、検索結果に対してユーザが検索
目的に適合しているとして選択した文書中のキーワード
を利用して、検索条件の自動変更を行う。これにより、
ユーザの抱く興味の傾向などを検索結果に反映させるこ
とができる。なお、ここでは、指摘されたページ全体に
含まれるキーワードを利用する。
【0007】
【発明が解決しようとする課題】しかし、上記のような
従来のウェブ視聴率調査や検索エンジンにおいて、ユー
ザがどのような話題やテーマに注目したかといったユー
ザの興味に関する情報を取得する場合、得られる情報量
や信頼性の点で十分とはいえなかった。ユーザに対して
アンケートに答えてもらう方法では、ユーザにとっては
アンケートに答えるという負担があるため、高い回答率
が得られない場合があった。同様に、ユーザの負担を考
慮すると、ページ中の文単位のような細かい項目ごとの
評価を要求するといった煩雑なアンケートを行うことは
困難である。さらに、アンケートを行うためには、アン
ケート用のページやボタンを用意するなどの措置が必要
であるため、任意のウェブコンテンツに関する情報を容
易に取得することができなかった。
【0008】サーバマシンやクライアントマシンにおい
て得られる情報を用いて推測する方法では、上記のよう
に、サーバにおいて得られる情報は所定のウェブコンテ
ンツへのヒット数である。そのため、所定のウェブコン
テンツへの滞在時間を推測することはできるが、ユーザ
がどのウェブページをどの程度の時間読んだかというよ
うなウェブページごとの詳細な情報を得ることはできな
い。このような情報は、クライアントマシンにおいてウ
ェブブラウザにて表示されたウィンドウの状態を監視す
ることにより得ることができる。しかし、ウェブブラウ
ザを監視する手段は、アプリケーションプログラムやプ
ロキシサーバとしてクライアントマシンに実装され、ウ
ェブブラウザの外で動作するため、ウェブページのデー
タ構造にアクセスすることができない。そのため、マウ
ス操作の操作対象となるHTML中のオブジェクトを記
録することはできない。したがって、ユーザがウェブコ
ンテンツの中のどの部分に特に興味を持ったかというよ
うな更に詳細な情報を得ることはできない。
【0009】ウェブブラウザ中の情報にアクセスする方
法としては、ウェブコンテンツ自体をJavaアプレッ
トによって実装する方法が考えられる。しかし、この方
法であっても、当該Javaアプレット中の内容しかわ
からないため、一般のウェブページには適用できない。
【0010】また、検索エンジンにおいてユーザの評価
に基づいて検索条件を変更する方法は、上述したよう
に、検索条件を変更するために用いるキーワードが対象
であるウェブページの文書全体から抽出されたものであ
る。そのため、ウェブページの文書中においてユーザが
特に注目した部分(文やキーワード)等を、検索条件に
きめ細かく反映させることができない。
【0011】本発明は以上のような技術的課題を解決す
るためになされたものであって、ユーザによる明示的な
入力を必要とせず、かつウェブコンテンツにおいてユー
ザが興味を持った箇所に関する詳細な情報を取得できる
ようにする。また、ユーザによるウェブブラウザ上での
操作を含む詳細な操作を抽出して、ユーザの抱く興味の
傾向を示す情報として利用できるようにする。
【0012】
【課題を解決するための手段】かかる目的のもと、本発
明は、通信ネットワークにて接続されたサーバとクライ
アントとを備えた情報抽出システムであって、サーバ
は、クライアントにおいて閲覧に供されるデータファイ
ルを提供し、クライアントは、通信ネットワークを介し
てサーバから受信したこのデータファイルの内容を表示
する閲覧手段と、この閲覧手段にて表示されたデータフ
ァイルの内容を閲覧する際にユーザが行った入力操作に
基づいて予め定められた特定の操作を検出する操作検出
手段と、この操作検出手段により検出された、閲覧手段
の表示画面上における特定の操作の行われた場所に表示
されている情報を抽出する手段とを備えることを特徴と
している。
【0013】また本発明は、ウェブコンテンツを格納す
るウェブサーバと、通信ネットワークを介して当該ウェ
ブサーバからウェブコンテンツを受信して表示するクラ
イアントとを備えた情報抽出システムであって、クライ
アントは、このウェブコンテンツの表示画面においてユ
ーザが行った操作を操作イベントとして検出する機能を
備え、ウェブサーバに格納されたこのウェブコンテンツ
は、このクライアントの操作イベント検出機能を用いて
操作イベントを検出する処理と、検出された操作イベン
トの列を解析して予め定められた特定の操作を抽出する
処理と、このウェブコンテンツの中からこの特定の操作
の対象となった情報を抽出して前記ウェブサーバに返送
する処理とをこのクライアントに実行させる、このクラ
イアントの機能を拡張するための機能拡張プログラム言
語にて記述されたプログラムパッケージを埋め込んであ
ることを特徴としている。このような構成とすれば、ウ
ェブコンテンツの作成者がウェブコンテンツにこのよう
なプログラムパッケージを埋め込んでおくことにより、
このウェブコンテンツが情報処理装置からアクセスされ
ることによって、かかる情報処理装置においてユーザが
興味を示した内容に関する情報を取得できる点で優れて
いる。得られた情報は、ウェブ視聴率調査や検索エンジ
ンにおける検索条件の絞り込みといったサービスに利用
することができる。
【0014】これとは異なり、ウェブコンテンツを格納
するウェブサーバと、通信ネットワークを介して当該ウ
ェブサーバからウェブコンテンツを受信して表示するク
ライアントとを備えた情報抽出システムであって、クラ
イアントは、このウェブコンテンツの表示画面において
ユーザが行った操作を操作イベントとして検出する機能
を備え、ウェブサーバは、このクライアントの操作イベ
ント検出機能を用いて操作イベントを検出する処理と、
検出された操作イベントの列を解析して予め定められた
特定の操作を抽出する処理と、このウェブコンテンツの
中からこの特定の操作の対象となった情報を抽出して前
記ウェブサーバに返送する処理とをこのクライアントに
実行させる、このクライアントの機能を拡張するための
機能拡張プログラム言語にて記述されたプログラムパッ
ケージをこのウェブコンテンツに埋め込んでクライアン
トに送信することを特徴としている。このような構成と
すれば、ウェブサーバにおいて、格納されているウェブ
コンテンツに対してユーザが興味を示した情報を取得で
きる点で優れている。得られた情報は、ウェブ視聴率調
査や検索エンジンにおける検索条件の絞り込みといった
サービスに利用することができる。
【0015】さらに、ウェブコンテンツを格納するウェ
ブサーバと、通信ネットワークを介してこのウェブサー
バからウェブコンテンツを受信して付加的な処理を行う
プロキシサーバと、このプロキシサーバにてこの付加的
な処理を施されたこのウェブコンテンツを表示するクラ
イアントとを備えた情報抽出システムであって、クライ
アントは、このウェブコンテンツの表示画面においてユ
ーザが行った操作を操作イベントとして検出する機能を
備え、プロキシサーバは、クライアントの操作イベント
検出機能を用いて操作イベントを検出する処理と、検出
された操作イベントの列を解析して予め定められた特定
の操作を抽出する処理と、このウェブコンテンツの中か
らこの特定の操作の対象となった情報を抽出して前記プ
ロキシサーバに返送する処理とをこのクライアントに実
行させる、このクライアントの機能を拡張するための機
能拡張プログラム言語にて記述されたプログラムパッケ
ージを、ウェブサーバから受信したウェブコンテンツに
埋め込んでクライアントに送信することを特徴としてい
る。このような構成とすれば、プロキシサーバにおい
て、ウェブコンテンツを受信した情報処理装置のユーザ
がこのウェブコンテンツにおける興味を示した内容に関
する情報を取得できる点で優れている。得られた情報
は、ウェブ視聴率調査や検索エンジンにおける検索条件
の絞り込みといったサービスに利用することができる。
【0016】ここで、プロキシサーバは、前記のような
プログラムパッケージをクライアントに送るのではな
く、クライアントにて検出された操作イベントを収集す
る操作イベント取得手段と、このクライアントから受け
取ったこの操作イベントの列を解析して予め定められた
特定の操作を抽出する操作イベント解析手段と、このウ
ェブコンテンツの中からこの特定の操作の対象となった
情報を抽出する情報抽出手段とを備えることを特徴とす
ることができる。このように構成すれば、操作イベント
に基づく特定の操作の抽出及びユーザが興味を持った情
報の抽出をプロキシサーバにおいて実行するため、クラ
イアントにおける負担を軽減させることができる点で好
ましい。プロキシサーバが情報を抽出する対象であるウ
ェブコンテンツは、プロキシサーバがウェブサーバから
受信したものを保持しておいて用いても良いし、情報抽
出の際にクライアントに要求しても良い。
【0017】さらにまた、ウェブコンテンツを格納する
ウェブサイトと、通信ネットワークを介してこのウェブ
サイトからウェブコンテンツを受信して表示するウェブ
ブラウザを備えた情報処理装置と、この情報処理装置に
おけるポータルサイトとを備えた情報抽出システムであ
って、このポータルサイトは、情報処理装置からアクセ
スされた際に、この情報処理装置においてローカルプロ
キシとして動作するプログラムファイルをこの情報処理
装置に送信し、この情報処理装置のウェブブラウザは、
ウェブコンテンツの表示画面においてユーザが行った操
作を操作イベントとして検出する機能を備え、情報処理
装置において動作するこのローカルプロキシは、ウェブ
ブラウザの操作イベント検出機能を用いて操作イベント
を検出する処理と、検出された操作イベントの列を解析
して予め定められた特定の操作を抽出する処理と、この
ウェブコンテンツの中からこの特定の操作の対象となっ
た情報を抽出する処理とをこのウェブブラウザに実行さ
せる、このウェブブラウザの機能を拡張するための機能
拡張プログラム言語にて記述されたプログラムパッケー
ジを、ウェブサーバから受信したこのウェブコンテンツ
に埋め込むと共に、このウェブブラウザにて抽出された
情報を前記ポータルサイトに送信することを特徴として
いる。このような構成とすれば、ポータルサイトにおい
て、情報処理装置のユーザが受信したウェブコンテンツ
における興味を示した内容に関する情報を取得できる点
で優れている。得られた情報は、ウェブ視聴率調査や検
索エンジンにおける検索条件の絞り込みといったサービ
スに利用することができる。
【0018】また、本発明は、文書データを表示する閲
覧手段と、この閲覧手段にて表示された文書を閲覧する
際にユーザが行った入力操作に基づいて、ユーザが興味
を持つ情報に対して無意識的に行った操作として定義付
けた操作を検出する操作検出手段と、この操作検出手段
により検出された、この閲覧手段の表示画面上における
この特定の操作の行われた場所に表示されている文字列
を抽出する文字列抽出手段とを備えることを特徴として
いる。ユーザが興味を持つ情報に対して無意識的に行っ
た操作とは、アンケートへの入力のような積極的な操作
とは異なり、ユーザが文書の内容を注意しながら読む際
に、マウスポインタでテキストをなぞりながら読んだ
り、読んでいる範囲を範囲選択して読んだりするような
無意識的に現れる動作である。これらの動作を検出して
その動作の対象となった情報を取得することにより、ユ
ーザの積極的な入力操作を要請することなくユーザが興
味を示した内容に関する情報を取得できる点で好まし
い。
【0019】ここで文字列抽出手段は、この特定の操作
の行われた場所に表示されている文字列を含む文または
行を単位として抽出を行うことを特徴としている。文ま
たは行を単位として抽出するには、抽出する文字列の範
囲を拡張して、改行コードや「。」等の文または行の区
切りを示す箇所を検出し、その範囲でテキストを抽出す
る。これにより、ユーザが興味を示した内容を、まとま
った意味のある情報として抽出することができる点で好
ましい。
【0020】また、本発明はウェブサーバからウェブコ
ンテンツを受信して表示するウェブブラウザを備えた情
報処理装置と接続し、この情報処理装置の情報を収集す
る情報収集装置において、この情報処理装置において実
行されることにより、このウェブブラウザの操作イベン
ト検出機能を用いて操作イベントを検出する処理と、検
出された操作イベントの列を解析して予め定められた特
定の操作を抽出する処理と、このウェブコンテンツの中
からこの特定の操作の対象となった情報を抽出する処理
とをこのウェブブラウザに実行させる、このウェブブラ
ウザの機能を拡張するための機能拡張プログラム言語に
て記述されたプログラムパッケージを、ウェブサーバか
ら受信したウェブコンテンツに埋め込むプログラムファ
イルを記憶する記憶手段と、このプログラムファイルを
記憶手段から読み出して情報処理装置に送信する送信手
段と、情報処理装置にて抽出されたこの情報を収集する
情報収集手段とを備えることを特徴としている。
【0021】ここで、前記情報収集装置の前記記憶手段
に記憶された前記プログラムファイルは、Javaアプ
レットにて作成され、前記プログラムパッケージをJa
vaスクリプトで記述して前記ウェブコンテンツに埋め
込むことを特徴としている。このように構成すれば、パ
ーソナルコンピュータなどで広く利用されているJav
aに対応したウェブブラウザを用いて情報の抽出を行う
ことができる点で好ましい。また、Javaアプレット
にて作成することにより、予めプログラムファイルを情
報処理装置に配布しておく必要がない点で優れている。
【0022】また、本発明は、文書データを表示する表
示画面上でユーザが行った入力操作に基づいて予め定め
られた特定の操作を検出するステップと、検出された、
この表示画面上におけるこの特定の操作の行われた場所
に表示されている文字列を、この文字列を含む文または
行を単位として抽出するステップとを含むことを特徴と
している。
【0023】更に、本発明は、文書データを表示する表
示画面上でユーザが行った入力操作に基づいて、ポイン
ティングデバイスのポインタを、表示されている文書の
行に沿って移動させるなぞり読み動作を検出するステッ
プと、検出された、この表示画面上におけるこのなぞり
読み動作の行われた場所に表示されている文字列を、こ
の文字列を含む文または行を単位として抽出するステッ
プとを含むことを特徴としている。このような構成とす
れば、なぞり読みが行われた時点で、ユーザによる積極
的な入力操作を必要とせずに、このなぞり読みの行われ
た箇所のテキストを抽出できる点で特に優れている。ま
た、文または行単位で文字列を抽出することにより、ユ
ーザが興味を示した内容を、まとまった意味のある情報
として抽出することができる点で好ましい。
【0024】ここで、この文字列を抽出するステップに
おいて、文書の表示画面におけるポインタが移動した位
置の文字列の1行上の文字列を含む文または行を抽出す
ることを特徴とすることができる。ユーザはなぞり読み
を行っている際に、マウスポインタのある行の一つ上の
行を読む場合がある。そこで、このような構成とすれ
ば、ユーザが興味を持って読んだと推定される情報を漏
らさず抽出することができる点で優れている。更にま
た、本発明は、文書データを表示する表示画面上でユー
ザが行った入力操作に基づいて、ポインティングデバイ
スのポインタを、表示されている文書の行を順に指しな
がら当該行とは直交する方向に移動させる行単位なぞり
読み動作を検出するステップと、検出された、この表示
画面上におけるこの行単位なぞり読み動作の行われた場
所に表示されている文字列を、この文字列を含む文また
は行を単位として抽出するステップとを含むことを特徴
としている。このような構成とすれば、ユーザがマウス
をテキストの行に直交する方向に動かしながら、長い文
章を読んだ場合に、ユーザによる積極的な入力操作を必
要とせずに、この行単位なぞり読みの行われた箇所のテ
キストを抽出できる点で特に優れている。なお、横書き
のテキストにおいては、なぞり読みは行と一致する横方
向のポインタの動きから検出し、行単位なぞり読みは行
と直交する縦方向のポインタの動きから検出する。これ
に対し、縦書きのテキストにおいては、なぞり読みは行
と一致する縦方向のポインタの動きから検出し、行単位
なぞり読みは行と直交する横方向のポインタの動きから
検出する。また、本発明は、コンピュータに実行させる
プログラムを当該コンピュータの入力手段が読取可能に
記憶した記憶媒体において、このプログラムは、文書デ
ータを表示する処理と、この文書データを表示する表示
画面上でユーザが行った入力操作に基づいて予め定めら
れた特定の操作を検出する処理と、検出された、この表
示画面上におけるこの特定の操作の行われた場所に表示
されている文字列を抽出する処理とをこのコンピュータ
に実行させることを特徴としている。このように構成す
れば、このプログラムをロードした情報処理装置におい
て文書データを表示した場合に、ユーザがこの文書にお
ける興味を示した内容に関する情報を取得できる点で優
れている。得られた情報は、ウェブ視聴率調査や検索エ
ンジンにおける検索条件の絞り込みといったサービスを
提供するサーバに転送すれば、これらのサービスに利用
することができる。
【0025】
【発明の実施の形態】以下、添付図面に示す実施の形態
に基づいてこの発明を詳細に説明する。まず、本発明の
概要を説明する。本発明は、ユーザがコンピュータの画
面上で文書を閲覧する際の無意識的なマウスの動きと、
ユーザの興味の対象との間に関連があると考え、マウス
の特徴的な動作を検出することにより、ユーザが興味を
示したと推定される情報を抽出する。マウスの動作に基
づいてユーザの興味に関わる情報を抽出するため、文書
中の文や単語、あるいは挿入されている図表といった小
さな単位でユーザが注目した対象を特定することができ
る。
【0026】本実施の形態では、以下にあげる五つのマ
ウスの動きを、ユーザが興味を持って注目した対象に対
して無意識的に行った操作と定義する。 1.マウスのボタンを押したままマウスポインタを移動
させる(ドラッグする)ことにより、マウスポインタで
指定された範囲のテキストを選択する動作(以下、テキ
スト選択と称す)。 2.マウスポインタをリンクの上に重ねるリンクへのポ
インティング動作。 3.マウスによるリンクのクリック。 4.マウスポインタをテキストの行に沿って横方向に動
かしながらその行を読むときの、当該マウスポインタを
横方向に移動させる動作(以下、なぞり読みと称す)。 5.テキスト中の読んでいる行をマウスポインタで指
し、読む行を移動するのに伴って、マウスポインタを縦
に少しずつ動かす動作(以下、縦方向なぞり読みと称
す)。なお、ここではポインティングデバイスとしてマ
ウスを用いた場合の動作を定義したが、トラックボール
やペンタブレットなどの他のポインティングデバイスを
用いた場合でも、ユーザが興味を持った対象に対して
は、概ね同様の動作を行うと考えられる。したがって、
以下の説明においても、特にポインティングデバイスの
種類を区別することなく、マウスを用いる場合を例とし
て説明する。また、ユーザが興味を持って注目した対象
に対して無意識的に行った操作は上の五つの操作に限定
されるものではない。この他にも、経験的に、ユーザが
興味を持って注目した対象に対して行ったと推定される
操作を任意に定義することによって、情報の抽出に用い
ることができる。
【0027】図1は、本実施の形態における情報抽出シ
ステムの全体構成を説明する図である。同図において、
符号10は操作イベント検出部であり、コンピュータの
画面に表示された文書上におけるマウスの動作を監視し
て、その中から操作イベントを検出する。符号20は操
作イベント解析部であり、操作イベント検出部10によ
り検出された操作イベントの列(以下、操作イベント列
と称す)を解析して、ユーザが興味を示した対象に対し
て行ったと推定される特定の操作を抽出する。符号30
はテキスト抽出部であり、コンピュータの画面に表示さ
れた文書のうちで、操作イベント解析部20により抽出
された操作の対象となったテキストを抽出する。これら
の各構成要素は、コンピュータに上記各処理を実行させ
るためのプログラムモジュールとして実現される。な
お、本実施の形態では、インターネットなどで一般的に
用いられているウェブコンテンツを表示するためのウェ
ブブラウザの表示画面を、マウスの動作を監視する対象
領域とする。すなわち、ウェブブラウザにて表示された
ウェブコンテンツ(ホームページ等)上におけるマウス
の動作から操作イベント検出部10が操作イベントを検
出し、検出した操作イベントから操作イベント解析部2
0が特定の操作を抽出し、テキスト抽出部30がかかる
操作の対象となったテキストをユーザが興味を持って注
目した情報として抽出する。この場合、操作イベント検
出部10,操作イベント解析部20及びテキスト抽出部
30は、ダイナミックHTMLの機能を用いて実現する
ことができる。
【0028】操作イベント検出部10は、JavaScript等
のスクリプト言語を用いてHTMLファイルに埋め込む
形態で実現することができる。JavaScriptでは、マウス
の移動やクリック、ドラッグ、文字列の選択、キーを押
下したり離したりする動作、画面のスクロール等の操作
を、イベントとして抽出することが可能である。例え
ば、マウスの移動に対してonMouseMoveというイベント
ハンドラを定義し、HTMLファイルに記述しておくこ
とにより、マウスが移動した場合に、その動作を操作イ
ベントとして検出することができる。なお、ウェブコン
テンツ以外の、所定のアプリケーションプログラムにて
作成された文書を対象として、当該文書を表示している
表示画面上におけるマウスの動作を監視する場合でも、
オペレーティングシステムのAPI等を利用することに
より、マウスの特定のから操作イベントを抽出すること
ができる。
【0029】操作イベント解析部20は、操作イベント
検出部10により検出された操作イベント列を解析し、
当該操作イベント列が予め定義されている特定の操作に
該当するかどうかを調べる。そして、所定の操作イベン
ト列が当該特定の操作に該当する場合、当該操作が行わ
れたことをテキスト抽出部30に通知する。また、テキ
スト抽出部30におけるテキストの抽出に用いるため、
当該操作が行われた位置(座標値)等の具体的な情報を
テキスト抽出部30に送る。ここで、予め定義された特
定の操作とは、ユーザが興味を持った対象に対して無意
識的に行うと推定された操作である。本実施の形態で
は、上述した五つの操作、すなわち、1.テキスト選
択、2.リンクへのポインティング、3.リンクのクリ
ック、4.なぞり読み、5.縦方向なぞり読みを特定の
操作として定義する。操作イベント検出部10により検
出された操作イベント列の中からこれらの特定の操作を
抽出する処理の詳細については後述する。
【0030】テキスト抽出部30は、操作イベント解析
部20から特定の操作を抽出したことを示す通知を受け
取ると、操作イベント解析部20からさらにテキストの
抽出に必要な座標値などの情報を受信する。そして、受
け取った情報を用いて、ウェブブラウザにて表示されて
いるウェブコンテンツの該当個所から、当該特定の操作
の対象となったテキストを取得する。操作イベント解析
部20によって抽出される特定の操作ごとにおけるテキ
ストの抽出処理の詳細については後述する。
【0031】なお、取得したテキストは、当該テキスト
を利用する他のシステムに送信される。例えば、ウェブ
視聴率調査を行うシステムや検索エンジンにおいて、テ
キスト抽出部30により取得されたテキストを受信し、
ユーザが興味を持った対象に関する情報として利用する
ことができる。
【0032】図2は、操作イベント検出部10、操作イ
ベント解析部20及びテキスト抽出部30の働きを概念
的に説明する図である。図2において、操作イベント検
出部10、操作イベント解析部20及びテキスト抽出部
30は、JavaScriptで記述され、ウェブコンテンツ20
0に埋め込まれているものとする。図2を参照すると、
まず、ウェブブラウザにて表示されたウェブコンテンツ
200のうち、所定のテキスト201に対してマウスに
よる特定の操作が行われたものとする(211)。する
と、操作イベント検出部10により、マウスの動作に基
づく操作イベントが検出される。検出された操作イベン
トは操作イベント解析部20に送られる(212)。次
に、操作イベント解析部20により、操作イベント列の
解析が行われて、特定の操作が抽出される。そして、特
定の操作が抽出されたことを示す通知及び操作の内容に
関する情報がテキスト抽出部30に送られる(21
3)。この後、テキスト抽出部30により、抽出された
特定の操作に応じた処理が行われて、ウェブコンテンツ
200の中からテキスト201が抽出される(21
4)。
【0033】こうして得られたテキスト201は、ユー
ザがウェブコンテンツ200を閲覧する際に、興味を持
った情報であると考えられるため、ウェブ視聴率の調査
や、検索エンジンにおける検索条件の絞り込み等、種々
のサービスに利用することができる。そこで、抽出され
たテキスト201は、当該テキスト201をユーザに関
する情報として利用しようとする利用者に送られる必要
がある。テキスト201の送信は、スクリプトの形でウ
ェブコンテンツ200に埋め込んでおき、ウェブブラウ
ザの機能を用いて行ったり、所定のプログラムを情報処
理装置に提供しておき、当該プログラムの機能にて行う
等、種々の方法を採ることができる。
【0034】次に、個々の特定の操作ごとに、本実施の
形態によるテキストを取得する処理を詳細に説明する。
まず、特定の操作としてテキスト選択が行われた場合に
ついて説明する。操作イベント解析部20は、操作イベ
ント検出部10から送られてくる操作イベント列の中か
ら、テキストを選択する操作を行った時に発生するsele
ctイベントを検出すると、このselectイベントに基づい
て、テキスト選択の操作に対応するselectionオブジェ
クトを取得する。テキスト選択の捜査の終了は、押下さ
れているマウスボタンを離した時に発生するmouseupイ
ベントによって認識することができる。なお、ダイナミ
ックHTMLでは、テキスト選択の操作を行うと、選択
された範囲をselectionオブジェクトとして取得するこ
とができる。したがって、ダイナミックHTMLに対応
したウェブブラウザにおいては、ユーザによるテキスト
選択の操作に応じて直ちにselectionオブジェクトが取
得されることとなる。
【0035】テキスト抽出部30は、操作イベント解析
部20にて生成されたselectionオブジェクトを用い
て、選択されたテキストを抽出する。これにより、図4
に示すように、「This cat is very smart.」という文
の中から「cat is very」という文字列が抽出される。
そして、抽出された文字列「cat is very」が所定のシ
ステムに送られ、ユーザが興味を持って注目した情報と
して利用される。
【0036】図3は、上述したテキスト抽出部30によ
るテキスト抽出処理を、ダイナミックHTMLを用いて
実現する場合のプログラムを説明する図である。図4
は、当該プログラムにより、「This cat is very smar
t.」という文の中から「cat isvery」というテキスト列
が選択された場合のテキスト抽出の課程を説明する図で
ある。ここでは、テキストを抽出するための関数として
getSelectedText関数を定義する。getSelectedText関数
の引数は、ユーザのテキスト選択により発生したselect
ionオブジェクトslである(図4のselectionオブジェク
ト401)。図3のプログラムリストの3行目におい
て、取得したselectionオブジェクトslに基づいて、cre
ateRangeメソッドによりTextRangeオブジェクトtrを生
成する(図4のTextRangeオブジェクト402)。ここ
で、TextRangeオブジェクトとは、ダイナミックHTM
Lでテキスト操作を行うためのオブジェクトである。次
に、プログラムリストの4行目において、TextRangeオ
ブジェクトのtextプロパティにより、選択範囲のテキス
ト「cat is very」を抽出する(図4のテキスト40
3)。
【0037】次に、特定の操作としてリンクのポインテ
ィングが行われた場合について説明する。操作イベント
解析部20は、操作イベント検出部10から送られてく
る操作イベント列の中から、マウスポインタがリンクの
上に乗った時に発生するイベントと、リンクから外れた
時に発生するイベントを用いてリンクのポインティング
操作を検出する。本実施の形態では、これらのイベント
発生と同時に、リンクタグの付けられているテキストと
リンクが張られた部分を持つテキストとを文または行の
単位で抽出する。また、マウスポインタが単にリンクの
上を通過した場合と、偶然リンクの上でマウスポインタ
が長時間停止した場合とを排除するため、ポインティン
グしていた時間を測定して判断材料とする。
【0038】具体的には、まず、マウスポインタがリン
クの上に乗ったことを示すイベント(mouseoverイベン
ト)が発生すると、その発生時刻t1を記憶する。その
後、マウスの移動イベント(mousemoveイベント)が発
生すると、リンク上のマウスポインタの位置(座標値)
を求める。次に、マウスポインタがリンクから外れたこ
とを示すイベント(mouseoutイベント)が発生したなら
ば、その発生時刻t2を求める。そして、しきい値
l、Thに対して、Tl<(t2−t1)<Thであれ
ば、マウスによるリンクのポインティング操作が行われ
たものと認識してテキスト抽出部30に通知し、mousem
oveイベントにより得られたマウスポインタの位置情報
をテキスト抽出部30に送る。ここで、しきい値Tl
hはユーザが無意識にマウスポインタをリンク上に通
過させた場合と偶然マウスポインタがリンク上で長時間
停止した場合とを排除するために設けられたものであ
る。すなわち、Tl≧(t2−t1)の場合は、マウス
ポインタがリンク上を通過したに過ぎないと判断して、
テキスト抽出部30への通知は行わない。また、(t2
−t1)≧Thの場合は、偶然マウスポインタがリンク
上に長時間位置したものと判断して、テキスト抽出部3
0への通知は行わない。
【0039】テキスト抽出部30は、リンクのポインテ
ィング操作が行われたことを知らせる通知を受け取る
と、当該ポインティング操作が行われた箇所がリンクタ
グであれば、当該リンクタグの付けられたテキストを文
または行の単位で抽出する。また、当該ポインティング
操作が行われた箇所が文中の所定の箇所に張られたリン
クであれば、当該リンクを含むテキストを文または行の
単位で抽出する。
【0040】ここで、文または行の単位でテキストを抽
出する方法について説明する。テキストを文または行の
単位で区切るには、まず、ポインティング操作の対象と
なったリンクタグまたはポインティング操作が行われた
位置(座標値)から抽出対象のテキストの範囲を順次広
げていく。そして、改行コード、「。」「、」「.」等
の文や行の区切りを示す記号が現れたところでテキスト
の範囲の拡張を止め、得られたテキスト列を抽出する。
【0041】図5は、上述したテキスト抽出部30によ
るテキスト抽出処理を、ダイナミックHTMLを用いて
実現する場合のプログラムを説明する図である。図6
は、当該プログラムにより、ウェブブラウザにて表示さ
れたウェブコンテンツの文書の中から「This cat is ve
ry smart」という文のなかのリンク(下線が引かれた
「cat」の部分)にポインティングが行われた場合のテ
キスト抽出の課程を説明する図である。ここでは、テキ
ストを抽出するための関数としてgetLinkTagText関数と
getLinkText関数とを定義する。
【0042】getLinkTagText関数は、リンクタグの付け
られたテキストを抽出する関数である。引数はアンカー
オブジェクトanchorである。そして、図5のプログラム
リストの3行目において、当該リンクタグの付けられて
いるテキスト全部の抽出を行っている。getLinkText関
数は、リンクを張られた部分を持つテキストを文または
行の単位で抽出する関数である。引数はマウスポインタ
の存在する座標である。以下、図6を参照しながら、ge
tLinkText関数によるテキストの抽出の処理を説明す
る。図5のプログラムリストの8行目において、bodyオ
ブジェクトに対してcreateTestRangeメソッドを用い、
当該ウェブコンテンツのページ全体を含むTextRangeオ
ブジェクトを生成する(図6のTextRangeオブジェクト
601)。次に、プログラムリストの9行目において、
moveToPointメソッドにより、TextRangeオブジェクトに
マウスポインタが指している文字を指し示すようにする
(図6のTextRangeオブジェクト602)。次に、プロ
グラムリストの10行目において、テキストの選択領域
を変更する関数(図6のchangeTextRange関数は、この
処理を行うために定義した関数である)により、TextRa
ngeオブジェクトの選択範囲を文または行の単位まで拡
張する(図6のTextRangeオブジェクト603)。最後
に、プログラムリストの11行目において、TextRange
オブジェクトのTextプロパティにより、テキスト「This
cat is very smart.」を抽出する(図6のテキスト6
04)。
【0043】次に、特定の操作としてリンクのクリック
が行われた場合について説明する。操作イベント解析部
20は、操作イベント検出部10から送られてくる操作
イベント列の中から、リンクをクリックしたときに発生
するイベントを用いてリンクのクリック操作を検出す
る。本実施の形態では、リンクのポインティングの場合
と同様に、イベント発生と同時に、リンクタグの付けら
れているテキストとリンクが張られた部分を持つテキス
トとを文または行の単位で抽出する。具体的には、マウ
スポインタがリンクの上に乗ったことを示すイベント
(mouseoverイベント)が発生すると、その発生時刻t
1を記憶する。その後、マウスの移動イベント(mousem
oveイベント)が発生すると、リンク上のマウスポイン
タの位置(座標値)を求める。次に、クリックイベント
(clickイベント)が発生したならば、テキスト抽出部
30に通知し、mousemoveイベントにより得られたマウ
スポインタの位置情報をテキスト抽出部30に送る。
【0044】テキスト抽出部30は、リンクのクリック
操作が行われたことを知らせる通知を受け取ると、当該
クリック操作が行われた箇所がリンクタグであれば、当
該リンクタグの付けられたテキストを文または行の単位
で抽出する。また、当該クリック操作が行われた箇所が
文中の所定の箇所に張られたリンクであれば、当該リン
クを含むテキストを文または行の単位で抽出する。テキ
スト抽出部30によるテキスト抽出の処理は、上述した
ポインティング操作の場合と同様であるため、説明を省
略する。
【0045】次に、特定の操作としてなぞり読みが行わ
れた場合について説明する。なぞり読みの抽出は、マウ
スの移動イベントで得られるマウスポインタの位置(座
標値)とイベント発生時刻とを利用して行う。なぞり読
みの動きはマウスの水平方向の直線上の動きであり、こ
れを検出する方法はいくつか考えられるが、本実施の形
態では以下のような手法を用いる。まず、マウスの動き
に途切れのない水平方向の連続移動を検出する。そし
て、水平方向への連続移動の長さが所定のしきい値以上
の場合になぞり読みとして検出する。これは、偶然マウ
スが水平方向の直線移動をした動作を排除するためであ
る。このような場合に発生するマウスの水平方向の移動
は、あまり長くならないと考えられるので、適当なしき
い値を設定することにより排除することができる。な
お、水平方向への連続移動は、マウスの移動イベントが
発生するたびに、次の条件を判断することにより検出で
きる。第1に、最も新しい数回分(2〜4回程度)のマ
ウスポインタの座標から得られる移動の傾きからマウス
が表示画面上で水平方向の移動をしているかどうかを判
断する。第2に、最後のイベント発生時刻とその直前の
イベント発生時刻との差からマウスの動きが途切れてい
ないかどうかを判断する。以上の条件を満足して、マウ
スが水平方向の移動をし、かつ動きが途切れていないと
判断された場合、マウスは水平方向への連続移動をして
いると認識する。そして、この二つの条件のどちらかが
満たされなくなった場合、水平方向への連続移動が終了
したと判断する。
【0046】以上の前提に基づいて、操作イベント解析
部20がなぞり読みの操作を検出する処理について説明
する。以下の説明において、パラメータArは、マウス
の移動方向を水平方向とみなすかどうかを決定するため
の傾きに関するしきい値である。パラメータTrは、マ
ウスの動作が連続移動であるかどうかを決定するための
停止時間に関するしきい値である。また、パラメータL
は、検出された水平方向への連続移動をなぞり読みと判
断するための移動の長さに関するしきい値である。な
お、座標は直交するx−y座標にて表され、x方向が表
示画面の水平方向(すなわち、行と平行な方向)、y方
向が表示画面の垂直方向(すなわち、行と直交する方
向)とする。操作イベント解析部20は、mousemoveイ
ベントが発生するたびに、当該マウスポインタの座標
(xi,yi)とn回前に発生したmousemoveイベントに
おけるマウスポインタの座標(xi-n,yi-n)との差
(xi−xi-n,yi−yi-n)を求める。そして、x方向
(水平方向)の差が正の値であれば、傾きaを下式 a=(yi−yi-n)/(xi−xi-n) で求める。また、最後のイベント発生時刻tiとその直
前のイベント発生時刻ti -1との間の時間間隔tdを下式 td=ti−ti-1 で求める。そして、求まったa、tdの値に応じて、次
の4種類の処理のうちのいずれかを実行する。 (1)水平方向への連続移動をしていることを示すフラ
グrflagがオフで、a<Arかつtd<Tr(傾き及び
直前のイベントとの時間間隔がしきい値の範囲内)であ
る場合:マウスによる水平方向への連続移動が始まった
と解釈し、フラグrflagをオンにして、マウスポインタ
の座標(xi,yi)を記憶する。 (2)フラグrflagがオフでa≧Arまたはtd≧Tr
(傾きまたは直前のイベントとの時間間隔のうち少なく
ともいずれか一方がしきい値の範囲を越えている)であ
る場合:マウスによる水平方向の連続移動が行われてい
ないと解釈する。 (3)フラグrflagがオンで、a<Arかつtd<Tr
である場合:マウスによる水平方向への連続移動中であ
ると解釈し、マウスポインタの座標(xi,yi)を記憶
する。 (4)フラグrflagがオンでa≧Arまたはtd≧Tr
である場合:マウスによる水平方向への連続移動が終了
したと解釈し、フラグrflagをオフにする。記憶したマ
ウスの水平方向への連続移動中におけるマウスポインタ
の座標から、当該動作の始点と終点のx座標、当該動作
を行っている間のy座標の平均、及び移動の長さlを算
出する。ここで、l<Lであれば、抽出された移動の長
さがしきい値Lよりも短いため、この動作をなぞり読み
としては検出しない。l≧Lであれば、この動作をなぞ
り読みとして検出する。以上のようにして、なぞり読み
操作が検出されたならば、操作イベント解析部20は、
テキスト抽出部30に通知し、mousemoveイベントによ
り得られたなぞり読みの始点及び終点におけるマウスポ
インタの座標(位置情報)をテキスト抽出部30に送
る。
【0047】テキスト抽出部30は、なぞり読み操作が
行われたことを知らせる通知を受け取ると、当該なぞり
読みの行われた箇所のテキストを抽出する。ここで、テ
キストの抽出は、なぞり読みを行ったときにマウスポイ
ンタの重なっている行のテキスト及びその一つ上の行の
テキストを、文または行の単位でそれぞれ抽出する。マ
ウスポインタの重なっている行及び一つ上の行を抽出す
る理由は、ユーザはなぞり読みを行っている際に、マウ
スポインタと同じ行または一つ上の行を読む傾向がある
ためである。したがって、マウスポインタの重なってい
る行及び一つ上の行を抽出することにより、ユーザが興
味を持って注目したと考えられる情報が抽出対象から外
れにくくなる。なお、マウスポインタの重なっている行
及び一つ上の行の両方からテキストを抽出するのではな
く、いずれか一方からのみ抽出するようにしても良い。
マウスポインタの重なっている行の一つ上の行を認識す
るためには、マウスポインタの位置を基準として、y座
標の上の方向に順次着目し、検出される文字列が変わっ
たところで一つ上の行に移ったと判断する。具体的に
は、まず、マウスポインタの存在する場所の文字とその
m個前の文字及びn個後の文字の合計三文字を記憶す
る。ここで、m、nは2以上の適当な数である。この
後、マウスポインタの位置(座標値)からy座標の上の
方向に数ドットずつ座標を動かして着目してゆき、順次
着目する座標の文字とそのm個前の文字及びn個後の文
字を取得する。そして、これらを先に記憶したマウスポ
インタの存在する場所の文字及びその前後の文字と比較
する。比較の結果三つの文字が全て一致した場合は、未
だマウスポインタが重なっている行と認識し、それ以外
は、一つ上の行であると認識する。
【0048】マウスポインタの重なっている行とその一
つ上の行とを識別するために、マウスポインタの存在す
る場所の文字と前後に数個ずつ離れた二つの文字の合計
3文字を用いる理由について説明する。まず、一文字の
みで認識しようとすると、偶然マウスポインタのある場
所の文字とその上に位置する文字とが一致してしまう場
合がある。そこで、信頼性を高めるために複数の文字を
用いて行の認識を行う。また、マウスポインタのある場
所の文字から数個離れた文字を用いるのは、マウスポイ
ンタの重なっている文字が含まれる単語の上に偶然同一
の単語が存在する場合は、マウスポインタの位置の文字
を含む数文字が上下の行で同一となるため、これを排除
する必要があるためである。さらに、マウスポインタの
ある場所の文字の前と後に位置する文字をそれぞれ用い
るのは、マウスポインタのある場所の文字がページの先
頭や末尾である場合、前方のみまたは後方のみから文字
を取ると、マウスポインタのある文字から数個離れた文
字の位置が当該ページから外れてしまう場合があるが、
そのような場合でもマウスポインタのある場所の文字の
前後から比較用の文字を取っておけば、行の識別を行う
ことが可能となるためである。マウスポインタが重なっ
ている行の一つ上の行を認識する手順を、図7を参照し
て説明する。図7において、まず、マウスポインタの重
なっている行の三つの文字("j","r","e")を記憶す
る。その後、着目する座標(後述するTextRangeオブジ
ェクトの選択範囲)を、マウスポインタのある座標から
y座標の上方向に数ドットずつ動かし、その座標にある
行の三つの文字("i","r","o")を取得する。ここで
は、マウスポインタのある文字は"r"と"r"で同一である
が、"j"と"i"、及び"e"と"o"の二組が異なるため、一つ
上の行であると認識できる。
【0049】以上の前提に基づいて、テキスト抽出部3
0がなぞり読みの対象となった行及びその一つ上の行か
らテキストを抽出する処理について説明する。図8は、
上述したテキスト抽出部30によるテキスト抽出処理
を、ダイナミックHTMLを用いて実現する場合のプロ
グラムを説明する図である。ここでは、なぞり読みを検
出した際におけるテキストの抽出のために、getTracedT
ext関数を定義する。getTracedText関数は、操作イベン
ト解析部20でなぞり読みを検出した後に、マウスポイ
ンタの座標を用いてマウスポインタの重なっている行ま
たは一つ上の行のテキストを抽出する関数である。引数
のx、yはマウスポインタの存在する座標(x,y)で
ある。また、upは抽出する行を示し、up=falseの
場合はマウスポインタと重なっている行を抽出し、up
=trueの場合はマウスポインタと重なっている行の一つ
上の行を抽出する。図8のプログラムリストの3行目に
おいて、TextRangeオブジェクトを生成する。また、4
行目において、マウスポインタの存在する座標(x,
y)にある文字に、TextRangeオブジェクトの選択範囲
を移動する。プログラムリストの5〜25行の処理は、
マウスポインタと重なっている行の一つ上の行を認識す
る処理である。まず、7〜11行において、マウスポイ
ンタの重なっている行にある三つの文字(centerchar1,
rightchar1, leftchar1)を取得する。これは、マウス
ポインタの位置にある文字(centerchar1)とその後方
CMOVE文字先の文字(rightchar1)及び前方CMO
VE文字先の文字(leftchar1)である。次に、12〜
24行において、マウスポインタの存在する位置からP
MOVEポイントずつy座標の上方向に移動し、その位
置での文字とその前後CMOVE文字ずつ先の2文字の
合計3文字(centerchar2, rightchar2, leftchar2)を
取得する。そして、7〜11行で取得した(centerchar
1, rightchar1, leftchar1)と比較する。この中で一つ
でも異なるものがあれば、一つ上の行と認識する。この
後、26行目で、文または行の単位までTextRangeオブ
ジェクトの選択範囲を拡張し、27行目で、その行のテ
キストを抽出する。マウスが重なっている行またはその
一つ上の行において、文または行の単位でテキストを抽
出する方法は、リンクのポインティング操作において説
明した方法と同様である。
【0050】次に、特定の操作として縦方向なぞり読み
が行われた場合について説明する。縦方向なぞり読み
は、読んでいるテキストの行をマウスポインタで指しな
がら、マウスポインタを行と直交する方向に少しずつ動
かす読み方で、移動距離の短い、非常にゆっくりとした
マウスの動きとなる。縦方向なぞり読みの抽出は、マウ
スの移動イベントで得られるマウスポインタの座標
(x,y)とイベント発生時刻を利用して行う。縦方向
なぞり読みを検出する方法は、いくつか考えられるが、
本実施の形態では以下の方法を用いる。まず、マウスの
動きに途切れのない垂直方向への連続移動を検出する。
そして、垂直方向への連続移動の長さがしきい値以上の
場合に縦方向なぞり読みとして検出する。これは、偶然
マウスが垂直方向の直線移動した動作を排除するためで
ある。なお、垂直方向への連続移動は、マウスの移動イ
ベントが発生するたびに、次の条件を判断することによ
り検出できる。第1に、最後のイベントにおけるマウス
ポインタの座標とその直前のイベントにおけるマウスポ
インタの座標の変位とから、マウスがウィンドウ上で垂
直方向の移動をしているかどうかを判断する(縦方向な
ぞり読みのマウスの動きは非常に遅くかつ短いため、傾
きではなくマウスポインタの座標の変位に基づいて判断
する)。第2に、最後のイベント発生時刻とその直前の
イベント発生時刻との差からマウスの動きが途切れてい
ないかどうかを判断する。以上の条件を満足して、マウ
スが垂直方向の移動をし、かつ動きが途切れていないと
判断された場合、マウスは垂直方向への連続移動をして
いると認識する。そして、この二つの条件のどちらかが
満たされなくなった場合、垂直方向への連続移動が終了
したと判断する。
【0051】以上の前提に基づいて、操作イベント解析
部20が縦方向なぞり読みの操作を検出する処理につい
て説明する。以下の説明において、パラメータXr、Y
rは、マウスの移動方向を垂直方向とみなすかどうかを
決定するためのマウスの移動における変位のしきい値で
ある。パラメータTrは、マウスの動作が連続移動であ
るかどうかを決定するための停止時間に関するしきい値
である。また、パラメータLは、検出された垂直方向へ
の連続移動を縦方向なぞり読みと判断するための移動の
長さに関するしきい値である。なお、座標は直交するx
−y座標にて表され、x方向が表示画面の水平方向(す
なわち、行と平行な方向)、y方向が表示画面の垂直方
向(すなわち、行と直交する方向)とする。操作イベン
ト解析部20は、mousemoveイベントが発生するたび
に、当該マウスポインタの座標(xi,yi)とその直前
に発生したmousemoveイベントにおけるマウスポインタ
の座標(xi-1,yi-1)との差(xi−xi-1,yi−y
i-1)を求める。そして、0<yi−yi-1<Yrであれ
ば、次に、x方向の差の絶対値dを下式 d=|xi−xi-1| で求める。また、最後のイベント発生時刻tiとその直
前のイベント発生時刻ti -1との間の時間間隔tdを下式 td=ti−ti-1 で求める。そして、求まったd、tdの値に応じて、次
の4種類の処理のうちのいずれかを実行する。 (1)垂直方向への連続移動をしていることを示すフラ
グrflagがオフで、d<Xrかつtd<Tr(x方向の
変位及び直前のイベントとの時間間隔がしきい値の範囲
内)である場合:マウスによる垂直方向への連続移動が
始まったと解釈し、フラグrflagをオンにして、マウス
ポインタの座標(xi,yi)を記憶する。 (2)フラグrflagがオフでd≧Xrまたはtd≧Tr
(x方向の変位または直前のイベントとの時間間隔のう
ち少なくともいずれか一方がしきい値の範囲を越えてい
る)である場合:マウスによる垂直方向の連続移動が行
われていないと解釈する。 (3)フラグrflagがオンで、d<Xrかつtd<Tr
である場合:マウスによる垂直方向への連続移動中であ
ると解釈し、マウスポインタの座標(xi,yi)を記憶
する。 (4)フラグrflagがオンでd≧Xrまたはtd≧Tr
である場合:マウスによる垂直方向への連続移動が終了
したと解釈し、フラグrflagをオフにする。記憶したマ
ウスの垂直方向への連続移動中におけるマウスポインタ
の座標から、当該動作の始点と終点のy座標、当該動作
を行っている間のx座標の平均、及び移動の長さlを算
出する。ここで、l<Lであれば、抽出された移動の長
さがしきい値Lよりも短いため、この動作を縦方向なぞ
り読みとしては検出しない。l≧Lであれば、この動作
を縦方向なぞり読みとして検出する。以上のようにし
て、縦方向なぞり読み操作が検出されたならば、操作イ
ベント解析部20は、テキスト抽出部30に通知し、mo
usemoveイベントにより得られたなぞり読みの始点及び
終点におけるマウスポインタの座標(位置情報)をテキ
スト抽出部30に送る。
【0052】テキスト抽出部30は、縦方向なぞり読み
操作が行われたことを知らせる通知を受け取ると、当該
なぞり読みの行われた箇所のテキストを抽出する。ここ
で、テキストの抽出は、縦方向なぞり読みを行ったとき
にマウスポインタの重なっている行のテキスト及びその
一つ上の行のテキストを、文または行の単位でそれぞれ
抽出する。また、マウスポインタの重なっている行また
は一つ上の行のいずれか一方からのみ抽出するようにし
ても良い。テキスト抽出部30による具体的なテキスト
抽出の処理は、上述したなぞり読みの場合と同様である
ため、説明を省略する。
【0053】なお、以上の説明において、マウスポイン
タをテキストの行に沿って横方向に動かす動作をなぞり
読みと呼び、テキスト中の読んでいる行をマウスポイン
タで指し、マウスポインタを行に直交する方向に少しず
つ動かす動作を縦方向なぞり読みと呼んだが、これはテ
キストが横書きであることを前提としたためである。テ
キストが縦書きである場合は、行に沿った縦方向の動作
がなぞり読みであり、行と直交する横方向の動作が縦方
向なぞり読みに相当する。
【0054】以上説明した本実施の形態における情報抽
出システムは、インターネットなどのネットワークに接
続し、ウェブブラウザを搭載した情報処理装置において
機能する。すなわち、当該情報処理装置がウェブサーバ
から受信したウェブコンテンツをウェブブラウザにて表
示し、表示された当該ウェブコンテンツの内容をユーザ
が閲覧する際に、無意識に行う上記の各操作を操作イベ
ントとして検出し、そのような操作の対象となったテキ
ストを抽出する。ここで、情報処理装置に本実施の形態
における情報抽出システムの機能を提供する手段とし
て、種々の形態が考えられる。以下、代表的な提供形態
について図9乃至図12を参照して説明する。
【0055】図9に示す提供形態は、操作イベント検出
部10、操作イベント解析部20及びテキスト抽出部3
0をJavaScript等のスクリプト言語で記述し、ウェブサ
ーバ100に格納されるウェブコンテンツ101に予め
埋め込んでおく形態である。これにより、情報処理装置
110がウェブサーバ100からウェブコンテンツ10
1を受信すると、ウェブブラウザ111は、ウェブコン
テンツ101に埋め込まれているスクリプト102に基
づいて、上述した操作イベントを検出する処理、操作イ
ベント列を解析して文字列の選択、リンクのポインティ
ング、なぞり読み等の上記特定の操作を検出する処理、
及び当該操作の対象である文字列を抽出する処理を実行
する。抽出されたテキストは、ウェブサーバ100に返
送される。抽出されたテキストをウェブサーバ100に
返送する機能は、操作イベント検出部10、操作イベン
ト解析部20及びテキスト抽出部30と同様に、スクリ
プトとしてウェブコンテンツ101に埋め込むことによ
って提供しても良いし、Javaアプレット等の形でウ
ェブコンテンツ101と一緒に情報処理装置110に配
信しても良い。こうして得られたテキストは、ユーザが
ウェブコンテンツ101を閲覧する際に、興味を持った
情報であると考えられるため、ウェブサーバ100にお
いて、ウェブ視聴率の調査や、検索エンジンにおける検
索条件の絞り込み等、種々のサービスに利用することが
できる。
【0056】図10に示す提供形態は、ウェブサーバ1
00が、ウェブコンテンツ101に対して操作イベント
検出部10、操作イベント解析部20及びテキスト抽出
部30をJavaScript等のスクリプト言語で書き込む書き
込み処理部120を備える形態である。この形態では、
情報処理装置110からウェブコンテンツ101へのア
クセス要求が出されると、ウェブサーバ100では、ま
ず書き込み処理部120により、当該ウェブコンテンツ
101に対して操作イベント検出部10、操作イベント
解析部20及びテキスト抽出部30の機能を実現するス
クリプトが書き込まれる。その上で、当該ウェブコンテ
ンツ101が情報処理装置110に送信される。情報処
理装置110のウェブブラウザ111は、受信したウェ
ブコンテンツ101に埋め込まれているスクリプトに基
づいて、上述した操作イベントを検出する処理、操作イ
ベント列を解析して文字列の選択、リンクのポインティ
ング、なぞり読み等の上記特定の操作を検出する処理、
及び当該操作の対象である文字列を抽出する処理を実行
する。抽出されたテキストは、ウェブサーバ100に返
送される。抽出されたテキストをウェブサーバ100に
返送する機能は、操作イベント検出部10、操作イベン
ト解析部20及びテキスト抽出部30と同様に、スクリ
プトとしてウェブコンテンツ101に埋め込むことによ
って提供しても良いし、Javaアプレット等の形でウ
ェブコンテンツ101と一緒に情報処理装置110に配
信しても良い。こうして得られたテキストは、ユーザが
ウェブコンテンツ101を閲覧する際に、興味を持った
情報であると考えられるため、ウェブサーバ100にお
いて、ウェブ視聴率の調査や、検索エンジンにおける検
索条件の絞り込み等、種々のサービスに利用することが
できる。
【0057】図11に示す提供形態は、ウェブサーバ1
00と情報処理装置110との間にプロキシサーバ13
0を介在させ、当該プロキシサーバ130において、ウ
ェブコンテンツ101に対して操作イベント検出部1
0、操作イベント解析部20及びテキスト抽出部30を
JavaScript等のスクリプト言語で書き込む形態である。
この形態では、情報処理装置110からウェブコンテン
ツ101へのアクセス要求が出され、ウェブサーバ10
0から情報処理装置110へウェブコンテンツ101が
送られると、まずプロキシサーバ130が当該ウェブコ
ンテンツ101を受信する。そして、当該ウェブコンテ
ンツ101に対して操作イベント検出部10、操作イベ
ント解析部20及びテキスト抽出部30の機能を実現す
るスクリプトを書き込み、その上で、当該ウェブコンテ
ンツ101を情報処理装置110に送信する。情報処理
装置110のウェブブラウザ111は、受信したウェブ
コンテンツ101に埋め込まれているスクリプトに基づ
いて、上述した操作イベントを検出する処理、操作イベ
ント列を解析して文字列の選択、リンクのポインティン
グ、なぞり読み等の上記特定の操作を検出する処理、及
び当該操作の対象である文字列を抽出する処理を実行す
る。抽出されたテキストは、プロキシサーバ130に送
信される。抽出されたテキストをプロキシサーバ130
に送信する機能は、操作イベント検出部10、操作イベ
ント解析部20及びテキスト抽出部30と同様に、スク
リプトとしてウェブコンテンツ101に埋め込むことに
よって提供しても良いし、Javaアプレット等の形で
ウェブコンテンツ101と一緒に情報処理装置110に
配信しても良い。こうして得られたテキストは、ユーザ
がウェブコンテンツ101を閲覧する際に、興味を持っ
た情報であると考えられるため、プロキシサーバ130
において、ウェブ視聴率の調査や、検索エンジンにおけ
る検索条件の絞り込み等、種々のサービスに利用するこ
とができる。
【0058】また、図11の提供形態の変形例として、
プロキシサーバ130はウェブコンテンツ101に対し
て操作イベント解析部20及びテキスト抽出部30の機
能を実現するスクリプトの埋め込みを行わず、情報処理
装置110において操作イベントの検出のみを実行させ
るようにしても良い。この場合、プロキシサーバ130
に操作イベント解析部20及びテキスト抽出部30が設
けられる。情報処理装置110において検出された操作
イベントは、プロキシサーバ130に送られる。そし
て、プロキシサーバ130において、操作イベント列を
解析して文字列の選択、リンクのポインティング、なぞ
り読み等の上記特定の操作を検出する処理、及び当該操
作の対象である文字列を抽出する処理が実行される。情
報処理装置110において検出された操作イベントをプ
ロキシサーバ130に転送するには、プロキシサーバ1
30がウェブコンテンツ101を情報処理装置110に
送る際に、当該ウェブコンテンツ101に操作イベント
を返送するためのスクリプトを埋め込んでも良いし、プ
ロキシサーバ130から操作イベントの送信を情報処理
装置110に対して要求して送信させるようにしても良
い。また、プロキシサーバ130は、ウェブサーバ10
0から受信したウェブコンテンツ101を保持してお
き、当該保持されたウェブコンテンツ101からテキス
ト抽出部30がテキストを抽出するようにしても良い
し、該当するウェブコンテンツ101を情報処理装置1
10から転送するようにしても良い。
【0059】図12に示す提供形態は、情報処理装置1
10がインターネットに接続した際に最初にアクセスす
るポータルサイト140が、ウェブコンテンツ101に
対して操作イベント検出部10、操作イベント解析部2
0及びテキスト抽出部30をJavaScript等のスクリプト
言語で書き込むローカルプロキシを実現するプログラム
ファイル150を情報処理装置110に送信する形態で
ある。この形態では、情報処理装置110がポータルサ
イト140にアクセスすると、ポータルサイト140の
記憶部141に格納されたプログラムファイル150が
送受信部142を介して情報処理装置110に送信され
る。プログラムファイル150はJavaアプレット等
として作成される。ポータルサイト140から情報処理
装置110へ送信されたプログラムファイル150は、
情報処理装置110においてローカルプロキシ160と
して動作する。このローカルプロキシ160は、情報処
理装置110がウェブサーバ100から受信したウェブ
コンテンツ101に対して操作イベント検出部10、操
作イベント解析部20及びテキスト抽出部30の機能を
実現するスクリプトを書き込み、ウェブブラウザ111
に渡す。ウェブブラウザ111は、ローカルプロキシ1
60から受け取ったウェブコンテンツ101に埋め込ま
れているスクリプトに基づいて、上述した操作イベント
を検出する処理、操作イベント列を解析して文字列の選
択、リンクのポインティング、なぞり読み等の上記特定
の操作を検出する処理、及び当該操作の対象である文字
列を抽出する処理を実行する。抽出されたテキストは、
ポータルサイト140に送信される。抽出されたテキス
トをプロキシサーバ130に送信する機能は、操作イベ
ント検出部10、操作イベント解析部20及びテキスト
抽出部30と同様に、スクリプトとしてウェブコンテン
ツ101に埋め込むことによって提供しても良いし、ロ
ーカルプロキシ160の機能として提供しても良い。ま
た、ポータルサイト140の送受信部142において、
抽出されたテキストを送信するように情報処理装置11
0に要求を出すことにより、抽出されたテキストの収集
を行っても良い。こうして得られたテキストは、ユーザ
がウェブコンテンツ101を閲覧する際に、興味を持っ
た情報であると考えられるため、ポータルサイト140
において、ウェブ視聴率の調査や、検索エンジンにおけ
る検索条件の絞り込み等、種々のサービスに利用するこ
とができる。
【0060】図13は、このようにして得られたテキス
トを用いて、検索エンジンにおけるキーワードベクトル
(選択されたキーワードとその重要度を示す重み)を生
成する場合について、本実施の形態と従来技術とを比較
する図である。従来技術の手法では、ページ全体に含ま
れるキーワードにTF・IDF式等の手法によりキーワ
ードに重みを付けて、重要なキーワードを抽出してい
る。これに対し、本実施の形態では、ページ中でユーザ
が行った操作の対象となったテキストに対して、キーワ
ードの重み付け処理を行う。キーワードの重み付けに関
しては、TF・IDF式におけるIDF式のような既存
の方法を用いることができる。本実施の形態により得ら
れたテキストに基づいて生成されたキーワードベクトル
は、単独でウェブ視聴率の調査や、検索エンジンにおけ
る検索条件の絞り込み等のサービスに用いることもでき
るが、図13に示すように、従来技術において生成され
たキーワードベクトルと組み合わせて利用することもで
きる。
【0061】なお、以上の四種類の提供形態において、
抽出されたテキストの送信先は、上記の各送信先に限定
されない。当該テキストを利用できる種々の利用者に対
して送信することができる。例えば、図9に示した形態
において、スクリプト102を埋め込んだウェブコンテ
ンツ101の作成者に対して、抽出されたテキストを送
るようにしても良い。また、図11や図12に示した形
態において、当該抽出されたテキストを用いたサービス
を行う、プロキシサーバ130やポータルサイト140
とは別に設けられたサーバに転送するようにしても良
い。
【0062】また、本実施の形態では、ウェブコンテン
ツを対象として、ユーザが行った操作に基づいてテキス
トの抽出を行ったが、他の任意の形式の文書データを対
象としてテキストの抽出を行うようにしても良い。この
場合、マウスの動作を監視する領域としては、ウェブブ
ラウザによるウェブコンテンツの表示画面以外に、コン
ピュータのディスプレイ装置における表示画面全体や、
アプリケーションプログラムによって表示されるウィン
ドウの領域内など、種々の範囲に設定することができ
る。
【0063】さらにまた、テキスト以外の画像などのオ
ブジェクトに対してユーザが行った操作に基づいて、当
該操作の対象となったオブジェクトに関する情報を抽出
することもできる。この場合、ユーザが興味を持って無
意識的に行った動作として定義される動作としては、テ
キスト選択と同様にして行われたオブジェクトの選択操
作や、リンクのポインティング、クリックなどが挙げら
れる。
【0064】さらに、マウスや他のポインティングデバ
イス以外の入力手段を用いて、ユーザが興味を持って無
意識的に行った動作を定義することも可能である。例え
ば、カーソルキーなどを用いたキー操作や、ユーザが表
示されたテキストを読み上げた場合の音声の入力や、ユ
ーザの視線の動き等から特定の動作を定義することがで
きる。
【0065】
【発明の効果】以上説明したように、本発明によれば、
ユーザによる明示的な入力を必要とせず、かつウェブコ
ンテンツにおいてユーザが興味を持った箇所に関する詳
細な情報を取得することができる。また、ユーザによる
ウェブブラウザ上での操作を含む詳細な操作を抽出し
て、ユーザの抱く興味の傾向を示す情報として利用する
ことができる。
【図面の簡単な説明】
【図1】 本実施の形態における情報抽出システムの全
体構成を説明するための図である。
【図2】 本実施の形態における操作イベント検出部1
0、操作イベント解析部20及びテキスト抽出部30の
働きを概念的に説明する図である。
【図3】 テキスト選択が行われた場合のテキスト抽出
部30によるテキスト抽出処理を、ダイナミックHTM
Lを用いて実現する場合のプログラムを説明する図であ
る。
【図4】 テキスト選択が行われた場合のテキスト抽出
の課程を説明する図である。
【図5】 リンクのポインティングが行われた場合のテ
キスト抽出部30によるテキスト抽出処理を、ダイナミ
ックHTMLを用いて実現する場合のプログラムを説明
する図である。
【図6】 リンクのポインティングが行われた場合のテ
キスト抽出の課程を説明する図である。
【図7】 なぞり読みにおいて、マウスポインタが重な
っている行の一つ上の行を認識する処理を説明する図で
ある。
【図8】 なぞり読みが行われた場合のテキスト抽出の
課程を説明する図である。
【図9】 本実施の形態における情報抽出システムを提
供する形態の例を説明する図である。
【図10】 本実施の形態における情報抽出システムを
提供する形態の他の例を説明する図である。
【図11】 本実施の形態における情報抽出システムを
提供する形態の更に他の例を説明する図である。
【図12】 本実施の形態における情報抽出システムを
提供する形態の更に他の例を説明する図である。
【図13】 本実施の形態により抽出されたテキストを
検索エンジンにおけるキーワードベクトルの生成に用い
た例を従来技術と比較する図である。
【符号の説明】
10…操作イベント検出部、20…操作イベント解析
部、30…テキスト抽出部、100…ウェブサーバ、1
01…ウェブコンテンツ、102…スクリプト、110
…情報処理装置、111…ウェブブラウザ、120…書
き込み処理部、130…プロキシサーバ、140…ポー
タルサイト、141…記憶部、142…送受信部、15
0…プログラムファイル、160…ローカルプロキシ、
200…ウェブコンテンツ、201…テキスト、401
…selectionオブジェクト、402…TextRangeオブジェ
クト、403…テキスト、601、602、603…Te
xtRangeオブジェクト、604…テキスト
───────────────────────────────────────────────────── フロントページの続き (72)発明者 青木 義則 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (72)発明者 中島 周 神奈川県大和市下鶴間1623番地14 日本 アイ・ビー・エム株式会社 東京基礎研 究所内 (56)参考文献 特開2000−76266(JP,A) 土方嘉徳,Webページ閲覧中の操作 に基づくユーザの興味の推定,日本ソフ トウェア科学会第16回大会論文集,1999 年 9月19日,第349〜352頁 青木義則,安藤史郎,中島周,Web ブラウザ操作の記録・再生システム,情 報処理学会研究報告(99−DPS− 95),1999年11月19日,第99巻,第94 号,第25〜30頁 古井陽之助,青木義則,土方嘉徳,曽 谷俊男,中島周,Webブラウザ操作の 検出・再生技術とそのマーケティングへ の応用の検討,情報処理学会研究報告 (2000−DPS−97),2000年 3月22 日,第2000巻,第30号,第73〜78頁 鷲崎誠司,村本達也,WWWのアクセ ス履暦に基づく利用者の興味の自動推定 方法,情報処理学会研究報告ワークショ ップ論文集,1997年 7月 2日,第97 巻,第2号,第251〜256頁 Yoshinori Hijikat a,Estimating a Use r’s Degree of Inte rest in a Page dur ing Web Browsing,S ystems,Man, and Cy bernetics, 1999.IEEE SMC’99 Conference Proceedings,米国,1999年 10月12日,Vol.4,p.105−110, URL,http://WWW.iee e.org (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 通信ネットワークにて接続されたサーバ
    とクライアントとを備えた情報抽出システムであって、 前記サーバは、 前記クライアントにおいて閲覧に供されるデータファイ
    ルを提供し、 前記クライアントは、 前記通信ネットワークを介して前記サーバから受信した
    前記データファイルの内容を表示する閲覧手段と、 前記閲覧手段にて表示された前記データファイルの内容
    を閲覧する際にユーザが行った入力操作に基づいて予め
    定められた特定の操作を検出する操作検出手段と、 前記操作検出手段により検出された前記閲覧手段の表示
    画面上における前記特定の操作に基づいて、当該操作の
    行われた場所に表示されているコンテンツを特定し、当
    該コンテンツの持つ情報を抽出する情報抽出手段とを備
    えることを特徴とする情報抽出システム。
  2. 【請求項2】 ウェブコンテンツを格納するウェブサー
    バと、通信ネットワークを介して当該ウェブサーバから
    ウェブコンテンツを受信して表示するクライアントとを
    備えた情報抽出システムであって、 前記クライアントは、前記ウェブコンテンツの表示画面
    においてユーザが行った操作を操作イベントとして検出
    する機能を備え、 前記ウェブサーバに格納された前記ウェブコンテンツ
    は、前記クライアントの操作イベント検出機能を用いて
    操作イベントを検出する処理と、検出された当該操作イ
    ベントの列を解析して予め定められた特定の操作を抽出
    する処理と、前記ウェブコンテンツの中から当該特定の
    操作の対象となった所定のウェブコンテンツを特定して
    当該ウェブコンテンツの持つ情報を抽出して前記ウェブ
    サーバに返送する処理とを前記クライアントに実行させ
    る、前記クライアントの機能を拡張するための機能拡張
    プログラム言語にて記述されたプログラムパッケージを
    埋め込んであることを特徴とする情報抽出システム。
  3. 【請求項3】 ウェブコンテンツを格納するウェブサー
    バと、通信ネットワークを介して当該ウェブサーバから
    ウェブコンテンツを受信して表示するクライアントとを
    備えた情報抽出システムであって、 前記クライアントは、前記ウェブコンテンツの表示画面
    においてユーザが行った操作を操作イベントとして検出
    する機能を備え、 前記ウェブサーバは、前記クライアントの操作イベント
    検出機能を用いて操作イベントを検出する処理と、検出
    された当該操作イベントの列を解析して予め定められた
    特定の操作を抽出する処理と、前記ウェブコンテンツの
    中から当該特定の操作の対象となった所定のウェブコン
    テンツを特定して当該ウェブコンテンツの持つ情報を抽
    出して前記ウェブサーバに返送する処理とを前記クライ
    アントに実行させる、前記クライアントの機能を拡張す
    るための機能拡張プログラム言語にて記述されたプログ
    ラムパッケージを前記ウェブコンテンツに埋め込んで前
    記クライアントに送信することを特徴とする情報抽出シ
    ステム。
  4. 【請求項4】 ウェブコンテンツを格納するウェブサー
    バと、通信ネットワークを介して当該ウェブサーバから
    ウェブコンテンツを受信して付加的な処理を行うプロキ
    シサーバと、当該プロキシサーバにて当該付加的な処理
    を施された当該ウェブコンテンツを表示するクライアン
    トとを備えた情報抽出システムであって、 前記クライアントは、前記ウェブコンテンツの表示画面
    においてユーザが行った操作を操作イベントとして検出
    する機能を備え、 前記プロキシサーバは、前記クライアントの操作イベン
    ト検出機能を用いて操作イベントを検出する処理と、検
    出された当該操作イベントの列を解析して予め定められ
    た特定の操作を抽出する処理と、前記ウェブコンテンツ
    の中から当該特定の操作の対象となった所定のウェブコ
    ンテンツを特定して当該ウェブコンテンツの持つ情報
    抽出して前記プロキシサーバに返送する処理とを前記ク
    ライアントに実行させる、前記クライアントの機能を拡
    張するための機能拡張プログラム言語にて記述されたプ
    ログラムパッケージを、前記ウェブサーバから受信した
    前記ウェブコンテンツに埋め込んで前記クライアントに
    送信することを特徴とする情報抽出システム。
  5. 【請求項5】 ウェブコンテンツを格納するウェブサイ
    トと、通信ネットワークを介して当該ウェブサイトから
    ウェブコンテンツを受信して表示するウェブブラウザを
    備えた情報処理装置と、当該情報処理装置におけるポー
    タルサイトとを備えた情報抽出システムであって、 前記ポータルサイトは、前記情報処理装置からアクセス
    された際に、前記情報処理装置においてローカルプロキ
    シとして動作するプログラムファイルを前記情報処理装
    置に送信し、 前記情報処理装置のウェブブラウザは、前記ウェブコン
    テンツの表示画面においてユーザが行った操作を操作イ
    ベントとして検出する機能を備え、 前記情報処理装置において動作する前記ローカルプロキ
    シは、 前記ウェブブラウザの操作イベント検出機能を用いて操
    作イベントを検出する処理と、検出された当該操作イベ
    ントの列を解析して予め定められた特定の操作を抽出す
    る処理と、前記ウェブコンテンツの中から当該特定の操
    作の対象となった所定のウェブコンテンツを特定して当
    該ウェブコンテンツの持つ情報を抽出する処理とを前記
    ウェブブラウザに実行させる、前記ウェブブラウザの機
    能を拡張するための機能拡張プログラム言語にて記述さ
    れたプログラムパッケージを、前記ウェブサーバから受
    信した前記ウェブコンテンツに埋め込むと共に、 前記ウェブブラウザにて抽出された前記情報を前記ポー
    タルサイトに送信することを特徴とする情報抽出システ
    ム。
  6. 【請求項6】 ウェブコンテンツを格納するウェブサー
    バと、通信ネットワークを介して当該ウェブサーバから
    ウェブコンテンツを受信して付加的な処理を行うプロキ
    シサーバと、当該プロキシサーバにて当該付加的な処理
    を施された当該ウェブコンテンツを表示するクライアン
    トとを備えた情報抽出システムであって、 前記クライアントは、前記ウェブコンテンツの表示画面
    においてユーザが行った操作を操作イベントとして検出
    する機能を備え、 前記プロキシサーバは、 前記クライアントにて検出された前記操作イベントを収
    集する操作イベント取得手段と、 前記クライアントから受け取った前記操作イベントの列
    を解析して予め定められた特定の操作を抽出する操作イ
    ベント解析手段と、 前記ウェブコンテンツの中から当該特定の操作の対象と
    なった所定のウェブコンテンツを特定して当該ウェブコ
    ンテンツの持つ情報を抽出する情報抽出手段とを備える
    ことを特徴とする情報抽出システム。
  7. 【請求項7】 文書データを表示する閲覧手段と、 前記閲覧手段にて表示された文書を閲覧する際にユーザ
    が行った入力操作に基づいて、ユーザが興味を持つ情報
    に対して無意識的に行った操作として定義付けた操作を
    検出する操作検出手段と、 前記操作検出手段により検出された特定の操作に基づい
    て、当該操作の行われた場所に表示されている文字列を
    特定し、当該文字列を抽出する文字列抽出手段とを備え
    ることを特徴とする情報処理装置。
  8. 【請求項8】 前記文字列抽出手段は、前記特定の操作
    の行われた場所に表示されている文字列を含む文または
    行を単位として抽出を行うことを特徴とする請求項7に
    記載の情報処理装置。
  9. 【請求項9】 ウェブサーバからウェブコンテンツを受
    信して表示するウェブブラウザを備えた情報処理装置と
    接続し、当該情報処理装置の情報を収集する情報収集装
    置において、 前記情報処理装置において実行されることにより、前記
    ウェブブラウザの操作イベント検出機能を用いて操作イ
    ベントを検出する処理と、検出された当該操作イベント
    の列を解析して予め定められた特定の操作を抽出する処
    理と、前記ウェブコンテンツの中から当該特定の操作の
    対象となった所定のウェブコンテンツを特定して当該ウ
    ェブコンテンツの持つ情報を抽出する処理とを前記ウェ
    ブブラウザに実行させる、前記ウェブブラウザの機能を
    拡張するための機能拡張プログラム言語にて記述された
    プログラムパッケージを、前記ウェブサーバから受信し
    た前記ウェブコンテンツに埋め込むプログラムファイル
    を記憶した記憶手段と、 前記記憶手段から前記プログラムファイルを読み出して
    前記情報処理装置に送信する送信手段と、 前記情報処理装置にて抽出された前記情報を収集する情
    報収集手段とを備えることを特徴とする情報収集装置。
  10. 【請求項10】 前記情報収集装置の前記記憶手段に記
    憶された前記プログラムファイルは、Javaアプレッ
    トにて作成され、前記プログラムパッケージをJava
    スクリプトで記述して前記ウェブコンテンツに埋め込む
    ことを特徴とする請求項9に記載の情報収集装置。
  11. 【請求項11】 文書データを表示する表示画面上でユ
    ーザが行った入力操作に基づいて予め定められた特定の
    操作を検出するステップと、 検出された前記表示画面上における前記特定の操作に基
    づいて、当該操作の行われた場所に表示されている文字
    列を特定し、前記文書データから当該文字列を含む文ま
    たは行を抽出するステップとを含むことを特徴とする文
    字列抽出方法。
  12. 【請求項12】 文書データを表示する表示画面上でユ
    ーザが行った入力操作に基づいて、ポインティングデバ
    イスのポインタを、表示されている文書の行に沿って移
    動させるなぞり読み動作を検出するステップと、 検出された、前記表示画面上における前記なぞり読み動
    作の行われた場所に表示されている文字列を特定し、前
    記文書データから当該文字列を含む文または行を抽出
    るステップとを含むことを特徴とする文字列抽出方法。
  13. 【請求項13】 前記文字列を抽出するステップにおい
    て、前記文書の表示画面における前記ポインタが移動し
    た位置の文字列の1行上の文字列を含む文または行を抽
    出することを特徴とする請求項12に記載の文字列抽出
    方法。
  14. 【請求項14】 文書データを表示する表示画面上でユ
    ーザが行った入力操作に基づいて、ポインティングデバ
    イスのポインタを、表示されている文書の行を順に指し
    ながら当該行とは直交する方向に移動させる行単位なぞ
    り読み動作を検出するステップと、 検出された、前記表示画面上における前記行単位なぞり
    読み動作の行われた場所に表示されている文字列を特定
    し、前記文書データから当該文字列を含む文または行を
    抽出するステップとを含むことを特徴とする文字列抽出
    方法。
  15. 【請求項15】 コンピュータに実行させるプログラム
    を当該コンピュータの入力手段が読取可能に記憶した記
    憶媒体において、 前記プログラムは、 文書データを表示する処理と、 文書データを表示する表示画面上でユーザが行った入力
    操作に基づいて予め定められた特定の操作を検出する処
    理と、 検出された、前記表示画面上における前記特定の操作に
    基づいて、当該操作の行われた場所に表示されている文
    字列を特定し、前記文書データから当該文字列を含む文
    または行を抽出する処理とを前記コンピュータに実行さ
    せることを特徴とする記憶媒体。
JP37134799A 1999-12-27 1999-12-27 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体 Expired - Fee Related JP3476185B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP37134799A JP3476185B2 (ja) 1999-12-27 1999-12-27 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体
US09/746,236 US6934750B2 (en) 1999-12-27 2000-12-22 Information extraction system, information processing apparatus, information collection apparatus, character string extraction method, and storage medium
US11/175,095 US7490090B2 (en) 1999-12-27 2005-07-05 Information extraction system, information processing apparatus, information collection apparatus, character string extraction method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37134799A JP3476185B2 (ja) 1999-12-27 1999-12-27 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2001188792A JP2001188792A (ja) 2001-07-10
JP3476185B2 true JP3476185B2 (ja) 2003-12-10

Family

ID=18498556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37134799A Expired - Fee Related JP3476185B2 (ja) 1999-12-27 1999-12-27 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体

Country Status (2)

Country Link
US (2) US6934750B2 (ja)
JP (1) JP3476185B2 (ja)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5694546A (en) 1994-05-31 1997-12-02 Reisman; Richard R. System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list
JP2003091615A (ja) * 2001-09-18 2003-03-28 Net Business Laboratory 懸賞応募受付方法とサーバ、並びに懸賞応募受付プログラムと当該プログラムを記録したコンピュータ読取可能な記録媒体
JP3405978B2 (ja) * 2001-10-04 2003-05-12 一隆 北守 イベント処理プログラムおよびイベント処理システム
JP2003208434A (ja) * 2001-11-07 2003-07-25 Nec Corp 情報検索システム及びそれに用いる情報検索方法
US7346606B2 (en) * 2003-06-30 2008-03-18 Google, Inc. Rendering advertisements with documents having one or more topics using user topic interest
DE60208155T2 (de) * 2002-04-18 2006-06-29 Siemens Ag Erweiterung von Webseiten um neue Funktionalität für Web-basierte Dienste
DE10224948A1 (de) 2002-06-05 2004-05-27 Egner, Steffen, Dr. Vorrichtung und Verfahren zum Untersuchen von Bildern
US8316001B1 (en) 2002-07-22 2012-11-20 Ipvision, Inc. Apparatus and method for performing analyses on data derived from a web-based search engine
US9412123B2 (en) 2003-07-01 2016-08-09 The 41St Parameter, Inc. Keystroke analysis
US10999298B2 (en) 2004-03-02 2021-05-04 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
JP2006065467A (ja) * 2004-08-25 2006-03-09 Hitachi Ltd データ抽出定義情報生成装置およびデータ抽出定義情報生成方法
US8270320B2 (en) * 2004-09-30 2012-09-18 Avaya Inc. Method and apparatus for launching a conference based on presence of invitees
US7936863B2 (en) * 2004-09-30 2011-05-03 Avaya Inc. Method and apparatus for providing communication tasks in a workflow
US8107401B2 (en) * 2004-09-30 2012-01-31 Avaya Inc. Method and apparatus for providing a virtual assistant to a communication participant
US8180722B2 (en) 2004-09-30 2012-05-15 Avaya Inc. Method and apparatus for data mining within communication session information using an entity relationship model
US20060149528A1 (en) * 2005-01-05 2006-07-06 Inventec Corporation System and method of automatic Japanese kanji labeling
US8078963B1 (en) * 2005-01-09 2011-12-13 Apple Inc. Efficient creation of documents
JP2006323793A (ja) * 2005-05-17 2006-11-30 Norio Goto スライドショープログラム、スライドショーwebブラウザプログラム
JP4817289B2 (ja) 2005-09-29 2011-11-16 富士通株式会社 穴埋めテスト問題作成プログラム、方法及び装置
WO2007056344A2 (en) 2005-11-07 2007-05-18 Scanscout, Inc. Techiques for model optimization for statistical pattern recognition
US11301585B2 (en) 2005-12-16 2022-04-12 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US8938671B2 (en) 2005-12-16 2015-01-20 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US20070219986A1 (en) * 2006-03-20 2007-09-20 Babylon Ltd. Method and apparatus for extracting terms based on a displayed text
US8151327B2 (en) 2006-03-31 2012-04-03 The 41St Parameter, Inc. Systems and methods for detection of session tampering and fraud prevention
US20070255701A1 (en) * 2006-04-28 2007-11-01 Halla Jason M System and method for analyzing internet content and correlating to events
JP2007316934A (ja) * 2006-05-25 2007-12-06 Fujitsu Ltd 情報処理装置、情報処理方法及びプログラム
US20070293950A1 (en) * 2006-06-14 2007-12-20 Microsoft Corporation Web Content Extraction
KR20080075584A (ko) * 2007-02-13 2008-08-19 김일 웹 문서 내의 관심영역 설정 및 분석방법과 이를 위한 시스템
US20080228715A1 (en) * 2007-03-12 2008-09-18 Terabyte Media, Llc Apparatus and method for distributed information retrieval and processing
US20090070297A1 (en) * 2007-07-18 2009-03-12 Ipvision, Inc. Apparatus and Method for Performing Analyses on Data Derived from a Web-Based Search Engine
US8577996B2 (en) * 2007-09-18 2013-11-05 Tremor Video, Inc. Method and apparatus for tracing users of online video web sites
US8549550B2 (en) 2008-09-17 2013-10-01 Tubemogul, Inc. Method and apparatus for passively monitoring online video viewing and viewer behavior
US20090100456A1 (en) * 2007-10-12 2009-04-16 John Hughes Method and apparatus for monitoring online video
JP2009245186A (ja) * 2008-03-31 2009-10-22 Toppan Printing Co Ltd 閲覧情報配信装置およびその処理方法、プログラム
JP5228574B2 (ja) * 2008-03-31 2013-07-03 凸版印刷株式会社 閲覧情報配信装置およびその処理方法、プログラム
US9396331B2 (en) * 2008-04-22 2016-07-19 The 41St Parameter, Inc. Systems and methods for security management based on cursor events
US8677018B2 (en) 2008-08-25 2014-03-18 Google Inc. Parallel, side-effect based DNS pre-caching
US9612995B2 (en) 2008-09-17 2017-04-04 Adobe Systems Incorporated Video viewer targeting based on preference similarity
US9112850B1 (en) 2009-03-25 2015-08-18 The 41St Parameter, Inc. Systems and methods of sharing information through a tag-based consortium
US9507870B2 (en) * 2009-05-05 2016-11-29 Suboti, Llc System, method and computer readable medium for binding authored content to the events used to generate the content
CA2781299A1 (en) 2009-11-20 2012-05-03 Tadashi Yonezaki Methods and apparatus for optimizing advertisement allocation
US20110145138A1 (en) * 2009-12-15 2011-06-16 Martin Fitzgerald Bradley Browser extension that processes text to facilitate commerce on social media
WO2012054646A2 (en) 2010-10-19 2012-04-26 The 41St Parameter, Inc. Variable risk engine
JP5786458B2 (ja) 2011-05-30 2015-09-30 富士通株式会社 キーワード抽出及びウエブコンテンツアクセス情報の収集装置
JP5799683B2 (ja) * 2011-09-06 2015-10-28 富士ゼロックス株式会社 情報処理システム及びプログラム
US8914496B1 (en) * 2011-09-12 2014-12-16 Amazon Technologies, Inc. Tracking user behavior relative to a network page
JP2013073455A (ja) * 2011-09-28 2013-04-22 Video Research:Kk 端末装置及び収集方法
JP5530995B2 (ja) * 2011-10-24 2014-06-25 日本電信電話株式会社 Webページ情報取得システム、Webページ情報取得方法、Webページ情報取得プログラム
US10754913B2 (en) 2011-11-15 2020-08-25 Tapad, Inc. System and method for analyzing user device information
US9633201B1 (en) 2012-03-01 2017-04-25 The 41St Parameter, Inc. Methods and systems for fraud containment
US9521551B2 (en) 2012-03-22 2016-12-13 The 41St Parameter, Inc. Methods and systems for persistent cross-application mobile device identification
EP2880619A1 (en) 2012-08-02 2015-06-10 The 41st Parameter, Inc. Systems and methods for accessing records via derivative locators
JP2014099052A (ja) * 2012-11-14 2014-05-29 International Business Maschines Corporation テキストを編集する装置、データ処理方法およびプログラム
WO2014078569A1 (en) 2012-11-14 2014-05-22 The 41St Parameter, Inc. Systems and methods of global identification
US9239878B2 (en) * 2012-12-19 2016-01-19 Amazon Technologies, Inc. Interactivity analyses of web resources based on reload events
EP2939082A4 (en) * 2012-12-28 2016-10-26 Fabtale Productions Pty Ltd METHOD AND SYSTEM FOR ANALYZING THE LEVEL OF A USER ENGAGEMENT WITHIN AN ELECTRONIC DOCUMENT
US10902327B1 (en) 2013-08-30 2021-01-26 The 41St Parameter, Inc. System and method for device identification and uniqueness
US9384287B2 (en) 2014-01-15 2016-07-05 Sap Portals Isreal Ltd. Methods, apparatus, systems and computer readable media for use in keyword extraction
US9372776B2 (en) * 2014-02-03 2016-06-21 Aternity Information Systems Ltd. Monitoring user activity and performance of computerized devices
CN104111782B (zh) * 2014-07-04 2018-01-12 可牛网络技术(北京)有限公司 一种网页滑动的方法及浏览器
US10091312B1 (en) 2014-10-14 2018-10-02 The 41St Parameter, Inc. Data structures for intelligently resolving deterministic and probabilistic device identifiers to device profiles and/or groups
JP6781723B2 (ja) * 2018-03-01 2020-11-04 ビッグローブ株式会社 情報分析システムおよび情報分析方法に関する。
US11164206B2 (en) * 2018-11-16 2021-11-02 Comenity Llc Automatically aggregating, evaluating, and providing a contextually relevant offer

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0461817A3 (en) * 1990-06-15 1993-11-18 American Telephone & Telegraph Image segmenting apparatus and methods
US5343401A (en) * 1992-09-17 1994-08-30 Pulse Microsystems Ltd. Embroidery design system
US5598187A (en) * 1993-05-13 1997-01-28 Kabushiki Kaisha Toshiba Spatial motion pattern input system and input method
JP3042945B2 (ja) * 1993-07-07 2000-05-22 富士通株式会社 画像抽出装置
JP3422897B2 (ja) * 1996-05-17 2003-06-30 株式会社テクノクラフト 文字列抽出システム及び文字列抽出方法
US5864789A (en) * 1996-06-24 1999-01-26 Apple Computer, Inc. System and method for creating pattern-recognizing computer structures from example text
US5796952A (en) * 1997-03-21 1998-08-18 Dot Com Development, Inc. Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database
US6249606B1 (en) * 1998-02-19 2001-06-19 Mindmaker, Inc. Method and system for gesture category recognition and training using a feature vector
US6088731A (en) * 1998-04-24 2000-07-11 Associative Computing, Inc. Intelligent assistant for use with a local computer and with the internet
US6631345B1 (en) * 1999-08-12 2003-10-07 International Business Machines Corporation Recording, storing, and emulating user interaction events
US6704771B1 (en) * 1999-09-21 2004-03-09 Neostar, Inc. Electronic message payload for interfacing with text contained in the message

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Yoshinori Hijikata,Estimating a User’s Degree of Interest in a Page during Web Browsing,Systems,Man, and Cybernetics, 1999.IEEE SMC’99 Conference Proceedings,米国,1999年10月12日,Vol.4,p.105−110,URL,http://WWW.ieee.org
古井陽之助,青木義則,土方嘉徳,曽谷俊男,中島周,Webブラウザ操作の検出・再生技術とそのマーケティングへの応用の検討,情報処理学会研究報告(2000−DPS−97),2000年 3月22日,第2000巻,第30号,第73〜78頁
土方嘉徳,Webページ閲覧中の操作に基づくユーザの興味の推定,日本ソフトウェア科学会第16回大会論文集,1999年 9月19日,第349〜352頁
青木義則,安藤史郎,中島周,Webブラウザ操作の記録・再生システム,情報処理学会研究報告(99−DPS−95),1999年11月19日,第99巻,第94号,第25〜30頁
鷲崎誠司,村本達也,WWWのアクセス履暦に基づく利用者の興味の自動推定方法,情報処理学会研究報告ワークショップ論文集,1997年 7月 2日,第97巻,第2号,第251〜256頁

Also Published As

Publication number Publication date
US7490090B2 (en) 2009-02-10
JP2001188792A (ja) 2001-07-10
US20050246348A1 (en) 2005-11-03
US20010016840A1 (en) 2001-08-23
US6934750B2 (en) 2005-08-23

Similar Documents

Publication Publication Date Title
JP3476185B2 (ja) 情報抽出システム、情報処理装置、情報収集装置、文字列抽出方法及び記憶媒体
US10671692B2 (en) Uniquely identifying and tracking selectable web page objects
US7216290B2 (en) System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US9128909B2 (en) Intelligent augmentation of media content
US9703883B2 (en) Social bookmarking of resources exposed in web pages
US7562287B1 (en) System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US8560564B1 (en) Hypertext browser assistant
US7607082B2 (en) Categorizing page block functionality to improve document layout for browsing
US9262766B2 (en) Systems and methods for contextualizing services for inline mobile banner advertising
US9547717B2 (en) Administration of search results
US20050131992A1 (en) System, method and apparatus for selecting, displaying, managing, tracking and transferring access to content of web pages and other sources
US20050010563A1 (en) Internet search application
US20130054356A1 (en) Systems and methods for contextualizing services for images
JPH10116220A (ja) パラメータをローカル表示装置において容易に表示するシステムおよび方法
JP2001504613A (ja) データナビゲータインタフェース
CN104423991B (zh) 在移动终端加载网页、提供网页数据的方法及装置
US9690855B2 (en) Method and system for searching for a web document
JP2007149074A (ja) コンテキスト・ベースのナビゲーション
CN106097072A (zh) 一种商品信息的对比方法、装置与终端设备
JP2010128928A (ja) 検索システム及び検索方法
US10719206B1 (en) Measuring unresponsive interactions
US8185514B1 (en) User-interface feature and technique for providing users of a network site links that have been determined to be of interest to the user
Lingam et al. Supporting end-users in the creation of dependable web clips
CN113378036A (zh) 页面操作分析、埋点方法、装置、设备及存储介质
JP5103590B2 (ja) 情報処理装置および情報処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees