オンライン商店上の製品情報自動索引方法及びシステム

Info

Publication number
JP2000172722A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
information
product
price
html
document
Prior art date
Application number
JP33862399A
Other languages
English (en)
Inventor
Soho Boku
Koso Kan
Daiki Kyo
Teizen Ri
昊相 咸
大基 姜
相鳳 朴
悌善 李
Original Assignee
Korea Electronics Telecommun
韓國電子通信研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

(57)【要約】 (修正有) 【課題】 インタネットのウェブ上でHTML文書の形
態で存在するオンライン商店の製品に関する製品情報自
動索引方法を提案する。 【解決手段】 オンライン商店のHTML文書をロボッ
トで持ってくる段階と、HTML文書から価格情報を探
し出しその他の不要な情報を除去する前処理(processon
g)段階と、その結果を読み込んでページの類型を判別す
る段階と、判別された各類型に合うアルゴリズムを適用
して製品情報を抽出する段階と、それぞれの類型による
アルゴリズムを適用し、残った価格情報に対してブライ
ンド探索(blind search)によって製品情報を抽出する段
階とからなり、既存のディレクトリサービスでウェブ上
のオンライン商店に対する比較購買を可能とするシステ
ムを構成する。

Description

【発明の詳細な説明】

【0001】

【発明の属する技術分野】本発明は、ウェブ上のオンラ
イン商店から提示される商品目録(catalog)を自動抽出
していろいろの商店に対するオンライン比較ショッピン
グ(online comparison shopping)を可能にしたオンライ
ン商店上の製品情報自動索引方法及びシステムに関す
る。

【0002】

【従来の技術】一般に、将来の電子商取引環境は既存の
流通秩序とは基本的に異なるものである。よって、既存
の価格体系も変化していく。特に、全世界を連結するウ
ェブとインタネット上の電子商取引の特性から見ると、
特定製品の価格差異は国内での比較に止まらず、全世界
的に適用されることになるだろう。このような状況で購
買者が買おうとする製品の品質にばらつきが少ない場
合、一番合理的な価格を提示する商店で購買するのは当
然である。しかし、オンライン商店は幾何級数的に増加
しているので、購買者は欲する商品を探し出し難くな
る。

【0003】従来の技術は3種類に大別される。第1、
既存の検索エンジンを用いる方法である。この方法は検
索しようとする製品と全く関係のないページやスパム(s
pam)されたページまで見せてしまうという短所があり、
製品を選択する価値基準の中で最も重要な価格に対する
考慮よりは一般的な情報検索方法論による基準で文書の
順位が決められるので、多方面で不適である。第2、人
間の手によって管理される商品情報検索専用ディレクト
リサービスまたは検索エンジンがある。この方法は人間
によるものなので繊細な面はあるが、商店の個数が多く
なると、一々保守することが難しくなる。第3、データ
ベース(database)または別のデータストーア(data stor
e)を使用することなく商店に実時間で接続して商品情報
を持ってくる方法がある。この方法は一番確実な情報を
提示するという長所はあるが、並列問合せ(parallel qu
ery)技術を使用する場合でも検索速度が遅く、ネットワ
ークのトラヒックを加重させる。

【0004】

【発明が解決しようとする課題】従って、本発明の目的
は、ウェブ上のオンライン商店の価格を含んだ製品情報
をミラーリングロボットソフトウェア(mirroring robot
software)を通じて持ってきて一つのファイルとして貯
蔵し、前処理過程によって雑音除去及びフィルタリング
(filtering)された文書から価格情報の含まれた製品情
報を抽出するようにすることにより、前記短所を解消す
ることのできるオンライン商店上の製品情報自動索引方
法及びシステムを提供することにある。

【0005】

【課題を解決するための手段】上記目的を達成するため
に、本発明によるオンライン商店上の製品情報自動索引
システムは、ウェブ上のオンライン商店を辿りつつ、製
品情報の含まれたHTML(Hyper Text Markup Languag
e)文書を収集し貯蔵するための電子取引情報収集及び貯
蔵器の役割を果たすミラーリングロボットソフトウェア
と、前記HTML文書貯蔵器に貯蔵された文書に対して
不要な情報を取り除くためのHTMLフィルタと、前記
HTMLフィルタを介して収集された情報の類型を判別
して既に分析された類型に当たる場合は、それに対する
分析モジュールを呼び出して製品情報を抽出するための
整形情報整理器と、前記整形情報整理器で分析失敗した
価格情報をもっている文書に対する製品情報を抽出する
ためのヒューリスティック解釈器と、既存の製品情報が
貯蔵されている名詞辞典テーブルと、前記名詞辞典テー
ブルの情報を前記整形情報整理器及び前記ヒューリステ
ィック解釈器へ提供し、前記名詞辞典テーブルの情報を
保守するための名詞辞典管理器と、前記整形情報整理器
及び前記ヒューリスティック解釈器から抽出された製品
情報を貯蔵するための価格情報資料貯蔵器と、前記価格
情報資料貯蔵器に貯蔵された価格情報資料をデータベー
ステーブルに生成して貯蔵するための製品情報テーブル
生成器と、前記製品情報テーブル生成器によって生成さ
れた価格情報資料を貯蔵するための製品情報テーブルと
を含んで構成されたことを特徴とする。

【0006】上記目的を達成するため、本発明によるオ
ンライン商店上の製品情報自動索引方法は、オンライン
商店のHTML文書をロボットで持ってくる段階と、H
TML文書から価格情報を探し出し、その他の必要な情
報のみ残して不要な情報を除去する前処理段階と、前記
前処理段階の結果を読み込んでページの類型を判別する
段階と、前記判別された各類型に合うアルゴリズムを適
用して製品情報を抽出する段階と、前記それぞれの類型
に合うアルゴリズムを適用し、残った価格情報に対して
ブラインド探索によって製品情報を抽出する段階とを含
んでなることを特徴とする。

【0007】従来の技術を察してみれば、まず伝統的な
検索エンジンによる方法は、購買者の所望する基準を満
足させ難い。購買者の欲する基準はいろいろであろうけ
れども、より合理的な価格または所望する仕様の製品を
検索サービスで提示することのできる機能である。この
ような技術的課題を解決するために、本発明では一つの
製品を〈サイトID、会社名、製品分類名、主要機能、
商品名、モデル名、価格、URL〉といったレコードと
定義し、各レコードに対する検索を可能にした。第2、
人間の手によって管理される検索サービスは多くの商店
を自動的に保守し難いという問題点がある。本発明の場
合、自動的に各段階が行われるので、このような問題点
がない。第3、実時間商品情報検索の場合、検索時間の
問題がありうる。本発明の場合、Fast CGI方式でウェブ
サーバーと連動して別の初期化遅延またはネットワーク
遅延なくデータベースから直ちに持ってくるので、早い
性能を示す。

【0008】既存の方法において提起された問題点、即
ちいろいろの商店から合理的な価格を探し出す問題を解
決するためには、オンライン商店の価格が記録されてい
る文書を検索して自動的に製品情報を抽出することが関
鍵である。本発明ではこのためにミラーリングロボット
ソフトウェアが持ってきた文書を製品情報抽出器の処理
し易い方式で変換する方法を用いて製品情報抽出器の負
担を省いた。このような変換のために、文書の雑音除去
とフィルタリング技術が用いられた。製品情報抽出器は
このように変換された文書から商品情報ページの類型に
よる分析で製品情報レコードを抽出する。

【0009】

【発明の実施の形態】以下、添付図面を参照して本発明
を詳細に説明する。

【0010】図1は本発明によるオンライン商店上の製
品情報自動索引システムの構成図である。電子取引情報
収集器11は、ウェブ上のオンライン商店を辿りつつ、
製品情報の含まれたHTML(Hyper Text Markup Langu
age)文書を収集してHTML文書貯蔵器12にHTML
文書を構成した後、前処理過程に移る。前処理過程は、
HTMLフィルタ13と価格情報整理器14によって行
われる。HTMLフィルタ13を通じて収集されたHT
ML文書は、一次的に不要なものがフィルタリングさ
れ、価格情報整理器14によって製品情報抽出サブシス
テムでの使用に適した形に変換される。製品情報抽出サ
ブシステムは、整形情報整理器15とヒューリスティッ
ク(heuristic)解釈器16から構成されている。整形情
報整理器15は、入力される文書の類型を判別し、既に
分析された類型に当たる場合には、それに対する分析モ
ジュールを呼び出して製品情報を抽出する。整形情報整
理器15で分析に失敗した価格情報を持っている文書
は、ヒューリスティック解釈器16に渡されて製品情報
が抽出される。整形情報処理器15は価格情報を有する
ウェブページを統計的に分析して類型別に分類した資料
を土台として構成された。この分類によれば、価格情報
を有するウェブページは、まず製品情報の配置類型によ
って、カタログのような要約型、改造式詳細型、そして
叙述式詳細型に分けられる。また、HTMLテーブルか
ら構成された類型によって、テーブルがヘッダ情報を有
する場合、テーブルがヘッダ情報をもたない場合、テー
ブルではなくリストから構成された場合、そしてテーブ
ルまたはリストを使用しない単純羅列型に分けられる。
テーブルまたはリストを使用した場合も、さらにそれぞ
れの元素(element)が単純な形態、ヘッダ情報と結合さ
れた形態、そして2つ以上のデータが結合された形態に
分けられる。一つのオンライン商店は前記ページ類型を
一つ以上もつことができる。

【0011】ウェブ上の文書はその類型が多様なので、
すべての類型を整形情報整理器15で扱うことができ
ず、必然的に整形情報整理器15には存在しない類型が
生ずることがある。このような類型は、HTMLフィル
タ13で見出した価格情報を基準としてその周辺に製品
情報が分布していることが多い。名詞辞典テーブル17
から検索された製品情報と価格情報を土台にして、ヒュ
ーリスティック解釈器16では、価格情報はあるが、上
手く整形情報整理器15で製品情報が抽出されないもの
に対して、多数個のヒューリスティックを順次行って製
品情報を抽出する。ここで、「ヒューリスティックを行
う」とは、製品情報抽出のための色々な条件の抽出方法
を適用することをいう。このヒューリスティックによっ
ても抽出されないとき、製品情報が間違って抽出される
おそれがあることを念頭において、このまま探索するブ
ラインド探索によって検索を行う。ブラインド探索は価
格情報から一番近いトークンを製品名とみなす探索方法
である。

【0012】整形情報整理器15とヒューリスティック
解釈器16は、多く用いられる既存の製品情報が入って
いる名詞辞典の助けを借りてさらに効率よく製品情報分
析を行う。名詞辞典は名詞辞典テーブル17の形に具現
されて名詞辞典管理器18によって保守される。

【0013】名詞辞典テーブル17には特定名詞とその
名詞の類型が<名詞、類型>の形態で貯蔵される。この
ような名詞辞典テーブル内の貯蔵された情報によって、
文書内の特定単語が製品名なのか、製品分類名なのか、
会社名なのか、主要仕様なのかを知ることができる。

【0014】以上の過程で抽出された製品情報は、価格
情報資料貯蔵器21に貯蔵される。貯蔵された価格情報
資料は製品情報テーブル生成器20によって製品情報テ
ーブル19に貯蔵される。

【0015】価格情報資料はファイル構造で貯蔵され、
製品情報テーブル19に入る価格情報は<サイトID、
会社名、製品分類名、主要機能、商品名、モデル名、価
格、URL>のテーブルスキーマを有する製品情報テー
ブルの形態でデータベースに貯蔵される。

【0016】図2は本発明に係る前処理のためのHTM
Lフィルタの資料流れ図であり、前処理過程の核心であ
るHTMLフィルタ13について説明している。電子取
引情報収集器11によって収集されたHTML文書か
ら、文書固有番号(Document ID:Doc ID)31、URL(U
niform Resource Locator)32、ハイパーリンク36、
そしてテーブル情報35が抽出される。また、スクリプ
ト33と不要なタグが排除された後、価格情報が抽出3
4される。抽出された価格情報はヒューリスティック解
釈器16の解釈過程で製品情報判別基準となる。

【0017】図3は本発明に係る製品情報抽出のための
整形情報整理器15の資料流れ図である。HTMLフィ
ルタ13により前処理されたHTML文書の各トークン
(token)に対して名詞辞典管理器18を照会し、各トー
クンの類型を決定する。この類型の中には、テーブルま
たはリストのヘッダ情報を示すものもあり、これらによ
り、テーブルまたはリストのヘッダ情報が位置する箇所
がわかる。

【0018】整形情報整理器15によって解釈が可能な
製品情報を有するHTML文書は、ヘッダ情報をもつ。
ヘッダ情報はテーブルまたはリストの上に位置し、該当
カラムに入るデータが何を意味するかを知らせる情報で
ある。

【0019】ここで、トークンとは、LANのアクセス
方式の一つである「トークンリング」で使用されるトー
クンではなく、電算学のプログラム言語理論から出る用
語である。すなわち、特定文書を順次読み取って解釈し
ようとする場合、連続的に入力される単語を一次的に語
彙分析器(lexical analyzer)が辞典的な解釈を行った
時、単語として抽出されたそれぞれの要素を意味する。
ここではHTML文書に対して名詞辞典テーブル17を
探してみて、特定単語が製品名なのか、製品分類名なの
か、主要仕様なのか、会社名なのかを解釈し、順次入力
される単語がトークンに変換される。

【0020】名詞辞典管理器18のヘッダ情報を示す単
語と、トークンデータの名詞単語とが同一である場合に
は、テーブル内の単語と同列に存在するトークンは、そ
の単語が持つ意味に応じる値を持つことが明示的に定め
られる。例えば、「製品名」という単語は、ヘッダ情報
を示す単語であるが、テーブルの特定列、特に最初の行
にこの単語が存在すると、同じテーブル内のその以下の
行の同列に存在する単語は、製品名を示す単語と明示的
に定められることになる。一方、名詞辞典管理器18の
ヘッダ情報を示す単語と、トークンデータの名詞単語と
が同一でないときであって、特定列の単語が名詞辞典テ
ーブル17に入っている一定の類型を持った単語と連続
して整合するのであれば、その特定列はその一定の類型
であると、暗示的に定めることができる。例えば、「会
社名」というヘッダ情報がないテーブルの場合に、会社
名を表す特定の単語が現れ、その単語が名詞辞典テーブ
ル17に存在し、いずれも「会社名」の類型を持ってい
れば、以下の列の単語に対しても同じ類型を適用する。
ヘッダ情報解釈器41によってヘッダ情報が解釈される
と、これによりテーブルデータ解釈器42によってテー
ブルの一行の各元素からなるレコードが解釈される。こ
のテーブルの一行の各元素からなるレコードが繰返し抽
出されると、抽出されたレコードは製品情報の候補(can
didate)となる。製品情報は製品情報有効性検査器44
によって有効性が検査され、有効でない製品情報は廃棄
される。このような二重チェック(double check)は抽出
される情報の品質を高くして正しい製品情報のみが残れ
るようにする。

【0021】ヒューリスティック解釈器によって解釈さ
れた製品情報の一部は、いずれのヒューリスティックも
満足せず、ブラインド探索によって抽出される。ここ
で、いずれのヒューリスティックも満足しないとは、製
品情報抽出のために用意されたいかなる条件のいかなる
方法によっても、抽出されないことをいう。ブラインド
検索で抽出すると、製品情報が間違って抽出されること
もある。かかる間違いを最小化するために、有効性検査
器42で有効性を検査する。例えば、製品名、製品分類
名などは数字のみで表現されることはなく、必ず文字が
一部入らなければならない。また、特殊文字の一部は製
品名や製品分類名などに含まれることはない。日付を表
すフィールドには有効な日付のみ入ることができる。例
えば、年度に3000年、または100年などが入った
り、マイナス表示が入ったりすることができない。

【0022】製品情報が抽出されたとき、最終的にレコ
ード配列の形態で再構成するためにレコード配列補完器
43によって隣接しているレコードに対して、データ補
完処理を行う。

【0023】抽出された製品情報はコンピュータメモリ
内の製品情報レコードに一時貯蔵される。レコードに対
する補完が必要な理由は、解釈された製品情報の一部フ
ィールドは満たされないこともあるからである。例え
ば、文書の最初に会社名が出、その下の製品情報には会
社名が出ない場合がある。この場合、製品情報の会社は
文書の最初に出た会社であることが明らかである。しか
し、整形情報整理器15やヒューリスティック解釈器1
6は局所的な検索アルゴリズムで現在のレコード以外の
情報を持たないので、このような会社情報を残りの製品
情報レコードに対しても更新するためにレコードに対す
る補完処理を行う。

【0024】解釈された製品情報は製品情報テーブル生
成器20によって〈サイトID、会社名、製品分類名、
主要機能、商品名、モデル名、価格、URL〉の形態で
製品情報テーブルのデータベースに貯蔵される。

【0025】即ち、本発明はオンライン商店のHTML
文書をロボットで持ってくる段階と、HTML文書から
価格情報を探し出し、その他の必要な情報のみ残して不
要な情報を除去する前処理段階と、前記前処理段階の結
果を読み込んでページの類型を判別する段階と、前記判
別された各類型に合うアルゴリズムを適用して製品情報
を抽出する段階と、前記それぞれの類型によるアルゴリ
ズムを適用し、残った価格情報に対してブラインド探索
を介して製品情報を抽出する段階とを行ってウェブ上の
オンライン商店に対する比較購買を可能とする。

【0026】以上説明した本発明は、本発明の属する技
術分野で通常の知識を有する者によって本発明の技術的
思想を外れない範囲内でいろいろの置換、変形及び変更
が可能なので、前述した実施例及び添付図面に限定され
るものではない。

【0027】

【発明の効果】上述したように、本発明は、自律的な形
態で構成されているオンライン商店上の製品情報を示す
HTML文書を、ミラーリングロボットによる文書収集
と雑音除去と情報フィルタリングのための前処理器、そ
して製品がHTML文書に表現される形式に対する分類
による整形情報解釈器と、製品情報がHTML文書に位
置する傾向によるヒューリスティック解釈器を経由させ
て比較ショッピングのための製品情報レコードを自動に
抽出することにより、ウェブ上の商品情報検索エンジ
ン、メタ検索エンジン、ショッピングエージェント、プ
ッシュソリューションなどでウェブ上のオンライン商店
に対する比較購買を可能にする。

【図面の簡単な説明】

【図1】本発明によるオンライン商店上の製品情報自動
索引システムの構成図である。

【図2】本発明に係わる前処理のためのHTMLフィル
タの資料流れ図である。

【図3】本発明に係わる製品情報抽出のための整形情報
整理器の資料流れ図である。

【符号の説明】

11 電子取引情報収集器 12 HTML文書貯蔵器 13 HTMLフィルタ 14 価格情報整理器 15 整形情報整理器 16 ヒューリスティック解釈器 17 名詞辞典テーブル 18 名詞辞典管理器 19 製品情報テーブル 20 製品情報テーブル生成器 21 価格情報資料貯蔵器

フロントページの続き (72)発明者 咸 昊相 大韓民国大田廣域市儒城区漁恩洞ハンビッ トアパートメント119−303 (72)発明者 朴 相鳳 大韓民国大田廣域市儒城区新城洞ハンウル アパートメント103−1003

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 ウェブ上のオンライン商店を辿りつつ、
    製品情報の含まれたHTML文書を収集するための電子
    取引情報収集器と、 前記電子取引情報収集器から収集された情報を貯蔵する
    ためのHTML文書貯蔵器と、 前記HTML文書貯蔵器に貯蔵された文書に対して不要
    な情報を除去するためのHTMLフィルタと、 前記HTMLフィルタを介して収集された情報の類型を
    判別し、既に分析された類型に当たる場合には、それに
    対する分析モジュールを呼び出して製品情報を抽出する
    ための整形情報整理器と、 前記整形情報整理器で分析失敗した価格情報をもってい
    る文書に対する製品情報を抽出するためのヒューリステ
    ィック解釈器と、 既存の製品情報が貯蔵されている名詞辞典テーブルと、 前記名詞辞典テーブルの情報を前記整形情報整理器及び
    前記ヒューリスティック解釈器へ提供し、前記名詞辞典
    テーブルの情報を保守するための名詞辞典管理器と、 前記整形情報整理器及び前記ヒューリスティック解釈器
    から抽出された製品情報を貯蔵するための価格情報資料
    貯蔵器と、 前記価格情報資料貯蔵器に貯蔵された価格情報資料を生
    成するための製品情報テーブル生成器と、 前記製品情報テーブル生成器によって生成された価格情
    報資料を貯蔵するための製品情報テーブルとを含んで構
    成されたことを特徴とするオンライン商店上の製品情報
    自動索引システム。
  2. 【請求項2】 前記整形情報整理器は、価格情報を有す
    るウェブページを統計的に分析して類型別に分類した資
    料を土台として構成されたことを特徴とする請求項1記
    載のオンライン商店上の製品情報自動索引システム。
  3. 【請求項3】 前記価格情報を有するウェブページは、
    製品情報の配置類型によって、カタログのような要約
    型、改造式詳細型、そして叙述式詳細型に分けられ、H
    TMLテーブルから構成された類型によって、テーブル
    がヘッダ情報を有する場合、テーブルがヘッダ情報をも
    たない場合、テーブルではなくリストから構成された場
    合、そしてテーブルまたはリストを使用していない単純
    羅列型に分けられることを特徴とする請求項2記載のオ
    ンライン商店上の製品情報自動索引システム。
  4. 【請求項4】 オンライン商店のHTML文書をロボッ
    トで持ってくる段階と、 HTML文書から価格情報を探し出し、その他の必要な
    情報のみ残して不要な情報を除去する前処理段階と、 前記前処理段階の結果を読み込んでページの類型を判別
    する段階と、 前記判別された各類型に合うアルゴリズムを適用して製
    品情報を抽出する段階と、 前記それぞれの類型によるアルゴリズムを適用し、残っ
    た価格情報に対してブラインド探索によって製品情報を
    抽出する段階とを含んでなることを特徴とするオンライ
    ン商店上の製品情報自動索引方法。

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177059B2 (en) 2000-05-09 2015-11-03 Cbs Interactive Inc. Method and system for determining allied products
US8930370B2 (en) 2000-05-09 2015-01-06 Cbs Interactive Inc. Content aggregation method and apparatus for on-line purchasing system
JP2002015113A (ja) * 2000-06-30 2002-01-18 Yafoo Japan Corp インターネット上で運営されている多数の電子商店の商品情報を横断検索して検索依頼人に通知する商品検索サーバー
WO2002021309A3 (en) * 2000-09-01 2003-10-02 Centives Inc E Item name normalization
US8762361B2 (en) 2000-09-01 2014-06-24 Risible Enterprises Llc Product normalization
US8037019B2 (en) 2000-09-01 2011-10-11 Invenda Corporation Product normalization
US7542964B2 (en) 2000-09-01 2009-06-02 Invenda Corporation Product normalization
US6853996B1 (en) 2000-09-01 2005-02-08 E-Centives, Inc. Product normalization
EP1758035A1 (en) * 2000-09-01 2007-02-28 E-Centives, Inc. Item name normalization
US7499911B2 (en) 2000-10-03 2009-03-03 Viewpoint Communications, Inc. Method of searching for, collecting and distributing information in distributed computer
WO2002029634A1 (fr) * 2000-10-03 2002-04-11 Viewpoint Communications Inc. Procede pour recuperer, collecter et distribuer des informations parmi des ordinateurs repartis
DE10208959B4 (de) * 2002-02-28 2006-10-12 Equero Future Net Technologies Ag Verfahren und Vorrichtung zur Erfassung und Auswertung von in einem Rechnernetzwerk abgelegten Informationen
WO2006006287A1 (ja) * 2004-07-12 2006-01-19 Shinichiro Fujiya ウエブ上の商品・サービスの検索システム
JP4731896B2 (ja) * 2004-12-07 2011-07-27 新日鉄ソリューションズ株式会社 情報処理装置、情報検索方法及びプログラム
JP2006163826A (ja) * 2004-12-07 2006-06-22 Ns Solutions Corp 情報処理装置、情報検索方法及びプログラム
JP2006209257A (ja) * 2005-01-25 2006-08-10 Ns Solutions Corp 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date Type
KR20000037595A (en) 2000-07-05 application
CN1255680A (zh) 2000-06-07 application

Similar Documents

Publication Publication Date Title
US6983282B2 (en) Computer method and apparatus for collecting people and organization information from Web sites
US6446035B1 (en) Finding groups of people based on linguistically analyzable content of resources accessed
US7346605B1 (en) Method and system for searching and monitoring internet trademark usage
US6963867B2 (en) Search query processing to provide category-ranked presentation of search results
US6605120B1 (en) Filter definition for distribution mechanism for filtering, formatting and reuse of web based content
US6405216B1 (en) Internet-based application program interface (API) documentation interface
US6510434B1 (en) System and method for retrieving information from a database using an index of XML tags and metafiles
US7395259B2 (en) Search engine system and associated content analysis methods for locating web pages with product offerings
Eirinaki et al. SEWeP: using site semantics and a taxonomy to enhance the Web personalization process
US6253208B1 (en) Information access
Mobasher et al. Web mining: Pattern discovery from world wide web transactions
US7219073B1 (en) Method for extracting information utilizing a user-context-based search engine
US20020123988A1 (en) Methods and apparatus for employing usage statistics in document retrieval
US7774333B2 (en) System and method for associating queries and documents with contextual advertisements
US20020035619A1 (en) Apparatus and method for producing contextually marked-up electronic content
US7266510B1 (en) Method for graphically representing clickstream data of a shopping session on a network with a parallel coordinate system
US6363374B1 (en) Text proximity filtering in search systems using same sentence restrictions
Schatz et al. Federating diverse collections of scientific literature
US20020038299A1 (en) Interface for presenting information
US20120265744A1 (en) Knowledge-based e-catalog procurement system and method
US6851087B1 (en) System and method of processing computer form data
US6304870B1 (en) Method and apparatus of automatically generating a procedure for extracting information from textual information sources
US6256623B1 (en) Network search access construct for accessing web-based search services
US6272490B1 (en) Document data linking apparatus
US6549941B1 (en) Software system and methods for resubmitting form data to related web sites

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050606

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090623

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091124