JP2000516005A - データアクセスシステム - Google Patents

データアクセスシステム

Info

Publication number
JP2000516005A
JP2000516005A JP10508586A JP50858698A JP2000516005A JP 2000516005 A JP2000516005 A JP 2000516005A JP 10508586 A JP10508586 A JP 10508586A JP 50858698 A JP50858698 A JP 50858698A JP 2000516005 A JP2000516005 A JP 2000516005A
Authority
JP
Japan
Prior art keywords
database
document
search
memory area
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10508586A
Other languages
English (en)
Inventor
レフ―スミス、ジョン
アップルバイ、スティーブ
フェアマン、イアン
アイレス、サラー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Telecommunications PLC
Original Assignee
British Telecommunications PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Telecommunications PLC filed Critical British Telecommunications PLC
Publication of JP2000516005A publication Critical patent/JP2000516005A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/972Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/01Automatic library building
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 1組のカテゴリヘッディングであり、各カテゴリヘッディングに1組のキーワードが準備されているカテゴリヘッディングに基いて自動的にデータベース(112)を生成する方法を記載する。処理プラットフォーム(100)がキーワードを使用して、インターネット(120)を介して処理プラットフォーム(100)と接続している複数のサーチエンジン(130a,130b,130c)で行うサーチを定める。サーチ結果は処理プラットフォーム(100)によって処理され、サーチ結果に組込まれたURLを識別する。次にURLを使用して、URLがインターネット(120)内の遠隔のデータソースから参照したページを検索する。次に処理プラットフォーム(100)はフィルタ処理を行って、ページに得点を付け、何れのページがもとのカテゴリに最も相関しているかを判断する。最も相関度の強いインターネット場所情報はデータベース(112)に記憶される。

Description

【発明の詳細な説明】 データアクセスシステム 本発明は、改良を加えたデータアクセス効率に関する。とくに本発明は、目的 に合わせた特別仕様のデータベース作成の分野に応用される。 データを著しく分散させて記憶する環境の例にはワールドワイドウエブ(WW W)がある。WWWは、膨大な情報を体系化せずに集めたものであり、インター ネットの多くの異なるサーバに記憶されている。最新の推定では、情報ページ数 は3,000万を越え、サーバ数は225万を越えている。 何等かの補助なしにこの程度のデータ量をナビゲートする(操る)ことは非常 に困難である。WWW用のインデックスとかディレクトリといったナビゲーショ ンの補助を作り、WWW用の2つの主要なナビゲーション方法を示している。 インデックスの場合、いわゆるサーチエンジン、例えばAltaVista(http://al tavista.digital.com)は可能な限り多くのWWWページを検索し、各ページ内 の単語にインデックスを付ける。通常、サーチエンジンはロボットまたはスパイ ダとして知られる処理を実行し、WWWから選択した領域内にある検索したペー ジに含まれる全てのハイパーリンクに完全にしたがう。大きなインターネットの サーチエンジンは何百万ものページについての記憶したインデックスをもつこと ができる。したがってユーザがキーワードを入力すると、キーワードはインデッ クスエントリと比較され、要求したキーワードを含むページのリストを受け取る 。これは情報を見付ける簡単な方法であるが、キーワードのインデックスがどの 程度包括的であり、しかも正確であるかによって効率が限定される。 ディレクトリ、例えばYahoo(http://www.yahoo.com/)は、特定のトピックに 関係するカテゴリの階層構造を含む。この階層構造はディレクトリの作成者によ って定められるが、最低レベルのカテゴリでは通常はディレクトリの監督者によ って、また時にはユーザによって加えられるエントリをもつ。ディレクトリでは 選択が既知のトピック領域カテゴリに制限されるので、サーチエンジンを使用す ることによって、ディレクトリで情報を見つけるほうが容易になる。しかしなが ら、ディレクトリ式のWWWナビゲーションの有効性は正確な類別方法に限定さ れる。このため2つの欠点が生じる:第1に、特定のヘッディングを類別するこ とによって、ディレクトリを集中的にマニュアルで再作動させるように変えるこ とが必要になるときがある。第2に、この方法はあるユーザにとっては適してい ないことがあるし、また直観的(intuitive)でないときがある。 本発明の1つの態様にしたがって、あて先のデータベースを分布させる装置で あり: あて先のデータベースと; 装置を分散形ソースデータベースに接続する手段と; 所定の問題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記メモリ領域に含まれるキーワード群に基いて、前記分散形ソースデータ ベースと関係付けられた少なくとも1つのサーチエンジンを制御して、前記キー ワードを含むドキュメントの場所に関する情報を含むサーチ結果を作り、該ドキ ュメントが該分散形ソースデータベースに記憶されているような制御用手段と; 所定の基準にしたがってそのそれぞれ内容に基いて前記少なくとも1つのサ ーチエンジンによって作られるサーチ結果内で識別された各ドキュメントに得点 をつける手段と; 各得点に基いて、前記得点をつける手段によって得点されたドキュメントの 少なくとも幾つかを選択する手段と; 前記選択手段によって選択された各ドキュメントごとに、前記分散形ソース データベース内のドキュメントの場所に関係する情報を前記あて先データベース に記憶する手段とを含むあて先データベースを分布させる装置を提供する。 本発明は、著しくより大きな分散形データベースからあて先のデータベースを 分布させる実際的な方法を与えることによって既知のサーチ方法に関係した問題 を克服する。 したがって、別に記載されない限り、“ページ”および“ドキュメント”とい う用語の両方は、単一のロケーション、例えばWWWに記憶されたデータのコン パイルを表しており、したがって相互に交換できる。 本発明の実施形態を効果的に応用できる1つの例として、学校という環境があ り、そこでは先生が、生徒にとって使用できる情報の量および形式を制限したい とする。いったん決めてしまうと、データベース内のデータは生徒は不適切なま たは無関係の情報を得る心配なしに自由に“ブラウズ(閲覧)”することができ る。別の例には、会社内の環境において、一定の課題に関して学術的な情報では なく、市販の情報のみが必要な場合がある。 1組のキーワード群を含み、各キーワード群がそれぞれの所定の課題のカテゴ リに関係するようにメモリ領域を構成することができる。カテゴリは階層的に構 成し、例えば上述のディレクトリと同様に、最も包括的なカテゴリはディレクト リの最上レベルに置かれ、カテゴリが次第に特定されるにしたがって低いレベル に枝分かれするようにできる。 好ましい実施形態では、データが最終的にあて先のデータベースに記憶される 前に、検索したドキュメントファイル参照数を低減する別の段階を含む。これに より、不適切なまたは無関係のドキュメントの参照を省くことができる。例えば 、要求されるデータベースが“furniture(家具)”のカテゴリおよび“table( 机)”のキーワードをもつとき、数学の“table(表)”に関係するドキュメン トへの参照を省くことが賢明であり望ましい。 本発明の第2の態様にしたがって、あて先データベースを分布する装置であり : あて先データベースと; 所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記あて先データベースおよび前記メモリ領域にアクセスでき、分散形ソー スデータベースに接続でき、かつ、 前記メモリ領域に含まれるキーワード群に基いて、前記分散形データベー スと関係する少なくとも1つのサーチエンジンを制御して、前記キーワードを含 み、前記分散形ソースデータベース内に記憶されるドキュメントの場所に関係す る情報を含むサーチ結果を作り; 所定の基準にしたがってそのそれぞれの内容に基いて前記サーチ結果内で 識別される各ドキュメントを得点し; それぞれの得点に基いてドキュメントの少なくとも幾つかを選択し;また 各選択したドキュメントごとに、前記分散形ソースデータベース内の場所 に関する情報を前記あて先データベースに記憶するようにされている処理プラッ トフォームとを含むあて先データベースを分布する装置が提供されている。 本発明の第3の態様にしたがって、あて先のデータベースを分布させる装置で あり、 a)この装置を分散形ソースデータベースに接続する手段と; b)所定の課題のカテゴリに関係するキーワード群を記憶する第1のメモリ 領域と; c)第1のメモリ領域からキーワードを読取り、分散形ソースデータベース へアクセスするサーチ手段へ前記キーワードを送る手段と; d)前記サーチ手段からサーチの結果を受取り、第2のメモリ領域に前記結 果を記憶する手段であり、前記結果が前記キーワードを含む前記ソースデータベ ース内に記憶されるドキュメントの場所に関係する情報を含むような記憶する手 段と、 e)第3のメモリ領域で前記ロケーション情報を識別し、かつ記憶する手段 と; f)前記第3のメモリ領域からロケーション情報を読取り、要求をソースデ ータベースに送り、選択したロケーション情報に関係するドキュメントのコピー を装置へ戻すようにする手段と; g)前記ドキュメントの前記コピーを受取り、第4のメモリ領域内に記憶す る手段と; h)その各内容に基いて所定の基準にしたがって第4のメモリ領域に記憶し た各ドキュメントにアクセスし、かつ得点する手段と; i)各得点に基いて前記ドキュメントの少なくとも幾つかを選択し、各選択 したドキュメントに対して、ソースデータベース内のドキュメントの場所に関係 する情報をデータベースに記憶する手段とを含むあて先データベースを分布させ る装置を提供する。 本発明の第4の態様にしたがって、あて先データベースを分布させる方法であ り: 所定の課題のカテゴリに関係するキーワード群に基いて、分散形ソースデー タベースに関係する少なくとも1つのサーチエンジンを制御して、前記キーワー ドを含み前記分散形ソースデータベース内に記憶されているドキュメントの場所 に関係する情報を含むサーチ結果を作る段階と; 所定の基準にしたがって各内容に基いて前記サーチ結果で識別される各ドキ ュメントを得点する段階と; 各得点に基いてドキュメントの少なくとも幾つかを選択する段階と; 各選択したドキュメントごとに、前記分散形ソースデータベース内のドキュ メントの場所に関係する情報を前記あて先データベースに記憶する段階とを含む 方法を提供する。 ここで本発明の実施形態を添付の図面を引用して例示的に記載する。 図1は、データベースを生成し、本発明を具現するシステムを示す模式図であ る。 図2は、図1のシステムで使用した主要なデータメモリ領域の模式図である。 図3は、データベースを構築する方法を示すフローチャートである。 図4は、データがデータベース内にどのように配置されているかを示す模式図 である。 図5は、データベースを構築するときにどのようにドキュメントを分散形デー タソースから検索するかを示すフローチャートである。 図6は、図1のシステムでどのようにサーチ結果が処理されるかを示すフロー チャートである。 図7は、図1のシステムでどのようにドキュメントが得点されるかを示すフロ ーチャートである。 図1では、本発明の実施形態にしたがってあて先データベースを構築して分布 させるのに適したシステムを示す。 このシステムでは、処理プラットフォーム(PP)100は、第2のメモリデバ イス110(例えば、ハードディスクドライブ)を接続し、第2のメモリデバイス1 10内に保持されるあて先データベース112へのアクセスを制御する。あて先デー タベース112はPP100とは別々にかつ遠隔に配置することができる。データベー スを分布するとき、データベース112はコンパイルされたデータベース115に記憶 されたデータを含む。PP100はインターネット120を介して、複数のサーチエン ジン130a、130b、および130c(見やすくするために、この3つのみが示 されている)にも接続されている。これらの情報サーバが分散形ソースデータベ ースを構成している。 この実施形態においてPP100は、UNIX(TM)応用計算プラットフォームで あり、適切なソフトエアを走行することができる。例えば、PP100はオフィス や学校のローカルエリアネットワークにおいてパーソナルコンピュータ(PC) 140a、140b、および140cを介してユーザにアクセスできる。各PC140a、140b、 および140cは、PC上を走行し、PP100と通信する適切な制御ソフトウエアの 制御のもとで、データベース112内の必要なデータにアクセスすることができる 。PC上のソフトウエアはローカルメモリ(図示されていない)に恒久的に記憶 できるか、または要求あるいは実行されるときにPP100から検索することがで きる。ソフトウエアは起動時に、周知のディレクトリサーチソフトウエア、例え ばYahooに一緒に関係付けられたユーザにグラフィカルユーザインターフェイス (GUI)を示す。したがってアクセスソフトウエアの詳細は、さらに詳しく記 載する必要はない。 図2はメインメモリ領域を示し、ここでは本発明の実施形態の実行中にアクセ スされるかまたは生成されるか、あるいはその両方が行われる。この場合、使用 されるメモリは第2のメモリ、例えばハードディスクであるが、メインメモリ、 例えばRAMは通常データを記憶するか、または第2のメモリに再び記憶する前 にデータを操作するのに使用される。この実施形態では、メモリ領域は第2のメ モリデバイス110とデータベース112とで共用される。メモリ領域には:カテゴリ リスト200、キーワードリスト205、URL(Uniform Resource Locator)メモリ21 0、ドキュメントメモリ215、報告メモリ220、サーチエンジンリスト225、サーチ エンジン構文(シンタックス)230、サーチ結果ファイル235、およびURLの初 期リスト240がある。残りの領域は起動中に使用される。 図3は、次の説明と共に、データベース112を構築し分布させる本発明の1つ の方法を記載する。 段階300では、メモリ領域200内にヘッディングおよびカテゴリでデータベース 112内に含まれるもので成るカテゴリリストを準備する。ヘッディングおよびカ テゴリは、完全なデータベース内でユーザが選択できるものに対して1:1の マッピングを行う。次に段階302では、カテゴリリストに含まれる各カテゴリに 対するキーワードのリストを生成する。ヘッディング、カテゴリ、およびキーワ ードはさらに、どの程度正確にデータベース内で情報が互いに関係することを予 定されているかを示す関係付け情報を含む。カテゴリリストの構造は以下でより 詳しく説明することにする。キーワードは、データベースを構築するために準備 されているが、それだけでは最終的なデータベース構造の一部は形成しない。 キーワードが各カテゴリに与えられると、段階304でキーワードは単一のキー ワードリストに結合され、メモリ領域205に記憶される。 次に段階306でキーワードは、キーワードサーチのために1または複数のサー チエンジン130a、130b、および130cへ送られる。通常の方法では、各サーチエン ジンは、各キーワードに対してサーチ結果を生成する。各キーワード/サーチエ ンジンの組合わせごとに、サーチ結果はメモリ領域235内の個々のテキストファ イルに記憶される。 段階306では、メモリ領域235に記憶した各個々のテキストファイルに保持され ているサーチ結果からURL(Uniform Resource Locators)を抽出する。その結 果、各サーチエンジンに対するサーチ結果の完全な組に対してURLの個々のリ ストが得られる。URLは、各サーチエンジンで見つけたキーワードの候補のペ ージを示す。URLのリストはメモリ領域240に記憶される。 段階308では、サーチによって生じたエラーは将来解析するためにメモリ領域2 20内のエラーログに記録される。 段階306の処理では、キーワードをサーチエンジンへ送ることによってサーチ を開始し、その結果を検索および記憶し、その結果を処理して、URLリストを 得る。これは図5および6を引用して以下でより詳しく記載する。 次に段階312でサーチエンジンによって生成されるURLリストを結合し、キ ーワードによって構成されるURLの単一のリストを形成する。この単一のリス トはメモリ領域215に記憶される。この段階は、複製されたURLを削除するこ とを含む。複製されたURLがあるときは、2以上のサーチエンジンが同じキー ワードで同じURLを起こす。2以上のサーチエンジンを使用するとき、この段 階を実行することが必要となるのは明白である。この結果、効果的に各キーワー ドに対するURLのリストが生成される。 次に段階316では、URLのリスト(上述のようにキーワードによって構成さ れている)は、段階302で生成したカテゴリおよびキーワードの元の記述に戻っ てそれを相互参照して、各カテゴリに対する候補のURLを識別する。次に段階 320で各カテゴリの各キーワードのURLをフィルタ処理して、処理されていな いページを消去する。この点で普通消去されるページには、http以外の参照 および将来有望でないサイト、例えば外国語サイトを含む。この段階は、サイト についてブラック(実際をいうとホワイト)に対して各URLを検査し、ブラッ クリストに入れられたサイトには適切なまたは関連の情報を明らかに供給せず、 ホワイトリストサイトでは適切で良好な品質の情報を供給することが知られてい る。この点で適切なフィルタ処理方法を使用して、所望の形式の辞書(ディクシ ョナリ)を生成できることが分かるであろう。 段階322ではフィルタ処理したURLの詳細をテキストファイルに報告して、 周期的な検査を実行して、有効な情報が拒絶されないことを保証できる。段階32 6では、統計をとることができ、将来のフィルタ処理(段階320)の改良を助ける ことができる。 段階330では、フィルタ処理段階320の後に残ってしまった各カテゴリの各UR Lを使用して、各WWWページを検索する。検索したページまたはドキュメント はメモリ領域215に記憶される。段階338は各検索したページが、提案されている カテゴリに対して得点される。得点プロセスは実質的に、検索したページの関連 、およびそれにしたがってこのページをデータベースに含むべきか否かを判断す る。得点プロセスは、図7を引用してより詳しく記載する。 ページが得点されると、第2のフィルタ処理段階342では、カットオフポイン トを適用して、どのページがカットオフポイントよりも高いスコアをもち、デー タベース112へ送られるかを示す。カットオフポイントは、例えば、ページの“ 関連”度(例えば、ページ内にキーワードが存在する数によって判断される)の 固定値を示し、各カテゴリ内の最大ページ数を制限することができる。その代り に、カットオフポイントは、特定のカテゴリで達成されるサーチ結果の類型に依 存して幾つかの特定の方法で判断することができる。 第2のフィルタ段階342の出力は、段階346で通常のデータベースローディング ルーチンを使用してデータベース112へ供給できるフォーマットに構成される。 データベース112用のデータベースの適切な1つの形式はリレーショナルデータ ベース、例えばOracle(TM)である。 データベース112用の適切な論理データ構成を図4に示す。データベース112の 使用可能なヘッディングは、第1の表400に記憶されている。各ヘッディング( HEAD1、HEAD2、など)は、このヘッディングのもとでユーザが使用で きるカテゴリをリストしたカテゴリ表410への参照を含む。各カテゴリは2つの 参照:すなわちURL表420に対する第1の参照並びにタイトルおよび記述表430 に対する第2の参照を含む。タイトルおよび記述表430は、(閾値より高い得点 または最高のn得点をもつ)各ページのタイトルおよび簡潔な要約を記載してい る。各アクセス可能なページに対してURLを保持することによって、URL表 はタイトルおよび記述表を写す。URLを使用して、必要なときにページを検索 する。 段階346からデータが上述のようなデータベースへロードするのに適した形態 に構成されると、段階360でローディングルーチンでデータをデータベース112へ 送り、予め作ったデータベース表にロードする。こうして、段階360でデータベ ース112を分布させる。この点でデータベース112は使用準備が完了する。 いったんデータをデータベース112に記憶すると、通常のやり方で標準データ ベーススクリプトを使用してアクセスできる。次にデータは“フロント−エンド ”ユーザインターフェイスを介してユーザヘ送られる。“フロント−エンド”ユ ーザインターフェイスは、例えば、通常のサーチエンジンまたはYahooのような ディレクトリに似せることができる。データベーススクリプトおよびインターフ ェイスの生成は従来の技術であり、本発明の技術的範囲内にはないので、より詳 しくは記載しないことにする。より詳しい情報を得るには、Oracle(TM)の ユーザガイドのようなテキストを参照すべきである。 例示的なカテゴリリストを抽出して、以下の記載と一緒に参照用に使用するた めに次に示す。カテゴリリストはデータベース112に必要なカテゴリを反映して いる。 カテゴリリストは、上述のものに類似した所定のフォーマット内のテキストフ ァイルとして準備され、キーワードがどのように相互に関係しているかを表す。 データベースの構築が開始されるとき、テキストファイルはシステムによって使 用される。 この例では、カテゴリレベルの上に“ヘッディング”レベルがある。都合上、 2つのみのヘッディング(構文“>>>>>”で表されている)、すなわち”ar ts & entertainment”および”hobbies & sports”が示されている。これらの ヘッディングは、実際はヘッディングのより長いリストの一部を形成し(都合上 、図示されていない)、所定のグループのユーザにとって重要である。データベ ース112が構築されると、ヘッディングを選択して、システムのユーザに送られ る最上レベルの選択の組を形成する。最後にこれらのヘッディングはデータベー スのヘッディング表400に記憶される。 各ヘッディングはカテゴリ(構文“=>”で表される)のリストをもつ。これ らのカテゴリは、選択されたヘッディングの1つ(この例では、各ヘッディング に対して3つのみのカテゴリが示されている)に応答してシステムのユーザへ送 られる。カテゴリはデータベース内のカテゴリ表に記憶される。各カテゴリは、 複数の関係付けられたキーワードをもち、これはコンマで分けられている。各キ ーワードは、データベース内のURL表420に記憶される。各キーワードは相関 するURL表320内のURLと、関連のタイトルおよび記述表430内のタイトルお よび記述データとのリンクをもつ。 例に示されているように、幾つかのカテゴリの後には“%%%”構文を最初に 記載して、別の単語または句が続く。この構文は次“See Also(また次も見よ) ”と翻訳される。See Alsoは有益で一般的に使用される方法であり、一定のトピ ックに関する別の情報を別の場所で見付けられることをユーザに気付かせること ができる。例として“films(フィルム)”のカテゴリを使用すると、see also のオプシヨンは”hobbies & sports: cinema(趣味とスポーツ:シネマ)”を参 照する。このときsee alsoは”hobbies & sports”ヘッディングのもとにある” cinema”カテゴリであることを意味する。see alsoのエントリは、図示されてい ないが別のデータベース表に記憶することができ、カテゴリ表410内のカテゴリ によっ て参照される。 上述の例から明らかなカテゴリリストの別の特徴は、各キーワードが2つの数 と関係付けられていることである。第1の番号は“意味(sense)”または単語の 意味である。例えば、”slide”には名詞も動詞もあり、名詞の"slide"は写真の スライドまたは公園で子供が滑り降りるつるつるした傾斜表面を意味する。意味 は辞書ソース、最も好ましくはコンピュータで読取り可能なフォーマットで使用 できる辞書ソースを参照することによって決定される。処理段階全体で同じ辞書 ソースを使用して、1つの単語に対する意味ラベルを一貫させることを保証する ことが明らかに重要である。 第2の数は、キーワードの加重値、またはキーワードが関係付けられたカテゴ リにどの程度関連しているかに関する。例えば、カテゴリ”photography(写真 )”における”camera(カメラ)”に対する加重値は5であり(5は最高の関連 度を表す)、一方で”flash(フラッシュ)”に対する加重値は1だけである( 1は最低の関連度を表す)。データベースを生成するときに、これらの数が与え る影響を次により詳しく記載する。 カテゴリリスト、それ自身は何等かの方法、または何等かのやり方によって定 めることができる。ファイルを構築する最も簡単なやり方はマニュアルで、すな わちユーザ(またはデータベースの生成者)が全てのキーワードを、例えば試行 錯誤して入力し、必要なデータベースを構築するやり方である。しかしながら、 リストを構築する最も効果的な方法が考えだされた。例えば、アダプティブ(適 応性をもつ)ソフトウエアを準備(または例えばWWWから選択)して、ユーザ が関心のある特定の課題に関係する多数の情報ページを提供することをユーザに 要求することができる。与えられたページに基いて、ソフトウエアは一緒に現れ る単語または句を決定し、重要な領域を示す。例えば、ユーザが写真に関心があ り、写真という課題に関して3ページを準備するとして、ソフトウエアは“カメ ラ”、“プロジェクタ”、“写真”、などの単語を写真を表すものとして十分に 強調することができる。この方法では、ユーザにとって重要な各課題に対して、 サンプルページが与えられ、キーワードが自動的に生成され、次にカテゴリリス トが自動的に生成されることになる。その代りに、コンピュータを応用したシソ ーラスを使用して、単一の入カカテゴリに対してキーワードを生成することがで きる。さらにこのようなシソーラスは、後でデータベースから捨てられるドキュ メントに基いて、一定のカテゴリと関係付けられた一定の単語を含めるかまたは 捨てる(あるいは単語に関係付けられた加重値を変化させる)ように適応させる ことができる。 最終的に、ソフトウエアを準備して、例えば、ユーザがインターネット上でア クセスする情報の最後のxページから、最も一般的に持ち上がる課題領域に基い て、ユーザに対する主要な課題関心領域を決定することができる。したがって如 何なる段階にも人間が介入することなく、構築された実際のカテゴリリスト並び にキーワードリストをソフトウエアおよび最終的なデータベースによって定める ことができる。 カテゴリリストの生成を簡単にする別の方法は、この実施形態を読むことによ って当業者に明らかになるであろう。 したがって、この実施形態から、カテゴリリスト、おそらくはキーワードを供 給するのとは別に、必要なデータベースを自動的に生成することができる。 ここでサーチエンジンを使用して、URLリストを生成するやり方を記載する 。サーチエンジンは、普通はWWWと関係付けて使用される。サーチエンジンは 一般に、httpコマンドに応答してサーチを行なう。本質的に、このようなコマン ドはサーチエンジンおよび一定の構文用のURLを含み、このURLでサーチエ ンジンによって実行されるサーチを特定する。一般に、異なるサーチエンジンに ついての同じコマンドの構文は変っており、異なるサーチエンジンでこのやり方 でサーチが成功できるようにする前に構文が決められる必要がある。次のhttpコ マンドの例では、サーチエンジンに”AltaVista”を伝えて、キーワード”slide ”をサーチする。 http://altavista.digital.com/cgi-bin/query?pg=q&what=web&fmt=.&q=slide 明らかに、各サーチエンジンごとに正しい構文を学習しなければならないことは 面倒であり、サーチエンジンのプロバイダは、“ユーザが親しみやすい(ユーザ フレンドリイな)”フロントエンドのGUIを準備して、ユーザのローカルコン ピュータシステム上で行なうことによってこの必要を克服できるであろう。G UIによりユーザは、ディスプレイスクリーン上で、例えば適切なボックス内に キーワードを入力し、"submit"ボタンを押下する(すなわち、ディスプレイスク リーン上でマウスポインタをボタンに置き、マウスボタンを左クリックする)こ とによってサーチ要求を提示することができる。GUIは、ユーザ入力を非常に 簡略化したものであり、上述に示したものに類似したより複雑な形式にまとめ、 サーチエンジンへ送る。 これに応答して、サーチエンジンはそのデータベースをサーチして、相関する キーワードを見付け、キーワードを含むページに対してURLを含むデータを戻 す。サーチの結果は通常、見付けた各ページごとにページの内容のタイトルおよ び簡単な要約も含む。表示されたサーチ結果から、サーチエンジンがURLによ って示されたページを検索することに応答して、何れかのURL上でクリックす ることができる。 一般的に、戻されたデータは通常、html(Hypertext Markup Language)形式の 情報ページである。ページはフォーマットされていないテキストおよび各htmlコ ードを含み、htmlコードはどのようにテキストを表示すべきかおよびGUI環境 内でどのようにユーザがそれと対話できるかを定める。通常、フォーマットされ ていないテキスト内では、ヘッディング、タイトル、本文テキストは異なるhtml コードを使用して区別される。GUIはhtmlページを採用し、ページごとにコー ドを翻訳し、適切にフォーマットされた、対話式のグラフィック表示の情報とし て、ユーザに送られる。 htmlは工業規格(industry-wide standard)であるので、ありのままのフォーマ ット化されていないテキストおよびhtmlコードを読取り、どのテキストが、例え ばWWWページの記述に関係しているか、およびどのテキストがURLなどに関 係しているかを翻訳することは比較的に簡単な作業である。この実施形態で達成 したことはまさにこのことであり、次に記載する。 サーチエンジンを制御するプロセスを、図5を参照して次に記載する。段階51 0では、アクセスされるサーチエンジン(SE)は、メモリ領域225内のファイル に保持されている使用可能なサーチエンジンのリストから選択される。次に段階 520でこのサーチエンジンに対するサーチ要求を作るときに使用するために、 メモリ領域230内の別々のテキストファイルから選択したサーチエンジン用の構 文が読取られる。段階530では、キーワードリストにアクセスして、このリスト から第1のキーワードを読取る。段階540で、適切な構文を使用して、キーワー ドをhttpコマンドへ適用する。したがって次にこのプロセスは段階550でコマン ドをサーチエンジンへ送る。次に段階560で結果を受け取るまで、サーチ結果を 待つ。次に結果は、段階570でメモリ領域235内のテキストファイルに記憶され、 ここで各サーチエンジン/キーワードの組合せごとに新しいテキストファイルを 使用する。 このプロセスは全てのキーワードをサーチするまでリターンブランチBにした がい、次にリターンブランチAにしたがって(再びキーワードリストの最上部か ら始める)、全てのサーチエンジンにアクセスするまで、リスト上の次のサーチ エンジンを選択する。プロセスの結果は、全てのサーチ結果を含む1組のテキス トファイルであり、将来参照するために、メモリ領域235内に記憶される。 図5に示したプロセス(および次の各プロセス)は、例えば夜間、すなわち通 信コストが最低のときに、PP100上を走行するソフトウエアルーチンまたはバ ッチファイルによって定められる。 図5を引用して記載したプロセスは、サーチエンジンおよびサーチエンジンに 対するキーワード要求が応答しないときに、リスト内の次のサーチエンジン、ま たは次のキーワードに移し、一方でサーチエンジンの故障またはエラーログに対 するサーチエンジンの要求(エラー記録段階308は図3に示されている)を記録 することによっても反応することができる。 図6は、サーチ結果のテキストファイルに関係して実行する段階を示す。都合 上、1つのサーチエンジン/キーワードの組合わせを表す1つのみのテキストフ ァイルについて検討する。 図6では、段階605でサーチ結果のテキストファイルを開き、文字ごとに連続 的に読取る。ファイルの始めから、ファイルが終わる(EOF)前に(段階610 )から、段階615で1つの文字をファイルから読取る。段階620では、文字が<文 字でないとき、ブランチAは段階610へ戻り、文字カウンタ(図示されていない )がインクリメントされて、ファイル内の文字を読取るところを示す。<文字は ht mlを示し、次のテキスト(またはその一部分)は、通常のテキストとは対立して いるためにhtmlコードである。とくに、URLは、a<文字の後でhtmlラベルa _hrefによって識別される。 文字がa<であるとき、処理は段階625に進む。段階625では、次の6つの文字 をファイルから読取る。次の8つの文字は段階630で読取られる。次の8つの文 字がa_herf=”であるとき、段階635で次の“文字まで、後続の全ての文字を読 取る。次の8つの文字がa herf=”でないとき、ブランチBが続き、段階630か ら段階610へ戻り、文字カウンタが1だけインクリメントされる。別の試験(詳 しくは記載しない)は、検索した文字がURLまたはハイーパーテキストリンク に関係しているか否かを判断し、ここではハイパーテキストリンクはこの目的に 対して必要ない。 段階635の後で、段階640では、第1と第2の“文字の間のテキストは、URL を表し、メモリ領域240内のテキストファイルに記憶される。多くの文字が段階6 10と635との間で読取られているが、文字カウウンタはインクリメントされる。 次に、全テキストファイルが読取られるまで、ブランチCが続く。全ファイル が読取られると、ファイルを閉じて、処理はこのサーチエンジン/キーワードの 組合わせを終了する。 図6に示した処理は、各サーチエンジン/キーワードの組合わせに対してテキ ストファイル上で実行される。その結果、各サーチエンジンに対するサーチの結 果から抽出したURLの個々のリストが得られる。これらのリストはメモリ領域 240に記憶される。メモリ領域240内にURLのこれらのリストを記憶した後で、 図3に示した全体的な処理は段階312から続く。 ここで図7を引用して検索したページを得点する方法を記載することにする。 ドキュメントの得点は組内の別のドキュメントの内容に部分的に関係しているの で、特定のカテゴリ、すなわちドキュメントの組に対して全てのドキュメントを 検索した後で、得点付けを行う。段階710では、ドキュメントの組内の全てのド キュメントを予備処理する。予備処理には幾つかの段階が必要である。第1に、 各ページはタイトル、ヘッディング、テキスト本文に分割される。テキストの本 文、すなわちページの実際の記述式テキストに関して、処理されるテキスト量を 固定して、全体的な処理量を制限する。例えば、最初の20行のみを得点付けに 使用することができる。次に、意味のない単語および用語を消去して、得点付け をより効果的にする。例えば、"and","the","but","a","however"などの単語は 、ページの情報内容に何も加えないので、これらを全て消去する。予備処理の次 の段階では、全ての単語を単根の形に変換する。例えば、全ての名詞を単数形に 、全ての形容詞を副詞に、全ての動詞を不定詞形に変換する。 予備処理が完了すると、組内のドキュメントはより容易に比較でき、それに割 当てられた得点は大きな意味をもつ。 段階720では、“単語総数”と呼ばれる定数、すなわちドキュメントの組内に 残っている予備処理後の全単語数を計算する。次に段階730では、組内の全ての ドキュメントに対してカテゴリ内の各キーワードの“ワードカウント”の発生数 を計算する。 次に、各ドキュメントに対して手続きの残り(段階740,750,760,770)を実行 する。段階740は、各ドキュメントに対して実行される手続きの開始をマークす る。 段階750では、アルゴリズムAを使用して、カテゴリ内の各単語に対してドキ ュメントのテキスト本文で演算を行い、各キーワードに対する個々の得点を生成 する。アルゴリズムAを次に示す: 加重値 :上述のようにカテゴリにおけるキーワードの組内の単語に付さ れた参照 カウント :ワードがページに現れる回数 単語総数 :上述のように、ページの組内の単語数 項目内の単語:ページ内の単語数 ワードカウント:単語がページの組内に現れる回数 オーダ(order):キーワード内の単一の単語数 段階760では、アルゴリズムBを使用して、カテゴリ内の各キーワードに対し てタイトルおよびヘッディングを得点して、各キーワードに対して1組の個々の 得点を生成する。アルゴリズムBを次に示す: アルゴリズムB 得点(タイトル)=100×加重値×カウント×オーダ 得点(ヘッディング1)=100×加重値×カウント×オーダ 得点(ヘッディング2)=50×加重値×カウント×オーダ 得点(ヘッディング3)=20×加重値×カウント×オーダ 、など。 加重値:上述のように、カテゴリのキーワードの組内の単語に付する参照。 カウント:キーワードが各タイトルまたはヘッディングに現れる回数。 オーダ :キーワード内の単一の単語数。 上述から分かるように、タイトルには主な重みが第1の主なヘッディングとと もに与えられる。次の課題のヘッディングは通常相関度は低いので、各より低い スコアを与える。 ページが予め処理され、上述のように得点されると、段階770で、ページに対 する合計得点が、アルゴリズムAおよびBからの全ての個々のキーワードのスコ アを加算することによって得られる。次に上述のように、得点がカテゴリに対す る一定の閾値よりも上であるときは、ページがカテゴリに相関していると考えら れ、結果的にデータベース内に含まれる。既に記載したように、閾値以外の方法 を使用して、どのドキュメントがデータベース内に含まれているか、例えば上位 nの得点ドキュメント、またはドキュメントの上位mパーセンタイルを使用でき るかを判断する。 この場合、得点を付けたページのサンプルをとって、それらを個々に検査して 、それがカテゴリにどの程度関連しているかを知り、そのカテゴリに対する閾値 を判定するために得点を使用して閾値を判断する。 明らかに、データベースから割当てられたカテゴリに対して誤った意味のキー ワードをもつ筋違いのドキュメントを除去することが望ましい。これは得点付け をする前に行って、得点付けに必要な処理量を低減することができる。明らかに 、人間がページを読取り、判断を行うことによって手動でこの段階を達成するこ とができる。しかしながら、文の中をみて、分の構造および意味論を理解するも の であり、これにより自然言語処理アルゴリズムは高精度に単語の意味を判断し、 人手による介入に取って代ることができる。このような方法を広く知られ、より 効果的になってきており、この記述の技術的範囲を越えている。この技術は本発 明の実施形態で好ましい形で使用されて、ページ内のキーワードの意味を判断で きたことを特記する。次に判断された意味を、上述のカテゴリリスト内に定めら れた要求される意味と比較する。 しかしながら、筋違いのドキュメントの除去は、如何なる点でも、例えばUR Lエントリを削除することによって、データベースを形成した後でさえも行うこ とができる。 しかしながら、上述の得点付け処理それ自身は当然、要求される閾値未満の低 い得点を筋違いのドキュメントに割当てることによって、これらを除去できるこ とを示した。例えば、写真のスライド(slide)に関係するドキュメントを要求し て、子供の滑り台(slide)に関する幾つかの(無関係の)ドキュメントが検索さ れたとすると、得点付け処理(他の関連するキーワード、例えば"camera"、"pho tograph"、および"flash"などを探しているとき)は、他のキーワードを見付け 損なうことなく、子供の滑り台(slide)のドキュメントを対応する低い得点に一 致させ、このようなドキュメントを自然にフィルタ処理することになる。 上述のシステムでは、分散形ソースデータベースはインターネットに接続した 情報サーバの形をとるが、本発明のシステムは他の分散形ソースデータベースで 使用するのに適している。 Source:Alta Vista(www.altavista.digital.com)
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,KE,LS,MW,S D,SZ,UG,ZW),EA(AM,AZ,BY,KG ,KZ,MD,RU,TJ,TM),AL,AM,AT ,AU,AZ,BA,BB,BG,BR,BY,CA, CH,CN,CU,CZ,DE,DK,EE,ES,F I,GB,GE,GH,HU,IL,IS,JP,KE ,KG,KP,KR,KZ,LC,LK,LR,LS, LT,LU,LV,MD,MG,MK,MN,MW,M X,NO,NZ,PL,PT,RO,RU,SD,SE ,SG,SI,SK,SL,TJ,TM,TR,TT, UA,UG,US,UZ,VN,YU,ZW (72)発明者 アップルバイ、スティーブ イギリス国、シーオー7・9ジェイキュ ー、エセックス、コルチェスター、ウィー ベンホー、リチャード・アベニュー 23 (72)発明者 フェアマン、イアン イギリス国、アイピー3・8ジェイダブリ ュ、サフォーク、イプスウィッチ、カムデ ン・ロード 28 (72)発明者 アイレス、サラー イギリス国、アイピー1・4ジェイワイ、 サフォーク、イプスウィッチ、バロンスデ ール・クローズ 37

Claims (1)

  1. 【特許請求の範囲】 1.あて先のデータベースを分布させる装置であり: あて先のデータベースと; 装置を分散形ソースデータベースに接続する手段と; 所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記メモリ領域に含まれるキーワード群に基いて、前記分散形ソースデータ ベースと関係付けられた少なくとも1つのサーチエンジンを制御して、前記キー ワードを含むドキュメントの場所に関する情報を含むサーチ結果を作り、該ドキ ュメントは該分散形ソースデータベースに記憶されているような制御用手段と; 所定の基準にしたがってそのそれぞれの内容に基いて前記少なくとも1つの サーチエンジンによって作られるサーチ結果内で識別された各ドキュメントに得 点をつける手段と; 各得点に基いて、前記得点をつける手段によって得点されたドキュメントの 少なくとも幾つかを選択する手段と; 前記選択手段によって選択された各ドキュメントごとに、前記分散形ソース データベース内のドキュメントの場所に関係する情報を前記あて先データベース に記憶する手段とを含むあて先データベースを分布させる装置。 2.前記少なくとも1つのサーチエンジンによって与えられたサーチ結果に含ま れる配置情報を識別し、第2のメモリ領域内に前記配置情報を記憶する手段をさ らに含む請求項1記載の装置。 3.前記少なくとも1つのサーチエンジンによって与えられたサーチ結果におい て識別されるドキュメントを検索し、ドキュメントメモリ内に前記検索したドキ ュメントを記憶する手段をさらに含む請求項1記載の装置。 4.前記メモリ領域がキーワード群の組を含むように構成され、各キーワード群 が各所定の課題のカテゴリに関係する請求項1乃至3の何れか1項記載の装置。 5.あて先データベースを分布する装置であり: あて先データベースと; 所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記あて先データベースおよび前記メモリ領域にアクセスでき、分散形ソー スデータベースに接続でき、かつ、 前記メモリ領域に含まれるキーワード群に基いて、前記分散形データベー スと関係する少なくとも1つのサーチエンジンを制御して、前記キーワードを含 み、前記分散形ソースデータベース内に記憶されるドキュメントの場所に関係す る情報を含むサーチ結果を作り; 所定の基準にしたがってそのそれぞれの内容に基いて前記サーチ結果内で 識別される各ドキュメントを得点し; それぞれの得点に基いてドキュメントの少なくとも幾つかを選択し;また 、 各選択したドキュメントごとに、前記分散形ソースデータベース内の場所 に関する情報を前記あて先データベースに記憶するようにされている処理プラッ トフォームとを含むあて先データベースを分布する装置。 6.あて先のデータベースを分布させる装置であり: a)この装置を分散形ソースデータベースに接続する手段と; b)所定の課題のカテゴリに関係するキーワード群を記憶する第1のメモリ 領域と; c)第1のメモリ領域からキーワードを読取り、分散形ソースデータベース へアクセスするサーチ手段へ前記キーワードを送る手段と; d)前記サーチ手段からサーチの結果を受取り、第2のメモリ領域に前記結 果を記憶する手段であり、前記結果が前記キーワードを含む前記ソースデータベ ース内に記憶されるドキュメントの場所に関係する情報を含むような記憶する手 段と; e)第3のメモリ領域で前記場所情報を識別し、かつ記憶する手段と; f)前記第3のメモリ領域から場所情報を読取り、要求をソースデータベー スに送り、選択した場所情報に関係するドキュメントのコピーを装置へ戻すよう にする手段と; g)前記ドキュメントの前記コピーを受取り、第4のメモリ領域内に記憶す る手段と; h)その各内容に基いて所定の基準にしたがって第4のメモリ領域に記憶し た各ドキュメントにアクセスし、かつ得点する手段と; i)各得点に基いて前記ドキュメントの少なくとも幾つかを選択し、各選択 したドキュメントに対して、ソースデータベース内のドキュメントの場所に関係 する情報をデータベースに記憶する手段とを含むあて先データベースを分布させ る装置。 7.あて先データベースを分布させる方法であり: 所定の課題のカテゴリに関係するキーワード群に基いて、分散形ソースデー タベースに関係する少なくとも1つのサーチエンジンを制御して、前記キーワー ドを含み前記分散形ソースデータベース内に記憶されているドキュメントの場所 に関係する情報を含むサーチ結果を作る段階と; 所定の基準にしたがって各内容に基いて前記サーチ結果で識別される各ドキ ュメントを得点する段階と; 各得点に基いてドキュメントの少なくとも幾つかを選択する段階と; 各選択したドキュメントごとに、前記分散形ソースデータベース内のドキュ メントの場所に関係する情報を前記あて先データベースに記憶する段階とを含む 方法。
JP10508586A 1996-07-31 1997-07-18 データアクセスシステム Pending JP2000516005A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP96305879.7 1996-07-31
EP96305879A EP0822502A1 (en) 1996-07-31 1996-07-31 Data access system
PCT/GB1997/001949 WO1998004979A1 (en) 1996-07-31 1997-07-18 Data access system

Publications (1)

Publication Number Publication Date
JP2000516005A true JP2000516005A (ja) 2000-11-28

Family

ID=8225046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10508586A Pending JP2000516005A (ja) 1996-07-31 1997-07-18 データアクセスシステム

Country Status (4)

Country Link
US (1) US6178419B1 (ja)
EP (2) EP0822502A1 (ja)
JP (1) JP2000516005A (ja)
WO (1) WO1998004979A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168984A (ja) * 2000-03-29 2012-09-06 Risk Monster Kk 与信機能を備えた匿名電子商取引システム及び方法

Families Citing this family (195)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5940834A (en) * 1997-03-13 1999-08-17 Mitel Corporation Automatic web page generator
JPH10283240A (ja) * 1997-04-09 1998-10-23 Canon Electron Inc 情報ファイル装置、情報ファイルの記録方法、および、情報ファイルの記録手順を記憶した記憶媒体
GB2329488A (en) * 1997-09-17 1999-03-24 Transcom Software Inc Accessing information according to subject heading
JP3664874B2 (ja) * 1998-03-28 2005-06-29 松下電器産業株式会社 文書検索装置
GB2336699A (en) * 1998-04-24 1999-10-27 Dialog Corp Plc The Automatic classification of text files
JPH11312172A (ja) * 1998-04-28 1999-11-09 Sharp Corp 情報処理装置及び方法並びにその制御プログラムを記憶した媒体
US6735585B1 (en) * 1998-08-17 2004-05-11 Altavista Company Method for search engine generating supplemented search not included in conventional search result identifying entity data related to portion of located web page
US6510467B1 (en) * 1998-09-16 2003-01-21 International Business Machines Corporation Method for transferring data files between a user and an internet server
JP3278406B2 (ja) * 1998-12-10 2002-04-30 富士通株式会社 ドキュメント検索仲介装置、ドキュメント検索システム、および、ドキュメント検索仲介プログラムを記録した記録媒体
US20030195872A1 (en) * 1999-04-12 2003-10-16 Paul Senn Web-based information content analyzer and information dimension dictionary
US6336117B1 (en) * 1999-04-30 2002-01-01 International Business Machines Corporation Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine
WO2000075809A1 (fr) * 1999-06-04 2000-12-14 Seiko Epson Corporation Procede de triage d'informations, trieur d'informations, support enregistre sur lequel le programme de triage d'informations est enregistre
WO2001002987A2 (en) * 1999-07-01 2001-01-11 Seekip.Com Web-based infomediary for intellectual property transfer
KR100328670B1 (ko) * 1999-07-21 2002-03-20 정만원 다중 추천 에이전트들을 이용하는 추천 시스템
US6625152B1 (en) 1999-10-13 2003-09-23 Cisco Technology, Inc. Methods and apparatus for transferring data using a filter index
US6546387B1 (en) 1999-11-15 2003-04-08 Transcom Software Inc. Computer network information management system and method using intelligent software agents
US6691108B2 (en) * 1999-12-14 2004-02-10 Nec Corporation Focused search engine and method
US6389467B1 (en) 2000-01-24 2002-05-14 Friskit, Inc. Streaming media search and continuous playback system of media resources located by multiple network addresses
AU2001231023A1 (en) * 2000-01-24 2001-07-31 Friskit, Inc. Streaming media search and playback system
US7281034B1 (en) 2000-01-24 2007-10-09 Friskit, Inc. System and method for media playback over a network using links that contain control signals and commands
US6606659B1 (en) * 2000-01-28 2003-08-12 Websense, Inc. System and method for controlling access to internet sites
US6665659B1 (en) * 2000-02-01 2003-12-16 James D. Logan Methods and apparatus for distributing and using metadata via the internet
US6766361B1 (en) 2000-02-24 2004-07-20 Cephire Technologies, Inc. Machine-to-machine e-commerce interface using extensible markup language
US20010054020A1 (en) * 2000-03-22 2001-12-20 Barth Brian E. Method and apparatus for dynamic information connection engine
EP1269754A4 (en) * 2000-03-14 2009-03-11 Joseph Robert Marchese DIGITAL VIDEO SYSTEM USING NETWORKED CAMERAS
US7523114B2 (en) * 2000-04-24 2009-04-21 Ebay Inc. Method and system for categorizing items in both actual and virtual categories
US7076743B2 (en) * 2000-05-04 2006-07-11 I-Lor, Llc Method for adding a plurality of user selectable functions to a hyperlink
US6876997B1 (en) * 2000-05-22 2005-04-05 Overture Services, Inc. Method and apparatus for indentifying related searches in a database search system
US6983320B1 (en) * 2000-05-23 2006-01-03 Cyveillance, Inc. System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages
US7251687B1 (en) 2000-06-02 2007-07-31 Vignette Corporation Method for click-stream analysis using web directory reverse categorization
US7039630B2 (en) * 2000-07-27 2006-05-02 Nec Corporation Information search/presentation system
JP2002049631A (ja) * 2000-08-01 2002-02-15 Sony Corp 情報提供装置および方法、並びに記録媒体
US6868434B1 (en) * 2000-08-07 2005-03-15 Sun Microsystems, Inc. System and method for testing server latencies using multiple concurrent users in a computer system
US8060816B1 (en) * 2000-10-31 2011-11-15 International Business Machines Corporation Methods and apparatus for intelligent crawling on the world wide web
GB2368670A (en) * 2000-11-03 2002-05-08 Envisional Software Solutions Data acquisition system
AU2002239297A1 (en) * 2000-11-16 2002-06-03 Mydtv, Inc. System and methods for determining the desirability of video programming events
US6898592B2 (en) * 2000-12-27 2005-05-24 Microsoft Corporation Scoping queries in a search engine
US7287064B1 (en) * 2001-11-20 2007-10-23 Sprint Spectrum L.P. Method and system for determining an internet user's interest level
US7194464B2 (en) 2001-12-07 2007-03-20 Websense, Inc. System and method for adapting an internet filter
EP1324220A1 (en) * 2001-12-24 2003-07-02 Abb Research Ltd. Process and system for generating and improving a collection of information objects
EP1466261B1 (en) * 2002-01-08 2018-03-07 Seven Networks, LLC Connection architecture for a mobile network
US7949648B2 (en) * 2002-02-26 2011-05-24 Soren Alain Mortensen Compiling and accessing subject-specific information from a computer network
JP4118580B2 (ja) * 2002-03-20 2008-07-16 富士通株式会社 配置情報推薦装置、その方法、プログラム
US20030225763A1 (en) * 2002-04-15 2003-12-04 Microsoft Corporation Self-improving system and method for classifying pages on the world wide web
US20040019496A1 (en) * 2002-05-30 2004-01-29 Chevron U.S.A. Inc. System and method for law practice information management
US7152059B2 (en) * 2002-08-30 2006-12-19 Emergency24, Inc. System and method for predicting additional search results of a computerized database search user based on an initial search query
US7076497B2 (en) * 2002-10-11 2006-07-11 Emergency24, Inc. Method for providing and exchanging search terms between internet site promoters
US20030088553A1 (en) * 2002-11-23 2003-05-08 Emergency 24, Inc. Method for providing relevant search results based on an initial online search query
US7533012B2 (en) * 2002-12-13 2009-05-12 Sun Microsystems, Inc. Multi-user web simulator
US7143025B2 (en) * 2002-12-13 2006-11-28 Sun Microsystems, Inc. Web simulator
US7917468B2 (en) * 2005-08-01 2011-03-29 Seven Networks, Inc. Linking of personal information management data
US8468126B2 (en) 2005-08-01 2013-06-18 Seven Networks, Inc. Publishing data in an information community
US7853563B2 (en) * 2005-08-01 2010-12-14 Seven Networks, Inc. Universal data aggregation
US7185088B1 (en) * 2003-03-31 2007-02-27 Microsoft Corporation Systems and methods for removing duplicate search engine results
AU2004235104A1 (en) * 2003-04-25 2004-11-11 Thomson Reuters Global Resources Distributed search methods, architectures, systems, and software
AU2013206478B2 (en) * 2003-04-25 2016-06-09 Thomson Reuters Enterprise Centre Gmbh Distributed search methods, architectures, systems, and software
US8321400B2 (en) * 2003-08-29 2012-11-27 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7440964B2 (en) * 2003-08-29 2008-10-21 Vortaloptics, Inc. Method, device and software for querying and presenting search results
US7444403B1 (en) 2003-11-25 2008-10-28 Microsoft Corporation Detecting sexually predatory content in an electronic communication
US20050177599A1 (en) * 2004-02-09 2005-08-11 Microsoft Corporation System and method for complying with anti-spam rules, laws, and regulations
US8161053B1 (en) * 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US7428530B2 (en) * 2004-07-01 2008-09-23 Microsoft Corporation Dispersing search engine results by using page category information
US7363296B1 (en) 2004-07-01 2008-04-22 Microsoft Corporation Generating a subindex with relevant attributes to improve querying
US7702618B1 (en) 2004-07-26 2010-04-20 Google Inc. Information retrieval system for archiving multiple document versions
US7580929B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase-based personalization of searches in an information retrieval system
US7536408B2 (en) 2004-07-26 2009-05-19 Google Inc. Phrase-based indexing in an information retrieval system
US7567959B2 (en) * 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7584175B2 (en) 2004-07-26 2009-09-01 Google Inc. Phrase-based generation of document descriptions
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7599914B2 (en) 2004-07-26 2009-10-06 Google Inc. Phrase-based searching in an information retrieval system
US7711679B2 (en) 2004-07-26 2010-05-04 Google Inc. Phrase-based detection of duplicate documents in an information retrieval system
US20060053156A1 (en) * 2004-09-03 2006-03-09 Howard Kaushansky Systems and methods for developing intelligence from information existing on a network
GB2418999A (en) * 2004-09-09 2006-04-12 Surfcontrol Plc Categorizing uniform resource locators
GB2418037B (en) * 2004-09-09 2007-02-28 Surfcontrol Plc System, method and apparatus for use in monitoring or controlling internet access
US7606793B2 (en) * 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US8051096B1 (en) 2004-09-30 2011-11-01 Google Inc. Methods and systems for augmenting a token lexicon
US7680648B2 (en) 2004-09-30 2010-03-16 Google Inc. Methods and systems for improving text segmentation
US7996208B2 (en) * 2004-09-30 2011-08-09 Google Inc. Methods and systems for selecting a language for text segmentation
US20060085401A1 (en) * 2004-10-20 2006-04-20 Microsoft Corporation Analyzing operational and other data from search system or the like
US8010082B2 (en) * 2004-10-20 2011-08-30 Seven Networks, Inc. Flexible billing architecture
US7441271B2 (en) 2004-10-20 2008-10-21 Seven Networks Method and apparatus for intercepting events in a communication system
US7643818B2 (en) * 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
US7706781B2 (en) * 2004-11-22 2010-04-27 Seven Networks International Oy Data security in a mobile e-mail service
FI117152B (fi) 2004-12-03 2006-06-30 Seven Networks Internat Oy Sähköpostiasetusten käyttöönotto matkaviestimelle
JP2006202081A (ja) * 2005-01-21 2006-08-03 Seiko Epson Corp メタデータ生成装置
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7877703B1 (en) 2005-03-14 2011-01-25 Seven Networks, Inc. Intelligent rendering of information in a limited display environment
US7796742B1 (en) 2005-04-21 2010-09-14 Seven Networks, Inc. Systems and methods for simplified provisioning
US8438633B1 (en) 2005-04-21 2013-05-07 Seven Networks, Inc. Flexible real-time inbox access
WO2006136660A1 (en) 2005-06-21 2006-12-28 Seven Networks International Oy Maintaining an ip connection in a mobile network
US8176041B1 (en) * 2005-06-29 2012-05-08 Kosmix Corporation Delivering search results
JP4238849B2 (ja) * 2005-06-30 2009-03-18 カシオ計算機株式会社 Webページ閲覧装置、Webページ閲覧方法、及びWebページ閲覧処理プログラム
US8069166B2 (en) 2005-08-01 2011-11-29 Seven Networks, Inc. Managing user-to-user contact with inferred presence information
US20080215614A1 (en) * 2005-09-08 2008-09-04 Slattery Michael J Pyramid Information Quantification or PIQ or Pyramid Database or Pyramided Database or Pyramided or Selective Pressure Database Management System
US20070112778A1 (en) * 2005-11-15 2007-05-17 Marek Graczynski Scientific information systems and methods for global networking opportunities
GB0524017D0 (en) * 2005-11-24 2006-01-04 Ibm Generation of a categorisation scheme
IL172551A0 (en) * 2005-12-13 2006-04-10 Grois Dan Method for assigning one or more categorized scores to each document over a data network
US7769395B2 (en) 2006-06-20 2010-08-03 Seven Networks, Inc. Location-based operations and messaging
US9166883B2 (en) 2006-04-05 2015-10-20 Joseph Robert Marchese Network device detection, identification, and management
US20070290787A1 (en) * 2006-06-20 2007-12-20 Trevor Fiatal Systems and methods for group messaging
US20080005070A1 (en) * 2006-06-28 2008-01-03 Bellsouth Intellectual Property Corporation Non-Repetitive Web Searching
US8615800B2 (en) 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US8020206B2 (en) * 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US8234157B2 (en) * 2006-07-24 2012-07-31 Emergency 24, Inc. Method for internet based advertising and referral using a fixed fee methodology
US9654495B2 (en) 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
GB2445764A (en) * 2007-01-22 2008-07-23 Surfcontrol Plc Resource access filtering system and database structure for use therewith
US8027975B2 (en) * 2007-01-31 2011-09-27 Reputation.Com, Inc. Identifying and changing personal information
US8015174B2 (en) * 2007-02-28 2011-09-06 Websense, Inc. System and method of controlling access to the internet
US20080215607A1 (en) * 2007-03-02 2008-09-04 Umbria, Inc. Tribe or group-based analysis of social media including generating intelligence from a tribe's weblogs or blogs
US8166021B1 (en) 2007-03-30 2012-04-24 Google Inc. Query phrasification
US7702614B1 (en) 2007-03-30 2010-04-20 Google Inc. Index updating using segment swapping
US7925655B1 (en) 2007-03-30 2011-04-12 Google Inc. Query scheduling using hierarchical tiers of index servers
US8086594B1 (en) 2007-03-30 2011-12-27 Google Inc. Bifurcated document relevance scoring
US7693813B1 (en) 2007-03-30 2010-04-06 Google Inc. Index server architecture using tiered and sharded phrase posting lists
US8166045B1 (en) 2007-03-30 2012-04-24 Google Inc. Phrase extraction using subphrase scoring
IL182518A0 (en) * 2007-04-12 2007-09-20 Grois Dan Pay per relevance (ppr) advertising method and system
US8122016B1 (en) * 2007-04-24 2012-02-21 Wal-Mart Stores, Inc. Determining concepts associated with a query
US8693494B2 (en) * 2007-06-01 2014-04-08 Seven Networks, Inc. Polling
US8805425B2 (en) * 2007-06-01 2014-08-12 Seven Networks, Inc. Integrated messaging
US20080313137A1 (en) * 2007-06-12 2008-12-18 Brian Galvin Behavioral WEB Graph
US8117223B2 (en) 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
US20090089381A1 (en) * 2007-09-28 2009-04-02 Microsoft Corporation Pending and exclusive electronic mail inbox
US20090106221A1 (en) * 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
US9348912B2 (en) * 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
JP5182614B2 (ja) * 2007-12-07 2013-04-17 アイシン・エィ・ダブリュ株式会社 検索装置、ナビゲーション装置、及び検索プログラム
US8364181B2 (en) 2007-12-10 2013-01-29 Seven Networks, Inc. Electronic-mail filtering for mobile devices
US8793305B2 (en) * 2007-12-13 2014-07-29 Seven Networks, Inc. Content delivery to a mobile device from a content service
US9002828B2 (en) 2007-12-13 2015-04-07 Seven Networks, Inc. Predictive content delivery
US8107921B2 (en) 2008-01-11 2012-01-31 Seven Networks, Inc. Mobile virtual network operator
US8862657B2 (en) 2008-01-25 2014-10-14 Seven Networks, Inc. Policy based content service
US20090193338A1 (en) * 2008-01-28 2009-07-30 Trevor Fiatal Reducing network and battery consumption during content delivery and playback
JP2009210547A (ja) * 2008-03-06 2009-09-17 Aisin Aw Co Ltd 目的地選択支援装置、及び目的地選択支援プログラム
JP2009210539A (ja) * 2008-03-06 2009-09-17 Aisin Aw Co Ltd 目的地検索支援装置、及び目的地検索支援プログラム
JP4636391B2 (ja) * 2008-03-12 2011-02-23 アイシン・エィ・ダブリュ株式会社 目的地設定支援装置、及び目的地設定支援プログラム
US20090248670A1 (en) * 2008-03-31 2009-10-01 Trevor Fiatal Content search engine
US8812493B2 (en) * 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8787947B2 (en) * 2008-06-18 2014-07-22 Seven Networks, Inc. Application discovery on mobile devices
US8078158B2 (en) 2008-06-26 2011-12-13 Seven Networks, Inc. Provisioning applications for a mobile device
WO2010002816A1 (en) * 2008-06-30 2010-01-07 Websense, Inc. System and method for dynamic and real-time categorization of webpages
CN101566984B (zh) * 2008-07-11 2011-02-09 博采林电子科技(深圳)有限公司 一种应用在个人手持设备中的搜索引擎和资源搜索方法
US8909759B2 (en) * 2008-10-10 2014-12-09 Seven Networks, Inc. Bandwidth measurement
US8700646B2 (en) * 2009-08-12 2014-04-15 Apple Inc. Reference file for formatted views
US20110047265A1 (en) * 2009-08-23 2011-02-24 Parental Options Computer Implemented Method for Identifying Risk Levels for Minors
US9043731B2 (en) 2010-03-30 2015-05-26 Seven Networks, Inc. 3D mobile user interface with configurable workspace management
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8838783B2 (en) 2010-07-26 2014-09-16 Seven Networks, Inc. Distributed caching for resource and mobile network traffic management
CA2806527A1 (en) 2010-07-26 2012-02-09 Seven Networks, Inc. Mobile network traffic coordination across multiple applications
US8886176B2 (en) 2010-07-26 2014-11-11 Seven Networks, Inc. Mobile application traffic optimization
GB2495877B (en) 2010-07-26 2013-10-02 Seven Networks Inc Distributed implementation of dynamic wireless traffic policy
WO2012060995A2 (en) 2010-11-01 2012-05-10 Michael Luna Distributed caching in a wireless network of content delivered for a mobile application over a long-held request
US8843153B2 (en) 2010-11-01 2014-09-23 Seven Networks, Inc. Mobile traffic categorization and policy for network use optimization while preserving user experience
US9060032B2 (en) 2010-11-01 2015-06-16 Seven Networks, Inc. Selective data compression by a distributed traffic management system to reduce mobile data traffic and signaling traffic
CN103620576B (zh) 2010-11-01 2016-11-09 七网络公司 适用于移动应用程序行为和网络条件的缓存
WO2012061437A1 (en) 2010-11-01 2012-05-10 Michael Luna Cache defeat detection and caching of content addressed by identifiers intended to defeat cache
US8484314B2 (en) 2010-11-01 2013-07-09 Seven Networks, Inc. Distributed caching in a wireless network of content delivered for a mobile application over a long-held request
US8326985B2 (en) 2010-11-01 2012-12-04 Seven Networks, Inc. Distributed management of keep-alive message signaling for mobile network resource conservation and optimization
US9330196B2 (en) 2010-11-01 2016-05-03 Seven Networks, Llc Wireless traffic management system cache optimization using http headers
US8903954B2 (en) 2010-11-22 2014-12-02 Seven Networks, Inc. Optimization of resource polling intervals to satisfy mobile device requests
WO2012060997A2 (en) 2010-11-01 2012-05-10 Michael Luna Application and network-based long poll request detection and cacheability assessment therefor
CA2798523C (en) 2010-11-22 2015-02-24 Seven Networks, Inc. Aligning data transfer to optimize connections established for transmission over a wireless network
EP2661697B1 (en) 2011-01-07 2018-11-21 Seven Networks, LLC System and method for reduction of mobile network traffic used for domain name system (dns) queries
GB2517815A (en) 2011-04-19 2015-03-04 Seven Networks Inc Shared resource and virtual resource management in a networked environment
GB2504037B (en) 2011-04-27 2014-12-24 Seven Networks Inc Mobile device which offloads requests made by a mobile application to a remote entity for conservation of mobile device and network resources
WO2012149434A2 (en) 2011-04-27 2012-11-01 Seven Networks, Inc. Detecting and preserving state for satisfying application requests in a distributed proxy and cache system
US9436726B2 (en) 2011-06-23 2016-09-06 BCM International Regulatory Analytics LLC System, method and computer program product for a behavioral database providing quantitative analysis of cross border policy process and related search capabilities
EP2737742A4 (en) 2011-07-27 2015-01-28 Seven Networks Inc AUTOMATIC PRODUCTION AND DISTRIBUTION OF GUIDELINES INFORMATION ON MOBILE MOBILE TRANSPORT IN A WIRELESS NETWORK
US8934414B2 (en) 2011-12-06 2015-01-13 Seven Networks, Inc. Cellular or WiFi mobile traffic optimization based on public or private network destination
EP2789137A4 (en) 2011-12-06 2015-12-02 Seven Networks Inc SYSTEM OF REDUNDANTLY CLUSTERED MACHINES FOR PROVIDING TILTING MECHANISMS IN MOBILE TRAFFIC MANAGEMENT AND NETWORK RESOURCE PRESERVATION
WO2013086455A1 (en) 2011-12-07 2013-06-13 Seven Networks, Inc. Flexible and dynamic integration schemas of a traffic management system with various network operators for network traffic alleviation
US9277443B2 (en) 2011-12-07 2016-03-01 Seven Networks, Llc Radio-awareness of mobile device for sending server-side control signals using a wireless network optimized transport protocol
WO2013090834A1 (en) 2011-12-14 2013-06-20 Seven Networks, Inc. Operation modes for mobile traffic optimization and concurrent management of optimized and non-optimized traffic
US8861354B2 (en) 2011-12-14 2014-10-14 Seven Networks, Inc. Hierarchies and categories for management and deployment of policies for distributed wireless traffic optimization
EP2792188B1 (en) 2011-12-14 2019-03-20 Seven Networks, LLC Mobile network reporting and usage analytics system and method using aggregation of data in a distributed traffic optimization system
US8886651B1 (en) 2011-12-22 2014-11-11 Reputation.Com, Inc. Thematic clustering
WO2013103988A1 (en) 2012-01-05 2013-07-11 Seven Networks, Inc. Detection and management of user interactions with foreground applications on a mobile device in distributed caching
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
WO2013116856A1 (en) 2012-02-02 2013-08-08 Seven Networks, Inc. Dynamic categorization of applications for network access in a mobile network
WO2013116852A1 (en) 2012-02-03 2013-08-08 Seven Networks, Inc. User as an end point for profiling and optimizing the delivery of content and data in a wireless network
US10636041B1 (en) 2012-03-05 2020-04-28 Reputation.Com, Inc. Enterprise reputation evaluation
US8595022B1 (en) 2012-03-05 2013-11-26 Reputation.Com, Inc. Follow-up determination
US8812695B2 (en) 2012-04-09 2014-08-19 Seven Networks, Inc. Method and system for management of a virtual network connection without heartbeat messages
US10263899B2 (en) 2012-04-10 2019-04-16 Seven Networks, Llc Enhanced customer service for mobile carriers using real-time and historical mobile application and traffic or optimization data associated with mobile devices in a mobile network
US8918312B1 (en) 2012-06-29 2014-12-23 Reputation.Com, Inc. Assigning sentiment to themes
WO2014011216A1 (en) 2012-07-13 2014-01-16 Seven Networks, Inc. Dynamic bandwidth adjustment for browsing or streaming activity in a wireless network based on prediction of user behavior when interacting with mobile applications
US9161258B2 (en) 2012-10-24 2015-10-13 Seven Networks, Llc Optimized and selective management of policy deployment to mobile clients in a congested network to prevent further aggravation of network congestion
US9307493B2 (en) 2012-12-20 2016-04-05 Seven Networks, Llc Systems and methods for application management of mobile device radio state promotion and demotion
US8744866B1 (en) 2012-12-21 2014-06-03 Reputation.Com, Inc. Reputation report with recommendation
US8805699B1 (en) 2012-12-21 2014-08-12 Reputation.Com, Inc. Reputation report with score
US9271238B2 (en) 2013-01-23 2016-02-23 Seven Networks, Llc Application or context aware fast dormancy
US8874761B2 (en) 2013-01-25 2014-10-28 Seven Networks, Inc. Signaling optimization in a wireless network for traffic utilizing proprietary and non-proprietary protocols
US9326185B2 (en) 2013-03-11 2016-04-26 Seven Networks, Llc Mobile network congestion recognition for optimization of mobile traffic
US8925099B1 (en) 2013-03-14 2014-12-30 Reputation.Com, Inc. Privacy scoring
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
US9065765B2 (en) 2013-07-22 2015-06-23 Seven Networks, Inc. Proxy server associated with a mobile carrier for enhancing mobile traffic management in a mobile network

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5404514A (en) * 1989-12-26 1995-04-04 Kageneck; Karl-Erbo G. Method of indexing and retrieval of electronically-stored documents
US5943663A (en) * 1994-11-28 1999-08-24 Mouradian; Gary C. Data processing method and system utilizing parallel processing
US5901287A (en) * 1996-04-01 1999-05-04 The Sabre Group Inc. Information aggregation and synthesization system
US5970502A (en) * 1996-04-23 1999-10-19 Nortel Networks Corporation Method and apparatus for synchronizing multiple copies of a database
US5920854A (en) * 1996-08-14 1999-07-06 Infoseek Corporation Real-time document collection search engine with phrase indexing
US5870740A (en) * 1996-09-30 1999-02-09 Apple Computer, Inc. System and method for improving the ranking of information retrieval results for short queries
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012168984A (ja) * 2000-03-29 2012-09-06 Risk Monster Kk 与信機能を備えた匿名電子商取引システム及び方法

Also Published As

Publication number Publication date
WO1998004979A1 (en) 1998-02-05
US6178419B1 (en) 2001-01-23
EP0917683A1 (en) 1999-05-26
EP0822502A1 (en) 1998-02-04

Similar Documents

Publication Publication Date Title
JP2000516005A (ja) データアクセスシステム
US7877407B2 (en) Method and apparatus for facilitating use of hypertext links on the world wide web
US9355178B2 (en) Methods of and systems for searching by incorporating user-entered information
US8359550B2 (en) Method for dynamically generating a “table of contents” view of the HTML-based information system
US6571240B1 (en) Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
JP4365074B2 (ja) ユーザ定義可能なパーソナリティを備えた文書拡充システム
US6859800B1 (en) System for fulfilling an information need
US8918401B1 (en) Systems and methods for providing searchable prior history
US7636714B1 (en) Determining query term synonyms within query context
US7774198B2 (en) Navigation system for text
US20140052709A1 (en) Document information management system
KR101393839B1 (ko) 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색시스템
US20120131049A1 (en) Search Tools and Techniques
US20020123994A1 (en) System for fulfilling an information need using extended matching techniques
AU2019201531A1 (en) An in-app conversational question answering assistant for product help
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
JPH08305729A (ja) ネットワーク情報フィルタリングシステム
CN1127031C (zh) 以电子方式创建个性化文档的系统和方法
Mills et al. Providing world wide access to historical sources
Croft et al. Search engines
McKee Towards better integration of dynamic search technology and the World-Wide Web
Matthews et al. Internationalising data access through LIMBER
WO2001024053A2 (en) System and method for automatic context creation for electronic documents
Rowe Exploiting captions for Web data mining
Ceric Advancements and trends in the World Wide Web search