JP2000516005A - データアクセスシステム - Google Patents
データアクセスシステムInfo
- Publication number
- JP2000516005A JP2000516005A JP10508586A JP50858698A JP2000516005A JP 2000516005 A JP2000516005 A JP 2000516005A JP 10508586 A JP10508586 A JP 10508586A JP 50858698 A JP50858698 A JP 50858698A JP 2000516005 A JP2000516005 A JP 2000516005A
- Authority
- JP
- Japan
- Prior art keywords
- database
- document
- search
- memory area
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
- G06F16/972—Access to data in other repository systems, e.g. legacy data or dynamic Web page generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/01—Automatic library building
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99936—Pattern matching access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99951—File or database maintenance
- Y10S707/99952—Coherency, e.g. same view to multiple users
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
1組のカテゴリヘッディングであり、各カテゴリヘッディングに1組のキーワードが準備されているカテゴリヘッディングに基いて自動的にデータベース(112)を生成する方法を記載する。処理プラットフォーム(100)がキーワードを使用して、インターネット(120)を介して処理プラットフォーム(100)と接続している複数のサーチエンジン(130a,130b,130c)で行うサーチを定める。サーチ結果は処理プラットフォーム(100)によって処理され、サーチ結果に組込まれたURLを識別する。次にURLを使用して、URLがインターネット(120)内の遠隔のデータソースから参照したページを検索する。次に処理プラットフォーム(100)はフィルタ処理を行って、ページに得点を付け、何れのページがもとのカテゴリに最も相関しているかを判断する。最も相関度の強いインターネット場所情報はデータベース(112)に記憶される。
Description
【発明の詳細な説明】
データアクセスシステム
本発明は、改良を加えたデータアクセス効率に関する。とくに本発明は、目的
に合わせた特別仕様のデータベース作成の分野に応用される。
データを著しく分散させて記憶する環境の例にはワールドワイドウエブ(WW
W)がある。WWWは、膨大な情報を体系化せずに集めたものであり、インター
ネットの多くの異なるサーバに記憶されている。最新の推定では、情報ページ数
は3,000万を越え、サーバ数は225万を越えている。
何等かの補助なしにこの程度のデータ量をナビゲートする(操る)ことは非常
に困難である。WWW用のインデックスとかディレクトリといったナビゲーショ
ンの補助を作り、WWW用の2つの主要なナビゲーション方法を示している。
インデックスの場合、いわゆるサーチエンジン、例えばAltaVista(http://al
tavista.digital.com)は可能な限り多くのWWWページを検索し、各ページ内
の単語にインデックスを付ける。通常、サーチエンジンはロボットまたはスパイ
ダとして知られる処理を実行し、WWWから選択した領域内にある検索したペー
ジに含まれる全てのハイパーリンクに完全にしたがう。大きなインターネットの
サーチエンジンは何百万ものページについての記憶したインデックスをもつこと
ができる。したがってユーザがキーワードを入力すると、キーワードはインデッ
クスエントリと比較され、要求したキーワードを含むページのリストを受け取る
。これは情報を見付ける簡単な方法であるが、キーワードのインデックスがどの
程度包括的であり、しかも正確であるかによって効率が限定される。
ディレクトリ、例えばYahoo(http://www.yahoo.com/)は、特定のトピックに
関係するカテゴリの階層構造を含む。この階層構造はディレクトリの作成者によ
って定められるが、最低レベルのカテゴリでは通常はディレクトリの監督者によ
って、また時にはユーザによって加えられるエントリをもつ。ディレクトリでは
選択が既知のトピック領域カテゴリに制限されるので、サーチエンジンを使用す
ることによって、ディレクトリで情報を見つけるほうが容易になる。しかしなが
ら、ディレクトリ式のWWWナビゲーションの有効性は正確な類別方法に限定さ
れる。このため2つの欠点が生じる:第1に、特定のヘッディングを類別するこ
とによって、ディレクトリを集中的にマニュアルで再作動させるように変えるこ
とが必要になるときがある。第2に、この方法はあるユーザにとっては適してい
ないことがあるし、また直観的(intuitive)でないときがある。
本発明の1つの態様にしたがって、あて先のデータベースを分布させる装置で
あり:
あて先のデータベースと;
装置を分散形ソースデータベースに接続する手段と;
所定の問題のカテゴリに関係するキーワード群を含むメモリ領域と;
前記メモリ領域に含まれるキーワード群に基いて、前記分散形ソースデータ
ベースと関係付けられた少なくとも1つのサーチエンジンを制御して、前記キー
ワードを含むドキュメントの場所に関する情報を含むサーチ結果を作り、該ドキ
ュメントが該分散形ソースデータベースに記憶されているような制御用手段と;
所定の基準にしたがってそのそれぞれ内容に基いて前記少なくとも1つのサ
ーチエンジンによって作られるサーチ結果内で識別された各ドキュメントに得点
をつける手段と;
各得点に基いて、前記得点をつける手段によって得点されたドキュメントの
少なくとも幾つかを選択する手段と;
前記選択手段によって選択された各ドキュメントごとに、前記分散形ソース
データベース内のドキュメントの場所に関係する情報を前記あて先データベース
に記憶する手段とを含むあて先データベースを分布させる装置を提供する。
本発明は、著しくより大きな分散形データベースからあて先のデータベースを
分布させる実際的な方法を与えることによって既知のサーチ方法に関係した問題
を克服する。
したがって、別に記載されない限り、“ページ”および“ドキュメント”とい
う用語の両方は、単一のロケーション、例えばWWWに記憶されたデータのコン
パイルを表しており、したがって相互に交換できる。
本発明の実施形態を効果的に応用できる1つの例として、学校という環境があ
り、そこでは先生が、生徒にとって使用できる情報の量および形式を制限したい
とする。いったん決めてしまうと、データベース内のデータは生徒は不適切なま
たは無関係の情報を得る心配なしに自由に“ブラウズ(閲覧)”することができ
る。別の例には、会社内の環境において、一定の課題に関して学術的な情報では
なく、市販の情報のみが必要な場合がある。
1組のキーワード群を含み、各キーワード群がそれぞれの所定の課題のカテゴ
リに関係するようにメモリ領域を構成することができる。カテゴリは階層的に構
成し、例えば上述のディレクトリと同様に、最も包括的なカテゴリはディレクト
リの最上レベルに置かれ、カテゴリが次第に特定されるにしたがって低いレベル
に枝分かれするようにできる。
好ましい実施形態では、データが最終的にあて先のデータベースに記憶される
前に、検索したドキュメントファイル参照数を低減する別の段階を含む。これに
より、不適切なまたは無関係のドキュメントの参照を省くことができる。例えば
、要求されるデータベースが“furniture(家具)”のカテゴリおよび“table(
机)”のキーワードをもつとき、数学の“table(表)”に関係するドキュメン
トへの参照を省くことが賢明であり望ましい。
本発明の第2の態様にしたがって、あて先データベースを分布する装置であり
:
あて先データベースと;
所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と;
前記あて先データベースおよび前記メモリ領域にアクセスでき、分散形ソー
スデータベースに接続でき、かつ、
前記メモリ領域に含まれるキーワード群に基いて、前記分散形データベー
スと関係する少なくとも1つのサーチエンジンを制御して、前記キーワードを含
み、前記分散形ソースデータベース内に記憶されるドキュメントの場所に関係す
る情報を含むサーチ結果を作り;
所定の基準にしたがってそのそれぞれの内容に基いて前記サーチ結果内で
識別される各ドキュメントを得点し;
それぞれの得点に基いてドキュメントの少なくとも幾つかを選択し;また
各選択したドキュメントごとに、前記分散形ソースデータベース内の場所
に関する情報を前記あて先データベースに記憶するようにされている処理プラッ
トフォームとを含むあて先データベースを分布する装置が提供されている。
本発明の第3の態様にしたがって、あて先のデータベースを分布させる装置で
あり、
a)この装置を分散形ソースデータベースに接続する手段と;
b)所定の課題のカテゴリに関係するキーワード群を記憶する第1のメモリ
領域と;
c)第1のメモリ領域からキーワードを読取り、分散形ソースデータベース
へアクセスするサーチ手段へ前記キーワードを送る手段と;
d)前記サーチ手段からサーチの結果を受取り、第2のメモリ領域に前記結
果を記憶する手段であり、前記結果が前記キーワードを含む前記ソースデータベ
ース内に記憶されるドキュメントの場所に関係する情報を含むような記憶する手
段と、
e)第3のメモリ領域で前記ロケーション情報を識別し、かつ記憶する手段
と;
f)前記第3のメモリ領域からロケーション情報を読取り、要求をソースデ
ータベースに送り、選択したロケーション情報に関係するドキュメントのコピー
を装置へ戻すようにする手段と;
g)前記ドキュメントの前記コピーを受取り、第4のメモリ領域内に記憶す
る手段と;
h)その各内容に基いて所定の基準にしたがって第4のメモリ領域に記憶し
た各ドキュメントにアクセスし、かつ得点する手段と;
i)各得点に基いて前記ドキュメントの少なくとも幾つかを選択し、各選択
したドキュメントに対して、ソースデータベース内のドキュメントの場所に関係
する情報をデータベースに記憶する手段とを含むあて先データベースを分布させ
る装置を提供する。
本発明の第4の態様にしたがって、あて先データベースを分布させる方法であ
り:
所定の課題のカテゴリに関係するキーワード群に基いて、分散形ソースデー
タベースに関係する少なくとも1つのサーチエンジンを制御して、前記キーワー
ドを含み前記分散形ソースデータベース内に記憶されているドキュメントの場所
に関係する情報を含むサーチ結果を作る段階と;
所定の基準にしたがって各内容に基いて前記サーチ結果で識別される各ドキ
ュメントを得点する段階と;
各得点に基いてドキュメントの少なくとも幾つかを選択する段階と;
各選択したドキュメントごとに、前記分散形ソースデータベース内のドキュ
メントの場所に関係する情報を前記あて先データベースに記憶する段階とを含む
方法を提供する。
ここで本発明の実施形態を添付の図面を引用して例示的に記載する。
図1は、データベースを生成し、本発明を具現するシステムを示す模式図であ
る。
図2は、図1のシステムで使用した主要なデータメモリ領域の模式図である。
図3は、データベースを構築する方法を示すフローチャートである。
図4は、データがデータベース内にどのように配置されているかを示す模式図
である。
図5は、データベースを構築するときにどのようにドキュメントを分散形デー
タソースから検索するかを示すフローチャートである。
図6は、図1のシステムでどのようにサーチ結果が処理されるかを示すフロー
チャートである。
図7は、図1のシステムでどのようにドキュメントが得点されるかを示すフロ
ーチャートである。
図1では、本発明の実施形態にしたがってあて先データベースを構築して分布
させるのに適したシステムを示す。
このシステムでは、処理プラットフォーム(PP)100は、第2のメモリデバ
イス110(例えば、ハードディスクドライブ)を接続し、第2のメモリデバイス1
10内に保持されるあて先データベース112へのアクセスを制御する。あて先デー
タベース112はPP100とは別々にかつ遠隔に配置することができる。データベー
スを分布するとき、データベース112はコンパイルされたデータベース115に記憶
されたデータを含む。PP100はインターネット120を介して、複数のサーチエン
ジン130a、130b、および130c(見やすくするために、この3つのみが示
されている)にも接続されている。これらの情報サーバが分散形ソースデータベ
ースを構成している。
この実施形態においてPP100は、UNIX(TM)応用計算プラットフォームで
あり、適切なソフトエアを走行することができる。例えば、PP100はオフィス
や学校のローカルエリアネットワークにおいてパーソナルコンピュータ(PC)
140a、140b、および140cを介してユーザにアクセスできる。各PC140a、140b、
および140cは、PC上を走行し、PP100と通信する適切な制御ソフトウエアの
制御のもとで、データベース112内の必要なデータにアクセスすることができる
。PC上のソフトウエアはローカルメモリ(図示されていない)に恒久的に記憶
できるか、または要求あるいは実行されるときにPP100から検索することがで
きる。ソフトウエアは起動時に、周知のディレクトリサーチソフトウエア、例え
ばYahooに一緒に関係付けられたユーザにグラフィカルユーザインターフェイス
(GUI)を示す。したがってアクセスソフトウエアの詳細は、さらに詳しく記
載する必要はない。
図2はメインメモリ領域を示し、ここでは本発明の実施形態の実行中にアクセ
スされるかまたは生成されるか、あるいはその両方が行われる。この場合、使用
されるメモリは第2のメモリ、例えばハードディスクであるが、メインメモリ、
例えばRAMは通常データを記憶するか、または第2のメモリに再び記憶する前
にデータを操作するのに使用される。この実施形態では、メモリ領域は第2のメ
モリデバイス110とデータベース112とで共用される。メモリ領域には:カテゴリ
リスト200、キーワードリスト205、URL(Uniform Resource Locator)メモリ21
0、ドキュメントメモリ215、報告メモリ220、サーチエンジンリスト225、サーチ
エンジン構文(シンタックス)230、サーチ結果ファイル235、およびURLの初
期リスト240がある。残りの領域は起動中に使用される。
図3は、次の説明と共に、データベース112を構築し分布させる本発明の1つ
の方法を記載する。
段階300では、メモリ領域200内にヘッディングおよびカテゴリでデータベース
112内に含まれるもので成るカテゴリリストを準備する。ヘッディングおよびカ
テゴリは、完全なデータベース内でユーザが選択できるものに対して1:1の
マッピングを行う。次に段階302では、カテゴリリストに含まれる各カテゴリに
対するキーワードのリストを生成する。ヘッディング、カテゴリ、およびキーワ
ードはさらに、どの程度正確にデータベース内で情報が互いに関係することを予
定されているかを示す関係付け情報を含む。カテゴリリストの構造は以下でより
詳しく説明することにする。キーワードは、データベースを構築するために準備
されているが、それだけでは最終的なデータベース構造の一部は形成しない。
キーワードが各カテゴリに与えられると、段階304でキーワードは単一のキー
ワードリストに結合され、メモリ領域205に記憶される。
次に段階306でキーワードは、キーワードサーチのために1または複数のサー
チエンジン130a、130b、および130cへ送られる。通常の方法では、各サーチエン
ジンは、各キーワードに対してサーチ結果を生成する。各キーワード/サーチエ
ンジンの組合わせごとに、サーチ結果はメモリ領域235内の個々のテキストファ
イルに記憶される。
段階306では、メモリ領域235に記憶した各個々のテキストファイルに保持され
ているサーチ結果からURL(Uniform Resource Locators)を抽出する。その結
果、各サーチエンジンに対するサーチ結果の完全な組に対してURLの個々のリ
ストが得られる。URLは、各サーチエンジンで見つけたキーワードの候補のペ
ージを示す。URLのリストはメモリ領域240に記憶される。
段階308では、サーチによって生じたエラーは将来解析するためにメモリ領域2
20内のエラーログに記録される。
段階306の処理では、キーワードをサーチエンジンへ送ることによってサーチ
を開始し、その結果を検索および記憶し、その結果を処理して、URLリストを
得る。これは図5および6を引用して以下でより詳しく記載する。
次に段階312でサーチエンジンによって生成されるURLリストを結合し、キ
ーワードによって構成されるURLの単一のリストを形成する。この単一のリス
トはメモリ領域215に記憶される。この段階は、複製されたURLを削除するこ
とを含む。複製されたURLがあるときは、2以上のサーチエンジンが同じキー
ワードで同じURLを起こす。2以上のサーチエンジンを使用するとき、この段
階を実行することが必要となるのは明白である。この結果、効果的に各キーワー
ドに対するURLのリストが生成される。
次に段階316では、URLのリスト(上述のようにキーワードによって構成さ
れている)は、段階302で生成したカテゴリおよびキーワードの元の記述に戻っ
てそれを相互参照して、各カテゴリに対する候補のURLを識別する。次に段階
320で各カテゴリの各キーワードのURLをフィルタ処理して、処理されていな
いページを消去する。この点で普通消去されるページには、http以外の参照
および将来有望でないサイト、例えば外国語サイトを含む。この段階は、サイト
についてブラック(実際をいうとホワイト)に対して各URLを検査し、ブラッ
クリストに入れられたサイトには適切なまたは関連の情報を明らかに供給せず、
ホワイトリストサイトでは適切で良好な品質の情報を供給することが知られてい
る。この点で適切なフィルタ処理方法を使用して、所望の形式の辞書(ディクシ
ョナリ)を生成できることが分かるであろう。
段階322ではフィルタ処理したURLの詳細をテキストファイルに報告して、
周期的な検査を実行して、有効な情報が拒絶されないことを保証できる。段階32
6では、統計をとることができ、将来のフィルタ処理(段階320)の改良を助ける
ことができる。
段階330では、フィルタ処理段階320の後に残ってしまった各カテゴリの各UR
Lを使用して、各WWWページを検索する。検索したページまたはドキュメント
はメモリ領域215に記憶される。段階338は各検索したページが、提案されている
カテゴリに対して得点される。得点プロセスは実質的に、検索したページの関連
、およびそれにしたがってこのページをデータベースに含むべきか否かを判断す
る。得点プロセスは、図7を引用してより詳しく記載する。
ページが得点されると、第2のフィルタ処理段階342では、カットオフポイン
トを適用して、どのページがカットオフポイントよりも高いスコアをもち、デー
タベース112へ送られるかを示す。カットオフポイントは、例えば、ページの“
関連”度(例えば、ページ内にキーワードが存在する数によって判断される)の
固定値を示し、各カテゴリ内の最大ページ数を制限することができる。その代り
に、カットオフポイントは、特定のカテゴリで達成されるサーチ結果の類型に依
存して幾つかの特定の方法で判断することができる。
第2のフィルタ段階342の出力は、段階346で通常のデータベースローディング
ルーチンを使用してデータベース112へ供給できるフォーマットに構成される。
データベース112用のデータベースの適切な1つの形式はリレーショナルデータ
ベース、例えばOracle(TM)である。
データベース112用の適切な論理データ構成を図4に示す。データベース112の
使用可能なヘッディングは、第1の表400に記憶されている。各ヘッディング(
HEAD1、HEAD2、など)は、このヘッディングのもとでユーザが使用で
きるカテゴリをリストしたカテゴリ表410への参照を含む。各カテゴリは2つの
参照:すなわちURL表420に対する第1の参照並びにタイトルおよび記述表430
に対する第2の参照を含む。タイトルおよび記述表430は、(閾値より高い得点
または最高のn得点をもつ)各ページのタイトルおよび簡潔な要約を記載してい
る。各アクセス可能なページに対してURLを保持することによって、URL表
はタイトルおよび記述表を写す。URLを使用して、必要なときにページを検索
する。
段階346からデータが上述のようなデータベースへロードするのに適した形態
に構成されると、段階360でローディングルーチンでデータをデータベース112へ
送り、予め作ったデータベース表にロードする。こうして、段階360でデータベ
ース112を分布させる。この点でデータベース112は使用準備が完了する。
いったんデータをデータベース112に記憶すると、通常のやり方で標準データ
ベーススクリプトを使用してアクセスできる。次にデータは“フロント−エンド
”ユーザインターフェイスを介してユーザヘ送られる。“フロント−エンド”ユ
ーザインターフェイスは、例えば、通常のサーチエンジンまたはYahooのような
ディレクトリに似せることができる。データベーススクリプトおよびインターフ
ェイスの生成は従来の技術であり、本発明の技術的範囲内にはないので、より詳
しくは記載しないことにする。より詳しい情報を得るには、Oracle(TM)の
ユーザガイドのようなテキストを参照すべきである。
例示的なカテゴリリストを抽出して、以下の記載と一緒に参照用に使用するた
めに次に示す。カテゴリリストはデータベース112に必要なカテゴリを反映して
いる。
カテゴリリストは、上述のものに類似した所定のフォーマット内のテキストフ
ァイルとして準備され、キーワードがどのように相互に関係しているかを表す。
データベースの構築が開始されるとき、テキストファイルはシステムによって使
用される。
この例では、カテゴリレベルの上に“ヘッディング”レベルがある。都合上、
2つのみのヘッディング(構文“>>>>>”で表されている)、すなわち”ar
ts & entertainment”および”hobbies & sports”が示されている。これらの
ヘッディングは、実際はヘッディングのより長いリストの一部を形成し(都合上
、図示されていない)、所定のグループのユーザにとって重要である。データベ
ース112が構築されると、ヘッディングを選択して、システムのユーザに送られ
る最上レベルの選択の組を形成する。最後にこれらのヘッディングはデータベー
スのヘッディング表400に記憶される。
各ヘッディングはカテゴリ(構文“=>”で表される)のリストをもつ。これ
らのカテゴリは、選択されたヘッディングの1つ(この例では、各ヘッディング
に対して3つのみのカテゴリが示されている)に応答してシステムのユーザへ送
られる。カテゴリはデータベース内のカテゴリ表に記憶される。各カテゴリは、
複数の関係付けられたキーワードをもち、これはコンマで分けられている。各キ
ーワードは、データベース内のURL表420に記憶される。各キーワードは相関
するURL表320内のURLと、関連のタイトルおよび記述表430内のタイトルお
よび記述データとのリンクをもつ。
例に示されているように、幾つかのカテゴリの後には“%%%”構文を最初に
記載して、別の単語または句が続く。この構文は次“See Also(また次も見よ)
”と翻訳される。See Alsoは有益で一般的に使用される方法であり、一定のトピ
ックに関する別の情報を別の場所で見付けられることをユーザに気付かせること
ができる。例として“films(フィルム)”のカテゴリを使用すると、see also
のオプシヨンは”hobbies & sports: cinema(趣味とスポーツ:シネマ)”を参
照する。このときsee alsoは”hobbies & sports”ヘッディングのもとにある”
cinema”カテゴリであることを意味する。see alsoのエントリは、図示されてい
ないが別のデータベース表に記憶することができ、カテゴリ表410内のカテゴリ
によっ
て参照される。
上述の例から明らかなカテゴリリストの別の特徴は、各キーワードが2つの数
と関係付けられていることである。第1の番号は“意味(sense)”または単語の
意味である。例えば、”slide”には名詞も動詞もあり、名詞の"slide"は写真の
スライドまたは公園で子供が滑り降りるつるつるした傾斜表面を意味する。意味
は辞書ソース、最も好ましくはコンピュータで読取り可能なフォーマットで使用
できる辞書ソースを参照することによって決定される。処理段階全体で同じ辞書
ソースを使用して、1つの単語に対する意味ラベルを一貫させることを保証する
ことが明らかに重要である。
第2の数は、キーワードの加重値、またはキーワードが関係付けられたカテゴ
リにどの程度関連しているかに関する。例えば、カテゴリ”photography(写真
)”における”camera(カメラ)”に対する加重値は5であり(5は最高の関連
度を表す)、一方で”flash(フラッシュ)”に対する加重値は1だけである(
1は最低の関連度を表す)。データベースを生成するときに、これらの数が与え
る影響を次により詳しく記載する。
カテゴリリスト、それ自身は何等かの方法、または何等かのやり方によって定
めることができる。ファイルを構築する最も簡単なやり方はマニュアルで、すな
わちユーザ(またはデータベースの生成者)が全てのキーワードを、例えば試行
錯誤して入力し、必要なデータベースを構築するやり方である。しかしながら、
リストを構築する最も効果的な方法が考えだされた。例えば、アダプティブ(適
応性をもつ)ソフトウエアを準備(または例えばWWWから選択)して、ユーザ
が関心のある特定の課題に関係する多数の情報ページを提供することをユーザに
要求することができる。与えられたページに基いて、ソフトウエアは一緒に現れ
る単語または句を決定し、重要な領域を示す。例えば、ユーザが写真に関心があ
り、写真という課題に関して3ページを準備するとして、ソフトウエアは“カメ
ラ”、“プロジェクタ”、“写真”、などの単語を写真を表すものとして十分に
強調することができる。この方法では、ユーザにとって重要な各課題に対して、
サンプルページが与えられ、キーワードが自動的に生成され、次にカテゴリリス
トが自動的に生成されることになる。その代りに、コンピュータを応用したシソ
ーラスを使用して、単一の入カカテゴリに対してキーワードを生成することがで
きる。さらにこのようなシソーラスは、後でデータベースから捨てられるドキュ
メントに基いて、一定のカテゴリと関係付けられた一定の単語を含めるかまたは
捨てる(あるいは単語に関係付けられた加重値を変化させる)ように適応させる
ことができる。
最終的に、ソフトウエアを準備して、例えば、ユーザがインターネット上でア
クセスする情報の最後のxページから、最も一般的に持ち上がる課題領域に基い
て、ユーザに対する主要な課題関心領域を決定することができる。したがって如
何なる段階にも人間が介入することなく、構築された実際のカテゴリリスト並び
にキーワードリストをソフトウエアおよび最終的なデータベースによって定める
ことができる。
カテゴリリストの生成を簡単にする別の方法は、この実施形態を読むことによ
って当業者に明らかになるであろう。
したがって、この実施形態から、カテゴリリスト、おそらくはキーワードを供
給するのとは別に、必要なデータベースを自動的に生成することができる。
ここでサーチエンジンを使用して、URLリストを生成するやり方を記載する
。サーチエンジンは、普通はWWWと関係付けて使用される。サーチエンジンは
一般に、httpコマンドに応答してサーチを行なう。本質的に、このようなコマン
ドはサーチエンジンおよび一定の構文用のURLを含み、このURLでサーチエ
ンジンによって実行されるサーチを特定する。一般に、異なるサーチエンジンに
ついての同じコマンドの構文は変っており、異なるサーチエンジンでこのやり方
でサーチが成功できるようにする前に構文が決められる必要がある。次のhttpコ
マンドの例では、サーチエンジンに”AltaVista”を伝えて、キーワード”slide
”をサーチする。
http://altavista.digital.com/cgi-bin/query?pg=q&what=web&fmt=.&q=slide
明らかに、各サーチエンジンごとに正しい構文を学習しなければならないことは
面倒であり、サーチエンジンのプロバイダは、“ユーザが親しみやすい(ユーザ
フレンドリイな)”フロントエンドのGUIを準備して、ユーザのローカルコン
ピュータシステム上で行なうことによってこの必要を克服できるであろう。G
UIによりユーザは、ディスプレイスクリーン上で、例えば適切なボックス内に
キーワードを入力し、"submit"ボタンを押下する(すなわち、ディスプレイスク
リーン上でマウスポインタをボタンに置き、マウスボタンを左クリックする)こ
とによってサーチ要求を提示することができる。GUIは、ユーザ入力を非常に
簡略化したものであり、上述に示したものに類似したより複雑な形式にまとめ、
サーチエンジンへ送る。
これに応答して、サーチエンジンはそのデータベースをサーチして、相関する
キーワードを見付け、キーワードを含むページに対してURLを含むデータを戻
す。サーチの結果は通常、見付けた各ページごとにページの内容のタイトルおよ
び簡単な要約も含む。表示されたサーチ結果から、サーチエンジンがURLによ
って示されたページを検索することに応答して、何れかのURL上でクリックす
ることができる。
一般的に、戻されたデータは通常、html(Hypertext Markup Language)形式の
情報ページである。ページはフォーマットされていないテキストおよび各htmlコ
ードを含み、htmlコードはどのようにテキストを表示すべきかおよびGUI環境
内でどのようにユーザがそれと対話できるかを定める。通常、フォーマットされ
ていないテキスト内では、ヘッディング、タイトル、本文テキストは異なるhtml
コードを使用して区別される。GUIはhtmlページを採用し、ページごとにコー
ドを翻訳し、適切にフォーマットされた、対話式のグラフィック表示の情報とし
て、ユーザに送られる。
htmlは工業規格(industry-wide standard)であるので、ありのままのフォーマ
ット化されていないテキストおよびhtmlコードを読取り、どのテキストが、例え
ばWWWページの記述に関係しているか、およびどのテキストがURLなどに関
係しているかを翻訳することは比較的に簡単な作業である。この実施形態で達成
したことはまさにこのことであり、次に記載する。
サーチエンジンを制御するプロセスを、図5を参照して次に記載する。段階51
0では、アクセスされるサーチエンジン(SE)は、メモリ領域225内のファイル
に保持されている使用可能なサーチエンジンのリストから選択される。次に段階
520でこのサーチエンジンに対するサーチ要求を作るときに使用するために、
メモリ領域230内の別々のテキストファイルから選択したサーチエンジン用の構
文が読取られる。段階530では、キーワードリストにアクセスして、このリスト
から第1のキーワードを読取る。段階540で、適切な構文を使用して、キーワー
ドをhttpコマンドへ適用する。したがって次にこのプロセスは段階550でコマン
ドをサーチエンジンへ送る。次に段階560で結果を受け取るまで、サーチ結果を
待つ。次に結果は、段階570でメモリ領域235内のテキストファイルに記憶され、
ここで各サーチエンジン/キーワードの組合せごとに新しいテキストファイルを
使用する。
このプロセスは全てのキーワードをサーチするまでリターンブランチBにした
がい、次にリターンブランチAにしたがって(再びキーワードリストの最上部か
ら始める)、全てのサーチエンジンにアクセスするまで、リスト上の次のサーチ
エンジンを選択する。プロセスの結果は、全てのサーチ結果を含む1組のテキス
トファイルであり、将来参照するために、メモリ領域235内に記憶される。
図5に示したプロセス(および次の各プロセス)は、例えば夜間、すなわち通
信コストが最低のときに、PP100上を走行するソフトウエアルーチンまたはバ
ッチファイルによって定められる。
図5を引用して記載したプロセスは、サーチエンジンおよびサーチエンジンに
対するキーワード要求が応答しないときに、リスト内の次のサーチエンジン、ま
たは次のキーワードに移し、一方でサーチエンジンの故障またはエラーログに対
するサーチエンジンの要求(エラー記録段階308は図3に示されている)を記録
することによっても反応することができる。
図6は、サーチ結果のテキストファイルに関係して実行する段階を示す。都合
上、1つのサーチエンジン/キーワードの組合わせを表す1つのみのテキストフ
ァイルについて検討する。
図6では、段階605でサーチ結果のテキストファイルを開き、文字ごとに連続
的に読取る。ファイルの始めから、ファイルが終わる(EOF)前に(段階610
)から、段階615で1つの文字をファイルから読取る。段階620では、文字が<文
字でないとき、ブランチAは段階610へ戻り、文字カウンタ(図示されていない
)がインクリメントされて、ファイル内の文字を読取るところを示す。<文字は
ht
mlを示し、次のテキスト(またはその一部分)は、通常のテキストとは対立して
いるためにhtmlコードである。とくに、URLは、a<文字の後でhtmlラベルa
_hrefによって識別される。
文字がa<であるとき、処理は段階625に進む。段階625では、次の6つの文字
をファイルから読取る。次の8つの文字は段階630で読取られる。次の8つの文
字がa_herf=”であるとき、段階635で次の“文字まで、後続の全ての文字を読
取る。次の8つの文字がa herf=”でないとき、ブランチBが続き、段階630か
ら段階610へ戻り、文字カウンタが1だけインクリメントされる。別の試験(詳
しくは記載しない)は、検索した文字がURLまたはハイーパーテキストリンク
に関係しているか否かを判断し、ここではハイパーテキストリンクはこの目的に
対して必要ない。
段階635の後で、段階640では、第1と第2の“文字の間のテキストは、URL
を表し、メモリ領域240内のテキストファイルに記憶される。多くの文字が段階6
10と635との間で読取られているが、文字カウウンタはインクリメントされる。
次に、全テキストファイルが読取られるまで、ブランチCが続く。全ファイル
が読取られると、ファイルを閉じて、処理はこのサーチエンジン/キーワードの
組合わせを終了する。
図6に示した処理は、各サーチエンジン/キーワードの組合わせに対してテキ
ストファイル上で実行される。その結果、各サーチエンジンに対するサーチの結
果から抽出したURLの個々のリストが得られる。これらのリストはメモリ領域
240に記憶される。メモリ領域240内にURLのこれらのリストを記憶した後で、
図3に示した全体的な処理は段階312から続く。
ここで図7を引用して検索したページを得点する方法を記載することにする。
ドキュメントの得点は組内の別のドキュメントの内容に部分的に関係しているの
で、特定のカテゴリ、すなわちドキュメントの組に対して全てのドキュメントを
検索した後で、得点付けを行う。段階710では、ドキュメントの組内の全てのド
キュメントを予備処理する。予備処理には幾つかの段階が必要である。第1に、
各ページはタイトル、ヘッディング、テキスト本文に分割される。テキストの本
文、すなわちページの実際の記述式テキストに関して、処理されるテキスト量を
固定して、全体的な処理量を制限する。例えば、最初の20行のみを得点付けに
使用することができる。次に、意味のない単語および用語を消去して、得点付け
をより効果的にする。例えば、"and","the","but","a","however"などの単語は
、ページの情報内容に何も加えないので、これらを全て消去する。予備処理の次
の段階では、全ての単語を単根の形に変換する。例えば、全ての名詞を単数形に
、全ての形容詞を副詞に、全ての動詞を不定詞形に変換する。
予備処理が完了すると、組内のドキュメントはより容易に比較でき、それに割
当てられた得点は大きな意味をもつ。
段階720では、“単語総数”と呼ばれる定数、すなわちドキュメントの組内に
残っている予備処理後の全単語数を計算する。次に段階730では、組内の全ての
ドキュメントに対してカテゴリ内の各キーワードの“ワードカウント”の発生数
を計算する。
次に、各ドキュメントに対して手続きの残り(段階740,750,760,770)を実行
する。段階740は、各ドキュメントに対して実行される手続きの開始をマークす
る。
段階750では、アルゴリズムAを使用して、カテゴリ内の各単語に対してドキ
ュメントのテキスト本文で演算を行い、各キーワードに対する個々の得点を生成
する。アルゴリズムAを次に示す:
加重値 :上述のようにカテゴリにおけるキーワードの組内の単語に付さ
れた参照
カウント :ワードがページに現れる回数
単語総数 :上述のように、ページの組内の単語数
項目内の単語:ページ内の単語数
ワードカウント:単語がページの組内に現れる回数
オーダ(order):キーワード内の単一の単語数
段階760では、アルゴリズムBを使用して、カテゴリ内の各キーワードに対し
てタイトルおよびヘッディングを得点して、各キーワードに対して1組の個々の
得点を生成する。アルゴリズムBを次に示す:
アルゴリズムB 得点(タイトル)=100×加重値×カウント×オーダ
得点(ヘッディング1)=100×加重値×カウント×オーダ
得点(ヘッディング2)=50×加重値×カウント×オーダ
得点(ヘッディング3)=20×加重値×カウント×オーダ
、など。
加重値:上述のように、カテゴリのキーワードの組内の単語に付する参照。
カウント:キーワードが各タイトルまたはヘッディングに現れる回数。
オーダ :キーワード内の単一の単語数。
上述から分かるように、タイトルには主な重みが第1の主なヘッディングとと
もに与えられる。次の課題のヘッディングは通常相関度は低いので、各より低い
スコアを与える。
ページが予め処理され、上述のように得点されると、段階770で、ページに対
する合計得点が、アルゴリズムAおよびBからの全ての個々のキーワードのスコ
アを加算することによって得られる。次に上述のように、得点がカテゴリに対す
る一定の閾値よりも上であるときは、ページがカテゴリに相関していると考えら
れ、結果的にデータベース内に含まれる。既に記載したように、閾値以外の方法
を使用して、どのドキュメントがデータベース内に含まれているか、例えば上位
nの得点ドキュメント、またはドキュメントの上位mパーセンタイルを使用でき
るかを判断する。
この場合、得点を付けたページのサンプルをとって、それらを個々に検査して
、それがカテゴリにどの程度関連しているかを知り、そのカテゴリに対する閾値
を判定するために得点を使用して閾値を判断する。
明らかに、データベースから割当てられたカテゴリに対して誤った意味のキー
ワードをもつ筋違いのドキュメントを除去することが望ましい。これは得点付け
をする前に行って、得点付けに必要な処理量を低減することができる。明らかに
、人間がページを読取り、判断を行うことによって手動でこの段階を達成するこ
とができる。しかしながら、文の中をみて、分の構造および意味論を理解するも
の
であり、これにより自然言語処理アルゴリズムは高精度に単語の意味を判断し、
人手による介入に取って代ることができる。このような方法を広く知られ、より
効果的になってきており、この記述の技術的範囲を越えている。この技術は本発
明の実施形態で好ましい形で使用されて、ページ内のキーワードの意味を判断で
きたことを特記する。次に判断された意味を、上述のカテゴリリスト内に定めら
れた要求される意味と比較する。
しかしながら、筋違いのドキュメントの除去は、如何なる点でも、例えばUR
Lエントリを削除することによって、データベースを形成した後でさえも行うこ
とができる。
しかしながら、上述の得点付け処理それ自身は当然、要求される閾値未満の低
い得点を筋違いのドキュメントに割当てることによって、これらを除去できるこ
とを示した。例えば、写真のスライド(slide)に関係するドキュメントを要求し
て、子供の滑り台(slide)に関する幾つかの(無関係の)ドキュメントが検索さ
れたとすると、得点付け処理(他の関連するキーワード、例えば"camera"、"pho
tograph"、および"flash"などを探しているとき)は、他のキーワードを見付け
損なうことなく、子供の滑り台(slide)のドキュメントを対応する低い得点に一
致させ、このようなドキュメントを自然にフィルタ処理することになる。
上述のシステムでは、分散形ソースデータベースはインターネットに接続した
情報サーバの形をとるが、本発明のシステムは他の分散形ソースデータベースで
使用するのに適している。
Source:Alta Vista(www.altavista.digital.com)
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,DE,
DK,ES,FI,FR,GB,GR,IE,IT,L
U,MC,NL,PT,SE),OA(BF,BJ,CF
,CG,CI,CM,GA,GN,ML,MR,NE,
SN,TD,TG),AP(GH,KE,LS,MW,S
D,SZ,UG,ZW),EA(AM,AZ,BY,KG
,KZ,MD,RU,TJ,TM),AL,AM,AT
,AU,AZ,BA,BB,BG,BR,BY,CA,
CH,CN,CU,CZ,DE,DK,EE,ES,F
I,GB,GE,GH,HU,IL,IS,JP,KE
,KG,KP,KR,KZ,LC,LK,LR,LS,
LT,LU,LV,MD,MG,MK,MN,MW,M
X,NO,NZ,PL,PT,RO,RU,SD,SE
,SG,SI,SK,SL,TJ,TM,TR,TT,
UA,UG,US,UZ,VN,YU,ZW
(72)発明者 アップルバイ、スティーブ
イギリス国、シーオー7・9ジェイキュ
ー、エセックス、コルチェスター、ウィー
ベンホー、リチャード・アベニュー 23
(72)発明者 フェアマン、イアン
イギリス国、アイピー3・8ジェイダブリ
ュ、サフォーク、イプスウィッチ、カムデ
ン・ロード 28
(72)発明者 アイレス、サラー
イギリス国、アイピー1・4ジェイワイ、
サフォーク、イプスウィッチ、バロンスデ
ール・クローズ 37
Claims (1)
- 【特許請求の範囲】 1.あて先のデータベースを分布させる装置であり: あて先のデータベースと; 装置を分散形ソースデータベースに接続する手段と; 所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記メモリ領域に含まれるキーワード群に基いて、前記分散形ソースデータ ベースと関係付けられた少なくとも1つのサーチエンジンを制御して、前記キー ワードを含むドキュメントの場所に関する情報を含むサーチ結果を作り、該ドキ ュメントは該分散形ソースデータベースに記憶されているような制御用手段と; 所定の基準にしたがってそのそれぞれの内容に基いて前記少なくとも1つの サーチエンジンによって作られるサーチ結果内で識別された各ドキュメントに得 点をつける手段と; 各得点に基いて、前記得点をつける手段によって得点されたドキュメントの 少なくとも幾つかを選択する手段と; 前記選択手段によって選択された各ドキュメントごとに、前記分散形ソース データベース内のドキュメントの場所に関係する情報を前記あて先データベース に記憶する手段とを含むあて先データベースを分布させる装置。 2.前記少なくとも1つのサーチエンジンによって与えられたサーチ結果に含ま れる配置情報を識別し、第2のメモリ領域内に前記配置情報を記憶する手段をさ らに含む請求項1記載の装置。 3.前記少なくとも1つのサーチエンジンによって与えられたサーチ結果におい て識別されるドキュメントを検索し、ドキュメントメモリ内に前記検索したドキ ュメントを記憶する手段をさらに含む請求項1記載の装置。 4.前記メモリ領域がキーワード群の組を含むように構成され、各キーワード群 が各所定の課題のカテゴリに関係する請求項1乃至3の何れか1項記載の装置。 5.あて先データベースを分布する装置であり: あて先データベースと; 所定の課題のカテゴリに関係するキーワード群を含むメモリ領域と; 前記あて先データベースおよび前記メモリ領域にアクセスでき、分散形ソー スデータベースに接続でき、かつ、 前記メモリ領域に含まれるキーワード群に基いて、前記分散形データベー スと関係する少なくとも1つのサーチエンジンを制御して、前記キーワードを含 み、前記分散形ソースデータベース内に記憶されるドキュメントの場所に関係す る情報を含むサーチ結果を作り; 所定の基準にしたがってそのそれぞれの内容に基いて前記サーチ結果内で 識別される各ドキュメントを得点し; それぞれの得点に基いてドキュメントの少なくとも幾つかを選択し;また 、 各選択したドキュメントごとに、前記分散形ソースデータベース内の場所 に関する情報を前記あて先データベースに記憶するようにされている処理プラッ トフォームとを含むあて先データベースを分布する装置。 6.あて先のデータベースを分布させる装置であり: a)この装置を分散形ソースデータベースに接続する手段と; b)所定の課題のカテゴリに関係するキーワード群を記憶する第1のメモリ 領域と; c)第1のメモリ領域からキーワードを読取り、分散形ソースデータベース へアクセスするサーチ手段へ前記キーワードを送る手段と; d)前記サーチ手段からサーチの結果を受取り、第2のメモリ領域に前記結 果を記憶する手段であり、前記結果が前記キーワードを含む前記ソースデータベ ース内に記憶されるドキュメントの場所に関係する情報を含むような記憶する手 段と; e)第3のメモリ領域で前記場所情報を識別し、かつ記憶する手段と; f)前記第3のメモリ領域から場所情報を読取り、要求をソースデータベー スに送り、選択した場所情報に関係するドキュメントのコピーを装置へ戻すよう にする手段と; g)前記ドキュメントの前記コピーを受取り、第4のメモリ領域内に記憶す る手段と; h)その各内容に基いて所定の基準にしたがって第4のメモリ領域に記憶し た各ドキュメントにアクセスし、かつ得点する手段と; i)各得点に基いて前記ドキュメントの少なくとも幾つかを選択し、各選択 したドキュメントに対して、ソースデータベース内のドキュメントの場所に関係 する情報をデータベースに記憶する手段とを含むあて先データベースを分布させ る装置。 7.あて先データベースを分布させる方法であり: 所定の課題のカテゴリに関係するキーワード群に基いて、分散形ソースデー タベースに関係する少なくとも1つのサーチエンジンを制御して、前記キーワー ドを含み前記分散形ソースデータベース内に記憶されているドキュメントの場所 に関係する情報を含むサーチ結果を作る段階と; 所定の基準にしたがって各内容に基いて前記サーチ結果で識別される各ドキ ュメントを得点する段階と; 各得点に基いてドキュメントの少なくとも幾つかを選択する段階と; 各選択したドキュメントごとに、前記分散形ソースデータベース内のドキュ メントの場所に関係する情報を前記あて先データベースに記憶する段階とを含む 方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP96305879.7 | 1996-07-31 | ||
EP96305879A EP0822502A1 (en) | 1996-07-31 | 1996-07-31 | Data access system |
PCT/GB1997/001949 WO1998004979A1 (en) | 1996-07-31 | 1997-07-18 | Data access system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000516005A true JP2000516005A (ja) | 2000-11-28 |
Family
ID=8225046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10508586A Pending JP2000516005A (ja) | 1996-07-31 | 1997-07-18 | データアクセスシステム |
Country Status (4)
Country | Link |
---|---|
US (1) | US6178419B1 (ja) |
EP (2) | EP0822502A1 (ja) |
JP (1) | JP2000516005A (ja) |
WO (1) | WO1998004979A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012168984A (ja) * | 2000-03-29 | 2012-09-06 | Risk Monster Kk | 与信機能を備えた匿名電子商取引システム及び方法 |
Families Citing this family (195)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5940834A (en) * | 1997-03-13 | 1999-08-17 | Mitel Corporation | Automatic web page generator |
JPH10283240A (ja) * | 1997-04-09 | 1998-10-23 | Canon Electron Inc | 情報ファイル装置、情報ファイルの記録方法、および、情報ファイルの記録手順を記憶した記憶媒体 |
GB2329488A (en) * | 1997-09-17 | 1999-03-24 | Transcom Software Inc | Accessing information according to subject heading |
JP3664874B2 (ja) * | 1998-03-28 | 2005-06-29 | 松下電器産業株式会社 | 文書検索装置 |
GB2336699A (en) * | 1998-04-24 | 1999-10-27 | Dialog Corp Plc The | Automatic classification of text files |
JPH11312172A (ja) * | 1998-04-28 | 1999-11-09 | Sharp Corp | 情報処理装置及び方法並びにその制御プログラムを記憶した媒体 |
US6735585B1 (en) * | 1998-08-17 | 2004-05-11 | Altavista Company | Method for search engine generating supplemented search not included in conventional search result identifying entity data related to portion of located web page |
US6510467B1 (en) * | 1998-09-16 | 2003-01-21 | International Business Machines Corporation | Method for transferring data files between a user and an internet server |
JP3278406B2 (ja) * | 1998-12-10 | 2002-04-30 | 富士通株式会社 | ドキュメント検索仲介装置、ドキュメント検索システム、および、ドキュメント検索仲介プログラムを記録した記録媒体 |
US20030195872A1 (en) * | 1999-04-12 | 2003-10-16 | Paul Senn | Web-based information content analyzer and information dimension dictionary |
US6336117B1 (en) * | 1999-04-30 | 2002-01-01 | International Business Machines Corporation | Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine |
WO2000075809A1 (fr) * | 1999-06-04 | 2000-12-14 | Seiko Epson Corporation | Procede de triage d'informations, trieur d'informations, support enregistre sur lequel le programme de triage d'informations est enregistre |
WO2001002987A2 (en) * | 1999-07-01 | 2001-01-11 | Seekip.Com | Web-based infomediary for intellectual property transfer |
KR100328670B1 (ko) * | 1999-07-21 | 2002-03-20 | 정만원 | 다중 추천 에이전트들을 이용하는 추천 시스템 |
US6625152B1 (en) | 1999-10-13 | 2003-09-23 | Cisco Technology, Inc. | Methods and apparatus for transferring data using a filter index |
US6546387B1 (en) | 1999-11-15 | 2003-04-08 | Transcom Software Inc. | Computer network information management system and method using intelligent software agents |
US6691108B2 (en) * | 1999-12-14 | 2004-02-10 | Nec Corporation | Focused search engine and method |
US6389467B1 (en) | 2000-01-24 | 2002-05-14 | Friskit, Inc. | Streaming media search and continuous playback system of media resources located by multiple network addresses |
AU2001231023A1 (en) * | 2000-01-24 | 2001-07-31 | Friskit, Inc. | Streaming media search and playback system |
US7281034B1 (en) | 2000-01-24 | 2007-10-09 | Friskit, Inc. | System and method for media playback over a network using links that contain control signals and commands |
US6606659B1 (en) * | 2000-01-28 | 2003-08-12 | Websense, Inc. | System and method for controlling access to internet sites |
US6665659B1 (en) * | 2000-02-01 | 2003-12-16 | James D. Logan | Methods and apparatus for distributing and using metadata via the internet |
US6766361B1 (en) | 2000-02-24 | 2004-07-20 | Cephire Technologies, Inc. | Machine-to-machine e-commerce interface using extensible markup language |
US20010054020A1 (en) * | 2000-03-22 | 2001-12-20 | Barth Brian E. | Method and apparatus for dynamic information connection engine |
EP1269754A4 (en) * | 2000-03-14 | 2009-03-11 | Joseph Robert Marchese | DIGITAL VIDEO SYSTEM USING NETWORKED CAMERAS |
US7523114B2 (en) * | 2000-04-24 | 2009-04-21 | Ebay Inc. | Method and system for categorizing items in both actual and virtual categories |
US7076743B2 (en) * | 2000-05-04 | 2006-07-11 | I-Lor, Llc | Method for adding a plurality of user selectable functions to a hyperlink |
US6876997B1 (en) * | 2000-05-22 | 2005-04-05 | Overture Services, Inc. | Method and apparatus for indentifying related searches in a database search system |
US6983320B1 (en) * | 2000-05-23 | 2006-01-03 | Cyveillance, Inc. | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages |
US7251687B1 (en) | 2000-06-02 | 2007-07-31 | Vignette Corporation | Method for click-stream analysis using web directory reverse categorization |
US7039630B2 (en) * | 2000-07-27 | 2006-05-02 | Nec Corporation | Information search/presentation system |
JP2002049631A (ja) * | 2000-08-01 | 2002-02-15 | Sony Corp | 情報提供装置および方法、並びに記録媒体 |
US6868434B1 (en) * | 2000-08-07 | 2005-03-15 | Sun Microsystems, Inc. | System and method for testing server latencies using multiple concurrent users in a computer system |
US8060816B1 (en) * | 2000-10-31 | 2011-11-15 | International Business Machines Corporation | Methods and apparatus for intelligent crawling on the world wide web |
GB2368670A (en) * | 2000-11-03 | 2002-05-08 | Envisional Software Solutions | Data acquisition system |
AU2002239297A1 (en) * | 2000-11-16 | 2002-06-03 | Mydtv, Inc. | System and methods for determining the desirability of video programming events |
US6898592B2 (en) * | 2000-12-27 | 2005-05-24 | Microsoft Corporation | Scoping queries in a search engine |
US7287064B1 (en) * | 2001-11-20 | 2007-10-23 | Sprint Spectrum L.P. | Method and system for determining an internet user's interest level |
US7194464B2 (en) | 2001-12-07 | 2007-03-20 | Websense, Inc. | System and method for adapting an internet filter |
EP1324220A1 (en) * | 2001-12-24 | 2003-07-02 | Abb Research Ltd. | Process and system for generating and improving a collection of information objects |
EP1466261B1 (en) * | 2002-01-08 | 2018-03-07 | Seven Networks, LLC | Connection architecture for a mobile network |
US7949648B2 (en) * | 2002-02-26 | 2011-05-24 | Soren Alain Mortensen | Compiling and accessing subject-specific information from a computer network |
JP4118580B2 (ja) * | 2002-03-20 | 2008-07-16 | 富士通株式会社 | 配置情報推薦装置、その方法、プログラム |
US20030225763A1 (en) * | 2002-04-15 | 2003-12-04 | Microsoft Corporation | Self-improving system and method for classifying pages on the world wide web |
US20040019496A1 (en) * | 2002-05-30 | 2004-01-29 | Chevron U.S.A. Inc. | System and method for law practice information management |
US7152059B2 (en) * | 2002-08-30 | 2006-12-19 | Emergency24, Inc. | System and method for predicting additional search results of a computerized database search user based on an initial search query |
US7076497B2 (en) * | 2002-10-11 | 2006-07-11 | Emergency24, Inc. | Method for providing and exchanging search terms between internet site promoters |
US20030088553A1 (en) * | 2002-11-23 | 2003-05-08 | Emergency 24, Inc. | Method for providing relevant search results based on an initial online search query |
US7533012B2 (en) * | 2002-12-13 | 2009-05-12 | Sun Microsystems, Inc. | Multi-user web simulator |
US7143025B2 (en) * | 2002-12-13 | 2006-11-28 | Sun Microsystems, Inc. | Web simulator |
US7917468B2 (en) * | 2005-08-01 | 2011-03-29 | Seven Networks, Inc. | Linking of personal information management data |
US8468126B2 (en) | 2005-08-01 | 2013-06-18 | Seven Networks, Inc. | Publishing data in an information community |
US7853563B2 (en) * | 2005-08-01 | 2010-12-14 | Seven Networks, Inc. | Universal data aggregation |
US7185088B1 (en) * | 2003-03-31 | 2007-02-27 | Microsoft Corporation | Systems and methods for removing duplicate search engine results |
AU2004235104A1 (en) * | 2003-04-25 | 2004-11-11 | Thomson Reuters Global Resources | Distributed search methods, architectures, systems, and software |
AU2013206478B2 (en) * | 2003-04-25 | 2016-06-09 | Thomson Reuters Enterprise Centre Gmbh | Distributed search methods, architectures, systems, and software |
US8321400B2 (en) * | 2003-08-29 | 2012-11-27 | Vortaloptics, Inc. | Method, device and software for querying and presenting search results |
US7440964B2 (en) * | 2003-08-29 | 2008-10-21 | Vortaloptics, Inc. | Method, device and software for querying and presenting search results |
US7444403B1 (en) | 2003-11-25 | 2008-10-28 | Microsoft Corporation | Detecting sexually predatory content in an electronic communication |
US20050177599A1 (en) * | 2004-02-09 | 2005-08-11 | Microsoft Corporation | System and method for complying with anti-spam rules, laws, and regulations |
US8161053B1 (en) * | 2004-03-31 | 2012-04-17 | Google Inc. | Methods and systems for eliminating duplicate events |
US7428530B2 (en) * | 2004-07-01 | 2008-09-23 | Microsoft Corporation | Dispersing search engine results by using page category information |
US7363296B1 (en) | 2004-07-01 | 2008-04-22 | Microsoft Corporation | Generating a subindex with relevant attributes to improve querying |
US7702618B1 (en) | 2004-07-26 | 2010-04-20 | Google Inc. | Information retrieval system for archiving multiple document versions |
US7580929B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase-based personalization of searches in an information retrieval system |
US7536408B2 (en) | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
US7567959B2 (en) * | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7584175B2 (en) | 2004-07-26 | 2009-09-01 | Google Inc. | Phrase-based generation of document descriptions |
US7580921B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7599914B2 (en) | 2004-07-26 | 2009-10-06 | Google Inc. | Phrase-based searching in an information retrieval system |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US20060053156A1 (en) * | 2004-09-03 | 2006-03-09 | Howard Kaushansky | Systems and methods for developing intelligence from information existing on a network |
GB2418999A (en) * | 2004-09-09 | 2006-04-12 | Surfcontrol Plc | Categorizing uniform resource locators |
GB2418037B (en) * | 2004-09-09 | 2007-02-28 | Surfcontrol Plc | System, method and apparatus for use in monitoring or controlling internet access |
US7606793B2 (en) * | 2004-09-27 | 2009-10-20 | Microsoft Corporation | System and method for scoping searches using index keys |
US8051096B1 (en) | 2004-09-30 | 2011-11-01 | Google Inc. | Methods and systems for augmenting a token lexicon |
US7680648B2 (en) | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation |
US7996208B2 (en) * | 2004-09-30 | 2011-08-09 | Google Inc. | Methods and systems for selecting a language for text segmentation |
US20060085401A1 (en) * | 2004-10-20 | 2006-04-20 | Microsoft Corporation | Analyzing operational and other data from search system or the like |
US8010082B2 (en) * | 2004-10-20 | 2011-08-30 | Seven Networks, Inc. | Flexible billing architecture |
US7441271B2 (en) | 2004-10-20 | 2008-10-21 | Seven Networks | Method and apparatus for intercepting events in a communication system |
US7643818B2 (en) * | 2004-11-22 | 2010-01-05 | Seven Networks, Inc. | E-mail messaging to/from a mobile terminal |
US7706781B2 (en) * | 2004-11-22 | 2010-04-27 | Seven Networks International Oy | Data security in a mobile e-mail service |
FI117152B (fi) | 2004-12-03 | 2006-06-30 | Seven Networks Internat Oy | Sähköpostiasetusten käyttöönotto matkaviestimelle |
JP2006202081A (ja) * | 2005-01-21 | 2006-08-03 | Seiko Epson Corp | メタデータ生成装置 |
US7461059B2 (en) | 2005-02-23 | 2008-12-02 | Microsoft Corporation | Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks |
US7877703B1 (en) | 2005-03-14 | 2011-01-25 | Seven Networks, Inc. | Intelligent rendering of information in a limited display environment |
US7796742B1 (en) | 2005-04-21 | 2010-09-14 | Seven Networks, Inc. | Systems and methods for simplified provisioning |
US8438633B1 (en) | 2005-04-21 | 2013-05-07 | Seven Networks, Inc. | Flexible real-time inbox access |
WO2006136660A1 (en) | 2005-06-21 | 2006-12-28 | Seven Networks International Oy | Maintaining an ip connection in a mobile network |
US8176041B1 (en) * | 2005-06-29 | 2012-05-08 | Kosmix Corporation | Delivering search results |
JP4238849B2 (ja) * | 2005-06-30 | 2009-03-18 | カシオ計算機株式会社 | Webページ閲覧装置、Webページ閲覧方法、及びWebページ閲覧処理プログラム |
US8069166B2 (en) | 2005-08-01 | 2011-11-29 | Seven Networks, Inc. | Managing user-to-user contact with inferred presence information |
US20080215614A1 (en) * | 2005-09-08 | 2008-09-04 | Slattery Michael J | Pyramid Information Quantification or PIQ or Pyramid Database or Pyramided Database or Pyramided or Selective Pressure Database Management System |
US20070112778A1 (en) * | 2005-11-15 | 2007-05-17 | Marek Graczynski | Scientific information systems and methods for global networking opportunities |
GB0524017D0 (en) * | 2005-11-24 | 2006-01-04 | Ibm | Generation of a categorisation scheme |
IL172551A0 (en) * | 2005-12-13 | 2006-04-10 | Grois Dan | Method for assigning one or more categorized scores to each document over a data network |
US7769395B2 (en) | 2006-06-20 | 2010-08-03 | Seven Networks, Inc. | Location-based operations and messaging |
US9166883B2 (en) | 2006-04-05 | 2015-10-20 | Joseph Robert Marchese | Network device detection, identification, and management |
US20070290787A1 (en) * | 2006-06-20 | 2007-12-20 | Trevor Fiatal | Systems and methods for group messaging |
US20080005070A1 (en) * | 2006-06-28 | 2008-01-03 | Bellsouth Intellectual Property Corporation | Non-Repetitive Web Searching |
US8615800B2 (en) | 2006-07-10 | 2013-12-24 | Websense, Inc. | System and method for analyzing web content |
US8020206B2 (en) * | 2006-07-10 | 2011-09-13 | Websense, Inc. | System and method of analyzing web content |
US8234157B2 (en) * | 2006-07-24 | 2012-07-31 | Emergency 24, Inc. | Method for internet based advertising and referral using a fixed fee methodology |
US9654495B2 (en) | 2006-12-01 | 2017-05-16 | Websense, Llc | System and method of analyzing web addresses |
GB2445764A (en) * | 2007-01-22 | 2008-07-23 | Surfcontrol Plc | Resource access filtering system and database structure for use therewith |
US8027975B2 (en) * | 2007-01-31 | 2011-09-27 | Reputation.Com, Inc. | Identifying and changing personal information |
US8015174B2 (en) * | 2007-02-28 | 2011-09-06 | Websense, Inc. | System and method of controlling access to the internet |
US20080215607A1 (en) * | 2007-03-02 | 2008-09-04 | Umbria, Inc. | Tribe or group-based analysis of social media including generating intelligence from a tribe's weblogs or blogs |
US8166021B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Query phrasification |
US7702614B1 (en) | 2007-03-30 | 2010-04-20 | Google Inc. | Index updating using segment swapping |
US7925655B1 (en) | 2007-03-30 | 2011-04-12 | Google Inc. | Query scheduling using hierarchical tiers of index servers |
US8086594B1 (en) | 2007-03-30 | 2011-12-27 | Google Inc. | Bifurcated document relevance scoring |
US7693813B1 (en) | 2007-03-30 | 2010-04-06 | Google Inc. | Index server architecture using tiered and sharded phrase posting lists |
US8166045B1 (en) | 2007-03-30 | 2012-04-24 | Google Inc. | Phrase extraction using subphrase scoring |
IL182518A0 (en) * | 2007-04-12 | 2007-09-20 | Grois Dan | Pay per relevance (ppr) advertising method and system |
US8122016B1 (en) * | 2007-04-24 | 2012-02-21 | Wal-Mart Stores, Inc. | Determining concepts associated with a query |
US8693494B2 (en) * | 2007-06-01 | 2014-04-08 | Seven Networks, Inc. | Polling |
US8805425B2 (en) * | 2007-06-01 | 2014-08-12 | Seven Networks, Inc. | Integrated messaging |
US20080313137A1 (en) * | 2007-06-12 | 2008-12-18 | Brian Galvin | Behavioral WEB Graph |
US8117223B2 (en) | 2007-09-07 | 2012-02-14 | Google Inc. | Integrating external related phrase information into a phrase-based indexing information retrieval system |
US20090089381A1 (en) * | 2007-09-28 | 2009-04-02 | Microsoft Corporation | Pending and exclusive electronic mail inbox |
US20090106221A1 (en) * | 2007-10-18 | 2009-04-23 | Microsoft Corporation | Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features |
US9348912B2 (en) * | 2007-10-18 | 2016-05-24 | Microsoft Technology Licensing, Llc | Document length as a static relevance feature for ranking search results |
JP5182614B2 (ja) * | 2007-12-07 | 2013-04-17 | アイシン・エィ・ダブリュ株式会社 | 検索装置、ナビゲーション装置、及び検索プログラム |
US8364181B2 (en) | 2007-12-10 | 2013-01-29 | Seven Networks, Inc. | Electronic-mail filtering for mobile devices |
US8793305B2 (en) * | 2007-12-13 | 2014-07-29 | Seven Networks, Inc. | Content delivery to a mobile device from a content service |
US9002828B2 (en) | 2007-12-13 | 2015-04-07 | Seven Networks, Inc. | Predictive content delivery |
US8107921B2 (en) | 2008-01-11 | 2012-01-31 | Seven Networks, Inc. | Mobile virtual network operator |
US8862657B2 (en) | 2008-01-25 | 2014-10-14 | Seven Networks, Inc. | Policy based content service |
US20090193338A1 (en) * | 2008-01-28 | 2009-07-30 | Trevor Fiatal | Reducing network and battery consumption during content delivery and playback |
JP2009210547A (ja) * | 2008-03-06 | 2009-09-17 | Aisin Aw Co Ltd | 目的地選択支援装置、及び目的地選択支援プログラム |
JP2009210539A (ja) * | 2008-03-06 | 2009-09-17 | Aisin Aw Co Ltd | 目的地検索支援装置、及び目的地検索支援プログラム |
JP4636391B2 (ja) * | 2008-03-12 | 2011-02-23 | アイシン・エィ・ダブリュ株式会社 | 目的地設定支援装置、及び目的地設定支援プログラム |
US20090248670A1 (en) * | 2008-03-31 | 2009-10-01 | Trevor Fiatal | Content search engine |
US8812493B2 (en) * | 2008-04-11 | 2014-08-19 | Microsoft Corporation | Search results ranking using editing distance and document information |
US8787947B2 (en) * | 2008-06-18 | 2014-07-22 | Seven Networks, Inc. | Application discovery on mobile devices |
US8078158B2 (en) | 2008-06-26 | 2011-12-13 | Seven Networks, Inc. | Provisioning applications for a mobile device |
WO2010002816A1 (en) * | 2008-06-30 | 2010-01-07 | Websense, Inc. | System and method for dynamic and real-time categorization of webpages |
CN101566984B (zh) * | 2008-07-11 | 2011-02-09 | 博采林电子科技(深圳)有限公司 | 一种应用在个人手持设备中的搜索引擎和资源搜索方法 |
US8909759B2 (en) * | 2008-10-10 | 2014-12-09 | Seven Networks, Inc. | Bandwidth measurement |
US8700646B2 (en) * | 2009-08-12 | 2014-04-15 | Apple Inc. | Reference file for formatted views |
US20110047265A1 (en) * | 2009-08-23 | 2011-02-24 | Parental Options | Computer Implemented Method for Identifying Risk Levels for Minors |
US9043731B2 (en) | 2010-03-30 | 2015-05-26 | Seven Networks, Inc. | 3D mobile user interface with configurable workspace management |
US8738635B2 (en) | 2010-06-01 | 2014-05-27 | Microsoft Corporation | Detection of junk in search result ranking |
US8838783B2 (en) | 2010-07-26 | 2014-09-16 | Seven Networks, Inc. | Distributed caching for resource and mobile network traffic management |
CA2806527A1 (en) | 2010-07-26 | 2012-02-09 | Seven Networks, Inc. | Mobile network traffic coordination across multiple applications |
US8886176B2 (en) | 2010-07-26 | 2014-11-11 | Seven Networks, Inc. | Mobile application traffic optimization |
GB2495877B (en) | 2010-07-26 | 2013-10-02 | Seven Networks Inc | Distributed implementation of dynamic wireless traffic policy |
WO2012060995A2 (en) | 2010-11-01 | 2012-05-10 | Michael Luna | Distributed caching in a wireless network of content delivered for a mobile application over a long-held request |
US8843153B2 (en) | 2010-11-01 | 2014-09-23 | Seven Networks, Inc. | Mobile traffic categorization and policy for network use optimization while preserving user experience |
US9060032B2 (en) | 2010-11-01 | 2015-06-16 | Seven Networks, Inc. | Selective data compression by a distributed traffic management system to reduce mobile data traffic and signaling traffic |
CN103620576B (zh) | 2010-11-01 | 2016-11-09 | 七网络公司 | 适用于移动应用程序行为和网络条件的缓存 |
WO2012061437A1 (en) | 2010-11-01 | 2012-05-10 | Michael Luna | Cache defeat detection and caching of content addressed by identifiers intended to defeat cache |
US8484314B2 (en) | 2010-11-01 | 2013-07-09 | Seven Networks, Inc. | Distributed caching in a wireless network of content delivered for a mobile application over a long-held request |
US8326985B2 (en) | 2010-11-01 | 2012-12-04 | Seven Networks, Inc. | Distributed management of keep-alive message signaling for mobile network resource conservation and optimization |
US9330196B2 (en) | 2010-11-01 | 2016-05-03 | Seven Networks, Llc | Wireless traffic management system cache optimization using http headers |
US8903954B2 (en) | 2010-11-22 | 2014-12-02 | Seven Networks, Inc. | Optimization of resource polling intervals to satisfy mobile device requests |
WO2012060997A2 (en) | 2010-11-01 | 2012-05-10 | Michael Luna | Application and network-based long poll request detection and cacheability assessment therefor |
CA2798523C (en) | 2010-11-22 | 2015-02-24 | Seven Networks, Inc. | Aligning data transfer to optimize connections established for transmission over a wireless network |
EP2661697B1 (en) | 2011-01-07 | 2018-11-21 | Seven Networks, LLC | System and method for reduction of mobile network traffic used for domain name system (dns) queries |
GB2517815A (en) | 2011-04-19 | 2015-03-04 | Seven Networks Inc | Shared resource and virtual resource management in a networked environment |
GB2504037B (en) | 2011-04-27 | 2014-12-24 | Seven Networks Inc | Mobile device which offloads requests made by a mobile application to a remote entity for conservation of mobile device and network resources |
WO2012149434A2 (en) | 2011-04-27 | 2012-11-01 | Seven Networks, Inc. | Detecting and preserving state for satisfying application requests in a distributed proxy and cache system |
US9436726B2 (en) | 2011-06-23 | 2016-09-06 | BCM International Regulatory Analytics LLC | System, method and computer program product for a behavioral database providing quantitative analysis of cross border policy process and related search capabilities |
EP2737742A4 (en) | 2011-07-27 | 2015-01-28 | Seven Networks Inc | AUTOMATIC PRODUCTION AND DISTRIBUTION OF GUIDELINES INFORMATION ON MOBILE MOBILE TRANSPORT IN A WIRELESS NETWORK |
US8934414B2 (en) | 2011-12-06 | 2015-01-13 | Seven Networks, Inc. | Cellular or WiFi mobile traffic optimization based on public or private network destination |
EP2789137A4 (en) | 2011-12-06 | 2015-12-02 | Seven Networks Inc | SYSTEM OF REDUNDANTLY CLUSTERED MACHINES FOR PROVIDING TILTING MECHANISMS IN MOBILE TRAFFIC MANAGEMENT AND NETWORK RESOURCE PRESERVATION |
WO2013086455A1 (en) | 2011-12-07 | 2013-06-13 | Seven Networks, Inc. | Flexible and dynamic integration schemas of a traffic management system with various network operators for network traffic alleviation |
US9277443B2 (en) | 2011-12-07 | 2016-03-01 | Seven Networks, Llc | Radio-awareness of mobile device for sending server-side control signals using a wireless network optimized transport protocol |
WO2013090834A1 (en) | 2011-12-14 | 2013-06-20 | Seven Networks, Inc. | Operation modes for mobile traffic optimization and concurrent management of optimized and non-optimized traffic |
US8861354B2 (en) | 2011-12-14 | 2014-10-14 | Seven Networks, Inc. | Hierarchies and categories for management and deployment of policies for distributed wireless traffic optimization |
EP2792188B1 (en) | 2011-12-14 | 2019-03-20 | Seven Networks, LLC | Mobile network reporting and usage analytics system and method using aggregation of data in a distributed traffic optimization system |
US8886651B1 (en) | 2011-12-22 | 2014-11-11 | Reputation.Com, Inc. | Thematic clustering |
WO2013103988A1 (en) | 2012-01-05 | 2013-07-11 | Seven Networks, Inc. | Detection and management of user interactions with foreground applications on a mobile device in distributed caching |
US9495462B2 (en) | 2012-01-27 | 2016-11-15 | Microsoft Technology Licensing, Llc | Re-ranking search results |
WO2013116856A1 (en) | 2012-02-02 | 2013-08-08 | Seven Networks, Inc. | Dynamic categorization of applications for network access in a mobile network |
WO2013116852A1 (en) | 2012-02-03 | 2013-08-08 | Seven Networks, Inc. | User as an end point for profiling and optimizing the delivery of content and data in a wireless network |
US10636041B1 (en) | 2012-03-05 | 2020-04-28 | Reputation.Com, Inc. | Enterprise reputation evaluation |
US8595022B1 (en) | 2012-03-05 | 2013-11-26 | Reputation.Com, Inc. | Follow-up determination |
US8812695B2 (en) | 2012-04-09 | 2014-08-19 | Seven Networks, Inc. | Method and system for management of a virtual network connection without heartbeat messages |
US10263899B2 (en) | 2012-04-10 | 2019-04-16 | Seven Networks, Llc | Enhanced customer service for mobile carriers using real-time and historical mobile application and traffic or optimization data associated with mobile devices in a mobile network |
US8918312B1 (en) | 2012-06-29 | 2014-12-23 | Reputation.Com, Inc. | Assigning sentiment to themes |
WO2014011216A1 (en) | 2012-07-13 | 2014-01-16 | Seven Networks, Inc. | Dynamic bandwidth adjustment for browsing or streaming activity in a wireless network based on prediction of user behavior when interacting with mobile applications |
US9161258B2 (en) | 2012-10-24 | 2015-10-13 | Seven Networks, Llc | Optimized and selective management of policy deployment to mobile clients in a congested network to prevent further aggravation of network congestion |
US9307493B2 (en) | 2012-12-20 | 2016-04-05 | Seven Networks, Llc | Systems and methods for application management of mobile device radio state promotion and demotion |
US8744866B1 (en) | 2012-12-21 | 2014-06-03 | Reputation.Com, Inc. | Reputation report with recommendation |
US8805699B1 (en) | 2012-12-21 | 2014-08-12 | Reputation.Com, Inc. | Reputation report with score |
US9271238B2 (en) | 2013-01-23 | 2016-02-23 | Seven Networks, Llc | Application or context aware fast dormancy |
US8874761B2 (en) | 2013-01-25 | 2014-10-28 | Seven Networks, Inc. | Signaling optimization in a wireless network for traffic utilizing proprietary and non-proprietary protocols |
US9326185B2 (en) | 2013-03-11 | 2016-04-26 | Seven Networks, Llc | Mobile network congestion recognition for optimization of mobile traffic |
US8925099B1 (en) | 2013-03-14 | 2014-12-30 | Reputation.Com, Inc. | Privacy scoring |
US9501506B1 (en) | 2013-03-15 | 2016-11-22 | Google Inc. | Indexing system |
US9483568B1 (en) | 2013-06-05 | 2016-11-01 | Google Inc. | Indexing system |
US9065765B2 (en) | 2013-07-22 | 2015-06-23 | Seven Networks, Inc. | Proxy server associated with a mobile carrier for enhancing mobile traffic management in a mobile network |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5404514A (en) * | 1989-12-26 | 1995-04-04 | Kageneck; Karl-Erbo G. | Method of indexing and retrieval of electronically-stored documents |
US5943663A (en) * | 1994-11-28 | 1999-08-24 | Mouradian; Gary C. | Data processing method and system utilizing parallel processing |
US5901287A (en) * | 1996-04-01 | 1999-05-04 | The Sabre Group Inc. | Information aggregation and synthesization system |
US5970502A (en) * | 1996-04-23 | 1999-10-19 | Nortel Networks Corporation | Method and apparatus for synchronizing multiple copies of a database |
US5920854A (en) * | 1996-08-14 | 1999-07-06 | Infoseek Corporation | Real-time document collection search engine with phrase indexing |
US5870740A (en) * | 1996-09-30 | 1999-02-09 | Apple Computer, Inc. | System and method for improving the ranking of information retrieval results for short queries |
US5974412A (en) * | 1997-09-24 | 1999-10-26 | Sapient Health Network | Intelligent query system for automatically indexing information in a database and automatically categorizing users |
-
1996
- 1996-07-31 EP EP96305879A patent/EP0822502A1/en not_active Withdrawn
-
1997
- 1997-07-18 US US09/068,462 patent/US6178419B1/en not_active Expired - Lifetime
- 1997-07-18 WO PCT/GB1997/001949 patent/WO1998004979A1/en not_active Application Discontinuation
- 1997-07-18 EP EP97931963A patent/EP0917683A1/en not_active Ceased
- 1997-07-18 JP JP10508586A patent/JP2000516005A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012168984A (ja) * | 2000-03-29 | 2012-09-06 | Risk Monster Kk | 与信機能を備えた匿名電子商取引システム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
WO1998004979A1 (en) | 1998-02-05 |
US6178419B1 (en) | 2001-01-23 |
EP0917683A1 (en) | 1999-05-26 |
EP0822502A1 (en) | 1998-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000516005A (ja) | データアクセスシステム | |
US7877407B2 (en) | Method and apparatus for facilitating use of hypertext links on the world wide web | |
US9355178B2 (en) | Methods of and systems for searching by incorporating user-entered information | |
US8359550B2 (en) | Method for dynamically generating a “table of contents” view of the HTML-based information system | |
US6571240B1 (en) | Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases | |
JP4365074B2 (ja) | ユーザ定義可能なパーソナリティを備えた文書拡充システム | |
US6859800B1 (en) | System for fulfilling an information need | |
US8918401B1 (en) | Systems and methods for providing searchable prior history | |
US7636714B1 (en) | Determining query term synonyms within query context | |
US7774198B2 (en) | Navigation system for text | |
US20140052709A1 (en) | Document information management system | |
KR101393839B1 (ko) | 링크된 용어들을 포함하는 활성 요약들을 제공하는 검색시스템 | |
US20120131049A1 (en) | Search Tools and Techniques | |
US20020123994A1 (en) | System for fulfilling an information need using extended matching techniques | |
AU2019201531A1 (en) | An in-app conversational question answering assistant for product help | |
JPH11161682A (ja) | 情報検索装置、情報検索方法及び記録媒体 | |
JPH08305729A (ja) | ネットワーク情報フィルタリングシステム | |
CN1127031C (zh) | 以电子方式创建个性化文档的系统和方法 | |
Mills et al. | Providing world wide access to historical sources | |
Croft et al. | Search engines | |
McKee | Towards better integration of dynamic search technology and the World-Wide Web | |
Matthews et al. | Internationalising data access through LIMBER | |
WO2001024053A2 (en) | System and method for automatic context creation for electronic documents | |
Rowe | Exploiting captions for Web data mining | |
Ceric | Advancements and trends in the World Wide Web search |