JP7330891B2 - インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法 - Google Patents

インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法 Download PDF

Info

Publication number
JP7330891B2
JP7330891B2 JP2019545972A JP2019545972A JP7330891B2 JP 7330891 B2 JP7330891 B2 JP 7330891B2 JP 2019545972 A JP2019545972 A JP 2019545972A JP 2019545972 A JP2019545972 A JP 2019545972A JP 7330891 B2 JP7330891 B2 JP 7330891B2
Authority
JP
Japan
Prior art keywords
browser
web page
portal
enhanced
environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019545972A
Other languages
English (en)
Other versions
JP2020515944A5 (ja
JP2020515944A (ja
Inventor
ジェレミー・リー・エプスタイン
ジョシュア・アラン・デイヴィッドソン
マイケル・ディナ・ハンティントン
Original Assignee
オプセック・オンライン・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オプセック・オンライン・リミテッド filed Critical オプセック・オンライン・リミテッド
Publication of JP2020515944A publication Critical patent/JP2020515944A/ja
Publication of JP2020515944A5 publication Critical patent/JP2020515944A5/ja
Priority to JP2022148312A priority Critical patent/JP2022184964A/ja
Application granted granted Critical
Publication of JP7330891B2 publication Critical patent/JP7330891B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/14Tree-structured documents
    • G06F40/143Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/197Version control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services; Handling legal documents
    • G06Q50/184Intellectual property management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/018Certifying business or products
    • G06Q30/0185Product, service or business identity fraud
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection

Description

関連出願
本出願は、その内容全体が参照により本明細書に組み込まれる、2017年2月22日に出願された「Systems and Methods for Direct In-Browser Markup of Elements in Internet Content」と題する米国仮出願第62/462,110号の優先権の利益を主張する。
圧倒的な量のデジタルコンテンツは、インターネットなどのネットワーク化された環境上で利用可能である。このデジタルコンテンツは複数のデータチャネルおよび/またはソースにわたって拡散され、ますます多くのコンテンツが毎日利用可能になっている。コンテンツを生成するか、またはさもなければコンテンツをインターネットに追加するエンティティは、インターネット上のコンテンツのいくつかのバージョンまたはバリエーションを一度に有することができる。インターネット上のコンテンツの異なるバージョンまたはバリエーションを頻繁に識別および追跡し、異なるバージョンまたはバリエーションが本物であるかどうかおよび/または準拠しているかどうかを決定することは、コンテンツが1つまたは複数のインターネットデータチャネルまたはソースに追加され得るかまたはそれらから削除され得る流動性と、インターネット上の圧倒的な量のコンテンツとを考慮すると、困難である可能性がある。
いくつかのシステムは、1つまたは複数の検索に基づいてデジタルコンテンツのバルクプリハーベスティングを実施し、その後、デジタルコンテンツの「オフライン」解析を実施するが、この手法は非効率的でリソース集約的である可能性がある。加えて、デジタルコンテンツのバルクプリハーベスティングは、大量のデジタルコンテンツを収集する効果的な方法であり得るが、そのようなバルクハーベスティングは関連するデジタルコンテンツを見つけないことがあるかつ/またはプリハーベストされたデジタルコンテンツは最新ではないことがある(たとえば、デジタルコンテンツはデジタルコンテンツがプリハーベストされた後で変化することがあり、このことは、その後、ユーザが再度データソースからコンテンツを取り出して見直すことを必要とする)。
本開示の例示的な実施形態は、インターネットまたは他のネットワーク化された環境上のデジタルコンテンツ内の要素のバージョンまたはバリエーションを検出および追跡することに関連付けられた問題に有利に対処する。たとえば、コンテンツの大規模なバルクハーベスティングを潜在的に回避するかつ/またはバルクハーベストされたコンテンツ内のギャップを埋める一方で、ネットワーク化された環境におけるデジタルコンテンツ内の要素の直接的なブラウザ内の検索、閲覧、タグ付け、マークアップ、比較、およびハーベスティングを提供する、例示的なシステム、方法、およびコンピュータ可読媒体が本明細書で説明される。
したがって、従来の手法は一般に、(現在の実装を検証するための)後続のフォローアップを伴う、ネットワーク化された環境内のコンテンツからの要素(たとえば、画像、テキスト、マークアップ、リンクなど)の別個の事前収集と、ルールまたはハーベスティングアルゴリズムの作成とを含む2段階のプロセスを必要とするが、本開示の例示的な実施形態は、ユーザがライブコンテンツをブラウズしている間に、ネットワーク化された環境内のコンテンツの特定の要素を識別することを提供することができる。たとえば、同時に取り出されたウェブページ自体に関する直接的な指示を介した、デジタルコンテンツの要素のこの「ライブ」で直接的なブラウザ内の検出および追跡は、その後にポータルへの即時の組込みを続けることができ、ポータルを介した追加のコンテンツの「ライブ」の検索および見直しを可能にするために使用されることが可能であり、かつ/またはポータルによって実行されるコンテンツハーベスティングアルゴリズムの効率および正確さを高めることができる。
たとえば、例示的な実施形態は、コンテンツ内の悪性の要素を発見する精度を改善することができる。コンテンツ内の悪性の要素は、たとえば、現在のコンプライアンスルールに準拠することができないかつ/または不正である、侵害している、偽造であるなどの要素を含むことができる。コンテンツ内の良性の要素は、たとえば、現在のコンプライアンスルールに準拠する要素および/または許可されている、真正である、かつ/または本物である要素を含むことができる。本開示の実施形態は、フォールスポジティブ(たとえば、要素を悪性であるとして誤って識別する)を低減するかつ/またはネットワーク化された環境におけるコンテンツの構造の変化および/もしくはコンテンツ内の要素に適応するために必要とされる時間の量を低減する可能性を提供する。要素ベースの検出は、見つかった大量の悪性の要素を迅速かつシームレスにハーベスティング(発見)機構に追加するために強化型ブラウザまたはブラウザ拡張部もしくはウェブブラウザ用のプラグインの実施形態を介して利用され得、マークアップコンテキストを示すことに基づいて悪性の要素とフォールスポジティブを区別する能力を容易にすることができる。
本開示の実施形態によれば、ネットワーク化された環境内のデジタルコンテンツの直接的な同時のブラウザ内のマークアップ、タグ付け、比較、およびハーベスティングのための方法が開示される。方法は、強化型ブラウザ環境のブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にするために、コンピューティングリソース上で強化型ブラウザ環境(たとえば、強化型ブラウザまたはブラウザ拡張部がロードされたウェブブラウザ)を実行するステップを含む。強化型ブラウザ環境はポータルとインターフェースする。方法はまた、強化型ブラウザ環境を介してウェブページ内の特定の要素の選択を受信するステップと、タグを特定の要素に割り当てるステップと、ポータルによってタグを要素およびウェブページのユニバーサルリソースロケータ(URL)に関連付けるステップとを含む。
本開示の実施形態によれば、ネットワーク化された環境内のデジタルコンテンツの直接的なブラウザ内のマークアップ、タグ付け、比較、およびハーベスティングのためのシステムが開示される。システムは、ネットワークを介してアクセス可能なポータルを実行するようにプログラムされた1つまたは複数のサーバを有するリモートコンピューティングシステムを含む。システムはまた、ウェブブラウザおよびブラウザ拡張部がインストールされた少なくとも1つのコンピューティングデバイスを含み、ブラウザ拡張部は、ウェブブラウザの機能を拡張するようにプログラムされる。少なくとも1つのコンピューティングデバイスは、ブラウザ拡張部を介してウェブページ内の特定の要素の選択を受信し、タグを特定の要素に割り当て、タグをブラウザ拡張部からポータルに送ってタグを要素およびウェブページのユニバーサルリソースロケータ(URL)に関連付けるようにプログラムされる。
本開示の実施形態によれば、ネットワーク化された環境内のデジタルコンテンツの同時のブラウザ内のタグ付けおよびハーベスティングのためのシステムが開示され、このシステムにおいて、リモートコンピューティングシステムは、ネットワークを介してアクセス可能なポータルを実行するようにプログラムされた1つまたは複数のサーバを含む。少なくとも1つのコンピューティングデバイスは、ネットワークを介してポータルにアクセスすることができ、強化型ブラウザのブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にするようにプログラムされた強化型ブラウザを実行することを1つまたは複数のサーバに行わせることができ、強化型ブラウザは、ポータルとインターフェースすることができ、ウェブページ内の特定の要素の選択を受信することと、タグを特定の要素に割り当てることと、タグを要素およびウェブページのユニバーサルリソースロケータ(URL)に関連付けるようにポータルに要求することと、を行うようにプログラムされ得る。
実施形態の任意の組合せおよび/または置換が想定される。他の目的および特徴は、添付の図面とともに検討されると、以下の詳細な説明から明らかとなろう。しかしながら、図面は本開示の限定の定義としてではなく、例示のみとして設計されていることを理解されたい。
図面では、同様の参照番号は、非限定的で非網羅的な実施形態の様々な図全体を通じて同様の部分を指す。
本開示の実施形態による、ネットワーク化された環境におけるデジタルコンテンツ内の要素の直接的なブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングのための例示的な環境のブロック図である。 本開示の実施形態による、ネットワーク化された環境におけるデジタルコンテンツ内の要素の直接的なブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングのための別の例示的な環境のブロック図である。 本開示の実施形態による、インターネット上のデジタルコンテンツ内の要素の直接的なブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングを容易にするための例示的なネットワーク化された環境を示す図である。 本開示の実施形態による、例示的なサーバのブロック図である。 本開示の実施形態による、例示的なコンピューティングデバイスのブロック図である。 本開示の実施形態による、強化型ウェブブラウザまたはブラウザ拡張部の実施形態の例示的な実装形態を示す図である。 本開示の実施形態による、強化型ウェブブラウザまたはブラウザ拡張部の実施形態の例示的な実装形態を示す図である。 本開示の実施形態による、強化型ウェブブラウザまたはブラウザ拡張部の実施形態の例示的な実装形態を示す図である。 本開示の実施形態による、ネットワーク化された環境におけるコンテンツ内の要素の直接的な同時のブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングのための例示的なプロセスを示すフローチャートである。 本開示の実施形態による、直接的な同時のブラウザ内の、ウェブページ内の特定の要素のタグ付けならびにタグおよび/または特定の要素へのコンテキスト属性の割当てのための例示的なプロセスを示すフローチャートである。
本開示の例示的な実施形態は、ネットワーク化された環境におけるデジタルコンテンツ内の要素の直接的なライブのブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングのための、要素のブラウザ内のマークアップ、タグ付け、および/もしくはハーベスティングに基づいてハーベスティングアルゴリズムを自立的に更新するための、ならびに/またはコンテンツ内の要素のバージョンもしくはバリエーションを削除し、それらにフラグを立て、もしくはそれらを更新するための、システム、方法、および非一時的コンピュータ可読媒体に関する。
例示的な実施形態では、ウェブブラウザを強化するために実行され得る強化型ウェブブラウザまたはブラウザ拡張部(もしくはプラグイン)は、ブラウザに組み込まれた視覚機構を提供し、データソースから同時に取り出され、ブラウザのウィンドウにおいてレンダリングされる、コンテンツの特定の選択された要素(たとえば、コンテンツ内の画像、テキスト、マークアップ、リンクなど)に対して1つまたは複数のアクションを実施することができる。強化型ブラウザ環境への言及が強化型ブラウザおよび/またはブラウザ拡張部を指すように、強化型ブラウザおよびブラウザ拡張部は、ウェブブラウザとともに、本明細書では集合的にかつ交換可能に強化型ブラウザ環境と呼ばれる。強化型ブラウザ環境は、コンテンツのどの要素が良性であるかまたは悪性であるかの直接的な指示を容易にすることができる。この直接的で厳密なブラウザ内のアクティビティは、強化型ブラウザ環境と通信している1つまたは複数のハーベスティングエンジンによって実装される発見機構に直接供給することができる。
図1Aは、本開示の実施形態による、デジタルコンテンツの同時のブラウザ内の検索、閲覧、タグ付け、比較、およびハーベスティングのための環境100のブロック図である。図1Aに示されるように、環境100は、たとえば、デジタルコンテンツに関連付けられたユニフォームリソース識別子(URI:uniform resource identifier)またはユニフォームリソースロケータ(URL:uniform resource locator)に基づいて、1つまたは複数のサーバによってホストされるデジタルコンテンツを取り出し、表示するように構成されたウェブブラウザ110を含むことができる。たとえば、ウェブブラウザ110は、URIまたはURLを使用して1つまたは複数のウェブページ102の形態のデジタルコンテンツをホストする1つまたは複数のウェブサーバをクエリすることができ、URIまたはURLに基づいて1つまたは複数のウェブページ102を取り出し、表示することができる。デジタルコンテンツは、ハイパーテキストマークアップ言語ファイル、拡張可能マークアップ言語ファイル、ポータブルドキュメントフォーマット(PDF)、画像ファイル、オーディオファイル、ビデオファイル、および/または他のフォーマットなどの、1つまたは複数のファイルフォーマットを有することができる。
ウェブブラウザ110は、デジタルコンテンツをユーザに表示するために、1つまたは複数のサーバから取り出されたファイルを処理することができる。いくつかの事例では、1つまたは複数のプラグイン(たとえば、Flashアプリケーション、Java(登録商標)アプレット)は、ファイルを処理し、デジタルコンテンツをユーザに表示するために、ウェブブラウザ110によって使用され得る。たとえば、プラグインは、ウェブブラウザが本来ならば処理することができないはずのコンテンツ、たとえば、Flashビデオ、ポータブルドキュメントフォーマット(PDF)、またはJava(登録商標)アプレットを埋め込むウェブページ102をウェブブラウザが処理することを可能にすることができる。ウェブブラウザ110は、複数のブラウザウィンドウまたはブラウザタブにおいて同時にデジタルコンテンツを開くように構成される。たとえば、ウェブブラウザ110は、異なるブラウザウィンドウにおいてまたは同じウィンドウの異なるタブにおいてのいずれかで、同時に複数のウェブページ102を開くように構成され得る。
例示的な実施形態では、ウェブブラウザ110は、ウェブブラウザ110の機能を拡張するために、ブラウザコンテキストにおいて実行され得るブラウザ拡張部またはプラグイン120をロードするように構成され得る。たとえば、ブラウザ拡張部120は、ウェブブラウザ110を実行するコンピューティングリソース上にダウンロードおよびインストールされ得、ウェブブラウザ110は、コンピューティングリソースがウェブブラウザ110を起動してブラウザ拡張部120の機能をウェブブラウザ110に組み込むと、ブラウザ拡張部120を呼び出す(callまたはinvoke)ことができる。ブラウザ拡張部120は、1つまたは複数のグラフィカルユーザインターフェース124を生成するように構成された1つまたは複数のユーザインターフェース122と、バックグラウンドプロセス126と、マークアップオーバーレイ128とを含むことができる。
ブラウザ拡張部120は、ウェブブラウザ110およびブラウザ拡張部120がウェブブラウザ110のブラウザウィンドウに表示されているデジタルコンテンツおよび/または表示されているデジタルコンテンツに関連付けられたURLに応答する動的なブラウジング環境を提供するために、ウェブブラウザ110の機能を拡張することができる。例示的な実施形態では、ウェブブラウザ110およびブラウザ拡張部120の動的な振る舞いは、ブラウザ拡張部120のバックグラウンドプロセス126、マークアップオーバーレイ128とブラウザ110との間の、および/またはブラウザ拡張部120とネットワーク化された環境を介してブラウザ拡張部120によってアクセス可能なポータル140との間の対話に応答して達成され得る。
ブラウザ拡張部120の実行によってポータル140へのアクセスを容易にするために、ブラウザ拡張部120は、ユーザ名、アカウント識別子、パスワード、および/または他の認証情報をユーザに促すようにプログラムされ得る。ユーザがユーザ認証情報を入力すると、ブラウザ拡張部120は、認証のためにユーザ認証情報をポータル140に送信することができ、ポータル140は、ブラウザ拡張部120がポータル140にアクセスするのを許可するかまたは拒否することによって応答することができる。ユーザ認証情報が検証され、ブラウザ拡張部120がポータル140へのアクセスを許可された後、ブラウザ拡張部120は、ネットワーク化された環境内のコンテンツの同時のブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングを容易にするために、最終的には、ネットワーク化された環境からの悪性のコンテンツの除去を容易にするために、ウェブブラウザ110およびポータル140とともに実行され得る。いくつかの実施形態では、ブラウザ拡張部120にポータル140へのアクセスが許可されると、ポータル140は、ポータル140とブラウザ拡張部120との間のステートフル通信を容易にするために、ポータル140とブラウザ拡張部120との間のセッション(および関連するセッション識別子)を作成することができる。いくつかの実施形態では、ブラウザ拡張部120にポータル140へのアクセスが許可されると、ポータル140はトークンを生成し、トークンをブラウザ拡張部120に送信することができる。ブラウザ拡張部120がメッセージをポータル140に送るたびに、メッセージはステートフル通信および/またはステートレス通信を用いたポータル140へのアクセスを容易にするためのトークンを含むことができる。
ポータル140は、ブラウザ拡張部120とインターフェースするように構成された1つまたは複数のアプリケーションプログラムインターフェース(API)142を含むことができる。API142は、ブラウザ拡張部120から受信されたメッセージを処理することができ、応答をブラウザ拡張部120に送信することができる。ポータル140は、ユーザ識別子および/またはアカウント識別子ごとに、そのユーザ識別子および/またはアカウント識別子についてのブラウザ拡張部120および/またはポータル140によって処理されたURLに対応するレコードのセットを含む、1つまたは複数のデータベース160を含むことができる。各レコードは、レコードに関連付けられたURLに対応するデジタルコンテンツから抽出される属性のフィールドを含むことができ、レコードに関連付けられたURLに割り当てられたタグのフィールドおよび/またはブラウザ拡張部120を介してURLに追加されたマークアップテキストもしくは選択のフィールドを含むことができる。したがって、データベース160内の各レコード162は、ユーザ識別子164、アカウント識別子166、URL168、URLに関連付けられたデジタルコンテンツから抽出され、URLに関連付けられたデジタルコンテンツに追加される属性170、および/またはURLに割り当てられたタグ172を含み得る。これらのフィールドに加えて、各レコードは、レコードが最後に更新された日付を含むことができる。
ポータル140は、ハーベスティングアルゴリズムを実装するように構成された1つまたは複数のマルチチャネルハーベスティングエンジン146を含むことができる。ハーベスティングアルゴリズムは、ウェブ、ダークウェブを検索/クロールし、(マーケットプレイスウェブページを含む)ウェブページを検索するために検索エンジンおよび/またはAPIとインターフェースし、ソーシャルメディアフィードを収集し、潜在的なフィッシング電子メールおよびランディングページを収集し、モバイルアプリケーションおよび関連するデータを検索し、有料検索広告または著作権侵害イベントを収集し、かつ/またはネットワーク化された環境内の任意の他のデジタルコンテンツをキャプチャするように構成され得る。1つまたは複数のマルチチャネルハーベスティングエンジン146は、ハーベスティングアルゴリズムを使用して1つまたは複数のクエリ(たとえば、データベース、APIまたはウェブベースのクエリ)を生成または構築することができ、クエリは、グラフィカルユーザインターフェース144を介して1人または複数のユーザによって入力された1つまたは複数の検索語(たとえば、キーワード)および/またはユニフォームリソースロケータに基づくものとすることができ、かつ/あるいは、1つまたは複数のマルチチャネルハーベスティングエンジン146は、1つまたは複数のクエリを自立的に生成または構築することができる。例示的な実施形態では、ポータル140は、ブラウザ拡張部から受信されたデータに基づいて、ハーベスティングアルゴリズムを自立的に精緻化することができる。1つまたは複数のマルチチャネルハーベスティングエンジン146は、検索語の単一のセットからいくつかのクエリを構築するようにハーベスティングアルゴリズムを実装することができ、ここで、各クエリは、検索エンジンおよび/またはアプリケーションプログラムインターフェース(API)に固有のものとすることができる。
1つまたは複数のマルチチャネルハーベスティングエンジン146は、検索エンジンおよび/またはAPIを用いてクエリのうちの少なくともいくつかを実行することができ、このことは、URLもしくはインターネットコンテンツおよび/またはネットワーク化された環境内の任意の他のコンテンツを返すことができる。一例として、1つまたは複数のマルチチャネルハーベスティングエンジン146の実行は、1つまたは複数のデータソースにおける1つまたは複数のウェブサーバによってホストされる1つまたは複数のインターネットドメインからの1つまたは複数のURLまたはウェブページを返すことができる。いくつかの実施形態では、検索結果はリストとして返され得、1つまたは複数のマルチチャネルハーベスティングエンジン146はポータル140によって処理されるべき結果の量を制限することができる。非限定的な例として、1つまたは複数のマルチチャネルハーベスティングエンジン146は、たとえば、検索結果にリストされた最初の100個のURLもしくはウェブページ(または最初の10ページの検索結果)、または任意の適切な量の結果を選択することができる。1つまたは複数のマルチチャネルハーベスティングエンジン146を介して返された結果は、たとえば、ウェブページ、ソーシャルメディアフィード、潜在的なフィッシング電子メールおよびランディングページ、モバイルアプリケーションおよび関連するデータ、有料検索広告または著作権侵害イベントを含むことができる。
1つまたは複数のマルチチャネルハーベスティングエンジン146は、様々なデータチャネルおよび/またはデータソースの並行検索を容易にするようにプログラムされ得る。クエリは、構造化クエリ言語(SQL:Structured Query Language)、コンテキストクエリ言語(CQL:Contextual Query Language)、プロプライエタリクエリ言語、ドメイン固有のクエリ言語および/または任意の他の適切なクエリ言語などの、1つまたは複数のクエリ言語を使用して生成または構築され得る。いくつかの実施形態では、粗いハーベスティングエンジン146は、Java(登録商標)、C、C++、Perl、Rubyなどの1つまたは複数のプログラミング言語またはスクリプトを使用して、1つまたは複数のクエリを生成または構築することができる。
抽出エンジン148は、ハーベスティングエンジン146から返された結果をパースし、各結果(たとえば、各ウェブページ)から属性を抽出することができる。抽出エンジン148が各結果から属性を抽出すると、抽出エンジン148は属性の属性データベース130(たとえば、リレーショナルデータベースまたはNoSQLデータベース)を構築する。たとえば、レコードはハーベストされたデータセット117内の結果ごと(たとえば、ウェブページごと)に作成され得、結果から抽出される各属性はその対応するレコード内のフィールドに対応することができる。レコードを作成するために結果から抽出される属性は、各結果が良性のコンテンツに対応するかまたは悪性のコンテンツに対応するかを評価する際に有益であり得る情報を含むことができる。結果から抽出され、データベース130のフィールドに記憶される属性は、たとえば、ユニフォームリソースロケータ、ウェブページのドメインの登録者名、デジタルコンテンツをホストするサーバの名前、HTMLページソースコード、XMLファイル、Java(登録商標)スクリプトなどの生データ、製品名、製品説明、販売者名、サーバ、登録者、販売者の地理的ロケーション、販売者が製品を出荷する地理的ロケーション、販売者レビュー、結果のタイトル(たとえば、ウェブページのタイトル)、価格、購入可能である製品の量などの数字、マーケットプレイス固有の識別子、製品画像、ロゴおよび/またはアートワークなどの画像、ビデオおよび/またはオーディオなどの他のメディアなどとすることができる。
結果から属性を抽出するために、抽出エンジン148は、たとえば、自然言語処理、機械学習、類似尺度、画像マッチング技法、および/またはパターンマッチング技法を使用して、結果における属性を識別することができる。抽出エンジン148は、結果に含まれるエンティティ(たとえば、販売者)を導出および/または識別するために、エンティティの1つまたは複数のオントロジーを利用することができる。様々なアルゴリズムおよび/または技法が抽出エンジン148によって利用され得る。たとえば、Baeza-Yates-Gonnetなどの、ファジーテキストパターンマッチングのためのアルゴリズムは単一の文字列に使用され得、ファジーAho-Corasickは、複数の文字列マッチングに使用され得る。教師ありまたは教師なし文書分類技法のためのアルゴリズムは、ファジーAho-Corasickなどの複数の文字列ファジーテキストパターンマッチングアルゴリズムを使用して、また、潜在的ディリクレ配分(LDA:Latent Dirichlet Allocation)および階層ディリクレ過程(HDP:Hierarchical Dirichlet Process)などのトピックモデルを使用して、テキスト文書を数値ベクトルに変換した後に用いられ得る。
ブラウザ拡張部120を再度参照すると、1つまたは複数のグラフィカルユーザインターフェース124は、(たとえば、フレームとして)ウェブブラウザ110のウィンドウに埋め込まれ得る、かつ/またはポップアップウィンドウもしくはメニューとして選択的に表示され得る。グラフィカルユーザインターフェース124は、ユーザがブラウザ拡張部120と対話することを可能にすることができる。いくつかの実施形態では、1つまたは複数のグラフィカルユーザインターフェース124は、1つまたは複数のグラフィカルユーザインターフェース124が別個の異なるブラウザウィンドウとして形成されるように、別個のウィンドウとして生成され得る。
1つまたは複数のグラフィカルユーザインターフェース124は、情報をユーザに表示するためのデータ出力領域、および/または、ユーザによって選択され得る(たとえば、メニューオプション、選択ツール)かつ/またはユーザからの情報を受信するように構成され得るデータエントリフィールドを含むことができる。データ出力領域のいくつかの例は、限定はしないが、テキスト、図形(たとえば、グラフ、マップ-地理的なものまたはそれ以外のもの、画像など)、および/または任意の他の適切なデータ出力領域を含むことができる。データエントリフィールドのいくつかの例は、限定はしないが、テキストボックス、チェックボックス、ボタン、ドロップダウンメニュー、および/または任意の他の適切なデータエントリフィールドを含むことができる。
バックグラウンドプロセス126は、ブラウザウィンドウに表示されているデジタルコンテンツと対話し、ポータル140と対話するために、ウェブブラウザ110のコンテキストにおいて実行され得る。たとえば、バックグラウンドプロセス126は、ウェブブラウザ110がURLにナビゲートするときにポータル140からの情報を要求するために、メッセージをポータル140のAPI142に送ることができ、ブラウザウィンドウ内のURLに関連付けられたデジタルコンテンツのプレゼンテーションを修正するために、情報をブラウザ拡張部の1つもしくは複数のグラフィカルユーザインターフェース124に挿入するために、および/またはグラフィカルユーザインターフェース124を介してユーザによって選択され得るオプションもしくはアクションを動的に指定するために、ポータル140から受信された情報を使用することができる。
マークアップオーバーレイ128は、選択可能なオーバーレイをウェブブラウザ110のブラウザウィンドウ上で提供して、ユーザがブラウザウィンドウにおいてレンダリングされているコンテンツに関連付けられたソースコードまたはファイルと対話することを可能にするために実行され得る。たとえば、ユーザは、画像、テキスト、マークアップ、リンク、および/またはブラウザウィンドウにおいてレンダリングされるコンテンツの他の要素を、独立してかつ個別に選択、タグ付け、およびマークアップすることができる。
画像、テキスト、マークアップ、リンク、および/またはブラウザウィンドウにおいてレンダリングされるコンテンツの他の要素の独立した個別の選択、タグ付け、およびマークアップを容易にするために、ウェブページがウェブブラウザ110によってブラウザウィンドウにロードされるとき、ブラウザ拡張部120のマークアップオーバーレイ128は、ウェブページおよび/またはブラウザウィンドウとのユーザ対話を監視することができる。たとえば、マークアップオーバーレイ128は、動きイベント(たとえば、マウスの動き、キーストローク、タッチスクリーン上のユーザジェスチャ)、選択イベント(たとえば、マウス、ユーザジェスチャ、またはキーボードを介して、クリックすること、ダブルクリックすること、タップすること、ダブルタップすること)、およびホバーイベント(たとえば、特定のロケーション/要素に関連付けられた選択イベントを受信することなしにまたは受信する前に、カーソルまたはポインタが特定のロケーション/要素の上に置かれる)を監視することができる。いくつかの実施形態では、マークアップオーバーレイ128は、監視を容易にするためのスクリプトとして実行することができる。
マークアップオーバーレイ128を介してユーザ対話を監視することによって、ブラウザ拡張部120は、動きイベント、ホバーイベント、および/または選択イベントに応答して、1つまたは複数の要素に関連付けられた1つまたは複数のアクションを実施することができる。たとえば、各動きイベント、ホバーイベント、および/または選択イベントは、画像、テキスト、マークアップ、リンク、および/またはブラウザウィンドウにおいてレンダリングされるコンテンツの他の要素の独立した個別の選択、タグ付け、およびマークアップを容易にするためにマークアップオーバーレイ128によって使用され得るイベント信号を発することができる。イベント信号は、要素のサイズ、ウェブページ内の要素の位置、ならびに、ファイル名、要素に関連付けられたタグ、および画像、文字列、またはリンクなどの要素のタイプなどの、要素に関連付けられた他の属性を含むことができ、それらを確かめるために使用され得る。マークアップオーバーレイ128は、動きイベント、ホバーイベント、および/または選択イベントに関連付けられたイベント信号をリッスンし、各タイプのイベントが検出されたときに異なるアクションを実施することができる。一例として、(たとえば、ホバーイベント信号に基づいて)検出されたホバーイベントは、カーソルまたはポインタが動くときに要素を見つけてアウトライン化するために、マークアップオーバーレイ128によって使用され得る。別の例として、(たとえば、選択イベント信号に基づいて)検出された選択イベントは、コンテキストメニューを表示し、ユーザ入力/選択をキャプチャするために、マークアップオーバーレイ128によって使用され得る。
ホバリングの効果の1つの非限定的な例として、ユーザは、カーソルを動かしてウェブページ内のターゲット(たとえば、HTML要素)をホバーオーバーする(たとえば、ホバーイベント)ことができ、ユーザが現在ホバーオーバーしている要素を含むイベント信号(ホバーイベント信号)が発せられ得る。マークアップオーバーレイ128は、要素のサイズおよび/またはブラウザウィンドウ内の要素の位置を確かめるために、ウェブブラウザ110からのイベント信号を受信または傍受することができる。要素のサイズおよび位置に基づいて、マークアップオーバーレイ128は、ブラウザウィンドウにおいてレンダリングされる要素の周りに境界線を引くことができる。イベント信号に応答して、マークアップオーバーレイ128は、要素の属性(たとえば、画像のファイル名、要素に関連付けられたタグ、画像、文字列、リンクなどの要素のタイプ)を確かめることもできる。
別の例として、ユーザがブラウザウィンドウ内のウェブページの一部分をクリックするとき(たとえば、選択イベント)、イベント信号(たとえば、選択イベント信号)がウェブブラウザ110によって発せられ、マークアップオーバーレイ128は、(たとえば、ホバーイベント信号に基づいて)ホバーイベントが検出されたときに実施されるアクションとは異なるアクションを実施することができる。いくつかの実施形態では、ブラウザ拡張部120のマークアップオーバーレイ128は、選択イベントに関連付けられたデフォルトアクションがウェブブラウザ110によって実施されることを防止する、たとえば、ウェブページ内のリンクが選択された場合にウェブブラウザがページリダイレクトを実施することを防止することができる。代わりに、ブラウザ拡張部120のマークアップオーバーレイ128は、選択イベントに応答して、1つまたは複数のメニューおよび/または関連の補足情報をレンダリングする。マークアップオーバーレイ128は、選択された要素とカーソルまたはポインタの両方のロケーションを知ることができるので、選択された要素に対して、または、たとえばユーザのマウスのカーソルもしくはポインタの位置に対してメニューが表示され得る。1つまたは複数のメニューは、選択された要素の要素タイプ(たとえば、<p>タグの場合は文字列/句に関連するアクション、<img>タグの場合はロゴに関連するアクション)に基づいて、コンテキストオプション/情報を表示することができる。たとえば、要素が画像であるとき、オプションまたはアクションの第1のセットを有する第1のメニューが提示され得、要素が文字列であるとき、オプションまたはアクションの第2のセットを有する第2のメニューが提示され得、要素がリンクであるとき、オプションまたはアクションの第3のセットを有する第3のメニューが提示され得る。
メニューオプションまたはアクションのいくつかの例は、たとえば、選択された要素を良性または悪性であるものとして識別することと、選択された要素を良性または悪性であるものとして識別したことを支持してまたはそれに反対して、ウェブページからのコンテキスト属性を識別および選択することと、コンテンツから欠落しているまたはコンテンツにおいて予想される要素および/またはコンテキスト属性を識別することと、選択された要素、良性または悪性としての要素の識別、および/またはコンテキスト属性をハーベストしてポータル140にインポートすることと、を行う能力を含むことができる。一例として、ユーザは、オプションのメニューを介して、コンテンツ内の文字列、画像、および/またはリンクをコンテキスト属性として識別し、追加することができる。別の例として、ユーザは、ユーザがウェブページ内に存在すると予想しているが、存在していない、またはユーザがウェブページ内の1つもしくは複数の要素が準拠しているかどうかを決定するために必要とするであろう、要素またはコンテキスト属性を入力することができる。たとえば、ウェブページが特定の句または画像を含んでいるはずであるが、含んでいない場合、ユーザは、ブラウザ拡張部のグラフィカルユーザインターフェースおよびメニューを介して、特定の句または画像を欠落しているものとして通知および識別することができ、ブラウザ拡張部は、コンテンツについてのレコードとともに記憶させるために、新しいポリシーを生成するために、ならびに/またはコンテンツ、コンテンツ配信者、および/もしくはコンテンツ所有者に関連付けられたスコアを生成もしくは更新するために、このデータをポータル140に送ることができる。
いくつかの実施形態では、ブラウザ拡張部120は、ウェブブラウザによってレンダリングされるコンテンツのコンテキストに記入するために、一連の関連する質問をユーザに提示することができる。たとえば、ユーザがコンテンツ内の要素(たとえば、ウェブページ内のロゴ)をフォールスポジティブとして識別するとき、コンテキストメニューは、追加の適用可能な属性/メタデータをチェックするようにユーザに依頼することによって、追加の情報、たとえば、このブランド/バーティカル/アカウントについてコンテンツ(たとえば、ウェブページまたはサイト)が信頼できるまたは信頼できない、要素(たとえば、ロゴ)がこのサイト/コンテキストでの使用が認可されていない(このことは、なぜ要素が認可されていないのかに関する追加の情報をユーザに促すことをブラウザ拡張部に行わせることができる)、要素(たとえば、ロゴ)に関連付けられた言い回しが欠落している、といったことを要求するように動的に生成され得る。
コンテンツ内の要素について指定されたコンテキスト属性は、報告/カテゴリー化の傾向からポリシーを発見、作成、および精緻化するために、要素およびコンテンツについてのその他の情報とともに使用され得る。ポリシーとコンテキストとの間の関係は、潜在的にこれらの追加の質問を動的に提示するためにマッピングされ得る。同様のポリシーが生成されると、ポータル140は、1つまたは複数の機械学習アルゴリズムを訓練して、コンテキストメニューを動的に指定することができる。たとえば、ブラウザ拡張部を介したポータル140は、履歴データに基づいて1つまたは複数の問い合わせを自立的に生成することができる(たとえば、ポータル140は、「これはあなたが探しているものですか?」または「この文字列が現れる(現れない)ことを期待していましたか?」などとたずねる)。
例示的な実施形態では、マークアップオーバーレイ128は、ブラウザウィンドウにおいてレンダリングされるコンテンツの要素を、ブラウザウィンドウ内の要素をレンダリングするためにブラウザによって使用される基礎的なメモリ内バージョンのソースコードまたはファイルのそれらの対応するセグメントにマッピングすることができる。たとえば、ユーザは、マークアップオーバーレイ128を介して、ブラウザウィンドウにおいてレンダリングされるコンテンツに含まれる画像を選択することができ、このことによって画像をハイライトすることができる。画像の選択に応答して、マークアップオーバーレイ128は、画像に対応する基礎的なソースコードまたはファイルのセグメント(たとえば、画像のファイル名を含むことができる)を識別することができる。ユーザは、画像またはソースコードもしくはファイルの対応するセグメントをマーク付けまたはタグ付けする、データベースレコードを作成するかまたはデータベースレコードをポータル140に含めるために、たとえば、バックグラウンドプロセス126を介して、画像および/またはソースコードもしくはファイルの対応するセグメント(たとえば、ファイル名)をポータルに送信する、および/あるいは、ネットワーク化された環境内のコンテンツを発見するために、ポータルによって利用されるハーベスティングアルゴリズムを自立的に更新するなどの、1つまたは複数のオプションを実施するようにマークアップオーバーレイ128に命令するための1つまたは複数のオプションを選択することができる。
非限定的な例として、例示的な動作では、ウェブブラウザ110のインスタンスが起動されたとき、ウェブブラウザ110は、ユーザインターフェース122、バックグラウンドプロセス126、および/またはマークアップオーバーレイ128がウェブブラウザ110とともに実行されるように、ブラウザ拡張部120のインスタンスをロードする。ブラウザ拡張部120は、(たとえば、1つまたは複数のグラフィカルユーザインターフェース124を介して)ウェブブラウザ110のユーザからのユーザ認証情報を要求することができる。ユーザ認証情報を受信すると、ブラウザ拡張部120のバックグラウンドプロセス126は、ユーザ認証情報を含むメッセージをポータル140に送信することによって、ポータル140との接続を確立しようと試みることができる。ポータル140がユーザ認証情報を認証した後、ポータルは、ブラウザ拡張部120とポータル140との間で接続が確立されたことを示すメッセージをブラウザ拡張部120に送信し返す。
その後、ウェブブラウザ110は、関連するURLを有するウェブページ102にナビゲートすることができる。たとえば、ユーザは、ウェブブラウザ110のアドレスバーにURLを入力することができ、ブラウザウィンドウにおいてレンダリングされるコンテンツに埋め込まれたリンクを選択することができ、テキストを検索エンジンのデータエントリフィールドに入力することができ、かつ/またはグラフィカルユーザインターフェース124のうちの1つにおいてレンダリングされるURLのリストからURLを選択することができる。URLのリストは、ポータル140のハーベスティングエンジン146によって実装されるハーベスティングアルゴリズム148に基づいてポータル140によって生成され得、悪性の要素または良性の要素を含むコンテンツについて見直されるべきURLを表すことができる。
いくつかの実施形態では、ブラウザ拡張部120のバックグラウンドプロセス126は、ウェブブラウザ110がウェブページ102にナビゲートしたことに応答して、ウェブページ102のURLをメッセージに組み込むことができ、メッセージをポータル140のAPI142に送信する。API142は、メッセージに基づいて1つまたは複数のデータベースクエリを作成することができる。1つまたは複数のデータベースクエリは、ポータル140とブラウザ拡張部120との間の確立された接続に関連付けられたユーザ識別子および/またはアカウント番号に固有のメッセージにおいて受信されたURLに関連付けられたレコードについてデータベースを検索するように構造化され得る(たとえば、データベースクエリは、ウェブブラウザ110およびブラウザ拡張部120のユーザに関連付けられたレコードのセットの中のURLに対応するレコードを検索するように構成され得る)。
1つまたは複数のクエリの結果は、ポータル140のAPI142によってブラウザ拡張部120のバックグラウンドプロセス126に送信し返され得る。一例として、1つまたは複数のクエリに応答して、URLに対応するレコードが返されなかった場合、API142は、URLについてのレコードがないことを示すメッセージ(たとえば、メッセージは結果のヌルセットを含むことができる)を送信することができる。レコードが見つからなかったことを示すメッセージを受信したことに応答して、バックグラウンドプロセス126は、URLについてのレコードがないというユーザへのインジケータを生成するように1つまたは複数のグラフィカルユーザインターフェース124を制御することができ、URLについてのレコードがないことを示すインジケータを挿入するためにウェブページまたはウェブページに関連付けられたブラウザタブのプレゼンテーションを修正することができ、ウェブページ102の要素に関して選択または実施され得るオプションまたはアクションを動的に指定するためにマークアップオーバーレイと対話することができる。例示的な実施形態では、インジケータはグラフィカルアイコンとすることができ、ウェブページのプレゼンテーションは、ウェブページに関連付けられたソースコードを修正することによって修正され得る。
別の例として、いくつかの実施形態では、1つまたは複数のクエリに応答して、URLに対応するレコードが返された場合、API142は、URLについてのレコードがあることを示すメッセージを送信することができる。メッセージは、URLに対応するレコードに含まれる情報を含むことができる。たとえば、メッセージは、ウェブページ内の特定の要素についてのレコードに記憶された任意のタグおよび/またはマークアップを含むことができる。レコードが見つかったことを示すメッセージを受信したことに応答して、バックグラウンドプロセス126は、URLに関連付けられたタグを表示するように1つまたは複数のグラフィカルユーザインターフェース124を制御することができ、URLに割り当てられたタグおよび/またはマークアップのうちの1つに対応するインジケータを挿入するためにウェブページ102またはウェブページ102に関連付けられたブラウザタブのプレゼンテーションを修正することができる。たとえば、バックグラウンドプロセス126は、マークアップをメモリ内バージョンのソースコードに挿入するかつ/またはブラウザウィンドウにおいてレンダリングされているマークアップに関連付けられた要素をハイライトするために、マークアップオーバーレイ128と対話することができる。別の例として、ブラウザウィンドウに挿入されるインジケータはグラフィカルアイコンとすることができ、ウェブページ102のプレゼンテーションは、ウェブページ102内の要素のうちの1つまたは複数についてのインジケータを挿入するためにウェブページに関連付けられたソースコードを修正することによって修正され得る。
1つまたは複数のグラフィカルユーザインターフェース124は、1つまたは複数のグラフィカルユーザインターフェース124に提示される1つまたは複数のオプションの選択に応答して、ユーザがブラウザ拡張部120およびポータル140の動作を制御することを可能にすることができる。一例として、ユーザは、バックグラウンドプロセス126にウェブページの画像をキャプチャさせる、1つまたは複数のグラフィカルユーザインターフェース124内のオプションを選択することができ、この画像は、データベース160に記憶され、ウェブページに関連付けられたURLのレコードに関連付けられ得る。別の例として、ユーザは、マークアップオーバーレイ128にウェブページ内の要素および/またはその対応するソースコードのセグメントを選択させる、1つまたは複数のグラフィカルユーザインターフェース124内のオプションを選択することと、指定されたマークアップまたはタグを選択された要素および/またはその対応するソースコードのセグメントに割り当てることと、指定されたマークアップまたはタグを支持するウェブページ内のコンテキスト属性を識別することと、選択された要素、マークアップもしくはタグ、および/またはコンテキスト属性をハーベストすることと、ポータル140におけるデータベース内のレコードを作成または修正することとを行うことができる。ウェブページまたはウェブページの要素をハーベストすることは、ウェブページまたは要素から属性を抽出することと、抽出された属性ならびに属性が抽出されたウェブページのURLおよびウェブページの要素を含む、データベース内のレコードを作成または更新することとを含むことができる。ウェブページをハーベストすることを選択したことに応答して、バックグラウンドプロセス126および/またはポータル140は、(たとえば、抽出エンジン148を介して)ウェブページから属性を自立的に抽出してURLのレコードに追加することができる。
いくつかの実施形態では、バックグラウンドプロセス126および/またはポータル140は、ウェブページの特定の要素を自立的にタグ付けおよび/またはマークアップするように構成され得る。たとえば、バックグラウンドプロセス126および/またはポータル140は、タグを指定し、マークアップオーバーレイを介してウェブページのための要素を選択し、ならびに/または、タグおよび/もしくはマークアップに基づいてメモリ内バージョンのソースコードを修正するために、1つまたは複数の機械学習アルゴリズムを利用するように構成され得る。機械学習アルゴリズムは、ブラウザ拡張部を介してポータル140によって受信されたデータを含む訓練データのコーパスを使用して訓練され得る。
いくつかの実施形態では、ウェブページ内の要素は、以前に識別されたコンテンツおよび/またはコンテンツの以前に識別された要素(たとえば、画像またはテキスト)に関連付けられた、特定の知られているまたは学習された属性に基づいて、自立的にタグ付けおよび/またはマークアップされ得る。一例として、ウェブページ内の要素が指定されたファイル名を有する画像である場合、ポータル140は、画像がコンプライアンス基準に準拠しているかどうかおよび/または良性であるかどうかを決定するためにブラウザ拡張部120と対話することができる。ポータル140は、画像がコンプライアンス基準に準拠しているかどうかまたは良性であるかどうかを決定するために、画像/ピクセルマッチング、画像シグネチャもしくはハッシュ、および/または画像のファイル名についての文字列類似尺度を使用することができ、決定に基づいてウェブページ内の画像をタグ付けまたはマークアップするようにブラウザ拡張部に命令することができる。
例示的な実施形態では、ポータル140は、良性の要素および悪性の要素(たとえば、要素がコンプライアンスポリシー違反を示しているかどうか)を識別する際にユーザおよびパーサ(たとえば、抽出エンジン148)を支援するために、コンテキストをプログラムで決定および提供するように構成され得る。これを達成するために、ポータル140は、ブラウザ拡張部120からポータル140に返される特定のデータを利用して、汎用ルールまたは学習された振る舞いを生成することができる。
例示的な実施形態では、ブラウザ拡張部120は、ウェブブラウザ110が複数のブラウザウィンドウまたはブラウザタブを開き、各ブラウザウィンドウまたはブラウザタブにおいて異なるウェブページにナビゲートするように、ウェブブラウザ110を制御するように構成され得る。ウェブブラウザ110がこのような方法で動作するとき、ブラウザ拡張部120およびポータル140の例示的な実施形態は、ブラウザウィンドウまたはブラウザタブで開かれたあるウェブページからのURLを処理するとき、本明細書で説明される方法と同じまたは同様の方法で動作することができる。ブラウザ拡張部120およびポータル140が通信して、URLの各々についてデータベース160にレコードが存在するかどうかおよび/あるいはURLがタグ付けされているかどうかまたは特定の要素がタグ付けもしくはマークアップされているかどうかを決定した後、1つまたは複数のグラフィカルユーザインターフェース124は、ユーザがウェブページ内の要素のタグ付け、マークアップ、およびハーベスティングを個別に、グループもしくはサブセットで、および/または集合的に実施することを可能にするように構成され得る。たとえば、ウェブブラウザ110は、異なるウェブページが各ブラウザタブによってレンダリングされている状態で開かれる多量のブラウザタブを有することができる。各ウェブページは少なくとも1つの画像を含むことができ、ブラウザ拡張部120および/またはポータル140は、(たとえば、画像/ピクセルマッチング、シグネチャ/ハッシュに基づいて)ウェブページのうちのどれが画像の同一のインスタンスを含むかを決定することができ、その結果、ブラウザタブまたはブラウザウィンドウのうちの1つの中の画像に関して取られる任意のアクションは、画像のインスタンスをレンダリングしたブラウザウィンドウまたはブラウザタブごとに自動的に取られる。
1つの非限定的な適用例では、環境100の例示的な実施形態はブランド/エンティティ保護および完全性のために利用され得、デジタルコンテンツがブランド/エンティティに関連付けられた画像および/またはテキストを含むかどうか、デジタルコンテンツに含まれる画像および/またはテキストが認証されているかどうか、許可されているかどうか、ならびに/あるいはブランドまたはエンティティに関して確立されたコンプライアンスポリシーに準拠しているかどうかについての決定が行われる(たとえば、デジタルチャネルにわたるブランド/エンティティの存在が一様で一貫しているように、画像および/またはテキストのいくつかのバリエーションまたはバージョンは使用されることがあるが、他のバリエーションおよび/またはバージョンは使用されないことがある)。ポータル140は、デジタルコンテンツに含まれる画像および/またはテキストが認証されているかどうか、許可されているかどうか、ならびに/あるいはブランドまたはエンティティに関して確立されたコンプライアンスポリシーに準拠しているかどうかを決定するための特定のインジケータを、ウェブページ内の要素の形態でのブラウザ拡張部120からの入力、要素が認証されているか否か、許可されているか否か、および/またはブランドもしくはエンティティに関して確立されたコンプライアンスポリシーに準拠しているか否かを示す要素についてのマークアップもしくはタグ、ならびに/あるいは割り当てられたマークアップまたはタグを支持して識別されたウェブページ内のコンテキスト属性(周囲のテキストまたは画像、およびタイトルタグ、メタタグ、登録者情報、コンテンツのコンテンツ配信ネットワーク、新しいポリシー定義などのメタデータ)に基づいて定義し、識別することができる。
特定のインジケータは、ウェブページの結果のセット、ウェブページ内の要素、ウェブページを提供するデータソース、および/またはウェブページをデータソースに追加するエンティティの識別情報を精緻化するために利用され得る値を生成するためにポータル140によって使用され得る。インジケータは、各結果に割り当てられ得る全体的なポリシー違反スコアに重み付けされ得、ここで、ポリシー違反スコアは、結果がブランドまたはエンティティに関連付けられた要素の認証用途、許可用途、および/または準拠用途に対応する可能性のインジケータとすることができる。たとえば、スコアが低いほど、悪性である、たとえば、許可されていない、真正ではない、および/または準拠していない要素を結果が含む可能性が低くなる。ポータル140のユーザは、結果がユーザによって見直されるべき結果のセットに追加される前に結果が到達しなければならない最小スコアのしきい値を設定することができる。ポータル140内のパーサはポリシー違反スコアを計算することができ、ポリシー違反スコアは、フォールスポジティブおよび良性の結果が結果のセットに含まれないように、フォールスポジティブまたは良性の結果を(たとえば、それらのスコアに基づいて)フィルタにかけて除去するために、パーサによって使用され得る。
返される結果についての最小スコアしきい値がユーザによって構成可能であるとき、ポータル140は、しきい値を指定する1つまたは複数の方法を使用することができる。一例として、ポータル140は、グラフィカルユーザインターフェース144においてスライダーを生成して、しきい値を増加/減少させることができる。ポリシーはインジケータの集合とすることができ、ポリシーを形成する様々なインジケータに独立して重み付けする能力をユーザに与えるために、よりきめ細かい制御が提供され得る。
例示的な実施形態では、ブラウザ拡張部120からポータル140によって受信されたデータは、ブランドまたはエンティティに関連付けられた要素の認証用途、許可用途、および/または準拠用途を識別するための汎用インジケータを生成するために外挿され得る。ブラウザ拡張部から受信されたデータが、要素と要素に割り当てられたタグまたはマークアップとを含むだけでなく、割り当てられたタグまたはマークアップを支持してコンテキスト属性も含むとき、この外挿は強化され得る。
たとえば、ポータル140のハーベスティングエンジン146および抽出エンジン148は、フォールスポジティブとしてフラグが立てられたexpedia.comからの結果を返すことができる(たとえば、結果は良性であり、良性であるというタグまたはマークアップが割り当てられている)。ユーザが追加するコンテキストは、expedia.comは信頼できる旅行サイトのURLであり、評判の良い旅行サイトはブランド(たとえば、ブランドのロゴ)に関連付けられた要素を使用することを任されている/奨励されているという知識とすることができる。この特定の非限定的な例では、ユーザは、expedia.comを「旅行」というバーティカル内のブランドについての信頼できるサイトとして識別することができる。時間がたつにつれて、expedia.comというURL(潜在的に任意の形態の、expedia.comまたはその拡張部分とする)と、「旅行」というバーティカル内のブランド/エンティティ(たとえば、Jet Blue)との間のポジティブ相関関係が構築され得る。この例は、URLが古い/間違った/不正確なロゴを含む(ウェブサイト上のロゴのバージョン、ウェブページがブランドまたはエンティティに関して確立されたコンプライアンスポリシーに準拠していない)ので、ポジティブインジケータとして所与のURLまたはドメイン上のブランド固有の画像に依然としてマーク付けする一方で、そのURLまたはドメインが信頼できるものとして識別され得るように、さらに拡張され得る。
上記の例示的な例を続けると、旅行というバーティカル内のブランドについてのexpedia.comからの結果は、そのスコアを低減させることができる(このコンテキスト内では、低減の量はサイトがどのくらい信頼できるようになったかに依存する)が、それは、これらの結果が同様の履歴例に基づいてフォールスポジティブである可能性がより高いからである。要素、たとえば、旅行エンティティの特定のロゴは、ポジティブインジケータとして以前に識別された要素(たとえば、expedia.com上に含まれる特定のロゴが準拠していないことが分かった)に応答して、スコアの増加を受ける可能性がある。この手法を使用して、一般的なアサーションは特定のアサーションよりも重くなく重み付けされることになる。
例示的な実施形態では、たとえば、ウェブページ内の要素、要素が認証されているか否か、許可されているか否か、および/またはブランドもしくはエンティティに関して確立されたコンプライアンスポリシーに準拠しているか否かを示す要素についてのマークアップもしくはタグ、ならびに/あるいは割り当てられたマークアップまたはタグを支持して識別されたウェブページ内のコンテキスト属性(周囲のテキストまたは画像、およびタイトルタグ、メタタグ、登録者情報、コンテンツのコンテンツ配信ネットワーク、新しいポリシー定義などのメタデータ)などの様々な要因は、ポリシー違反スコアに寄与する可能性がある。(たとえば、ダイレクトプロバイダウェブサイトのような)いくつかのウェブページに対しては準拠しているが、他のウェブページ(たとえば、Expediaのようなサードパーティサイト)に対しては準拠していない要素(たとえば、ブランドロゴのバージョン)などの追加のコンテキストがブラウザ拡張部120のユーザによって追加され得、この場合、ユーザは新しいポリシー定義を含めることができる。
ポータル140は、ポータル140のグラフィカルユーザインターフェース144を介してユーザに表示されるために結果が到達しなければならない、ポリシー違反スコアの最小しきい値を定義することができる。たとえば、ポータル140は、たとえば、しきい値を下回るスコアは準拠していた同様の履歴結果を示す可能性があるので、フォールスポジティブである可能性がある結果がユーザに表示されることを防止するために、このしきい値に基づいて結果の一部をフィルタにかけて除去することができる。いくつかの実施形態では、最小しきい値は、ポータル140のユーザが返される結果のボリュームを制御することができるように、ポータル140のユーザによって指定され得る。
図1Bは、本開示の実施形態による、デジタルコンテンツの同時のブラウザ内の検索、閲覧、タグ付け、比較、およびハーベスティングのための環境100'のブロック図である。図1Bに示されるように、ポータル140の本実施形態は、図1Aを参照して上記で説明されたように、GUI144と、1つまたは複数のハーベスティングエンジン146と、抽出エンジン148と、(レコード162ごとにユーザ識別子164、アカウント識別子166、URL168、属性170、および/またはタグ172を含む)データベース160とを含むことができる。ポータル140は、図1Aを参照して本明細書で説明される動作および機能を実施することができる。
ポータル140の本実施形態は、図1Aを参照して上記で説明されたように、ユーザインターフェース112と、バックグラウンドプロセス126と、マークアップオーバーレイ128とを含む強化型ブラウザ145も含むことができる。ポータル140の本実施形態は、ブラウザ機能110'も含むことができる。例示的な実施形態では、強化型ブラウザ145は、ネットワーク化された環境内のコンテンツの同時のブラウザ内の検索、閲覧、マークアップ、タグ付け、比較、およびハーベスティングを実現するためにウェブブラウザ110およびブラウザ拡張部120の動作および機能を組み合わせることができ、最終的には、ネットワーク化された環境からの悪性のコンテンツの除去を容易にすることができる。強化型ブラウザ145は、たとえば、デジタルコンテンツに関連付けられたユニフォームリソース識別子(URI)またはユニフォームリソースロケータ(URL)に基づいて1つまたは複数のサーバによってホストされるデジタルコンテンツを取り出して表示するために、ブラウザ機能110'を実行することができる。たとえば、強化型ブラウザ145は、URIまたはURLを使用して、1つまたは複数のウェブページ102の形態のデジタルコンテンツをホストする1つまたは複数のウェブサーバをクエリすることができ、図1Aに示されるウェブブラウザ110と同じ方法で、URIまたはURLに基づいて1つまたは複数のウェブページ102を取り出して表示することができる。ブラウザ機能110'は、1つまたは複数のサーバから取り出されたウェブページまたはファイルを処理してデジタルコンテンツをユーザに表示するために実行され得、1つまたは複数のプラグイン(たとえば、Flashアプリケーション、Java(登録商標)アプレット)を使用することができる。強化型ブラウザ145は、複数のブラウザウィンドウまたはブラウザタブでデジタルコンテンツを同時に開くことができる。
強化型ブラウザ145は、強化型ブラウザ145が強化型ブラウザ145のブラウザウィンドウに表示されているデジタルコンテンツおよび/または表示されているデジタルコンテンツに関連付けられたURLに応答する、動的なブラウジング環境を提供することができる。例示的な実施形態では、強化型ブラウザ145の動的な振る舞いは、バックグラウンドプロセス126と、マークアップオーバーレイ128と、ブラウザ機能110'との間、および/または強化型ブラウザ145と、GUI144と、ハーベスティングエンジン146と、抽出エンジン148と、データベース160との間の対話に応答して達成され得る。
1つまたは複数のグラフィカルユーザインターフェース124は、ユーザが強化型ブラウザ145と対話することを可能にするために、(たとえば、フレームとして)強化型ブラウザ145のウィンドウに埋め込まれ得る、かつ/またはポップアップウィンドウもしくはメニューとして選択的に表示され得る。いくつかの実施形態では、1つまたは複数のグラフィカルユーザインターフェース124は、1つまたは複数のグラフィカルユーザインターフェース124が別個の異なるウィンドウとして形成されるように、別個のウィンドウとして生成され得る。
バックグラウンドプロセス126は、ブラウザウィンドウに表示されているデジタルコンテンツと対話し、ハーベスティングエンジン146、抽出エンジン148、およびデータベース160と対話するために、強化型ブラウザのコンテキストにおいて実行され得る。たとえば、バックグラウンドプロセス126は、強化型ブラウザ145がURLにナビゲートするときにハーベスティングエンジン146、抽出エンジン148、および/またはデータベース160からの情報を要求することができる。強化型ブラウザは、ブラウザウィンドウ内のURLに関連付けられたデジタルコンテンツのプレゼンテーションを修正するために、情報を1つもしくは複数のグラフィカルユーザインターフェース124に挿入するために、および/またはグラフィカルユーザインターフェース124を介してユーザによって選択され得るオプションもしくはアクションを動的に指定するために、情報を使用することができる。
マークアップオーバーレイ128は、選択可能なオーバーレイを強化型ブラウザ145のブラウザウィンドウ上で提供して、ユーザが強化型ブラウザ145のブラウザウィンドウにおいてレンダリングされているコンテンツに関連付けられたソースコードまたはファイルと対話することを可能にするために実行され得る。たとえば、ユーザは、本明細書で説明されるように、マークアップオーバーレイ128を介して、画像、テキスト、マークアップ、リンク、および/またはブラウザウィンドウにおいてレンダリングされるコンテンツの他の要素を、独立してかつ個別に選択、タグ付け、およびマークアップすることができる。たとえば、本明細書で説明されるように、画像、テキスト、マークアップ、リンク、および/またはブラウザウィンドウにおいてレンダリングされるコンテンツの他の要素の独立した個別の選択、タグ付け、およびマークアップを容易にするために、ウェブページが強化型ブラウザ145によってブラウザウィンドウにロードされるとき、強化型ブラウザ145のマークアップオーバーレイ128は、ウェブページおよび/またはブラウザウィンドウとのユーザ対話を監視することができる。たとえば、マークアップオーバーレイ128は、動きイベント(たとえば、マウスの動き、キーストローク、タッチスクリーン上のユーザジェスチャ)、選択イベント(たとえば、マウス、ユーザジェスチャ、またはキーボードを介して、クリックすること、ダブルクリックすること、タップすること、ダブルタップすること)、およびホバーイベント(たとえば、特定のロケーション/要素に関連付けられた選択イベントを受信することなしにまたは受信する前に、カーソルまたはポインタが特定のロケーション/要素の上に置かれる)を監視することができる。いくつかの実施形態では、マークアップオーバーレイ128は、監視を容易にするためのスクリプトとして実行することができる。マークアップオーバーレイ128を介してユーザ対話を監視することによって、強化型ブラウザ145は、図1Aを参照して本明細書で説明されたように、動きイベント、ホバーイベント、および/または選択イベントに応答して、1つまたは複数の要素に関連付けられた1つまたは複数のアクションを実施することができる。
非限定的な例として、強化型ブラウザ145は、関連するURLを有するウェブページ102にナビゲートすることができる。たとえば、ユーザは、強化型ブラウザ145のアドレスバーにURLを入力することができ、強化型ブラウザ145のブラウザウィンドウにおいてレンダリングされるコンテンツに埋め込まれたリンクを選択することができ、テキストを検索エンジンのデータエントリフィールドに入力することができ、かつ/またはグラフィカルユーザインターフェース124のうちの1つにおいてレンダリングされるURLのリストからURLを選択することができる。URLのリストは、ポータル140のハーベスティングエンジン146によって実装されるハーベスティングアルゴリズム148に基づいてポータル140によって生成され得、悪性の要素または良性の要素を含むコンテンツについて見直されるべきURLを表すことができる。
いくつかの実施形態では、強化型ブラウザ145のバックグラウンドプロセス126は、ウェブページ102のURLに基づいて1つまたは複数のデータベースクエリを作成することができる。1つまたは複数のデータベースクエリは、ユーザ識別子および/またはアカウント番号に固有のURLに関連付けられたレコードについてデータベースを検索するように構造化され得る。1つまたは複数のクエリに応答して、URLに対応するレコードが返されなかった場合、URLについてのレコードがないことを示すメッセージ(たとえば、メッセージは結果のヌルセットを含むことができる)が強化型ブラウザ145に返され得、バックグラウンドプロセス126は、URLについてのレコードがないというユーザへのインジケータを生成するように1つまたは複数のグラフィカルユーザインターフェース124を制御することができ、URLについてのレコードがないことを示すインジケータを挿入するためにウェブページまたはウェブページに関連付けられたブラウザタブのプレゼンテーションを修正することができ、ウェブページ102の要素に関して選択または実施され得るオプションまたはアクションを動的に指定するためにマークアップオーバーレイと対話することができる。例示的な実施形態では、インジケータはグラフィカルアイコンとすることができ、ウェブページのプレゼンテーションは、ウェブページに関連付けられたソースコードを修正することによって修正され得る。
別の例として、いくつかの実施形態では、1つまたは複数のクエリに応答して、URLに対応するレコードが返された場合、URLに対応するレコードに含まれる情報が返され得、バックグラウンドプロセス126は、URLに関連付けられたタグを表示するように1つまたは複数のグラフィカルユーザインターフェース124を制御することができ、URLに割り当てられたタグおよび/またはマークアップのうちの1つに対応するインジケータを挿入するためにウェブページ102またはウェブページ102に関連付けられたブラウザタブのプレゼンテーションを修正することができる。たとえば、バックグラウンドプロセス126は、マークアップをメモリ内バージョンのソースコードに挿入するかつ/またはブラウザウィンドウにおいてレンダリングされているマークアップに関連付けられた要素をハイライトするために、マークアップオーバーレイ128と対話することができる。別の例として、ブラウザウィンドウに挿入されるインジケータはグラフィカルアイコンとすることができ、ウェブページ102のプレゼンテーションは、ウェブページ102内の要素のうちの1つまたは複数についてのインジケータを挿入するためにウェブページに関連付けられたソースコードを修正することによって修正され得る。
1つまたは複数のグラフィカルユーザインターフェース124は、1つまたは複数のグラフィカルユーザインターフェース124に提示される1つまたは複数のオプションの選択に応答して、ユーザが強化型ブラウザ145の動作を制御することを可能にすることができる。一例として、ユーザは、バックグラウンドプロセス126にウェブページの画像をキャプチャさせる、1つまたは複数のグラフィカルユーザインターフェース124内のオプションを選択することができ、この画像は、データベース160に記憶され、ウェブページに関連付けられたURLのレコードに関連付けられ得る。別の例として、ユーザは、マークアップオーバーレイ128にウェブページ内の要素および/またはその対応するソースコードのセグメントを選択させる、1つまたは複数のグラフィカルユーザインターフェース124内のオプションを選択することと、指定されたマークアップまたはタグを選択された要素および/またはその対応するソースコードのセグメントに割り当てることと、指定されたマークアップまたはタグを支持するウェブページ内のコンテキスト属性を識別することと、選択された要素、マークアップもしくはタグ、および/またはコンテキスト属性をハーベストすることと、データベース160内のレコードを作成または修正することとを行うことができる。
いくつかの実施形態では、バックグラウンドプロセス126は、ウェブページの特定の要素を自立的にタグ付けおよび/またはマークアップするように構成され得る。たとえば、バックグラウンドプロセス126は、タグを指定し、マークアップオーバーレイを介してウェブページのための要素を選択し、ならびに/または、タグおよび/もしくはマークアップに基づいてメモリ内バージョンのソースコードを修正するために、1つまたは複数の機械学習アルゴリズムを利用するように構成され得る。機械学習アルゴリズムは、GUI144、ハーベスティングエンジン146、および抽出エンジン148から受信されたデータを含む訓練データのコーパスを使用して訓練され得る。
いくつかの実施形態では、ウェブページ内の要素は、以前に識別されたコンテンツおよび/またはコンテンツの以前に識別された要素(たとえば、画像またはテキスト)に関連付けられた、特定の知られているまたは学習された属性に基づいて、自立的にタグ付けおよび/またはマークアップされ得る。一例として、ウェブページ内の要素が指定されたファイル名を有する画像である場合、強化型ブラウザ145は、たとえば、画像/ピクセルマッチング、画像シグネチャもしくはハッシュ、および/または画像のファイル名についての文字列類似尺度に基づいて、画像がコンプライアンス基準に準拠しているかどうかおよび/または良性であるかどうかを決定することができ、決定に基づいてウェブページ内の画像をタグ付けまたはマークアップすることができる。
例示的な実施形態では、ポータル140は、良性の要素および悪性の要素(たとえば、要素がコンプライアンスポリシー違反を示しているかどうか)を識別する際にユーザおよびパーサ(たとえば、抽出エンジン148)を支援するために、コンテキストをプログラムで決定および提供するように構成され得る。これを達成するために、ポータル140は、強化型ブラウザ145からポータル140に返される特定のデータを利用して、汎用ルールまたは学習された振る舞いを生成することができる。
例示的な実施形態では、強化型ブラウザ145は、複数のブラウザウィンドウまたはブラウザタブを開き、各ブラウザウィンドウまたはブラウザタブにおいて異なるウェブページにナビゲートする。強化型ブラウザ145がこのような方法で動作するとき、強化型ブラウザ145の例示的な実施形態は、ブラウザウィンドウまたはブラウザタブで開かれたあるウェブページからのURLを処理するとき、本明細書で説明される方法と同じまたは同様の方法で動作することができる。ポータル140が、URLの各々についてデータベース160にレコードが存在するかどうかおよび/あるいはURLがタグ付けされているかどうかまたは特定の要素がタグ付けもしくはマークアップされているかどうかを決定した後、1つまたは複数のグラフィカルユーザインターフェース124は、ユーザがウェブページ内の要素のタグ付け、マークアップ、およびハーベスティングを個別に、グループもしくはサブセットで、および/または集合的に実施することを可能にするように構成され得る。たとえば、強化型ブラウザ145は、異なるウェブページが各ブラウザタブによってレンダリングされている状態で開かれる多量のブラウザタブを有することができる。各ウェブページは少なくとも1つの画像を含むことができ、強化型ブラウザ145は、(たとえば、画像/ピクセルマッチング、シグネチャ/ハッシュに基づいて)ウェブページのうちのどれが画像の同一のインスタンスを含むかを決定することができ、その結果、ブラウザタブまたはブラウザウィンドウのうちの1つの中の画像に関して取られる任意のアクションは、画像のインスタンスをレンダリングしたブラウザウィンドウまたはブラウザタブごとに自動的に取られる。
ポータル140は、デジタルコンテンツに含まれる画像および/またはテキストが認証されているかどうか、許可されているかどうか、ならびに/あるいはブランドまたはエンティティに関して確立されたコンプライアンスポリシーに準拠しているかどうかを決定するための特定のインジケータを、ウェブページ内の要素の形態での強化型ブラウザ145からの入力、要素が認証されているか否か、許可されているか否か、および/またはブランドもしくはエンティティに関して確立されたコンプライアンスポリシーに準拠しているか否かを示す要素についてのマークアップもしくはタグ、ならびに/あるいは割り当てられたマークアップまたはタグを支持して識別されたウェブページ内のコンテキスト属性(周囲のテキストまたは画像、およびタイトルタグ、メタタグ、登録者情報、コンテンツのコンテンツ配信ネットワーク、新しいポリシー定義などのメタデータ)に基づいて定義し、識別することができる。特定の(重み付けされた)インジケータは、本明細書で説明されるように(たとえば、値、すなわち、ポリシー違反スコアを生成するために)ポータル140によって使用され得る。
強化型ブラウザの一実施形態はポータルの一実施形態に含まれるものとして説明されているが、例示的な実施形態では、強化型ブラウザは、図1Aを参照して説明されたブラウザ拡張部の実施形態と同様の方法でポータルとインターフェースするスタンドアロンアプリケーションとすることができる。1つの非限定的な例として、ネイティブデスクトップアプリケーションは、ブラウザまたはwebkitもしくはblinkなどのブラウザエンジンを埋め込むかまたは組み込むことができ、ネイティブデスクトップアプリケーションは、強化型ブラウザを形成することができる。
図2は、本開示の実施形態による、インターネットまたは他のネットワーク化された環境上のデジタルコンテンツおよび/またはデジタルコンテンツ内の要素の同時のブラウザ内の検索、閲覧、タグ付け、比較、およびハーベスティングを容易にするための例示的なネットワーク化された環境200である。環境200は、ユーザコンピューティングデバイス210~212と、リモートコンピューティングシステム220~223と、通信ネットワーク290とを含む。
図2に示されるように、ユーザコンピューティングデバイス210はウェブブラウザ110およびブラウザ拡張部120を含み、コンピューティングデバイス212は強化型ブラウザ145を含む。たとえば、コンピューティングデバイス212上に含まれる強化型ブラウザ145は、ブラウザまたはwebkitもしくはblinkなどのブラウザエンジンを埋め込むかまたは組み込むネイティブデスクトップアプリケーションとすることができる。コンピューティングデバイス212上のネイティブデスクトップアプリケーションとして強化型ブラウザ145を実装することは、セキュリティまたはサンドボックスの制約が別個のブラウザ拡張部の何らかの機能を妨げることになる場合に有益であり得る。ユーザコンピューティングデバイス211は、リモートコンピューティングシステム220においてユーザコンピューティングデバイス211用の仮想デスクトップ230を作成するためにリモートコンピューティングシステム220とインターフェースするように構成されたクライアント側アプリケーション215を含む。リモートコンピューティングシステム220は、仮想デスクトップ230を実装するように構成され、ウェブブラウザ110およびブラウザ拡張部120を含む、1つまたは複数のサーバ231を含むことができ、その結果、1つまたは複数のサーバ231は、ユーザコンピューティングデバイス211の代わりに、ユーザコンピューティングデバイス211から受信された命令に応答して、ウェブブラウザ110およびブラウザ拡張部120がユーザコンピューティングデバイス211において実行されているかのように、ウェブブラウザ110およびブラウザ拡張部120を実行する。
リモートコンピューティングシステム221~222は、それぞれ、デジタルコンテンツをホストするように構成された1つまたは複数のサーバ240および250を含むことができる。たとえば、1つまたは複数のサーバ240および250は、それぞれ、ウェブサイト241および251をホストするように構成されたウェブサーバとして実装され得、ここで、ウェブサイト241および251は、それぞれ、ウェブページ242および252を含む。ユーザコンピューティングデバイス210およびリモートコンピューティングシステム220によって実装されるウェブブラウザ110は、それぞれ、サーバ240および250によってホストされるウェブサイト241および251にナビゲートするように構成され得る。
リモートコンピューティングシステム223は、ポータル140を実装するように構成された1つまたは複数のサーバ260を含むことができ、1つまたは複数のデータベース160を含むことができる。いくつかの実施形態では、ポータル140は、強化型ブラウザ145の一実施形態を含んでもよく、含まなくてもよい。当業者は、サーバ260のうちの1つまたは複数がデータベース160を含むことができるように、データベース160がサーバ260のうちの1つまたは複数に組み込まれ得ることを認識されよう。いくつかの実施形態では、ポータル140を実行する1つまたは複数のサーバ260は、ポータル140によって処理されるべきウェブページにアクセスし、ウェブページを取り出すために、それぞれ、リモートコンピューティングシステム221~222のサーバ250および260と対話することができる。
通信ネットワーク290は、ネットワークに通信可能に結合されたデバイスの間で情報が送信され得る任意のネットワークとすることができる。たとえば、通信ネットワーク290は、インターネット、イントラネット、仮想プライベートネットワーク(VPN)、ワイドエリアネットワーク(WAN)、ローカルエリアネットワーク(LAN)などとすることができる。
例示的な動作では、強化型ブラウザ環境のインスタンスは、ユーザコンピューティングデバイス210もしくは212および/または1つもしくは複数のサーバ260もしくは231によって起動される。強化型ブラウザ環境は、たとえば、強化型ブラウザ145のインスタンスまたはブラウザ拡張部120がロードされたウェブブラウザ110のインスタンスとすることができる。ユーザインターフェース122、バックグラウンドプロセス126、およびマークアップオーバーレイ128は、ユーザコンピューティングデバイス210もしくは212および/または1つもしくは複数のサーバ260もしくは231によって強化型ブラウザ環境とともに実行され得る。強化型ブラウザ環境がブラウザ拡張部120を含む実施形態の場合、ブラウザ拡張部120は、(たとえば、1つまたは複数のグラフィカルユーザインターフェース124を介して)ウェブブラウザ110のユーザからのユーザ認証情報を要求する。ユーザ認証情報を受信すると、ブラウザ拡張部のバックグラウンドプロセス126は、ユーザ認証情報を含むメッセージをリモートコンピューティングシステム223に送信することによって、リモートコンピューティングシステム223との接続を確立しようと試みるために、ユーザコンピューティングデバイス210および/または1つもしくは複数のサーバ231によって実行され得る。1つまたは複数のサーバ260は、ユーザ認証情報を認証するためにポータル140を実行することができ、1つまたは複数のサーバ260は、ポータル140の動作に応答して、ユーザコンピューティングデバイス210または1つもしくは複数のサーバ231と1つまたは複数のサーバ260との間の接続が確立されたことを示すためのメッセージをブラウザ拡張部120に送信し返すことができる。強化型ブラウザ環境が強化型ブラウザ145を含む実施形態の場合、ユーザは、強化型ブラウザにアクセスするために、ユーザ認証情報を使用してポータルにログインすることができる。
その後、強化型ブラウザ環境は、URLに基づいてリモートコンピューティングシステム221または222のサーバをクエリすることによって、関連するURLを有するウェブページ102にナビゲートすることができる。クエリされたサーバは、ウェブページを、強化型ブラウザ145を実行するユーザコンピューティングシステム210もしくは212および/または1つもしくは複数のサーバ260もしくは231に返すことができ、強化型ブラウザ145は、強化型ブラウザ環境のブラウザウィンドウ内のウェブページをレンダリングし、ウェブページについてのメモリ内バージョンのソースコードをメモリに(たとえば、ユーザコンピューティングデバイス210もしくは212に関連付けられたメモリに、または1つもしくは複数のサーバ260もしくは231に関連付けられたメモリに)記憶することができる。強化型ブラウザ環境がウェブページ102にナビゲートしたことに応答して、強化型ブラウザ環境のバックグラウンドプロセス126は、ウェブページのURLをメッセージに組み込み、ポータル140によって処理するためにメッセージを1つまたは複数のサーバ260に送信することができ(このことは、メッセージに基づいて1つまたは複数のデータベースクエリを作成することができる)、または、バックグラウンドプロセス126は、1つまたは複数のデータベースを直接クエリすることができる。1つまたは複数のデータベースクエリは、強化型ブラウザ環境のユーザ(たとえば、ユーザコンピューティングデバイス210と1つもしくは複数のサーバ260との間の、および/または1つもしくは複数のサーバ231と1つもしくは複数のサーバ260との間の、および/またはポータル140にログインするユーザに基づく、確立された接続)に関連付けられたユーザ識別子および/またはアカウント識別子に固有のメッセージにおいて受信されたURLに関連付けられたレコードについてデータベースを検索するように構造化され得、たとえば、データベースクエリは、強化型ブラウザ環境のユーザに関連付けられたレコードのセットの中のURLに対応するレコードを検索するように構成され得る。1つまたは複数のクエリの結果は、本明細書で説明されるように、強化型ブラウザ環境のバックグラウンドプロセス126によって処理するために、1つまたは複数のサー
バ260によって強化型ブラウザ環境を実行するデバイスに送信し返され得る。強化型ブラウザ環境がサーバ260によって実行されている実施形態の場合、バックグラウンドプロセスは、データベース160からの結果をクエリし、受信することができる。
図3は、本開示の実施形態による、例示的なサーバ300のブロック図である。本実施形態では、サーバ300は、ポータル140の動作および/または機能のうちの1つまたは複数を実行するようにプログラムされ、かつ/または構成される。サーバ300は、例示的な実施形態を実装するための1つまたは複数のコンピュータ実行可能命令またはソフトウェアを記憶するための1つまたは複数の非一時的コンピュータ可読媒体を含む。非一時的コンピュータ可読媒体は、限定はしないが、1つまたは複数のタイプのハードウェアメモリ、非一時的有形媒体(たとえば、1つまたは複数の磁気ストレージディスク、1つまたは複数の光ディスク、1つまたは複数のフラッシュドライブ)などを含み得る。たとえば、サーバ300に含まれるメモリ306は、ポータル140の例示的な実施形態またはそれらの部分を実装するためのコンピュータ可読およびコンピュータ実行可能命令またはソフトウェアを記憶し得る。
サーバ300は、メモリ306に記憶されたコンピュータ可読およびコンピュータ実行可能命令またはソフトウェアならびにシステムハードウェアを制御するための他のプログラムを実行するための、構成可能および/またはプログラム可能プロセッサ302ならびに関連するコア304、任意選択で、1つまたは複数の追加の構成可能および/またはプログラム可能プロセッサ302'ならびに関連するコア304'(たとえば、複数のプロセッサ/コアを有するコンピュータシステムの場合)も含む。プロセッサ302およびプロセッサ302'は各々、シングルコアプロセッサまたはマルチコア(304および304')プロセッサであり得る。
コンピューティングデバイス内のインフラストラクチャおよびリソースが動的に共有され得るように、サーバ300において仮想化が用いられ得る。1つまたは複数の仮想マシン314は、処理が複数のコンピューティングリソースではなく1つのみのコンピューティングリソースを使用しているように見えるように、複数のプロセッサ上で動作する処理を扱うために、ならびに/またはポータル140に関連付けられた機能および動作を実施するためのコンピューティングリソースを割り振るために提供され得る。複数の仮想マシンは、1つのプロセッサとともに使用されることもあり、またはいくつかのプロセッサにわたって分散され得る。
メモリ306は、コンピュータシステムメモリまたはDRAM、SRAM、EDO RAMなどのランダムアクセスメモリを含み得る。メモリ306は、他のタイプのメモリまたはそれらの組合せも含み得る。
サーバ300は、本明細書で説明されるポータル140の例示的な実施形態を実装するために処理デバイス302によって実行され得るデータならびにコンピュータ可読命令および/またはソフトウェアを記憶するための、ハードドライブ、CD-ROM、マスストレージフラッシュドライブ、または他のコンピュータ可読媒体などの1つまたは複数のストレージデバイス324も含み得る。
サーバ300は、限定はしないが、標準電話回線、LANリンクもしくはWANリンク(たとえば、802.11、T1、T3、56kb、X.25)、ブロードバンド接続(たとえば、ISDN、フレームリレー、ATM)、ワイヤレス接続(セルラー基地局経由を含む)、コントローラエリアネットワーク(CAN)、または上記のいずれかもしくはすべての何らかの組合せを含む様々な接続を通じて、1つまたは複数のネットワーク、たとえば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)またはインターネットと1つまたは複数のネットワークデバイス322を介してインターフェースするように構成されたネットワークインターフェース312を含むことができる。ネットワークインターフェース312は、内蔵ネットワークアダプタ、ネットワークインターフェースカード、PCMCIAネットワークカード、カードバスネットワークアダプタ、ワイヤレスネットワークアダプタ、USBネットワークアダプタ、モデム、または、通信と本明細書で説明される動作を実施することとが可能な任意のタイプのネットワークにサーバ300をインターフェースするのに適している任意の他のデバイスを含み得る。図3に図示されるサーバ300はサーバとして実装されるが、サーバ300の例示的な実施形態は、ワークステーション、デスクトップコンピュータ、または、ワイヤレス通信もしくはワイヤード通信のいずれかによって他のデバイスとの通信が可能であり、本明細書で説明される動作を実施するのに十分なプロセッサパワーおよびメモリ容量を有する他の形態のコンピューティングデバイスもしくは電気通信デバイスなどの、任意のコンピュータシステムとすることができる。
サーバ300は、任意のUnixベースのサーバアプリケーション、Linux(登録商標)ベースのサーバアプリケーション、任意のプロプライエタリサーバアプリケーション、またはサーバ300上で動作し、本明細書で説明される動作を実施することが可能な任意の他のサーバアプリケーションを含む、サーバアプリケーションのバージョンのうちのいずれかなどの、任意のサーバアプリケーション316を動作させ得る。コンピューティングデバイス上で動作することができるサーバアプリケーションの一例は、Apacheサーバアプリケーションを含む。
図4は、ウェブブラウザ110およびブラウザ拡張部120の例示的な実施形態を実装するために使用され得る例示的なユーザコンピューティングデバイス400のブロック図である。コンピューティングデバイス400は、例示的な実施形態を実装するための1つまたは複数のコンピュータ実行可能命令またはソフトウェアを記憶するための1つまたは複数の非一時的コンピュータ可読媒体を含む。非一時的コンピュータ可読媒体は、限定はしないが、1つまたは複数のタイプのハードウェアメモリ、非一時的有形媒体(たとえば、1つまたは複数の磁気ストレージディスク、1つまたは複数の光ディスク、1つまたは複数のフラッシュドライブ)などを含み得る。たとえば、コンピューティングデバイス400に含まれるメモリ406は、ウェブブラウザ110およびブラウザ拡張部120の例示的な実施形態を実装するためのコンピュータ可読およびコンピュータ実行可能命令またはソフトウェアを記憶し得る。コンピューティングデバイス400は、メモリ406に記憶されたコンピュータ可読およびコンピュータ実行可能命令またはソフトウェアならびにシステムハードウェアを制御するための他のプログラムを実行するための、構成可能および/またはプログラム可能プロセッサ402ならびに関連するコア404、任意選択で、1つまたは複数の追加の構成可能および/またはプログラム可能プロセッサ402'ならびに関連するコア404'(たとえば、複数のプロセッサ/コアを有するコンピュータシステムの場合)も含む。プロセッサ402およびプロセッサ402'は各々、シングルコアプロセッサまたはマルチコア(404および404')プロセッサであり得る。
メモリ406は、コンピュータシステムメモリまたはDRAM、SRAM、EDO RAMなどのランダムアクセスメモリを含み得る。メモリ406は、他のタイプのメモリまたはそれらの組合せも含み得る。
ユーザは、コンピュータモニタなどの視覚表示デバイス418を通じてコンピューティングデバイス400と対話し得、視覚表示デバイス418は、例示的な実施形態に従って提供され得る1つまたは複数のユーザインターフェース420を表示し得る。コンピューティングデバイス400は、ユーザからの入力を受信するための他のI/Oデバイス、たとえば、キーボードまたは任意の適切なマルチポイントタッチインターフェース(たとえば、キーボード)408、ポインティングデバイス410(たとえば、マウス)を含み得る。キーボード408およびポインティングデバイス410は、視覚表示デバイス418に結合され得る。コンピューティングデバイス400は、他の適切な従来のI/O周辺機器を含み得る。
コンピューティングデバイス400は、本明細書で説明されるポータル140の例示的な実施形態を実装するデータならびにコンピュータ可読命令および/またはソフトウェアを記憶するための、ハードドライブ、CD-ROM、または他のコンピュータ可読媒体などの1つまたは複数のストレージデバイス424も含み得る。例示的なストレージデバイス424は、例示的な実施形態を実装するために必要とされる情報も記憶し得る。たとえば、例示的なストレージデバイス424は、ブラウザ履歴および/またはブラウザ拡張部120とポータル140との間の通信を容易にするためにブラウザ拡張部によって作成された1つもしくは複数のファイルなどの情報を記憶することができる。
コンピューティングデバイス400は、限定はしないが、標準電話回線、LANリンクもしくはWANリンク(たとえば、802.11、T1、T3、56kb、X.25)、ブロードバンド接続(たとえば、ISDN、フレームリレー、ATM)、ワイヤレス接続、コントローラエリアネットワーク(CAN)、または上記のいずれかもしくはすべての何らかの組合せを含む様々な接続を通じて、1つまたは複数のネットワーク、たとえば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)またはインターネットと1つまたは複数のネットワークデバイス422を介してインターフェースするように構成されたネットワークインターフェース412を含むことができる。ネットワークインターフェース412は、内蔵ネットワークアダプタ、ネットワークインターフェースカード、PCMCIAネットワークカード、カードバスネットワークアダプタ、ワイヤレスネットワークアダプタ、USBネットワークアダプタ、モデム、または、通信と本明細書で説明される動作を実施することとが可能な任意のタイプのネットワークにコンピューティングデバイス400をインターフェースするのに適している任意の他のデバイスを含み得る。さらに、コンピューティングデバイス400は、ワークステーション、デスクトップコンピュータ、サーバ、ラップトップ、ハンドヘルドコンピュータ、タブレットコンピュータ(たとえば、iPad(登録商標)タブレットコンピュータ)、モバイルコンピューティングデバイスもしくは通信デバイス(たとえば、iPhone(登録商標)通信デバイス)、または、通信が可能であり、本明細書で説明される動作を実施するのに十分なプロセッサパワーおよびメモリ容量を有する他の形態のコンピューティングデバイスもしくは電気通信デバイスなどの、任意のコンピュータシステムであり得る。
コンピューティングデバイス400は、Microsoft(登録商標) Windows(登録商標)オペレーティングシステムのバージョンのうちのいずれか、異なるリリースのUnixオペレーティングシステムおよびLinux(登録商標)オペレーティングシステム、Macintoshコンピュータ用の任意のバージョンのMacOS(登録商標)、任意の埋込み型オペレーティングシステム、任意のリアルタイムオペレーティングシステム、任意のオープンソースオペレーティングシステム、任意のプロプライエタリオペレーティングシステム、またはコンピューティングデバイス上で動作し、本明細書で説明される動作を実施することが可能な任意の他のオペレーティングシステムなどの任意のオペレーティングシステム416を動作させ得る。例示的な実施形態では、オペレーティングシステム416は、ネイティブモードまたはエミュレートモードで動作し得る。例示的な実施形態では、オペレーティングシステム416は、1つまたは複数のクラウドマシンインスタンス上で動作し得る。
図5は、強化型ブラウザ環境(たとえば、強化型ブラウザ145の一実施形態またはブラウザ拡張部120の一実施形態がロードされたウェブブラウザ110の一実施形態)のブラウザウィンドウ500で開かれたウェブページ502を図示する。強化型ブラウザ環境は、本開示の実施形態によるデジタルコンテンツおよび/またはデジタルコンテンツ内の要素の同時のブラウザ内の検索、閲覧、タグ付け、比較、およびハーベスティングを容易にするために実装され得る。
強化型ブラウザ環境のグラフィカルユーザインターフェース124は、強化型ブラウザ環境によって表示されているウェブページの一部分をオーバーレイするために配設され得るか、またはブラウザウィンドウ500のフレームに埋め込まれ得る。たとえば、本例では、強化型ブラウザ環境のグラフィカルユーザインターフェース124は、ブラウザウィンドウ500の底部に沿って示されている。別の例として、グラフィカルユーザインターフェース124は、図6に示されるように、ポップアップウィンドウとしてレンダリングされ得る。グラフィカルユーザインターフェース124は、ポータルによってブラウザ拡張部に提供され得る、見直されるべきURLのリスト510を含む。リストは、URLごとのブランド識別情報512、ポータルに記憶されたレコードに基づいたURLの最終見直し日514、URLに関連付けられたステータス/コンプライアンス516、URLが準拠しているまたは準拠していない理由518を含む、URLに関連付けられたタグおよび属性も含むことができる。
ユーザは、ウェブページ502の上でマウスもしくはカーソルを動かすか、またはさもなければウェブページ502に対してジェスチャを実施して、強化型ブラウザ環境のマークアップオーバーレイを介して、画像、テキスト、リンクなどの、ウェブページ502においてレンダリングされる1つまたは複数の要素をホバーオーバーするかつ/または選択することができる。要素(たとえば、画像520)をホバーオーバーすると、ホバーイベントおよび/または選択イベントに関連付けられたイベント信号が強化型ブラウザ環境のマークアップオーバーレイによって受信または傍受され得、マークアップオーバーレイは、(参照番号522によって示されるように)要素をハイライトすることができる。ユーザが要素を右クリックしたことまたはさもなければ要素を選択するためにジェスチャをしたことに応答して、選択イベントに関連付けられたイベント信号が受信または傍受され得、強化型ブラウザ環境のマークアップオーバーレイはメニュー530をレンダリングすることができる。メニュー530は、強化型ブラウザ環境によって実施され得るオプションまたはアクションを含むことができる。たとえば、メニュー530は、選択された画像520を、古いロゴ、間違ったロゴ、あるタイプのロゴの欠落、画像の無許可使用などに対応するものとして識別するオプションを含むことができる。オプションは、画像またはテキストをタグ付けまたはマークするためにユーザによって選択され得る。たとえば、オプションのうちの1つ(たとえば、古いロゴオプション532)を選択したことに応答して、強化型ブラウザ環境は、選択された要素(たとえば、画像520)を特定のカテゴリー用のポジティブインジケータまたはネガティブインジケータとして含むことができ、このインジケータはポータルに送られるかまたはポータルによって処理され得る。「1次的」な画像を、ウェブページ所有者が制御しない広告または他の要素などのウェブページ上の2次的なロゴまたは画像と区別するのを助けるために、強化型ブラウザ環境はマークアップコンテキスト、相対的な画像サイズもしくはテキスト位置を送ることができ、かつ/またはポータルはそれらを処理することができる。メニュー530は、ユーザによってウェブページ内で発見されハイライトされた要素に基づいて全く新しいポリシーを作成するた
めの「新しいポリシールール」アクションも含むことができる。新しいポリシーは、ポータルに送られかつ/またはポータルによって処理され得、新しいポリシーを受信したことに応答して、ポータルは、新しいポリシーを含むようにハーベスティングアルゴリズムを精緻化することができ、その結果、次にポータルのハーベスティングエンジンが実行されると、ハーベスティングエンジンは新しいポリシーを使用して、考えられる問題について見直されるべきネットワーク化された環境内のコンテンツを識別する。いくつかの実施形態では、ポータルは、ブラウザ拡張部から提供されたデータを使用して、ポータルのユーザに表示されるべき結果を識別するためにシステムによって利用され得るポリシー違反スコアを生成または更新することができる。
図7は、強化型ブラウザ環境(たとえば、強化型ブラウザ145の一実施形態またはブラウザ拡張部120の一実施形態がロードされたウェブブラウザ110の一実施形態)のブラウザウィンドウ700で開かれたウェブページ702を図示する。強化型ブラウザ環境は、本開示の実施形態によるデジタルコンテンツおよび/またはデジタルコンテンツ内の要素の同時のブラウザ内の検索、閲覧、タグ付け、比較、およびハーベスティングを容易にするために実装され得る。
ユーザは、ウェブページ702の上でマウスもしくはカーソルを動かすか、またはさもなければウェブページ702に対してジェスチャを実施して、強化型ブラウザ環境のマークアップオーバーレイを介して、画像、テキスト、リンクなどの、ウェブページ702においてレンダリングされる1つまたは複数の要素をホバーオーバーするかつ/または選択することができる。要素(たとえば、画像720)をホバーオーバーすると、ホバーイベントに関連付けられたイベント信号が強化型ブラウザ環境のマークアップオーバーレイによって受信または傍受され得、マークアップオーバーレイは、(参照番号722によって示されるように)要素をハイライトすることができる。ユーザが要素を右クリックしたことまたはさもなければ要素を選択するためにジェスチャをしたことに応答して、マークアップオーバーレイはメニュー730をレンダリングすることができる。メニュー730は、強化型ブラウザ環境によって実施され得るオプションまたはアクションを含むことができる。たとえば、メニュー730は、選択された要素を、編集ポリシーオプション、サブオプションを有する新しいポリシーオプションなどに対応するものとして識別するオプションを含むことができる。オプションは、画像またはテキストをタグ付けまたはマークするためにユーザによって選択され得る。たとえば、オプションのうちの1つ(たとえば、新しいポリシーサブオプション「ネガティブ」732)を選択したことに応答して、強化型ブラウザ環境は、選択された要素(たとえば、画像720)を特定のカテゴリー用のポジティブインジケータまたはネガティブインジケータとして含むことができ、このインジケータはブラウザ拡張部によってポータルに送られるかつ/またはポータルによって処理され得る。「1次的」な画像を、ウェブページ所有者が制御しない広告または他の要素などのウェブページ上の2次的なロゴまたは画像と区別するのを助けるために、強化型ブラウザ環境はマークアップコンテキスト、相対的な画像サイズもしくはテキスト位置を送り、かつ/またはポータルはそれらを処理する。
メニュー730内のオプションを選択したことに応答して、選択された要素のタグまたはマークアップを支持するウェブページ502上のコンテキスト属性を識別するためにサブメニュー740も表示され得る。たとえば、ユーザは、要素のタグまたはマークアップを支持するテキスト文字列742、画像744、およびリンク746を識別し、追加することができる。文字列をコンテキスト属性に追加するために、ユーザは「文字列を追加する(add string)」を選択することができ、ウェブページから選択された要素に関連付けられたコンテキスト属性として追加すべき、ウェブページ702内の文字列をハイライトすることができる。画像をコンテキスト属性に追加するために、ユーザは「画像を追加する(add image)」オプションを選択することができ、ウェブページから選択された要素に関連付けられたコンテキスト属性として追加すべき、ウェブページ702内の画像をハイライトすることができる。リンクをコンテキスト属性に追加するために、ユーザはウェブページ内のリンクを選択することができ、リンクのURLはコンテキスト属性に現れることができる。マークアップオーバーレイがブラウザウィンドウをオーバーレイし、ユーザがメニューをアクティブ化しているので、ユーザによるリンクの選択はその通常のアクション、すなわち、強化型ブラウザ環境によるリンクのURLへのナビゲーションをもたらさない。コンテキスト属性の各々は、ポジティブインジケータ/ネガティブインジケータを割り当てられ得る。
新しいポリシールールは、ユーザによってウェブページ内で発見されハイライトされた、選択された要素に基づいてポータルによって作成され得る。新しいポリシーは、サブメニュー740を介してユーザによって識別され追加されたコンテキスト属性を含むことができる。新しいポリシーはポータルに送られ得、新しいポリシーを受信したことに応答して、ポータルは、コンテキスト属性を有する新しいポリシーを含むようにハーベスティングアルゴリズムを精緻化することができ、その結果、次にポータルのハーベスティングエンジンが実行されると、ハーベスティングエンジンは新しいポリシーを使用して、考えられる問題について見直されるべきネットワーク化された環境内のコンテンツを識別する。いくつかの実施形態では、ポータルは、強化型ブラウザ環境から提供されたデータを使用して、ポータルのユーザに表示されるべき結果を識別するためにシステムによって利用され得るポリシー違反スコアを生成または更新することができる。
非限定的な例示的な例として、ウェブページ702は、ブランドNIKEに関連付けられた要素を含むことができる。ポータルは、強化型ブラウザ環境を使用して見直されるべきウェブページとしてウェブページ702を識別するとき、文字列「NIKE」を適切にマッチングすることができる。しかしながら、この単純な文字列マッチングは、マッチが企業のコンテキスト内であるときとマッチが女神のコンテキスト内であるときを見分ける能力に欠ける。ウェブページ702が企業のNIKE(ナイキ)ではなく女神のNike(ニケ)に言及している場合、ウェブページはユーザに関係がないことがある。ユーザは、企業のNIKEは事実上、オリュンポス(Olympus)またはステュクスもしくはスティクス(Styx)(神、川、またはバンドとなる)の言及と並べて言及されることは決してないということをポータルが知らないまたは学習していない場合があり、ウェブページ702内のそれらの文字列の存在は、ウェブページ702がフォールスポジティブであったことと、見直しのために提供されるべきではなかったこととをほぼ確実に意味するというコンテキストをポータルに追加することができる。ユーザは、ポータルを訓練するかまたはポータルが見直しのためにウェブページを識別するポリシーを精緻化するために、このコンテキストをキャプチャすることができる。ユーザは、追加の文字列をコンテキスト属性(たとえば、「Zues」、「Greek Pantheon」、「Styx」、「deities」)として追加/ハイライト/タイプ/入力することができる。これらのコンテキスト属性は、強化型ブラウザ環境からポータルに送られ得るかつ/またはポータルによって処理され得る。その後、ポータルのハーベスティングエンジンがNikeの結果を返すとき、ポータルの抽出エンジンは、一連のネガティブインジケータ(たとえば、「Zues」、「Greek Pantheon」、「Styx」、「deities」)に対して基本的な文字列マッチングを実施して、ウェブページ702を見直すときにユーザが適用した同じコンテキストを使用して結果を精緻化することができる。文字列マッチングは例示的な非限定的な例として説明されるが、文字列マッチングは、強化型ブラウザ環境を介して識別されるコンテキスト属性に基づいて実装され精緻化され得る多くのポリシーのうちの1つである。
非限定的な例示的な例はエンティティ/アカウントレベルに関するが、コンテキスト属性は製品レベルおよび全般/モジュールレベルで利用され得る。そのようなコンテキストデータは、製品に固有の任意の製品キャンペーンについての、エンティティ/アカウントのすべての将来のスキャンについての、および/または所与のモジュール/チャネル内の他のエンティティ/アカウント(たとえば、オンラインマーケットプレイス)についての将来の結果を精緻化するために使用され得る。追加のコンテキスト/ポリシーは強化型ブラウザ環境を介して受信される入力に基づくので、これらの3つのレベルにおける精緻化は時間がたつにつれて改善することができる。
図8は、本開示による、環境の一実施形態において実装されるプロセス800を示すフローチャートである。動作802において、強化型ブラウザ環境は、コンピューティングリソース上で実行される。たとえば、ブラウザ拡張部の一実施形態は、コンピューティングリソース上で実行されて、コンピューティングリソース上のウェブブラウザの機能を拡張するか、または強化型ブラウザ145の一実施形態は、コンピューティングリソース上で実行される。強化型ブラウザ環境は、強化型ブラウザ環境のブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にすることができる。強化型ブラウザ環境は、通信ネットワークを介してポータルと通信しているか、またはポータルに埋め込まれ、強化型ブラウザ環境は、ポータルからのウェブページのリストをレンダリングすることができるグラフィカルユーザインターフェースを生成することができる。グラフィカルユーザインターフェースを介したリスト内のURLの選択は、リストからのURLの選択に応答して、URLをホストするデータソースからURLに関連付けられたウェブページを取り出すように強化型ブラウザ環境に命令することを、強化型ブラウザポータルに行わせることができる。ポータルのデータベース内のレコードがリスト内のURLに対応する場合、強化型ブラウザ環境は、強化型ブラウザ環境のグラフィカルユーザインターフェースにレコードから取り出されたデータを投入することができる。
動作804において、ウェブページ内の特定の要素の選択は、強化型ブラウザ環境を介して受信される。たとえば、強化型ブラウザ環境は、特定の要素の選択に関連付けられたイベント信号を受信または傍受することができる。強化型ブラウザ環境(たとえば、強化型ブラウザまたはブラウザ拡張部)は、特定の要素の選択に応答して(たとえば、イベント信号に応答して)、メニューを生成することができる。メニューは、特定の要素の選択に基づいて強化型ブラウザ環境によって実施されることが可能な少なくとも1つのオプションまたはアクションを含むことができる。動作806において、タグは、強化型ブラウザ環境を介して(たとえば、強化型ブラウザ環境によって生成されたメニューを介して)特定の要素に割り当てられる。タグは、特定の要素がウェブページのコンテキストにおいて良性であるか悪性であるかを示すことができる。動作808において、タグは強化型ブラウザ環境からポータルに送られるかつ/またはタグを特定の要素およびウェブページのユニバーサルリソースロケータ(URL)に関連付けるためにポータルによって処理され得る。
強化型ブラウザ環境は、特定の要素をポータルに送ることもできる、かつ/または、特定の要素の選択に応答して、ウェブページのソースコードのセグメントを抽出することができ、ソースコードの抽出されたセグメントをポータルに送ることができる。ポータルがウェブページに関連付けられたURLに対応するデータベースレコードを有しない場合、ポータルは、強化型ブラウザ拡張部からタグ、特定の要素、ソースコードのセグメント、および/またはコンテキスト属性を受信したことに応答して、データベース内のURLについてのレコードを作成することができ、タグ、特定の要素、ソースコードのセグメント、および/またはコンテキスト属性をレコードに追加することができる。
メニューは、特定の要素に割り当てられたタグを支持してまたはそれに反対して、ウェブページ内の1つまたは複数の文字列、画像、および/またはリンクの選択が強化型ブラウザ拡張部を介して受信され得るように、コンテキスト属性を特定の要素に関連付けるためのオプションまたはアクションを含むことができる。1つまたは複数の文字列、画像、および/またはリンクは、ハイライトしたこと、クリックしたこと、ホバーオーバーしたこと、ユーザジェスチャに応答して、強化型ブラウザ環境を介してウェブページ内で選択され得る。強化型ブラウザ環境を介したウェブページ内の1つまたは複数のリンクの選択は、ウェブブラウザを1つまたは複数のリンクによって参照されるウェブページにナビゲートさせることなしに、リンクの宛先をコンテキスト属性に追加することができる。
図9は、本開示による、環境の一実施形態において実装されるプロセス900を示すフローチャートである。動作902において、強化型ブラウザ環境は、コンピューティングリソース上で実行される。たとえば、ブラウザ拡張部の一実施形態は、コンピューティングリソース上で実行されて、コンピューティングリソース上のウェブブラウザの機能を拡張するか、または強化型ブラウザ145の一実施形態は、コンピューティングリソース上で実行される。強化型ブラウザ環境は、ウェブブラウザのブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にすることができる。強化型ブラウザ環境は、通信ネットワークを介してポータルと通信しているか、またはポータルに埋め込まれ、強化型ブラウザ環境は、ポータルからのウェブページのリストをレンダリングすることができるグラフィカルユーザインターフェースを生成することができる。グラフィカルユーザインターフェースを介したリスト内のURLの選択は、リストからのURLの選択に応答して、URLをホストするデータソースからURLに関連付けられたウェブページを取り出すようにウェブブラウザに命令することを、強化型ブラウザ環境に行わせることができる。ポータルのデータベース内のレコードがリスト内のURLに対応する場合、強化型ブラウザ環境は、強化型ブラウザ環境のグラフィカルユーザインターフェースにレコードから取り出されたデータを投入することができる。
動作904において、ウェブページ内の特定の要素の選択は、強化型ブラウザ環境を介して受信される。たとえば、強化型ブラウザ環境は、特定の要素の選択に関連付けられたイベント信号を受信または傍受することができる。動作906において、強化型ブラウザ環境は、特定の要素の選択に応答して(たとえば、イベント信号に応答して)、メニューを生成する。メニューは、特定の要素の選択に基づいて強化型ブラウザ環境によって実施されることが可能な少なくとも1つのオプションまたはアクションを含むことができる。動作908において、タグは、強化型ブラウザ環境のメニューを介して特定の要素に割り当てられる。タグは、特定の要素がウェブページのコンテキストにおいて良性であるか悪性であるかを示すことができる。動作910において、ウェブページ内の1つまたは複数のコンテキスト属性が、強化型ブラウザ環境を介して選択され、タグおよび/または特定の要素に割り当てられる。動作912において、タグおよび1つまたは複数のコンテキスト属性が強化型ブラウザ環境からポータルに送られる、かつ/または、ポータルがタグおよび1つまたは複数のコンテキスト属性を処理して、タグおよびコンテキスト属性を特定の要素およびウェブページのユニバーサルリソースロケータ(URL)に関連付ける。
動作914において、ポータルは、強化型ブラウザ環境から受信されたタグおよびコンテキスト属性に基づいて1つまたは複数の新しいポリシーを作成することができ、動作916において、ポータルは、強化型ブラウザ環境内の見直されるべき追加のURLを識別するためのおよび/またはハーベスティングエンジンによって識別されるフォールスポジティブURLを軽減するためにポータルによって使用され得る1つまたは複数の新しいポリシーを使用して、1つまたは複数のハーベスティングエンジンを実行することができる。
例示的なフローチャートは、例示的な目的で本明細書で提供され、方法の非限定的な例である。当業者は、例示的な方法が例示的なフローチャートにおいて示されるステップよりも多いまたは少ないステップを含み得ることと、例示的なフローチャートにおけるステップが例示的なフローチャートに示される順序とは異なる順序で実施され得ることとを認識されよう。
本明細書で開示される主題の特定の実施形態の上記の説明は、例示および説明の目的で提示されており、本明細書に記載される主題の範囲を限定するものではない。上記の説明および添付の図面から他の様々な実施形態、修正形態、および適用例が当業者に明らかになるであろうことが十分に企図される。したがって、そのような他の実施形態、修正形態、および適用例は、以下の添付の特許請求の範囲の範囲内に入るものとする。さらに、当業者は、本明細書で説明された実施形態、修正形態、および適用例は特定の環境のコンテキスト内にあり、本明細書に記載される主題はそれに限定されないが、任意の数の他の方法、環境および目的において有利に適用され得ることを諒解されよう。したがって、以下に記載される特許請求の範囲は、本明細書で開示される新規の特徴および技法の全範囲および趣旨を考慮して解釈されるべきである。
100、100' 環境
102 ウェブページ
110 ウェブブラウザ
120 ブラウザ拡張部
122 ユーザインターフェース
124 グラフィカルユーザインターフェース
126 バックグラウンドプロセス
128 マークアップオーバーレイ
140 ポータル
142 アプリケーションプログラムインターフェース(API)、API
144 グラフィカルユーザインターフェース、GUI
145 強化型ブラウザ
146 ハーベスティングエンジン
148 抽出エンジン
160 データベース
162 レコード
164 ユーザ識別子
166 アカウント識別子
168 URL
170 属性
172 タグ
200 環境
210、211、212 ユーザコンピューティングデバイス
215 クライアント側アプリケーション
220~223 リモートコンピューティングシステム
230 仮想デスクトップ
231、240、250、260、300 サーバ
241、251 ウェブサイト
242、252 ウェブページ
290 通信ネットワーク
302、302'、402、402' プロセッサ
304、304'、404、404' コア
306、406 メモリ
312、412 ネットワークインターフェース
314 仮想マシン
316 サーバアプリケーション
322、422 ネットワークデバイス
324、424 ストレージデバイス
400 コンピューティングデバイス
408 マルチポイントタッチインターフェース
410 ポインティングデバイス
416 オペレーティングシステム
418 視覚表示デバイス
420 ユーザインターフェース

Claims (24)

  1. ネットワーク化された環境内のデジタルコンテンツの同時のブラウザ内のタグ付けおよびハーベスティングのための方法であって、
    強化型ブラウザ環境のブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にするために、コンピューティングリソース上で前記強化型ブラウザ環境を実行するステップであって、前記強化型ブラウザ環境がポータルとインターフェースする、ステップと、
    前記強化型ブラウザ環境を介して1つまたは複数のグラフィカルユーザインターフェースを生成するステップであって、前記1つまたは複数のグラフィカルユーザインターフェースは、前記強化型ブラウザ環境の前記ブラウザウィンドウに埋め込まれ、別個の前記ブラウザウィンドウとして生成される、ステップと、
    前記ポータルを介して、前記ウェブページ内の前記要素に関するポリシーを定義するステップであって、前記ポリシーが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを決定するために使用される、ステップと、
    ユーザが前記要素を選択するためにジェスチャをしたことに応答して、前記強化型ブラウザ環境を介して前記ウェブページ内の前記要素の選択を受信するステップと、
    前記強化型ブラウザ環境を介してタグを前記要素に割り当てるステップであって、前記タグが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを示す、ステップと、
    前記ポータルによって前記タグを前記要素および前記ウェブページのユニバーサルリソースロケータ(URL)に関連付けるステップと、
    前記関連付けに応答して、前記ウェブページ内の前記タグ付けされた要素のブラウザ内のハーベスティングを実施するステップと、
    前記要素に割り当てられた前記タグに基づいて、新しいポリシーを定義するステップであって、前記新しいポリシーが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを含む、ステップと、
    前記新しいポリシーを含むようにハーベスティングエンジンのハーベスティングアルゴリズムを精緻化するステップであって、前記ハーベスティングエンジンが、前記新しいポリシーによって精緻化された前記ハーベスティングアルゴリズムを使用して、ハーベスティングのためにネットワーク化された環境内のコンテンツを発見する、ステップと
    を含む方法。
  2. 前記ポータルからウェブページのリストを受信するステップと、
    前記ユーザが前記リストから前記URLを選択したことに応答して、前記グラフィカルユーザインターフェースを介して前記リスト内の前記URLの選択を受信するステップと、
    前記リストからの前記URLの選択に応答して、前記URLをホストするデータソースから前記URLに関連付けられた前記ウェブページを取り出すように前記強化型ブラウザ環境に命令するステップと
    をさらに含む、請求項1に記載の方法。
  3. 前記タグが、前記ウェブページ内の前記要素が良性であるか悪性であるかを示す、請求項2に記載の方法。
  4. 前記要素の選択に応答して、前記強化型ブラウザ環境によってメニューを生成するステップであって、前記メニューが、前記要素の選択に基づいて前記強化型ブラウザ環境によって実施されることが可能な少なくとも1つのオプションまたはアクションを含む、ステップ
    をさらに含む、請求項1に記載の方法。
  5. 前記強化型ブラウザ環境が、前記少なくとも1つのオプションまたはアクションの選択に応答して、前記タグを前記要素に割り当てる、請求項4に記載の方法。
  6. 前記少なくとも1つのオプションまたはアクションが、コンテキスト属性を前記要素に関連付けることを含み、前記方法が、
    前記ユーザが1つまたは複数の文字列を選択するためにジェスチャをしたことに応答して、前記要素に割り当てられた前記タグを支持してまたはそれに反対して、前記強化型ブラウザ環境を介して前記ウェブページ内の前記1つまたは複数の文字列の選択を受信するステップ
    をさらに含む、請求項4に記載の方法。
  7. 前記1つまたは複数の文字列の選択が、
    前記強化型ブラウザ環境を介して前記ウェブページ内の前記1つまたは複数の文字列をハイライトすること
    を含む、請求項6に記載の方法。
  8. 前記少なくとも1つのオプションまたはアクションが、コンテキスト属性を前記要素に関連付けることを含み、前記方法が、
    前記ユーザが1つまたは複数の画像を選択するためにジェスチャをしたことに応答して、前記要素に割り当てられた前記タグを支持してまたはそれに反対して、前記強化型ブラウザ環境を介して前記ウェブページ内の前記1つまたは複数の画像の選択を受信するステップ
    をさらに含む、請求項4に記載の方法。
  9. 前記少なくとも1つのオプションまたはアクションが、コンテキスト属性を前記要素に関連付けることを含み、前記方法が、
    前記ユーザが1つまたは複数のリンクを選択するためにジェスチャをしたことに応答して、前記要素に割り当てられた前記タグを支持してまたはそれに反対して、前記強化型ブラウザ環境を介して前記ウェブページ内の前記1つまたは複数のリンクの選択を受信するステップ
    をさらに含む、請求項4に記載の方法。
  10. 前記強化型ブラウザ環境を介した前記ウェブページ内の1つまたは複数のリンクの選択が、前記リンクの宛先を前記コンテキスト属性に追加する、請求項9に記載の方法。
  11. 前記1つまたは複数のリンクの選択が、前記強化型ブラウザ環境が前記1つまたは複数のリンクによって参照されるウェブページにナビゲートすることをもたらさない、請求項10に記載の方法。
  12. 前記要素の選択に応答して、前記ウェブページのソースコードのセグメントを抽出するステップと、
    前記ソースコードの前記抽出されたセグメントを前記強化型ブラウザ環境から前記ポータルに送信するステップと
    をさらに含む、請求項1に記載の方法。
  13. 前記URLが、前記ポータルによって維持されるデータベース内に対応するレコードを有さず、前記方法が、
    前記強化型ブラウザ環境から前記タグを受信したことに応答して、前記URLについてのレコードを作成するステップと、
    前記タグを前記レコードに追加するステップと
    をさらに含む、請求項1に記載の方法。
  14. 前記URLが、データベース内に対応するレコードを有し、前記方法が、
    前記強化型ブラウザ環境のグラフィカルユーザインターフェースに前記レコードから取り出されたデータを投入するステップ
    をさらに含む、請求項1に記載の方法。
  15. 前記新しいポリシーによって精緻化された前記ハーベスティングアルゴリズムを使用して、ハーベストするためにデジタルコンテンツを検索するためのクエリを生成するステップ
    をさらに含む、請求項1に記載の方法。
  16. 前記クエリを生成するステップが、
    前記ハーベスティングアルゴリズムを使用して、用語の単一のセットから前記クエリを生成するステップであって、各クエリが、検索エンジンまたはアプリケーションプログラムインターフェース(API)の少なくとも1つに固有のものである、ステップ
    を含む、請求項15に記載の方法。
  17. 前記クエリの実行が、見直されるべき追加のウェブページに関連付けられたユニバーサルリソースロケータ(URL)のリストを返す、請求項15に記載の方法。
  18. ネットワーク化された環境内のデジタルコンテンツの同時のブラウザ内のタグ付けおよびハーベスティングのためのシステムであって、
    ネットワークを介してアクセス可能なポータルを実行するようにプログラムされた1つまたは複数のサーバを含むリモートコンピューティングシステムと、
    ウェブブラウザおよびブラウザ拡張部がインストールされた少なくとも1つのコンピューティングデバイスであって、前記ブラウザ拡張部が、前記ウェブブラウザの機能を拡張し、前記ウェブブラウザのブラウザウィンドウにおいてレンダリングされるウェブページ内の要素の独立した別個の選択およびタグ付けを容易にするようにプログラムされ、前記ブラウザ拡張部が、前記ネットワークを介して前記ポータルと通信している、少なくとも1つのコンピューティングデバイスと
    を備え、
    前記少なくとも1つのコンピューティングデバイスが、
    前記ブラウザ拡張部を介して1つまたは複数のグラフィカルユーザインターフェースを生成することであって、前記1つまたは複数のグラフィカルユーザインターフェースは、前記ウェブブラウザの前記ブラウザウィンドウに埋め込まれ、別個の前記ブラウザウィンドウとして生成される、ことと、
    前記ウェブページ内の前記要素に関するポリシーを識別することであって、前記ポリシーが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを決定するために使用される、ことと、
    ユーザが前記要素を選択するためにジェスチャをしたことに応答して、前記ブラウザ拡張部を介して前記ウェブページ内の前記要素の選択を受信することと、
    前記ブラウザ拡張部を介してタグを前記要素に割り当てることであって、前記タグが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを示す、ことと、
    前記タグを前記ブラウザ拡張部から前記ポータルに送って前記タグを前記要素および前記ウェブページのユニバーサルリソースロケータ(URL)に関連付けることと、
    前記関連付けに応答して、前記ウェブページ内の前記タグ付けされた要素のブラウザ内のハーベスティングを実施することと、
    前記要素に割り当てられた前記タグに基づいて、新しいポリシーを定義することであって、前記新しいポリシーが前記ウェブページ内の前記要素が認証されているかどうか、許可されているかどうかを含み、前記ポータルが前記新しいポリシーを含むようにハーベスティングエンジンのハーベスティングアルゴリズムを精緻化し、前記ハーベスティングエンジンが、前記新しいポリシーによって精緻化された前記ハーベスティングアルゴリズムを使用して、ハーベスティングのためにネットワーク化された環境内のコンテンツを発見する、ことと
    を行うために、前記ブラウザ拡張部を実行するようにプログラムされる、システム。
  19. 前記少なくとも1つのコンピューティングデバイスが、
    前記ポータルからウェブページのリストを受信することと、
    前記ユーザが前記リストから前記URLを選択したことに応答して、前記グラフィカルユーザインターフェースを介して前記リスト内の前記URLの選択を受信することと、
    前記リストからの前記URLの選択に応答して、前記URLをホストするデータソースから前記URLに関連付けられた前記ウェブページを取り出すように前記ウェブブラウザに命令することと
    を行うために、前記ブラウザ拡張部を実行するようにプログラムされる、請求項18に記載のシステム。
  20. 前記少なくとも1つのコンピューティングデバイスが、
    前記要素の選択に応答して、前記ブラウザ拡張部によってメニューを生成することであって、前記メニューが、前記要素の選択に基づいて前記ブラウザ拡張部によって実施されることが可能な少なくとも1つのオプションまたはアクションを含む、生成すること
    を行うために、前記ブラウザ拡張部を実行するようにプログラムされ、
    前記ブラウザ拡張部が、前記少なくとも1つのオプションまたはアクションの選択に応答して、前記タグを前記要素に割り当てるか、または少なくとも1つのコンテキスト属性を前記要素に関連付ける、請求項18に記載のシステム。
  21. 前記少なくとも1つのコンピューティングデバイスが、
    前記ユーザが1つまたは複数の文字列、画像またはリンクを選択するためにジェスチャをしたことに応答して、前記要素に割り当てられた前記タグを支持してまたはそれに反対して、前記ブラウザ拡張部を介して前記ウェブページ内の前記1つまたは複数の文字列、画像またはリンクの選択を受信する
    ために、前記ブラウザ拡張部を実行するようにプログラムされる、請求項20に記載のシステム。
  22. 前記ブラウザ拡張部が、前記ブラウザ拡張部を介した前記1つまたは複数の文字列、画像またはリンクの選択に応答して、前記1つまたは複数の文字列をコンテキスト属性として追加する、請求項21に記載のシステム。
  23. 前記少なくとも1つのコンピューティングデバイスが、
    前記要素の選択に応答して、前記ウェブページのソースコードのセグメントを抽出することと、
    前記ソースコードの前記抽出されたセグメントを前記ブラウザ拡張部から前記ポータルに送信することと
    を行うために、前記ブラウザ拡張部を実行するようにプログラムされる、請求項18に記載のシステム。
  24. 前記タグが、前記ウェブページ内の前記要素が良性であるか悪性であるかを示す、請求項18に記載のシステム。
JP2019545972A 2017-02-22 2018-02-21 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法 Active JP7330891B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022148312A JP2022184964A (ja) 2017-02-22 2022-09-16 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762462110P 2017-02-22 2017-02-22
US62/462,110 2017-02-22
PCT/US2018/018921 WO2018156558A1 (en) 2017-02-22 2018-02-21 Systems and methods for direct in-browser markup of elements in internet content

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022148312A Division JP2022184964A (ja) 2017-02-22 2022-09-16 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法

Publications (3)

Publication Number Publication Date
JP2020515944A JP2020515944A (ja) 2020-05-28
JP2020515944A5 JP2020515944A5 (ja) 2021-11-25
JP7330891B2 true JP7330891B2 (ja) 2023-08-22

Family

ID=63167288

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019545972A Active JP7330891B2 (ja) 2017-02-22 2018-02-21 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法
JP2022148312A Pending JP2022184964A (ja) 2017-02-22 2022-09-16 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022148312A Pending JP2022184964A (ja) 2017-02-22 2022-09-16 インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法

Country Status (6)

Country Link
US (1) US11089052B2 (ja)
EP (1) EP3586250B1 (ja)
JP (2) JP7330891B2 (ja)
CN (1) CN110537180B (ja)
CA (1) CA3054176C (ja)
WO (1) WO2018156558A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11468172B2 (en) * 2019-02-06 2022-10-11 Cisco Technology, Inc. Browser extension security system
US11144541B2 (en) 2019-02-18 2021-10-12 Microsoft Technology Licensing, Llc Intelligent content and formatting reuse
US11200294B2 (en) * 2019-03-20 2021-12-14 Hisense Visual Technology Co., Ltd. Page updating method and display device
US20200394614A1 (en) * 2019-06-12 2020-12-17 Ambry Hill Technologies, LLC Methods, devices, and systems for capturing content from client transaction related messages on a client device by a third party
US11080467B1 (en) 2019-08-22 2021-08-03 Quantcast Corporation Visual tag builder
US20220301670A1 (en) * 2019-09-06 2022-09-22 Roche Molecular Systems, Inc. Automated information extraction and enrichment in pathology report using natural language processing
US11010371B1 (en) * 2019-09-16 2021-05-18 Palantir Technologies Inc. Tag management system
CN110769275B (zh) * 2019-10-09 2022-04-08 北京达佳互联信息技术有限公司 直播数据流的处理方法、装置及系统
US20220150280A1 (en) * 2020-11-06 2022-05-12 Microsoft Technology Licensing, Llc Context menu security policy enforcement
CN112989195B (zh) * 2021-03-20 2023-09-05 重庆图强工程技术咨询有限公司 基于大数据的全过程咨询方法、装置、电子设备及存储介质
US11816176B2 (en) * 2021-07-27 2023-11-14 Locker 2.0, Inc. Systems and methods for enhancing online shopping experience
US20230128589A1 (en) * 2021-10-22 2023-04-27 International Business Machines Corporation Predicting policy violations in a document with an enterprise data source
US11792234B1 (en) * 2022-11-11 2023-10-17 Netskope, Inc. Browser extension identification and isolation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002196093A (ja) 2000-08-02 2002-07-10 General Electric Co <Ge> オートメーション化された対話的データ収集とデータ転送とデータ評価方法
JP2004503873A (ja) 2000-06-14 2004-02-05 ゼネラル・エレクトリック・カンパニイ グローバルネットワーク上でプラントパラメータと性能を評価する方法、システムおよびプログラム
JP2004510214A5 (ja) 2001-05-04 2008-08-07
JP2009500729A (ja) 2005-06-29 2009-01-08 グーグル インコーポレイテッド 広告ネットワークへの参加のためのウェブサイトの適性レビュー

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030050927A1 (en) * 2001-09-07 2003-03-13 Araha, Inc. System and method for location, understanding and assimilation of digital documents through abstract indicia
EP3029585A1 (en) * 2000-05-04 2016-06-08 Google, Inc. Enhanced hyperlink
US20030110449A1 (en) * 2001-12-11 2003-06-12 Wolfe Donald P. Method and system of editing web site
US7308648B1 (en) * 2002-11-27 2007-12-11 Microsoft Corporation Method, system, and computer-readable medium for filtering harmful HTML in an electronic document
JP2007536634A (ja) * 2004-05-04 2007-12-13 フィッシャー−ローズマウント・システムズ・インコーポレーテッド プロセス制御システムのためのサービス指向型アーキテクチャ
US7831547B2 (en) * 2005-07-12 2010-11-09 Microsoft Corporation Searching and browsing URLs and URL history
US7870475B2 (en) * 2006-05-16 2011-01-11 Yahoo! Inc. System and method for bookmarking and tagging a content item
US8166056B2 (en) 2007-02-16 2012-04-24 Palo Alto Research Center Incorporated System and method for searching annotated document collections
US20080288486A1 (en) * 2007-05-17 2008-11-20 Sang-Heun Kim Method and system for aggregate web site database price watch feature
US9712560B2 (en) * 2007-11-05 2017-07-18 Cabara Software Ltd. Web page and web browser protection against malicious injections
US9038184B1 (en) 2010-02-17 2015-05-19 Symantec Corporation Detection of malicious script operations using statistical analysis
US20110225162A1 (en) * 2010-03-09 2011-09-15 Clifford Lyon Assigning Tags to Digital Content
US20120198324A1 (en) * 2011-01-27 2012-08-02 Ruchi Mahajan Systems, Methods, and Apparatuses to Write on Web Pages
US8433719B1 (en) * 2011-12-29 2013-04-30 Google Inc. Accelerating find in page queries within a web browser
US9740369B2 (en) * 2013-03-15 2017-08-22 Palantir Technologies Inc. Systems and methods for providing a tagging interface for external content
US10002117B1 (en) * 2013-10-24 2018-06-19 Google Llc Translating annotation tags into suggested markup
US9081789B2 (en) * 2013-10-28 2015-07-14 Tealium Inc. System for prefetching digital tags
US10915232B1 (en) * 2015-04-09 2021-02-09 Integral Ad Science, Inc. Methods, systems, and media for specifying different content management techniques across various publishing platforms
US9386037B1 (en) * 2015-09-16 2016-07-05 RiskIQ Inc. Using hash signatures of DOM objects to identify website similarity
US10594733B2 (en) * 2016-04-06 2020-03-17 Rapid7, Inc System and method for application software security and auditing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004503873A (ja) 2000-06-14 2004-02-05 ゼネラル・エレクトリック・カンパニイ グローバルネットワーク上でプラントパラメータと性能を評価する方法、システムおよびプログラム
JP2002196093A (ja) 2000-08-02 2002-07-10 General Electric Co <Ge> オートメーション化された対話的データ収集とデータ転送とデータ評価方法
JP2004510214A5 (ja) 2001-05-04 2008-08-07
JP2009500729A (ja) 2005-06-29 2009-01-08 グーグル インコーポレイテッド 広告ネットワークへの参加のためのウェブサイトの適性レビュー

Also Published As

Publication number Publication date
EP3586250B1 (en) 2023-09-20
CN110537180B (zh) 2024-01-09
US11089052B2 (en) 2021-08-10
EP3586250A4 (en) 2020-09-02
JP2022184964A (ja) 2022-12-13
WO2018156558A1 (en) 2018-08-30
CA3054176C (en) 2024-02-06
US20180239826A1 (en) 2018-08-23
CN110537180A (zh) 2019-12-03
EP3586250A1 (en) 2020-01-01
JP2020515944A (ja) 2020-05-28
CA3054176A1 (en) 2018-08-30

Similar Documents

Publication Publication Date Title
JP7330891B2 (ja) インターネットコンテンツ内の要素の直接的なブラウザ内のマークアップのためのシステムおよび方法
US10868827B2 (en) Browser extension for contemporaneous in-browser tagging and harvesting of internet content
US9652550B2 (en) Indexing application pages of native applications
US9614862B2 (en) System and method for webpage analysis
US8626757B1 (en) Systems and methods for detecting network resource interaction and improved search result reporting
US8930437B2 (en) Systems and methods for deterring traversal of domains containing network resources
US20110271201A1 (en) Decentralized Contextual Collaboration Across Heterogeneous Environments
US11500952B1 (en) Indexing access limited native applications
US10031971B2 (en) System and methods for optimizing the response to a request for dynamic web content
US9679081B2 (en) Navigation control for network clients
US20130117716A1 (en) Function Extension for Browsers or Documents
KR102023147B1 (ko) 대응하는 리소스에 대한 애플리케이션 부분적 딥 링크
US9384283B2 (en) System and method for deterring traversal of domains containing network resources
US10791130B2 (en) Trigger-based harvesting of data associated with malignant content in a networked environment
CN113656737A (zh) 网页内容展示方法、装置、电子设备以及存储介质
US8934662B1 (en) Tracking image origins
US10970358B2 (en) Content generation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211008

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20211008

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220106

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20220106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220314

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220916

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220916

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20221011

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221111

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221114

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20230120

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20230130

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20230130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230809

R150 Certificate of patent or registration of utility model

Ref document number: 7330891

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150