JP2022542634A - データのエシカルな収集のためのシステム及び方法 - Google Patents

データのエシカルな収集のためのシステム及び方法 Download PDF

Info

Publication number
JP2022542634A
JP2022542634A JP2021559277A JP2021559277A JP2022542634A JP 2022542634 A JP2022542634 A JP 2022542634A JP 2021559277 A JP2021559277 A JP 2021559277A JP 2021559277 A JP2021559277 A JP 2021559277A JP 2022542634 A JP2022542634 A JP 2022542634A
Authority
JP
Japan
Prior art keywords
url
data
urls
database
website
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021559277A
Other languages
English (en)
Inventor
ウォルシュ、ブランディー
パケット、ゲリ
トーマス、トッド
ドノヴァン、ブライアン
Original Assignee
アクシオム エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アクシオム エルエルシー filed Critical アクシオム エルエルシー
Publication of JP2022542634A publication Critical patent/JP2022542634A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90332Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Storage Device Security (AREA)

Abstract

コンピュータ化されたシステムは、データ提携先からのデータがエシカルに調達されていることを自動的に保証する。システムは、データ・プロバイダによって提供されたURLに関連付けられたウェブサイトを調査し、プライバシー・ポリシー・データが抽出及び捕捉される。URLに関連付けられたウェブサイトのプライバシー条項を分析するためにキーワード・セットが使用される。データをエシカルに収集しているウェブサイトに関連付けられたURLはURLデータベースに記憶され、又は、新規のデータ提携先がこれらのURLをそのデータのソースとして識別するたびごとにこれらのURLがチェックされる必要がないように、URLにフラグ若しくはスコアが付与される。システムは、URLを定期的に再チェックして、対応するウェブサイトのデータ収集実施に変更がなされていないことを保証してもよい。

Description

マーケティング・サービス・プロバイダ(MSP:marketing services provider)は、マルチチャネルのマーケティング・キャンペーンを含めて、マーケティング・キャンペーンの多くの側面で顧客を支援するために存在する。
チャネルは、例えば、電子メール、ウェブ、ダイレクト・メール、及びデジタル・テレビを含んでもよい。これらのサービスを提供する際に、MSPは、例えば、顧客データ統合、データ拡張、データ衛生及び品質改善、重複除去、データベース・マーケティング、プロスペクティング、マーケティング・キャンペーン管理、データ・アナリティクス、並びに関連サービスを実行してもよい。これらのサービスのすべては、顧客に関連するMSPによって維持されるデータによって駆動される。MSPによって提供されるサービスを駆動する顧客データにアクセスするために、多くのMSPは、顧客データ・ブローカとの提携契約を結ぶ。一部のMSPは、顧客のために最も包括的なソリューション・スイートを提供するために、非常に多くの異なるデータ・ブローカとの提携契約を有してもよい。
MSPは、データ提携先によってMSPに提供されるデータがエシカルに調達されている(ethically sourced)ことを保証する処置をとらなければならない。このプロセスは極めて時間がかかり高価である。単一のデータ提携先が、特定のユニフォーム・リソース・ロケータ(URL:uniform resource locator)に関連付けられた何万個ものウェブサイトからデータを収集している場合がある。それぞれが非常に多くのURLからデータを収集する多数のデータ提携先が存在し得ることを考慮すると、MSPが手作業で各URLを個別にチェックして、そこで収集されたデータが適切なプライバシー・ポリシーの下でエシカルに調達されていることを保証するのは実現可能でない。この種の手作業のチェックが完了する時までに、データはもはや有用であるほど十分に新鮮ではなくなっているであろう。これらのURLのいずれにおけるプライバシー・ポリシーも不変ではなく、いつかは変わり得るので定期的な再チェックを必要とすることを考慮すると、上記の問題はより一層複雑になる。何らかの手作業のチェックが完了する時までに、関連するURLのプライバシー・ポリシーのうちのいくつかは変更され、努力が無駄になっている可能性が十分にある。
それにもかかわらず、MSPが自己のデータがエシカルに調達されていることを保証するために使用するプロセスは、代案がないために手作業で従来実行されてきた。各データ提携先がそのデータ・ソースに対するURLを列挙したフォームに記入した後、MSPの職員がそれらのURLのそれぞれを個別にチェックする。これは、この作業に割り当てなければならない従業員勤務時間数が多大であるため、MSPにとって非常にコストがかかる。URLを手作業でチェックすることによって生じる遅延は、データの最新で潜在的に最も正確なソースを使用する前にMSPが待機しなければならないことにより、MSPの顧客に最終的に納入される製品の品質を劣化させることを意味する。これは、例えば、ある消費者が現在市場で特定の製品を探していることの指示など、迅速に対応しなければならないデータに関して特に困難を生じる。最後に、手作業のプロセスは、いずれかのポリシーが変化したかどうかを調べるためにデータ・ソースURLを継続的にチェックすることを不可能にする。これはデータをチェックするプロセスの品質を劣化させ、非エシカルに調達されたデータがMSPのシステムに入り込み得る機会を増加させる。時々の定期チェックのみが実現可能である。データが最新の時に最も価値が高く、労働コストが上昇し続け、非エシカルに調達されたデータの使用(たとえ過失であっても)に対するペナルティが増大し続けている今日の世界では、データ・ソースをチェックする手作業の方法は単にもはや選択肢とはならない。所望されているのは、データがエシカルに調達されていることを保証する自動化されたシステム及び方法であって、新鮮なデータに直ちに対応できるほど十分に迅速に結果を提供し、プライバシー・ポリシーにおける何らかの変更を迅速に識別するためにデータ提携先によって提供されるデータに対するURLを継続的にチェックすることで、データがもはやエシカルな方法で収集され記憶されていない可能性を実証するシステム及び方法である。
この背景技術のセクションで言及されている参照事項は本発明に関する従来技術であることを認めるものではない。
本発明は、データ提携先からのデータがエシカルに調達されていることを保証するためにMSPによって使用されるための自動化されソフトウェア実装されたシステム及び方法に関する。ソフトウェアは、データがマーケティング・キャンペーンにおいてエシカルに使用され得ることを保証するためにアクティブなデータ・ソースURLを継続的に調査する。ソース及びプライバシー・データが、データ提携先がデータを調達し得る非常に多くのURLのそれぞれに対して抽出及び捕捉され、この情報が分析され、将来の使用のために特定の構造体内に記憶される。いくつかの実装形態では、URLに関連付けられたウェブサイトのプライバシー条項を分析するためにキーワード・セットが使用される。いくつかの実装形態では、この目的のためにキーワード・セット・データベースを使用してキーワードを追跡してもよい。データをエシカルに収集しているウェブサイトに関連付けられたURLはURLデータベースに記憶されるため、新規のデータ提携先がこれらのURLをそのデータのソースとして識別するたびごとにこれらのURLをチェックする必要がない。代替的に、すべてのチェックされたURLが、エシカルな調達を示すフラグ又はデータを調達する際に使用されるエシックスを反映するスコアなどの、それらのURLに付随するポリシーに関連する追加情報とともにデータベースに維持されてもよい。また、いくつかの実装形態では、システムは、URLデータベース内のURLを定期的に再チェックして、対応するウェブサイトのデータ収集業務に、データがもはやエシカルに調達されていないことを示すような変更がなされていないことを保証してもよい。このチェックは、特定のスケジュールで実行するようにスケジュールされてもよく、リソースが利用可能な時に実行されてもよく、又は、それぞれの対応するURLに対して最新のプライバシー・ポリシーが利用可能であることを保証するために絶えず再実行されることさえ可能である。
本発明のこれら及び他の特徴、目的及び利点は、図面とともに以下の詳細な説明を考慮することからより良く理解されるであろう。
本発明の第1の実装形態によるプロセス・フロー図である。 本発明の実装形態によるシステム・アーキテクチャ図である。 本発明の第2の実装形態によるプロセス・フロー図である。
本発明をさらに詳細に説明する前に、理解されるべきであるが、本発明の範囲は、優先権が主張される後続の出願における特許請求の範囲によってのみ限定されるものであるから、本発明は説明される特定の実施例に限定されず、特定の実施例を説明する際に使用される用語はそれらの特定の実施例を説明する目的のみのものであって、限定的であることを意図してない。
プロセスのソフトウェア実装された自動化部分が動作する前に、プロセスは、潜在的なデータ提携先に一連の質問を提示することによって開始する。データ提携先は、プロセスを管理するソフトウェアにログインすることが可能であり、質問は順次的なフォームに提示されることが可能である。潜在的データ提携先に尋ねられる質問は、潜在的データ提携先が国内主体かそれとも国際主体かに応じて変わり得る。国内主体に提示される質問の非限定的なサンプル・セットは以下の通りである。
会社及び連絡先情報
日付:
会社名:
住所:
会社ウェブサイト:
連絡先担当者:
連絡先電子メール:
連絡先電話番号:
事業年数:
データ情報
1.御社がMSPに提供しようとしているデータの概要を記述してください。
2.御社が利用可能なものとして有しているすべてのデータ要素を示すレコード・レイアウト又はデータ辞書を添付してください。レイアウトは、各要素の個数及び値(又は要素内の各値)を含まなければなりません。例えば、年齢範囲については、御社が有している推定範囲及び範囲ごとの個数を提供してください。
3.御社のファイルに対してどのような衛生プロセス(例えば、アドレス・クリーニング、NCOA、オプトアウト抑制など)をどのくらいの頻度で実行していますか?
データ調達
1.御社はデータのオリジネータですか、それともアグリゲータですか、それともその両方ですか?
2.データの出典は何ですか、そしてデータはどのように収集されていますか?(例えば、オンライン、オフライン、コール・センター、保証書、調査、小売り取引など)
3.データはどの国(単数又は複数)で発生しましたか?
4.御社のデータの収集中にプライバシー・ポリシーを参照していますか?御社のプライバシー・ポリシーのURLを提供してください。
5.第三者による個人のデータの転送及び使用に関して、データ収集プロセス中にその個人は御社のプライバシー・ポリシー又はどこか他の箇所で通知を受けますか?
6.御社(又はデータ収集者)は、個人が個別に明確に「オプトイン」が可能であるメカニズムを提供していますか?そうであるならば、その個人は何に対して(例えば、第三者へのデータ転送、モバイル・マーケティング・キャンペーン、電子メール・マーケティング・キャンペーンなど)オプトインしますか?
7.御社(又はデータ収集者)は、個人が「オプトアウト」する選択を実行するか、又は第三者へのその個人のデータの転送を防止することが可能なメカニズムを提供していますか?
8.収集されたデータは、子供(すなわち、13未満又は13~17歳の者)に関する何らかの情報を含みますか?御社の回答が「はい」であるならば、御社はそのデータをMSPに提供していますか?
9.御社がデータのオリジネータでないならば、MSPにデータを供給する御社の能力に影響を及ぼす御社と御社のデータ・ソースとの間の契約上の制限を、該当する場合には具体的に特定してください。
カリフォルニア州データ調達
1.御社はカリフォルニア州消費者プライバシー法(CCPA:California Consumer Privacy Act)で定義されるカリフォルニア州住民の「個人情報」をMSPに提供しようとしていますか?案内として、下記で提供される「個人情報」のCCPA定義を参照してください。この定義は、カリフォルニア州議会によっていかなる時にも変更を受けることに注意してください。個人情報の定義:個人情報とは、(1)特定の消費者(彼若しくは彼女の実名、通称、署名、社会保障番号、肉体的特徴若しくは記述、郵便宛先、物理的住所、固有個人識別子、オンライン識別子、インターネット・プロトコル・アドレス、電子メール・アドレス、アカウント名、社会保障番号、運転免許番号、旅券番号、電話番号、旅券番号、運転免許若しくは州識別カード番号、保険証券番号、教育、雇用、雇用履歴、銀行口座番号、クレジット・カード番号、デビット・カード番号、若しくは任意の他の金融情報、医療情報、健康保険情報又は他の類似の識別子を含むがそれらに限定されない)又は(2)世帯、を識別し、それに関係し、それを記述し、それに関連付けられることが可能であり、又は、直接的若しくは間接的に、それに合理的に結び付けられ得る情報である。
2.御社の消費者向けプライバシー通知は、該当する場合、CCPAの要件に準拠していますか?
オンライン及び/又はモバイル・データ調達
1.ファイルのいずれかの部分はオンラインで又はモバイル・デバイスから調達されたものですか?もし回答が「いいえ」であるならば、このセクションの質問2~4を飛ばしてください。
2.データがオンラインで、個人から直接的に、及び自動化された手段によって(例えば、サイト訪問者によって記入されたデータ入力フィールド、クッキー、モバイルSDK、APIフィード、クローラ、ウェブ・スクレイピングなど)の両方で、どのように収集されているかの概要を記述してください。
3.個人によって意図的に提供されなかった収集データについてその個人はどのように通知されましたか(例えば、掲示されたプライバシー・ポリシーを通じて、ポップアップ・ボックス内で、など)?
4.御社がアグリゲータであって、御社が共有しているデータの元の収集者ではない場合、御社のデータ調達先のデータ制作者の上位100個のURL又は個別のデータ収集先のURLのレコード数で上位10%、のいずれか数が多い方の名称を提供してください。
規制/コンプライアンス情報
1.御社は政府の照会又は調査に関与したことがありますか?もしそうであれば、説明してください。
国際主体に提示される質問のサンプル・セットは以下の通りである。
会社及び連絡先情報
日付:
会社名:
住所:
国:
御社はEUで何らかの重要な意思決定プレゼンスを有していますか?
会社ウェブサイト:
連絡先担当者:
連絡先電子メール:
連絡先電話番号:
事業年数:
データ情報
1.データの概要を記述してください。
2.御社が利用可能なものとして有しているすべてのデータ要素を示すレコード・レイアウトをこの文書に添付してください。レイアウトは、各要素の個数及び値(又は要素内の各値)を含まなければなりません。例えば、年齢範囲については、御社が有している推定範囲及び範囲ごとの個数を提供してください。
3.御社のファイルに対してどのような衛生処理(例えば、アドレス・クリーニング、NCOA、オプトアウト抑制など)を実行していますか?
4.収集されたすべてのデータがMSPに利用可能となりますか?もしそうでないならば、何が利用可能でないですか?
5.MSPにデータを供給する御社の能力に影響を及ぼす御社と御社のデータ・ソースとの間の契約上の制限を、該当する場合には具体的に特定してください。
6.御社がデータのオリジネータでないならば、MSPにデータを供給する御社の能力に影響を及ぼす御社と御社のデータ・ソースとの間の契約上の制限を、該当する場合には具体的に特定してください。
7.御社が現在加入又は会員資格を維持している自主規制機関を列挙してください。
8.以下の種類のデータ、すなわち法的に注意を要するとみなされるデータ及び/又はMSPの制限されるデータ・カテゴリに属するデータ、のいずれかを弊社に供給しようとしていますか?もしそうであるならば、どちらであって、データ収集の時点で消費者に通知するためにどんな追加的予防措置がとられますか?
9.提示されるデータ・セットに該当する特定の消費者プライバシー法を以下に示してください。
データ調達
11.御社はデータのオリジネータですか、それともアグリゲータですか、それともその両方ですか?
12.データの出典は何ですか、そしてデータはどのように収集されていますか?(例えば、オンライン、オフライン、コール・センター、保証書、調査、小売り取引など)
13.データはどの国(単数又は複数)で発生しましたか?(すべての国を列挙してください)
14.もし御社がデータ・アグリゲータであれば、御社のデータ供給者が法令遵守(例えば、相当な注意、監査、認定の確認など)を保証するために適切な措置をとったことを保証するために、契約条項に加えて、御社がとっている措置を記述してください。
15.御社のデータの収集中にプライバシー・ポリシーを参照していますか?はい/いいえ。御社のプライバシー・ポリシーのURLを提供してください。
16.通知及び選択に関する以下の質問に回答してください。
a.ユーザはwww.youronlinechoices.comを通じて自己の選好を表明することができますか?
b.御社がMSPに供給しているデータは消費者/個人の同意(オプトイン)とともに収集されていますか?
c.上記の質問に対する回答が「はい」であるならば、個人のオプトインは何に対して(例えば、第三者へのデータ転送、モバイル・マーケティング・キャンペーン、電子メール・マーケティング・キャンペーンなど)なされていますか?
d.上記の質問16.a.に対する回答が「はい」であるならば、同意は透明性及び同意の枠組(TCF:Transparency and Consent Framework)を使用して収集されていますか?
e.個人が何に同意したか(その個人が何を話したか、並びにいつ及びどのようにその個人が同意したかを含む)を文書化するために記録が付けられていますか?
f.上記の質問に対する回答が「はい」であるならば、そのような記録は要求された場合にMSPにとって直ちに利用可能となりますか?
g.オプトイン/同意はデータを収集するための唯一の法的根拠ではないので、御社が供給しているデータは合法的な利害関係を法的基礎として収集されていますか?
h.上記の質問に対する回答が「はい」であるならば、御社及び弊社の共同の合法的利害関係がデータ主体のそれになぜ優先するのか説明してください。
i.第三者による個人のデータの転送及び使用に関して、その個人は通知を受けますか?
j.御社は、個人が「オプトアウト」する選択を実行するか、又は第三者へのその個人のデータの転送を防止することが可能なメカニズムを提供していますか?
k.御社のデータ・ソース(該当する場合)は、個人が「オプトアウト」する選択を実行するか、又は第三者へのその個人のデータの転送を防止することが可能なメカニズムを提供していますか?
L.収集されたデータは、子供(すなわち、13未満又は13~17歳の者)に関する何らかの情報を含みますか?
m.御社の回答が「はい」であるならば、御社はそのデータをMSPに提供していますか?
17.御社はいずれかのEU自主規制方式に加入していますか?このフォームに記入する時点で有効なもののみを列挙してください。
18.御社は御社のプライバシー及び/又はセキュリティ実施について認定されていますか?このフォームに記入する時点で有効なもののみを列挙してください。
オンライン及び/又はモバイル・データ調達
19.ファイルのいずれかの部分はオンラインで及び/又はモバイル・デバイスから調達されたものですか?
もし御社の回答が「いいえ」であるならば、このセクションの残りを飛ばして政府照会に進んでください。もし「はい」であるならば、オンラインで又はモバイル・デバイスから調達されたファイルの割合を提示してください。
20.データがオンラインで、個人から直接的に、及び自動化された手段によって(例えば、サイト訪問者によって記入されたデータ入力フィールド、クッキー、モバイルSDK、APIフィード、クローラ、ウェブ・スクレイピングなど)の両方で、どのように収集されているかの概要を記述してください。
21.個人によって意図的に提供されなかった収集データについてその個人はどのように通知されましたか(例えば、掲示されたプライバシー・ポリシーを通じて、ポップアップ・ボックス内で、など)?
22.御社がロケーション・データを供給しているならば、以下の質問に回答してください。
a.データ収集の頻度(どのくらいの間隔でデータが収集されているか)を示してください。
b.ユーザのロケーション・データが収集される前に、ユーザのロケーション・データが第三者のマーケティング目的で共有/使用されることを説明するために、ユーザに対して通知が提供されますか?
23.御社がアグリゲータであって、御社が共有しているデータの元の収集者ではない場合、御社のデータ調達先のデータ制作者の上位100個のURL又は個別のデータ収集先のURLのレコード数で上位10%、のいずれか数が多い方の名称を提供してください。
政府照会
20.御社は政府の照会又は調査に関与したことがありますか?もしそうであれば、説明してください。
この情報は、新規のプライバシー規制の導入又は既存のプライバシー規制に対する変更など、条件が変化する時に更新を受ける。質問票から返された回答は、明らかで顕著な問題を特定するために調査される。そのような問題点がない場合、情報は、エシカルなデータが提供されていることを保証するためにソフトウェア実装された機械学習システムに入力される。
図2は、この自動化されたプロセスを実行するシステムの特定の実装形態を示している。マーケティング・サービス・プロバイダ(MSP)サーバ30は、マーケティング・サービス・プロバイダのための中央処理サーバを提供する。これは機械学習システム32と通信し、機械学習システム32は以下で説明するようにシステムのための人工知能処理を提供する。機械学習システム32は、実入力であるか訓練用入力であるかにかかわらずさまざまな入力を受け取り、エシカルなデータ調達を示すプライバシー・ポリシーを識別するために学習する。機械学習システム32はまた、特定のウェブサイトでのデータ収集に関連するエシックスのレベルに対するスコアを導出し、及び/又は、データをエシカルに調達するサイトを示すフラグを作成してもよい。MSPサーバ30は、URL38のリストを入力として受け取り、承認された(又は、代替的に、調査され、及び、スコア付けされ、又は、フラグ付けされた)ウェブサイトに対するURLのデータベース34を維持する。機械学習システム32は、プライバシー・ポリシーの調査のために、キーワード及び潜在的にキー・フレーズを含むキーワード・セット36を利用する。これらはURLデータベース34内のURLに対応するウェブサイト40に対して適用され、ウェブサイト40はインターネット44などのネットワークを介してMSPサーバ30を通じてアクセスされる。各データ・プロバイダ42は、ウェブサイト40のうちの1つ又は複数に接続する。その理由は、それはデータ・プロバイダ42がそのデータを収集するための手段であるからである。データ・プロバイダ42はまた、MSPによる使用のために収集したデータを提供するために、及びこのデータがそこから収集されているURLをMSPサーバ30に提供するためにも、MSPサーバ30への接続(図示せず)をも有する。
次に図1を参照して、図2のシステムを使用するプロセスを説明する。理解され得るように、データ提携先が選択されるステップ10及びURLデータ38が(上記のフォームによって、又は他の方法で)収集されるステップ12の後、処理はステップ14に移動し、ステップ14の間に、識別されたURLが、以降のプロセスの自動化部分を訓練する機械学習システム32による調査のためにMSPサーバ30にアップロードされる。
MSPの機械学習システム32は、データのエシカルなソースであると既に承認したURLのURLデータベース34を維持する。ステップ16で、機械学習システムはまず、調査されている潜在的な提携先によってサーバに提供された各URLについて、URLデータベース34に従って、そのようなURLが既に調査されシステムによってエシカルなデータ・ソースと認められたかどうかを調べるチェックを行う。代替的に、URLデータベース34が、チェックされたすべてのURLに対する情報を、それらのURLに割り当てられたスコア又はそのURLが使用のために受容されたかどうかを示すブール値フラグとともに保持してもよい。その場合、データベース34に対するチェックは、対象となるURLからのデータがエシカルな使用のために受容可能であることを示すように適切なスコア(すなわち、閾値スコアを満たす)又はフラグが提示されているかどうかを調べるチェックである。そうである場合、URLのさらなる調査はここでは着手されない。多くの潜在的なデータ・ソース提携先がデータを収集するためにURLの重畳するセットを使用している可能性があり、そのために従来の手作業のシステムは多数回にわたる同じURLの再チェックを必要としたので、このステップは、さもなければ結果としてURLをチェックすることになるような重複を除去する。
ステップ18で、機械学習システムは、与えられたURLから関連するプライバシー・ポリシー構成要素、すなわち、そのURLで提供されるデータがエシカルに調達されたかどうかを示すプライバシー・ポリシー構成要素を抽出するために、所定のキーワードを使用してそのURLに関連付けられたウェブサイト40で入手可能な材料をスキャンする。(理解されるように、単一のウェブサイト40が図示されているが、システムは非常に多くのデータ・プロバイダ42及び関連するウェブサイト40が使用され得ること、さらに、複数のウェブサイト40が特定のデータ・プロバイダ42に対するデータ・ソースとして関連付けられ得ることを考慮している。例えば、数百のデータ・プロバイダ42及び数万のウェブサイト40があり得る。)再び注意すべきであるが、ウェブサイト40に対するURLはデータ・プロバイダ42によって提供され、これはデータ・プロバイダ42がウェブサイト40を通じて収集されたデータを使用していることを示している。機械学習システム32は、最初はキーワード・データベース36に記憶された所定のキーワード・セットから出発してもよいが、時間とともにシステムは、エシカルなデータに関連付けられていることが判明したプライバシー・ポリシーからのワードを入力することによって、独自にこのプロセスで有用な追加のキーワードを学習してもよい。この情報は、進行中に機械学習システム32によってキーワード・セット・データベース36に記憶されてもよい。機械学習システムでの使用を意図した方式で、訓練用ウェブサイトがこの目的のために使用されてもよい。プライバシー・ポリシー構成要素が抽出された後、ステップ20で、それらはMSPによる調査のためにダッシュボード・グラフィカル・ユーザ・ディスプレイに追加される。この調査は最初には人手で実行されてもよいが、最終的には調査は機械学習システム32によって実行され、グラフィカル・ディスプレイは、代替的に、人間の読み手のためにプロセスの結果を単に表示するだけでもよい。
ステップ22で、URLには、それらのプライバシー・ポリシー構成要素に対するスコアが割り当てられる。この調査及びスコア付けは機械学習システム32によって実行される。システムは、その結果に対して人手で定期的に提供されるフィードバックを通じて時間とともにその精度を改善する。スコアに基づいて、URLは使用のために受容又は却下され、閾値スコア以上のスコアを有するURLが受容される。そして、ステップ24で、使用のために受容されたURLがデータベース34に書き込まれるため、これらのURLが承認されると、それらは新規の提携先が評価されているときに再びチェックされる必要がない。
ステップ26で、URLのプライバシー・ポリシーに関して何らかの関連する変更があったかどうかを判定するために、既に承認されたURLが機械学習システム32によって再調査される。これらの再調査は定期的に実行されてもよく、又はシステムがこれらの再調査を実行するために利用可能なハードウェア・リソースを有するときにいつでも実行されてもよく、又はURLデータベース34内のURLのそれぞれを継続的に再調査するために機械学習システム32内に専用のシステムがあることさえ可能である。変更がない場合、データベース34内の情報に変更は行われない。変更がある場合、そのURLを再スコア付け又は再評価するために処理はステップ22に戻る。データをエシカルに調達しているウェブサイトに関連付けられたURLのみがURLデータベース34に記憶されている場合、データをもはやエシカルに調達していないウェブサイトに関連付けられていることが判明したURLはデータベース34から削除されてもよい。すべてのURLが保持されるがエシカルな遵守を示すためにブール値フラグが使用される場合、フラグが変更されてもよい。すべてのURLが保持されエシカルな遵守を示すスコアがURLに対して維持される場合、旧スコアが新スコアで上書きされてもよい。
ステップ28で、機械学習システムの処理が完了する。理解されるように、潜在的な提携先と、それらのデータを収集するためにそれらの潜在的な提携先によって使用されるURLとの評価を実行することから機械が学習するにつれて、人手の入力は次第に重要でなくなっていく。最終的に、図1に示すようなこのプロセスのすべてのステップにおいて人手の関与を完全に除去することが可能であると予想される。
次に図3を参照して、本発明を実装する第2のプロセスを説明することができる。ステップ50で、一実装形態ではシングル・サインオン(SSO:single sign-on)技術を使用して、ユーザ認証が実行される。ステップ52で、1つ又は複数のURLがポリシー及び条項の評価のためにアップロードされる。ここで注意すべきであるが、URLに関連付けられたウェブサイトのポリシーと条項との間には区別がある。ポリシーは、具体的に消費者プライバシー・ポリシーを対象とすることを意図しており、情報収集、使用、共有、オプトアウトなどを含む。条項は、ウェブサイトの条項及び条件を対象とすることを意図しており、サイト(及びそれに関する情報)の適切な使用及びユーザ/使用の合意を対象とする。場合によっては、評価されているデータがウェブサイトから採集され、それらの場合、対応するデータの意図された使用を妨げるものがないことを保証するために条項が調査される。ステップ54で、URL識別/検証が実行される。具体的には、システムは適切なURLフォーマッティングのために入力を調査し、応答を得るためにそのウェブサイトに電話をかけ、そのドメインが実際にアクティブであることを確認する。アクティブであることが検証できないドメインはさらなる調査のために例外レポートに捕捉される。そして、ステップ30で、検証されたドメインについてポリシー及び条項がダウンロードされる。ダウンロードされると、それらはプライバシー・ポリシー又は条項及び条件のいずれかに分類され、評価が実行されている1つ又は複数のデータ提携先とそれぞれ結び付けられる。これは、各文書について対応するデータベース内にタイムスタンプ及び新規のエントリを生成する。
ステップ58は、調達ポリシーの定期的判定である。システムは、新規の管理下にあるすべてのアクティブなポリシー及び条項を再捕捉する。テキスト内に過去のポリシー及び条項からの変更が検出された場合、ダウンロード及び分類のプロセスが再開する。テキストが変更されていない場合、システムは調査のタイムスタンプ・エントリを作成し、変更が検出されなかったことを示す。いずれの場合でも、それから処理はステップ60に進み、プライバシー・ポリシーのコンテキストを理解して特定のソースを承認又は却下する際に必要なデータ点を抽出するために自然言語処理(NLP:natural language processing)技術が適用される。特定のポリシーがなぜ/どのように却下又は承認されたかに関してニューラル・ネットワークが理解可能なデータ点を作成することにより、AIモデルはセマンティクスを学習し、時間とともに手作業の介入なしで却下又は承認を自動的に判定することができるようになる。
ステップ62で、ポリシー及び条項がタクソノミー化される。システムは、ポリシー内に存在する必要のある確立されたキー要素を使用し、処理は、人間及び機械の両者が調査することを可能にする所定のタクソノミー内で特定のテキストを識別、捕捉及び提示する。このようにして、プロセスはポリシー内でデータ使用を可能化又は防止するさまざまなテキスト及び句について標準化される。そして、ステップ64で、タクソノミー化されたポリシー及び条項はユーザ・インタフェース(UI:user interface)を通じて提示されてもよい。ステップ66で、UIを使用して、人間の調査者が、第三者とのデータの共有を許可又は防止する言葉についてポリシーを検査してもよい。この場合、システムは、ナビゲートの容易なタクソノミーにおいて関連性のあるテキストを表面化する予備的作業の大部分を実行している。これらの人手による調査は、機械によるスコア付けを可能にするために必要な訓練データ・セットのための基礎を形成する。理解されるべきであるが、機械学習システムがステップ66での手作業の調査からの入力を使用して成熟したある時間の後、手作業のステップは最終的に完全に除去されてもよい。
人手による調査がもはや不要であるほどにシステムが成熟した後、処理は代わりにステップ90に移動し、そこではUIを通じて人手による調査のためにテキストを表面化させる代わりに、データ点が抽出され機械学習アルゴリズムを通じて処理され、ステップ70で、ポリシーが学習セット内に含まれる承認されたポリシー及び不良のポリシーをどのくらい厳密に満たすかに関する定量化された出力、すなわちスコア、を生成する。手作業の場合又は機械学習により自動化された場合のいずれにおいても、判定ブロック72で、ポリシーが第三者との消費者データの共有を防止又は許可する言葉を含むかどうか、及び条項がデータの商業的利用を見込んでいるかそれとも防止しているかが判定される。合格はデータがキャンペーンに含まれてもよいことを示し、一方、不合格はデータが除外されることを示す。
本明細書に記載されるシステム及び方法は、ハードウェア及びソフトウェアの任意の組合せによってさまざまな実施例で実装されてもよい。例えば、一実施例では、システム及び方法は、コンピュータ・システム又はコンピュータ・システムの集まりによって実装されることが可能であり、各コンピュータ・システムが、プロセッサに結合されたコンピュータ可読記憶媒体上に記憶されたプログラム命令を実行する1つ又は複数のプロセッサを含む。プログラム命令は、本明細書に記載された機能を実装してもよい。図面に図示され本明細書に記載されたさまざまなシステム及び表示が、例示的な実装形態を表す。いずれの方法の順序も変更可能であり、さまざまな要素が追加、変更、又は省略されてもよい。
本明細書に記載されたコンピューティング・システム又はコンピューティング・デバイスは、本発明のさまざまな実装形態の諸部分を形成するものとして、クラウド・コンピューティング・システム又は非クラウド・コンピューティング・システムのハードウェア部分を実装してもよい。コンピュータ・システムは、コモディティ・サーバ、パーソナル・コンピュータ・システム、デスクトップ・コンピュータ、ラップトップ若しくはノートブック・コンピュータ、メインフレーム・コンピュータ・システム、ハンドヘルド・コンピュータ、ワークステーション、ネットワーク・コンピュータ、消費者用デバイス、アプリケーション・サーバ、記憶装置、電話機、携帯電話機、又は一般に任意の種類のコンピューティング・ノード、計算ノード、計算デバイス、及び/若しくはコンピューティング・デバイスを含むがこれらには限定されないさまざまな種類のデバイスのいずれでもよい。コンピューティング・システムは、入出力(I/O:input/output)インタフェースを介してシステム・メモリに結合された1つ又は複数のプロセッサ(そのいずれかが複数の処理コアを含んでもよく、シングルスレッドでもマルチスレッドでもよい)を含む。コンピューティング・システムはさらに、I/Oインタフェースに結合されたネットワーク・インタフェースを含んでもよい。
さまざまな実施例では、コンピュータ・システムは、1つのプロセッサを含むシングル・プロセッサ・システムであっても、複数のプロセッサを含むマルチプロセッサ・システムであってもよい。プロセッサは、コンピューティング命令を実行することが可能な任意の好適なプロセッサであってよい。例えば、さまざまな実施例では、それらは多様な命令セット・アーキテクチャのいずれかを実装する汎用又は組込みプロセッサであってよい。マルチプロセッサ・システムでは、プロセッサのそれぞれが共通に同じ命令セットを実装し得るが、必ずしもそうでなくてもよい。コンピュータ・システムはまた、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、又はインターネットなどの通信ネットワークを通じて他のシステム及び/又は構成要素と通信するための1つ又は複数のネットワーク通信デバイス(例えば、ネットワーク・インタフェース)をも含む。例えば、コンピューティング・デバイス上で実行されるクライアント・アプリケーションは、さまざまなサブシステムに実装されるクラウド・コンピューティング又は非クラウド・コンピューティング環境において、本明細書に記載されるシステムの構成要素のうちの1つ又は複数を実装する単一のサーバ上又はサーバのクラスタ上で実行されるサーバ・アプリケーションと通信するためにネットワーク・インタフェースを使用してもよい。別の例では、コンピュータ・システム上で実行されるサーバ・アプリケーションのインスタンスが、他のコンピュータ・システム上に実装され得るアプリケーションの他のインスタンスと通信するためにネットワーク・インタフェースを使用してもよい。
コンピューティング・デバイスはまた、1つ又は複数の永続的記憶装置及び/又は1つ若しくは複数のI/Oデバイスをも含む。さまざまな実施例では、永続的記憶装置は、ディスク・ドライブ、テープ・ドライブ、ソリッド・ステート・メモリ、他の大容量記憶装置、又は任意の他の永続的記憶装置に対応してもよい。コンピュータ・システム(又はその上で動作する分散アプリケーション若しくはオペレーティング・システム)は、所望に応じて永続的記憶装置に命令及び/又はデータを記憶してもよく、必要に応じて記憶された命令及び/又はデータを取得してもよい。例えば、いくつかの実施例では、コンピュータ・システムは、制御プレーン又は制御システムの1つ又は複数のノードを実装してもよく、永続的ストレージはそのサーバ・ノードにアタッチされたSSDを含んでもよい。複数のコンピュータ・システムが同じ永続的記憶装置を共有してもよく、又は永続的記憶装置のプールを共有してもよく、プール内のデバイスは同じ又は異なるストレージ技術を表す。
コンピュータ・システムは、プロセッサによってアクセス可能なコード/命令及びデータを記憶し得る1つ又は複数のシステム・メモリを含む。システム・メモリは、例えば、アクセス速度に基づいてメモリ内の情報をスワップするように設計されたシステムにおける複数レベルのメモリ及びメモリ・キャッシュを含んでもよい。インタリービング及びスワッピングは、仮想メモリ実装形態において永続的ストレージに拡張されてもよい。メモリを実装するために使用される技術は、例として、スタティック・ランダムアクセス・メモリ(RAM:random-access memory)、ダイナミックRAM、読出し専用メモリ(ROM:read-only memory)、不揮発性メモリ、又はフラッシュ・メモリを含んでもよい。永続的ストレージと同様に、複数のコンピュータ・システムが同じシステム・メモリを共有してもよく、又はシステム・メモリのプールを共有してもよい。システム・メモリ(単数又は複数)は、本明細書に記載されたルーチンを実装するためにプロセッサによって実行可能なプログラム命令を含んでもよい。さまざまな実施例では、プログラム命令はバイナリ、アセンブリ言語、Javaなどの任意のインタプリタ型言語、C/C++などのコンパイラ型言語、又はそれらの任意の組合せでエンコードされてもよい。ここで与えられる特定の言語は単なる例である。いくつかの実施例では、プログラム命令は複数の個別のクライアント、サーバ・ノード、及び/又は他の構成要素を実装してもよい。
いくつかの実装形態では、プログラム命令は、オペレーティング・システム(図示せず)を実装するために実行可能な命令を含んでもよく、オペレーティング・システムはUNIX、LINUX、Solaris(商標)、MacOS(商標)、又はMicrosoft Windows(商標)などのさまざまなオペレーティング・システムのいずれでもよい。プログラム命令のうちのいずれか又は全部は、コンピュータ・プログラム製品、又はソフトウェアとして提供されてもよく、これらは命令がその上に記憶された非一時的コンピュータ可読記憶媒体を含んでもよく、その命令はさまざまな実装形態によるプロセスを実行するためにコンピュータ・システム(又は他の電子デバイス)をプログラムするために使用されてもよい。非一時的コンピュータ可読記憶媒体は、機械(例えば、コンピュータ)によって読出し可能な形態(例えば、ソフトウェア、処理アプリケーション)で情報を記憶する任意のメカニズムを含んでもよい。一般的に言えば、非一時的コンピュータ・アクセス可能媒体は、I/Oインタフェースを介してコンピュータ・システムに結合された磁気又は光学媒体、例えば、ディスク又はDVD/CD-ROM、などのコンピュータ可読記憶媒体又はメモリ媒体を含んでもよい。非一時的コンピュータ可読記憶媒体はまた、コンピュータ・システムのいくつかの実施例にシステム・メモリ又は他の種類のメモリとして含まれ得るRAM又はROMなどの任意の揮発性又は不揮発性媒体をも含んでもよい。他の実装形態では、プログラム命令は、ネットワーク・インタフェースを介して実装され得るような、ネットワーク及び/又は有線若しくは無線リンクなどの通信媒体を介して伝達される光学的、音響的又は他の形態の伝搬信号(例えば、搬送波、赤外線信号、デジタル信号など)を使用して通信されてもよい。ネットワーク・インタフェースは、他のデバイスとインタフェースをとるために使用されてもよく、他のデバイスは他のコンピュータ・システム又は任意の種類の外部電子デバイスを含んでもよい。一般的に、ネットワークを通じて他のデバイス上でアクセス可能なシステム・メモリ、永続的ストレージ、及び/又はリモート・ストレージは、本明細書に記載されたルーチンを実装する際に使用可能なデータ・ブロック、データ・ブロックのレプリカ、データ・ブロック及び/若しくはそれらの状態に関連付けられたメタデータ、データベース構成情報、並びに/又は任意の他の情報を記憶してもよい。
特定の実装形態では、I/Oインタフェースは、ネットワーク・インタフェース又は他の周辺インタフェースを通じたものを含めて、プロセッサ、システム・メモリ、及びシステム内の任意の周辺装置の間のI/Oトラフィックを調整してもよい。いくつかの実施例では、I/Oインタフェースは、ある構成要素(例えば、システム・メモリ)からのデータ信号を別の構成要素(例えば、プロセッサ)による使用に好適なフォーマットに変換するために、任意の必要なプロトコル、タイミング又は他のデータ変換を実行してもよい。いくつかの実施例では、I/Oインタフェースは、例えば、周辺構成要素相互接続(PCI:Peripheral Component Interconnect)バス標準又はユニバーサル・シリアル・バス(USB:Universal Serial Bus)標準の変種などのさまざまな種類の周辺バスを通じてアタッチされたデバイスに対するサポートを含んでもよい。また、いくつかの実施例では、システム・メモリへのインタフェースなどのI/Oインタフェースの機能のいくつか又は全部は、プロセッサに直接に組み込まれてもよい。
ネットワーク・インタフェースは、コンピュータ・システムと、例えば他のコンピュータ・システム(これは、1つ又は複数のストレージ・システム・サーバ・ノード、プライマリ・ノード、読出し専用ノード・ノード、及び/又は本明細書に記載されたデータベース・システムのクライアントを実装してもよい)などの、ネットワークにアタッチされた他のデバイスとの間でデータ交換されることを可能にしてもよい。さらに、I/Oインタフェースは、コンピュータ・システムとさまざまなI/Oデバイス及び/又はリモート・ストレージとの間の通信を可能にしてもよい。入出力デバイスは、いくつかの実施例では、1つ又は複数のディスプレイ端末、キーボード、キーパッド、タッチパッド、スキャニング装置、音声若しくは光学認識装置、又は1つ若しくは複数のコンピュータ・システムによるデータの入力若しくは取得に好適な任意の他のデバイスを含んでもよい。これらは、特定のコンピュータ・システムに直接に接続してもよく、又は一般的にクラウド・コンピューティング環境、グリッド・コンピューティング環境、若しくは複数のコンピュータ・システムを伴う他のシステムにおける複数のコンピュータ・システムに接続してもよい。複数の入出力デバイスが、コンピュータ・システムとの通信において存在してもよく、又はコンピュータ・システムを含む分散システムのさまざまなノード上に分散されてもよい。本明細書に記載されるユーザ・インタフェースは、さまざまな種類のディスプレイ画面を使用するユーザにとって可視であってもよく、ディスプレイ画面はCRTディスプレイ、LCDディスプレイ、LEDディスプレイ、及び他のディスプレイ技術を含んでもよい。いくつかの実装形態では、入力はタッチスクリーン技術を使用してディスプレイを通じて受け取られてもよく、他の実装形態では、入力はキーボード、マウス、タッチパッド、若しくは他の入力技術、又はこれらの技術の任意の組合せを通じて受け取られてもよい。
いくつかの実施例では、同様の入出力デバイスがコンピュータ・システムから分離してもよく、ネットワーク・インタフェースを介してなど、有線又は無線接続を通じてコンピュータ・システムを含む分散システムの1つ又は複数のノードと相互作用してもよい。ネットワーク・インタフェースは、1つ又は複数の無線ネットワーキング・プロトコル(例えば、Wi-Fi/IEEE802.11、又は他の無線ネットワーキング標準)を一般的にサポートしてもよい。ネットワーク・インタフェースは、例えば、他の種類のイーサネット・ネットワークなどの任意の好適な有線又は無線の一般的なデータ・ネットワークを介した通信をサポートしてもよい。さらに、ネットワーク・インタフェースは、アナログ音声ネットワーク若しくはデジタル・ファイバ通信ネットワークなどの電気通信/電話ネットワークを介した通信、ファイバ・チャネルSANなどのストレージ・エリア・ネットワークを介した通信、又は任意の他の好適な種類のネットワーク及び/若しくはプロトコルを介した通信をサポートしてもよい。
本明細書に記載される分散システム実施例のうちのいずれか、又はそれらの構成要素のうちのいずれかは、クラウド・コンピューティング環境における1つ又は複数のネットワークベースのサービスとして実装されてもよい。例えば、データベース・システムのデータベース・ティア内の読み書きノード及び/又は読出し専用ノードが、本明細書に記載される分散ストレージ・システムを使用するデータベース・サービス及び/又は他の種類のデータ・ストレージ・サービスをネットワークベースのサービスとしてクライアントに提示してもよい。いくつかの実施例では、ネットワークベースのサービスは、ネットワークを介して相互運用可能なマシン間相互作用をサポートするように設計されたソフトウェア及び/又はハードウェア・システムによって実装されてもよい。ウェブ・サービスは、ウェブ・サービス記述言語(WSDL:Web Services Description Language)などの機械処理可能なフォーマットで記述されたインタフェースを有してもよい。他のシステムが、ネットワークベースのサービスのインタフェースの記述によって規定される方法でネットワークベースのサービスと相互作用してもよい。例えば、ネットワークベースのサービスは、他のシステムが呼び出し得るさまざまなオペレーションを定義してもよく、他のシステムがさまざまなオペレーションを要求する際に従うことが期待され得る特定のアプリケーション・プログラミング・インタフェース(API:application programming interface)を定義してもよい。
さまざまな実施例では、ネットワークベースのサービスは、ネットワークベースのサービスの要求に関連付けられたパラメータ及び/又はデータを含むメッセージの使用を通じて要求され、又は呼び出されてもよい。このようなメッセージは、拡張可能マークアップ言語(XML:Extensible Markup Language)などの特定のマークアップ言語に従ってフォーマットされてもよく、及び/又はシンプル・オブジェクト・アクセス・プロトコル(SOAP:Simple Object Access Protocol)などのプロトコルを使用してカプセル化されてもよい。ネットワークベースのサービスの要求を実行するため、ネットワークベースのサービスのクライアントは、要求を含むメッセージを組み立て、ハイパーテキスト転送プロトコル(HTTP:Hypertext Transfer Protocol)などのインターネットベースのアプリケーション層転送プロコトルを使用して、ウェブ・サービスに対応するアドレス可能なエンドポイント(例えば、ユニフォーム・リソース・ロケータ(URL))へメッセージを伝達してもよい。いくつかの実施例では、ネットワークベースのサービスは、メッセージベースの技術ではなく表現状態転送(REST:Representational State Transfer)技術を使用して実装されてもよい。例えば、REST技術に従って実装されたネットワークベースのサービスが、PUT、GET、又はDELETEなどのHTTPメソッド内に含まれるパラメータを通じて呼び出されてもよい。
別段の断りがない限り、本明細書で使用されるすべての技術用語及び科学用語は、本発明が属する分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載されるものと類似又は同等の任意の方法及び材料もまた本発明の実施又は試験において使用可能であるが、限定された数の例示的方法及び材料が本明細書には記載される。当業者には認識されるように、本明細書における発明の概念から逸脱することなくさらに多くの変更が可能である。
本明細書で使用されるすべての用語は、文脈と整合する可能な限り最広義に解釈されるべきである。特に、「含む」「備える」という用語は、非排他的に要素、構成要素、又はステップを参照しており、参照される要素、構成要素、又はステップが、明確に参照されていない他の要素、構成要素、又はステップとともに存在し、又は利用され、又は組み合わされ得ることを示していると解釈されるべきである。マーカシュ型の群又は他のグルーピングが本明細書で使用される場合、群のすべての個別メンバ及び群のすべての可能な組合せ及び下位組合せが本開示に個別に含まれることが意図されている。範囲が本明細書で言及される場合、本開示はその範囲内のすべての点及びその範囲内のすべての部分範囲を含むことが具体的に意図されている。本明細書で引用されるすべての参考文献は、本明細書の開示との矛盾がない限り参照により本明細書に組み込まれる。
本発明について、例示的であることのみが意図され本発明の完全な範囲にとって限定的でない特定の好適な及び代替的な実施例を参照して説明した。単一のプレースホルダ請求項が本明細書において提示されるが、より広範囲の請求項が後続の非仮特許出願で提示される予定であるので、本発明はそのように限定されない。

Claims (20)

  1. データがエシカルに収集されていることを確認するためのコンピュータ化された方法であって、
    複数のユニフォーム・リソース・ロケータ(URL)をデータ・プロバイダからマーケティング・サービス・プロバイダ(MSP)サーバにアップロードするステップであって、前記複数のURLのそれぞれは、データがそこから収集されているウェブサイトに対応する、アップロードするステップと、
    URLデータベースにおいて前記複数のURLのそれぞれとの一致を検索するステップと、
    前記複数のURLのうち前記URLデータベース内で一致が発見されない各URLについて、前記複数のURLのうちのこのようなURLに対応する前記ウェブサイトからプライバシー・ポリシー構成要素を抽出するために機械学習システムを利用するステップと、
    前記複数のURLのうち前記URLデータベース内で一致が発見されない各URLについて、前記プライバシー・ポリシーがエシカルなデータ収集に適合しているかどうかを判定するために、前記対応するウェブサイトから抽出された前記プライバシー・ポリシー構成要素を調査するステップと、
    前記複数のURLのうち前記URLデータベース内で一致が発見されない各URLについて、前記対応するウェブサイトの前記プライバシー・ポリシーがエシカルなデータ収集に適合している場合に前記URLを前記URLデータベースに追加するか、又は前記プライバシー・ポリシーを示す関連付けられたブール値フラグ若しくは計算されたスコアとともに前記URLを前記URLデータベースに追加するステップと、
    を備える、コンピュータ化された方法。
  2. 前記複数のURLのうち前記URLデータベース内で一致が発見されない各URLについて、前記プライバシー・ポリシーがエシカルなデータ収集に適合しているかどうかを判定するために、前記対応するウェブサイトから抽出された前記プライバシー・ポリシー構成要素を調査する前記ステップが、前記対応するウェブサイトにおいて所定のキーワードを検索するステップを含む、請求項1に記載のコンピュータ化された方法。
  3. 前記所定のキーワードが、前記機械学習システムと通信しているキーワード・セット・データベースから引き出される、請求項1に記載のコンピュータ化された方法。
  4. 複数の訓練用ウェブサイトを前記機械学習システムに提示し、前記訓練用ウェブサイトのうちのいずれがデータのエシカルな収集に関連付けられているかを前記機械学習システムに対して識別することによって、前記機械学習システムを訓練するステップをさらに含む、請求項3に記載のコンピュータ化された方法。
  5. 前記機械学習システムが、データのエシカルな収集に関連付けられた訓練用ウェブサイトから追加的なキーワードを抽出し、前記キーワード・セット・データベースに前記抽出された追加的なキーワードを追加することによって前記キーワード・セット・データベースを更新するステップをさらに含む、請求項4に記載のコンピュータ化された方法。
  6. 前記複数のURLのうち前記URLデータベース内で一致が発見されない各URLについて、前記プライバシー・ポリシーがエシカルなデータ収集に適合しているかどうかを判定するために、前記対応するウェブサイトから抽出された前記プライバシー・ポリシー構成要素を調査する前記ステップが、各URLをスコア付けするステップを含む、請求項1に記載のコンピュータ化された方法。
  7. 各URLをスコア付けする前記ステップが、前記URLスコアが閾値スコアを満たすか又は超過することを判定するステップを含む、請求項6に記載のコンピュータ化された方法。
  8. 前記URLを前記URLデータベースに追加する前記ステップが、前記URLスコアを前記URLデータベース内の前記URLに関連付けるステップをさらに含む、請求項6に記載のコンピュータ化された方法。
  9. 前記URLを前記URLデータベースに追加する前記ステップが、フラグを前記URLデータベース内の前記URLに関連付けるステップをさらに含み、前記フラグが、このようなURLの前記対応するウェブサイトがデータをエシカルに調達しているかどうかのブール値指示子である、請求項6に記載のコンピュータ化された方法。
  10. 前記URLデータベース内の各URLについて、
    前記複数のURLのうちのこのようなURLに対応する前記ウェブサイトからプライバシー・ポリシー構成要素を抽出するために前記機械学習システムを利用するステップと、
    前記プライバシー・ポリシーがエシカルなデータ収集に適合しているかどうかを判定するために、前記対応するウェブサイトから抽出された前記プライバシー・ポリシー構成要素を調査するために前記機械学習システムを利用するステップと、
    前記対応するウェブサイトの前記プライバシー・ポリシーがエシカルなデータ収集に適合している場合に前記URLを前記URLデータベース内に保持し、又は前記対応するウェブサイトの前記プライバシー・ポリシーがエシカルなデータ収集にもはや適合していない場合に前記URLを前記URLデータベースから削除するステップと、
    をさらに含む、請求項1に記載のコンピュータ化された方法。
  11. 前記複数のURLのうちのこのようなURLに対応する前記ウェブサイトからプライバシー・ポリシー構成要素を抽出するために前記機械学習システムを利用する前記ステップと、前記プライバシー・ポリシーがエシカルなデータ収集に適合しているかどうかを判定するために、前記対応するウェブサイトから抽出された前記プライバシー・ポリシー構成要素を調査する前記ステップと、前記対応するウェブサイトの前記プライバシー・ポリシーがエシカルなデータ収集に適合している場合に前記URLを前記URLデータベース内に保持し、又は前記対応するウェブサイトの前記プライバシー・ポリシーがエシカルなデータ収集にもはや適合していない場合に前記URLを前記URLデータベースから削除する前記ステップと、が定期的に自動的に実行される、請求項10に記載のコンピュータ化された方法。
  12. 前記複数のURLのうちの少なくとも1つに対する前記プライバシー・ポリシーにおける変更を含む人間可読な表示を構築するステップをさらに含む、請求項11に記載のコンピュータ化された方法。
  13. データのエシカルな収集を保証するためのコンピュータ化されたシステムであって、
    マーケティング・サービス・プロバイダ(MSP)サーバと、
    前記MSPサーバと通信しているユニフォーム・リソース・ロケータ(URL)データベースであって、前記URLデータベースが複数のURLを含み、前記URLのそれぞれが、消費者データを収集するウェブサイトに関連付けられる、URLデータベースと、
    前記MSPサーバと通信している機械学習システムであって、前記機械学習システムが、前記MSPサーバから調査URLを受け取り、前記URLに関連付けられたウェブサイトで収集されたデータがエシカルに調達されているかどうかを判定するために、前記ウェブサイトのプライバシー・ポリシーを調査するように構成される、機械学習システムと、
    を備える、コンピュータ化されたシステム。
  14. 前記機械学習システムと通信しているキーワード・セットをさらに備え、前記機械学習システムが、前記キーワード・セット内のキーワードを検索することによって、前記URLに関連付けられた前記ウェブサイトの前記プライバシー・ポリシーを検索するように構成される、請求項13に記載のコンピュータ化されたシステム。
  15. 前記MSPサーバは、前記URLに関連付けられた前記ウェブサイトで収集された前記データがエシカルに調達されていると前記機械学習システムが判定する場合に、前記URLを前記URLデータベースに書き込むようにさらに構成される、請求項14に記載のコンピュータ化されたシステム。
  16. 前記機械学習システムと通信している複数の訓練用ウェブサイトをさらに備え、前記機械学習システムが、前記訓練用ウェブサイトを調査し、データがエシカルに調達されていることを示すプライバシー・ポリシーを含む訓練用ウェブサイトからキーワードを前記キーワード・セットに追加するようにさらに構成される、請求項15に記載のコンピュータ化されたシステム。
  17. 前記MSPサーバは、前記URLを前記URLデータベースに書き込み、前記URLに関連付けられた前記ウェブサイトからの前記データがエシカルに調達されている程度を示すURLスコアに前記URLデータベース内の前記URLを関連付けるようにさらに構成される、請求項14に記載のコンピュータ化されたシステム。
  18. 前記MSPサーバは、前記URLを前記URLデータベースに書き込み、前記URLに関連付けられた前記ウェブサイトからの前記データがエシカルに調達されているかどうかを示すブール値フラグに前記URLデータベース内の前記URLを関連付けるようにさらに構成される、請求項14に記載のコンピュータ化されたシステム。
  19. 前記機械学習システムは、前記URLデータベース内の各URLに関連付けられたウェブサイトで収集された前記データが依然としてエシカルに調達されているかどうかを判定するために前記ウェブサイトのプライバシー・ポリシーを再調査し、前記ウェブサイトで収集された前記データがもはやエシカルに調達されていない場合に前記URLデータベースから各このようなURLを削除するようにさらに構成される、請求項14に記載のコンピュータ化されたシステム。
  20. 前記機械学習システムが、前記URLデータベース内の各URLに関連付けられたウェブサイトのプライバシー・ポリシーを定期的に調査するようにさらに構成される、請求項19に記載のコンピュータ化されたシステム。
JP2021559277A 2019-08-07 2020-06-12 データのエシカルな収集のためのシステム及び方法 Pending JP2022542634A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962884025P 2019-08-07 2019-08-07
US62/884,025 2019-08-07
PCT/US2020/037491 WO2021025785A1 (en) 2019-08-07 2020-06-12 System and method for ethical collection of data

Publications (1)

Publication Number Publication Date
JP2022542634A true JP2022542634A (ja) 2022-10-06

Family

ID=74503069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021559277A Pending JP2022542634A (ja) 2019-08-07 2020-06-12 データのエシカルな収集のためのシステム及び方法

Country Status (8)

Country Link
US (2) US11526572B2 (ja)
EP (1) EP4010852A4 (ja)
JP (1) JP2022542634A (ja)
CN (1) CN114041146A (ja)
AU (1) AU2020326419A1 (ja)
CA (1) CA3131340A1 (ja)
MX (1) MX2022001502A (ja)
WO (1) WO2021025785A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230306438A1 (en) * 2022-03-22 2023-09-28 Dell Products L.P. Supply chain comparison via ai ethics scores

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1018008C1 (nl) 2001-05-07 2002-11-08 Jean-Luc Rochet Werkwijze en systeem voor het uitvoeren van gepersonifieerde interactieve geautomatiseerde elektronisch marketing van de leverancier van marketingdiensten.
SE0202057D0 (sv) * 2002-07-02 2002-07-02 Ericsson Telefon Ab L M Cookie receipt header
US7272853B2 (en) * 2003-06-04 2007-09-18 Microsoft Corporation Origination/destination features and lists for spam prevention
US20070005652A1 (en) * 2005-07-02 2007-01-04 Electronics And Telecommunications Research Institute Apparatus and method for gathering of objectional web sites
US8219533B2 (en) * 2007-08-29 2012-07-10 Enpulz Llc Search engine feedback for developing reliable whois database reference for restricted search operation
US8458179B2 (en) * 2007-11-29 2013-06-04 Palo Alto Research Center Incorporated Augmenting privacy policies with inference detection
US20110307484A1 (en) * 2010-06-11 2011-12-15 Nitin Dinesh Anand System and method of addressing and accessing information using a keyword identifier
US8918632B1 (en) * 2013-01-23 2014-12-23 The Privacy Factor, LLC Methods for analyzing application privacy and devices thereof
US9356961B1 (en) * 2013-03-11 2016-05-31 Emc Corporation Privacy scoring for cloud services
US11157944B2 (en) 2013-09-13 2021-10-26 Liveramp, Inc. Partner encoding of anonymous links to protect consumer privacy
US9672469B2 (en) * 2013-09-18 2017-06-06 Acxiom Corporation Apparatus and method to increase accuracy in individual attributes derived from anonymous aggregate data
US10747897B2 (en) * 2014-12-09 2020-08-18 Early Warning Services, Llc Privacy policy rating system

Also Published As

Publication number Publication date
CN114041146A (zh) 2022-02-11
EP4010852A4 (en) 2023-12-13
US20230004616A1 (en) 2023-01-05
US20210334329A1 (en) 2021-10-28
WO2021025785A8 (en) 2021-09-10
CA3131340A1 (en) 2021-02-11
WO2021025785A1 (en) 2021-02-11
MX2022001502A (es) 2022-03-11
US11526572B2 (en) 2022-12-13
AU2020326419A1 (en) 2021-10-14
EP4010852A1 (en) 2022-06-15

Similar Documents

Publication Publication Date Title
Saura et al. Assessing behavioral data science privacy issues in government artificial intelligence deployment
Steinert-Threlkeld Twitter as data
Li et al. Cross-cultural privacy prediction
US10552218B2 (en) Dynamic context of tasks
US10346487B2 (en) Data source attribution system
US10324591B2 (en) System for creating and retrieving contextual links between user interface objects
US20170046627A1 (en) Using machine learning techniques to determine propensities of entities identified in a social graph
US9330420B2 (en) Using crowdsourcing to improve sentiment analytics
US10176340B2 (en) Abstracted graphs from social relationship graph
US20130185106A1 (en) Using social media objects for content curation, management, and engagement facilitation
US10621181B2 (en) System and method for screening social media content
AU2014209386A1 (en) Method and apparatus for building a user profile for personalization using interaction data
WO2013016563A1 (en) Identification of rogue social media assets
JP2014527651A (ja) 対人的対話からのテキストコンテンツを用いて、対人関係影響情報を判定するためのシステム及び方法
Schaffner et al. Understanding account deletion and relevant dark patterns on social media
US20170357987A1 (en) Online platform for predicting consumer interest level
Jiang et al. Who's the Guinea Pig? Investigating online A/B/n tests in-the-wild
Kwak et al. Integrating the reviewers’ and readers’ perceptions of negative online reviews for customer decision-making: a mixed-method approach
US20230004616A1 (en) System and Method for Ethical Collection of Data
Biran et al. PolicyCLOUD: A prototype of a cloud serverless ecosystem for policy analytics
US9906611B2 (en) Location-based recommendation generator
Yu et al. Disparities and resilience: analyzing online Health information provision, behaviors and needs of LBGTQ+ elders during COVID-19
Austin et al. Towards dynamic transparency: The AppTrans (Transparency for Android applications) project
Silge et al. Navigating the R Package Universe.
KR102203032B1 (ko) 콘텐츠 관리 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230314

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240424