JP2024511307A

JP2024511307A - プライバシ主導型ユーザ・データ共有のための認知フレームワーク

Info

Publication number: JP2024511307A
Application number: JP2023553677A
Authority: JP
Inventors: エカラバラム、ヴィジャイ; バーティ、ハリシュ; シンデ、ラケシュ; クマールパトラ、アパイ; スキジャ、サンディープ
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2021-03-22
Filing date: 2022-03-22
Publication date: 2024-03-13
Also published as: US20220300650A1; WO2022199575A1; CN116897344A

Abstract

プロセッサは、データセットの利益対リソース・スコアを計算することと、利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することとを含む動作を実行するように構成されてもよい。オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて、再構築損失の最小化と必要な記憶空間の最小化とのバランスをとってもよい。プロセッサによって実行される動作は、オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、データセットを変換済みデータに変換することと、変換済みデータをユーザ空間に記憶することとをさらに含んでもよい。

Description

本開示は、データ・プライバシに関し、より詳細には、ユーザに合わせて調整されたユーザ間の対話を生成しながらデータを保護することに関する。

オンライン・サービスがますます普及している。多くのユーザは、プライバシに対する懸念から、オンラインで情報を提供することを躊躇している。したがって、オンライン・プロバイダは、ユーザ・データを保護する方法を常に模索している。

本開示の実施形態は、プライバシ主導型データ共有（privacy-driven data sharing）のための方法、システム、およびコンピュータ・プログラム製品を含む。実施形態は、プロセッサによって、データセットの利益対リソース・スコア（benefit-to-resource score）を計算することを含んでもよい。利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャが選択されてもよく、オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる。データセットは、前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、変換済みデータに変換されてもよい。変換済みデータは、ユーザ空間に記憶されてもよい。

上記の概要は、例示された各実施形態または本開示のすべての実装形態を説明することを意図したものではない。

本出願に含まれる図面は、本明細書に組み込まれ、本明細書の一部を形成する。これらは、本開示の実施形態を例示しており、説明とともに本開示の原理を解説する役割を果たす。図面は、特定の実施形態を例示しているにすぎず、本開示を限定するものではない。

本開示のいくつかの実施形態による、システムの代表的な構成要素の通信フローを示す図である。本開示のいくつかの実施形態による、プライバシ主導型データ共有のためのオーケストレーション・フローを示す図である。本開示のいくつかの実施形態による、プライバシ主導型データ共有システムを示す図である。本開示のいくつかの実施形態による、次元削減を使用したデータ共有方法を示す図である。本発明の一実施形態による、クラウド・コンピューティング環境を示す図である。本発明の一実施形態による、抽象化モデル層を示す図である。本開示の実施形態による、本明細書に記載の方法、ツール、およびモジュール、ならびに任意の関連機能のうちの１つまたは複数を実装する際に使用され得る例示的なコンピュータ・システムの高レベル・ブロック図である。

本発明は様々な修正形態および代替形態に従うことができるが、その具体的内容は、例として図面に示されており、詳細に説明される。しかしながら、本発明を記載されている特定の実施形態に限定することは意図されていないことが理解されるべきである。それとは反対に、本発明の範囲内に含まれるすべての修正形態、均等物、および代替形態を網羅することを意図している。

本開示の態様は、データ・プライバシに関連し、より詳細な態様は、ユーザ間（例えば、ユーザ（製品購入者）と様々な製品プロバイダとの間）の、ユーザに合わせて調整された対話を生成しながら、ユーザ情報およびその他のデータを保護することに関する。

オンライン製品プロバイダには、オンライン市場（例えば、インターネット）において製品を提供する組織が含まれることがある。オンライン製品プロバイダ（あるいは、製品プロバイダまたはプロバイダ）には、商品プロバイダ、サービス・プロバイダ、または他の様々な製品が含まれることがある。製品プロバイダは、電子機器、衣類、繊維、および自動車部品などの商品を提供することがある。例えば、プロバイダは、ユーザに商品を販売するオンライン小売店を運営する商品プロバイダであってもよい。製品プロバイダは、ソーシャル・メディア・サービスおよびウェブ・ホスティング・サービスなどのオンライン・サービスを提供することがある。製品プロバイダは、芝刈り、ハウス・クリーニング、および自動車修理などの現実世界のサービスを提供することがある。例えば、プロバイダは、ウェブ・ホスティング・サービスを提供するオンライン・ポータルを運営するサービス・プロバイダであってもよい。

プロバイダは、スマートフォンまたはラップトップ・コンピュータなどのユーザ・デバイスを介してユーザから要求を受信することによって動作してもよい。プロバイダは、要求の履行の一部として要求を解析してもよい。例えば、オンライン小売業者は、ユーザのユーザ・デバイスから１つまたは複数のパラメータを含む要求を受け取ってもよく、ユーザは、シャツの購入に興味がある場合があり、オンライン小売業者は、シャツに関するサイズ、色、ブランド、所属チームなどに関連するユーザ・デバイスからのパラメータを解析してもよい。ユーザは、ビーチに着ていくための小さい緑色のシャツを探している場合があり、ユーザ・デバイスは、サイズが小さいこと、色が緑色であること、季節が夏であることを示すパラメータを送信する場合がある。それに対応して、プロバイダは、パラメータに一致するシャツのリストを返してもよい。

プロバイダによって受信されたデータには利点がある可能性がある。第１に、プロバイダは、データを直接使用して、ユーザとの将来の対話に利益をもたらすことができる。例えば、プロバイダは、ユーザの許可を得て、ユーザの名前、住所、および購入履歴などのユーザ情報を保存してもよい。プロバイダは、ユーザ情報に対して１つまたは複数のアルゴリズムを実行して、データに関する洞察（insight）を生成してもよい。洞察は、ユーザによって提供された受信データには存在しなかった情報、またはユーザからのさらなる入力なしに受信データの分析のみに基づいて作成されたデータを含む、１つまたは複数の新しいデータ要素であってもよい。例えば、ユーザが、第１のブランドの特定のサイズの衣類（例えば、ジャケット）である第１の物品と、第２のブランドの第２のサイズの衣類（例えば、第２のジャケット）である第２の物品とを購入する場合、洞察は新しいデータとすることができ、この例では、新しいデータは、ユーザが好む可能性のある衣類サイズの範囲、ユーザが特定の物品を購入することを好む時間帯、ユーザが衣類を購入することを好む領域内の位置（例えば、自宅に対する相対的な位置、例えばリビング・ルームなど）であってもよい。アルゴリズムは、ユーザ情報のデータを分析し、データに関する結論を引き出すために使用される方法、プロセスなどであってもよい。例えば、プロバイダは、ユーザが暦年の秋の月にピンクのシャツを購入することを好むことを示す洞察を生成してもよい。

第２に、プロバイダは、データを直接使用して、他のユーザとの対話に利益をもたらすことができる。例えば、プロバイダは、自分のユーザ・デバイスから要求を送信した複数のユーザに関するデータを収集してもよく、プロバイダは、アルゴリズムを使用して分析を実行し、多くのユーザが毎年１１月の第２週にコートを購入することを好むという洞察を生成してもよい。

さらに、製品プロバイダは、要求からさらなる利益を得ることができる。プロバイダは、ユーザ情報、その情報によって生成された洞察、または１人もしくは複数人のユーザの他のデータもしくはそのユーザに関連する他のデータ、あるいはその組合せから（例えば、お金を稼ぐことによって）間接的に利益を得ることができる。プロバイダが間接的に利益を得ることができる第１の方法は、データを他のプロバイダに販売することによるものである。例えば、第１のオンライン小売業者は、第１のオンライン小売業者がユーザのためにデータを収集または生成した場合に第１のオンライン小売業者がそのデータを第２のオンライン小売業者と共有するという契約を第２のオンライン小売業者と結んでいる場合がある。このような実施形態では、ユーザは、契約について通知を受けることができ、第２のオンライン小売業者にデータを提供しないことを選択することができる。

ユーザの情報の共有および洞察の生成またはユーザに関連する任意の他のデータに関して、ユーザにとって多くの欠点が生じる可能性がある。例えば、情報は、ユーザにとって機密性の高いものである可能性がある（例えば、生年月日、ＳＳＮなど）。別の例では、ユーザは、情報が共有されること自体を望ましくないと感じる可能性がある。具体的には、ユーザは、任意の特定の情報自体を機密性が高いまたは個人的な情報であると識別しない場合があるが、ユーザは、プロバイダおよび広告主などの他のエンティティがユーザに関連する情報にアクセスし、その情報を収集および使用していることを望ましくないと感じる可能性がある。

ユーザは、プロバイダとのデータの共有を回避しようと試みた結果として、オンライン・サービスの使用を中止する場合がある。ユーザは、データ収集に参加すること、または特定のオンライン・プロバイダを使用することを望まない場合がある。その結果、オンライン・プロバイダは、顧客を獲得することがさらに困難になる可能性がある。場合によっては、ユーザは、データの収集を阻止するまたは阻止しようと試みるサード・パーティ・ユーティリティをインストールすることがある。これらのサード・パーティ・ユーティリティは、精査されていないかまたは安全ではない可能性がある。例えば、サード・パーティ・ユーティリティは、ユーザ・デバイス上で過剰な処理能力を使用すること、またはユーザ・デバイス上で大量のランダム・アクセス・メモリ（ＲＡＭ）を消費することがあり、その結果、サード・パーティ・ユーティリティは、ユーザ・デバイス上の速度低下またはデータ損失あるいはその両方を引き起こす可能性がある。

加えて、政府および他の規則制定当局などの様々な規制機関が、様々な状況においてユーザ情報を収集も共有もしないこと、またはそれ以外の方法で使用しないことを求める法律および規制を定めている。例えば、欧州連合で制定された一般データ保護規則（ＧＤＰＲ：General Data Protection Regulation）は、プロバイダおよび広告主に対し、特定のユーザ情報または生成された洞察あるいはその両方を収集も表示もしないよう求める場合がある。したがって、場合によっては、ＧＤＰＲに準拠するために、広告主および製品プロバイダは、規制に準拠するための効率の低い方法でオンライン事業を運営する場合がある。例えば、プロバイダは、ユーザが開始した要求の結果をパーソナライズすることなくオンライン・ストアを運営する。これにより、ユーザ・デバイスがより多くの結果を受信すること、ユーザ・デバイスの処理が遅くなること、または製品プロバイダから結果を提供するために必要なネットワーク帯域幅が増加すること、あるいはその組合せにつながる恐れがある。同様に、ユーザ向けに調整されていない広告を広告主から受信することにより、ユーザ・デバイスからの応答が遅くなる、またはメモリ使用量が増加する、あるいはその両方の可能性がある。

プライベート・クラウド環境における洞察生成（ＩＧＰＣＥ：Insight generation in private cloud environments）は、性能の向上を実現しながら規制への準拠を可能にすることができる。ＩＧＰＣＥは、ユーザのプライバシを損なうことなく、様々なオンライン製品プロバイダにわたってユーザ体験のパーソナライズを提供し、ユーザに提供される広告または他の提供品のカスタマイズを強化するように動作することができる。ＩＧＰＣＥは、高度にパーソナライズされたサービスの運用を容易にすると同時に、ユーザの消費習慣および他の個人情報を共有することに対してユーザが抱く信頼感を高めることができる。ＩＧＰＣＥは、ＧＤＰＲへの準拠などのより厳格なデータ取扱要件に準拠しながら動作することができる。

さらに、ＩＧＰＣＥは、ユーザが、ユーザ・データのアクセスおよび記憶と、ユーザ・データについて生成される洞察との両方を容易に制御できるようにすることができ、これにより、ユーザ情報を共有すること、そのデータをパーソナライズすること、または、ユーザ情報に基づいてデータに基づく洞察を生成できるようにすること、あるいはその組合せに対してユーザが同意する可能性が高まる場合がある。ＩＧＰＣＥを使用することにより、ユーザの生活機能の質を向上させることができる。例えば、ユーザは、様々なオンライン・プロバイダを見てまわるときに、ユーザに合わせた提供品、広告、および絞り込まれた検索結果を受け取ることができる。このユーザに合わせて調整されたオンライン体験を常に伴うことより、実際のユーザ情報がプロバイダと共有される方法を制限することができる。さらに、いくつかの実施形態では、製品（例えば、商品およびサービス）を消費するために、ＩＧＰＣＥをユーザ・デバイスとオンライン製品プロバイダとの間の仲介役として利用することにより、一部またはすべてのユーザ・データをプロバイダのいずれとも共有しなくても済む。

ＩＧＰＣＥは、ユーザによって所有および制御されるユーザ・デバイスからのユーザが開始した要求を検出することによって動作することができる。ＩＧＰＣＥは、ユーザが開始した要求およびＩＧＰＣＥに提供される他のユーザ情報に対する分析を実行することができる。例えば、ユーザは、ＩＧＰＣＥを通じて提供されるサービスにログインまたはサインアップし、これにより、アカウントを受け取り、プライベート・クラウドを割り当てられてもよい。ユーザは、ユーザの名前、年齢、個人のメールアドレスなどのユーザ情報をＩＧＰＣＥに提供することができる。ユーザに割り当てられたＩＧＰＣＥのプライベート・クラウドは、ユーザ情報（例えば、ユーザに関連するデータ）を記憶するように構成されてもよい。

いくつかの実施形態では、プライベート・クラウドは、ユーザについて生成された洞察を記憶するように構成されてもよい。例えば、ＩＧＰＣＥを使用するユーザは、プライベート・クラウドに製品プロバイダからの商品を間接的にブラウズさせてもよく、プライベート・クラウドは、製品プロバイダに向けてユーザが開始した要求の１つまたは複数のパラメータを収集してもよい。プライベート・クラウドはまた、製品プロバイダによって提供された商品またはサービスあるいはその両方に関連する（例えば、ユーザが何かを購入したという）購入決定を収集してもよい。プライベート・クラウドは、購入の情報に関連する分析を実行するとともに、ユーザが開始した要求を分析して１つまたは複数の洞察（例えば、ユーザはロング・ジャケットを好む）を生成してもよい。生成された洞察はプライベート・クラウドに記憶され、さらなるオンライン対話に使用されてもよい。例えば、製品プロバイダに対して商品またはサービスを求める後続の要求が検出された場合、プライベート・クラウドは、ユーザが開始した要求の１つまたは複数のパラメータと以前に生成された洞察との両方に基づいて、プロバイダ応答を変更してもよい（例えば、プロバイダ応答の結果を並べ替える、またはフィルタリングする、あるいはその両方）。例えば、ユーザが以前に青い靴下を探していた場合、ショーツについての新たな検索は、青色に基づいてフィルタリングされてもよい。

ＩＧＰＣＥのプライベート・クラウドは、スマート・オーケストレーションを実行して、ユーザおよびユーザ検索に関連する情報を分析してもよい。具体的には、ＩＧＰＣＥは、ユーザに属するデバイスが、ユーザが開始した要求を製品プロバイダに送信していることを検出してもよい。プライベート・クラウドは、ユーザが開始した要求をインターセプトし、要求に対する分析を実行して、ユーザの特定のユーザ情報を決定してもよい。ＩＧＰＣＥのプライベート・クラウドは、ユーザが開始した要求から特定のパラメータを削除して、匿名化された要求を作成し、その匿名化された要求を製品プロバイダに送信してもよい。プライベート・クラウドは、製品プロバイダからプロバイダ応答を受け取り、ユーザが開始した要求のパラメータとプロバイダ応答内の結果とに基づいて、対象を絞った応答を生成し、その対象を絞った応答を、ユーザが元の要求を送信するために使用したデバイスに送信してもよい。

一例では、ユーザは、小売ウェブサイトで一足の靴を探している場合があり、ユーザは、「サイズ９のテニス・シューズ」を求める要求を小売ウェブサイトに送信する場合がある。プライベート・クラウドは、デバイスからの要求をインターセプトし、その要求をユーザ情報（例えば、ユーザ・デバイスからの要求の１つまたは複数のパラメータで指定された靴のサイズ）について分析し、要求を匿名化してもよい。プライベート・クラウドは、「サイズ７からサイズ１０の靴」を唯一のパラメータとして使用するなど特定のパラメータを削除することによって、要求を匿名化してもよい。匿名化された要求は、ユーザに代わってプライベート・クラウドを介して送信されてもよく、プライベート・クラウドは、オンライン靴小売業者に「靴」を求める要求を送信し、「サイズ７からサイズ１０」の匿名化された要求に一致する靴のリストを受け取ってもよい。プライベート・クラウドは、サイズ「９」の靴ではない、または「テニス・シューズ」以外のタイプのすべての結果をフィルタリングして除外することによって、対象を絞った応答を生成してもよい。プライベート・クラウドは、ユーザ・デバイスを介してユーザに「サイズ９のテニス・シューズ」の応答を送信し、ユーザ・データのプライバシを維持するとともにデータ・プライバシ規制を遵守しながら、パーソナライズされた要求を完了する。

いくつかの実施形態では、ＩＧＰＣＥのポータブル構成要素がユーザ・デバイス上で実行されてもよい。ポータブル構成要素は、プラグイン（例えば、ブラウザ・プラグイン）、デバイスのソフトウェア環境の一部として実行されるバックグラウンド・プログラム（例えば、デーモンまたはジョブ）、または製品プロバイダで検索を実行しユーザが開始した要求に基づいて洞察を生成するように設計されたアルゴリズムであってもよい。ポータブル構成要素は、ユーザが開始した要求の検出を実行してもよい。

ポータブル構成要素は、ユーザが開始した要求を製品プロバイダが受け取れないようにすることによって動作してもよい。例えば、ポータブル構成要素は、ユーザが開始した要求を、アウトバウンド要求キュー、ネットワーク・スタック、またはユーザ・デバイスの他の送信構成要素から、インターセプトしてもよい。ポータブル構成要素は、要求をＩＧＰＣＥのプライベート・クラウドに送信し、対象を絞った応答をプライベート・クラウドから受信してもよい。

ポータブル構成要素は、例えば、製品プロバイダのウェブサイトまたはオンライン・ポータルに基づいてもよい。ポータブル構成要素は、ＩＧＰＣＥによる洞察の向上を可能にする様々なデータ特徴を自動的に取り出してもよい。このようなデータは、製品プロバイダによって別の方法で生成されていてもよい。具体的には、プライベート・クラウド（例えば、プライベート・クラウド上で実行されるオーケストレーション・エンジン）は、製品プロバイダ、またはユーザの洞察に基づいて、（ユーザが開始したクエリの１つまたは複数のパラメータにおいて）要求された製品のタイプを識別してもよい。プライベート・クラウドは、ポータブル構成要素によって使用される特定の洞察生成エンジン（例えば、アルゴリズム）をさらに識別してもよい。例えば、ユーザが最初のオンライン小売業者でシャツを閲覧している場合、ＩＧＰＣＥのプライベート・クラウドのオーケストレーション・エンジンは、最初のオンライン小売業者に対して特定のタイプの検索を実行すること、およびその小売業者に基づいて洞察を生成することが可能な、特定の洞察生成エンジンを識別してもよい。

洞察生成をプライベート・クラウドからユーザ・デバイス上で実行されるＩＧＰＣＥのポータブル構成要素へオフロードすることは、ユーザにとっての技術的な利点を含む可能性がある。例えば、洞察生成のための処理能力は、スマートフォン上で実行されるプラグインに分散されてもよく、ＩＧＰＣＥをホストするサーバからその処理能力をオフロードしてもよい（例えば、スマートフォンの構成要素が、サーバによって実行される処理を軽減する）。集合体でのオフロードは、コンピューティング・リソース（例えば、処理サイクルおよびメモリ空間）を節約する可能性がある。

いくつかの実施形態では、ＩＧＰＣＥは、ユーザのデバイス上にポータブル構成要素がインストールされることなく動作してもよい。例えば、プライベート・クラウドは、ユーザが製品プロバイダに接続して閲覧するためのオンライン・ポータル、ウェブサイト、または他のネットワーク宛先をホストしてもよい。ネットワーク宛先が含まれる場合もあれば、すべてのネットワーク・トラフィックがネットワーク宛先を経由して流れる場合もある。プライベート・クラウドは、トラフィックを監視して、ユーザが開始した要求を検出し、プライベート・クラウドから要求が離れないように要求をインターセプトしてもよい。

ＩＧＰＣＥはまた、ユーザに自分のユーザ情報の完全な制御を提供してもよい。例えば、ユーザは、特定の製品プロバイダから、データを共有するよう、またはユーザのデータに基づいて洞察を生成することを許可するよう求める要求を受け取ってもよい。ユーザは、その要求に対して拒否応答で応答してもよい。拒否応答は、情報を製品プロバイダと共有しないよう求める要求であってもよい。拒否応答の結果として、ＩＧＰＣＥは、ユーザ情報の共有を辞退し、プライベート・クラウドを介した動作を開始してもよい。例えば、ユーザがスマートフォン・アプリを介して拒否応答を提供した場合、ＩＧＰＣＥのポータブル構成要素は、プライベート・クラウドを介して動作を開始してもよい。別の例では、プライベート・クラウド上でユーザが拒否応答を提供した場合、ＩＧＰＣＥは、製品プロバイダへのユーザ情報の提供を阻止してもよい。

ＩＧＰＣＥは、透明性を持って動作するように構成されてもよい。例えば、ユーザが、オンライン製品プロバイダに移動して特定の商品またはサービスの検索を開始した場合、製品プロバイダは、データの共有、または製品プロバイダがユーザ・デバイスによって提供されるユーザ情報に基づいて洞察を生成することに対する許可を要求してもよい。ユーザは、許可を与えることによって要求に応答してもよい。許可を与えることにより、ユーザ・デバイスは製品プロバイダと直接通信して、商品およびサービスの閲覧ならびに検索を容易にすることができる。その後、ユーザは、製品プロバイダと情報を共有しないことを決定し、ユーザ・デバイスを介して関連する設定に移動し、情報を提供せずに特定の製品プロバイダを使用することを選択してもよい。これに応じて、ユーザ・デバイス上のポータブル構成要素は、製品プロバイダにユーザ情報を提供せずに動作を開始し、代わりにＩＧＰＣＥのプライベート・クラウドを介して通信してもよい。

本開示の実施形態は、プライバシ主導型データ共有のための方法を含む。方法は、データセットの利益対リソース・スコアを計算することと、利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することとを含んでもよい。オートエンコーダ・アーキテクチャは、利益対リソース・スコアに基づいて、再構築損失の最小化と必要な記憶空間の最小化とのバランスをとってもよい。方法は、オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、データセットを変換済みデータに変換することと、変換済みデータをユーザ空間に記憶することとをさらに含んでもよい。

図１は、本開示の実施形態による、システムの代表的な構成要素のオーケストレーション・フロー１００を示す。

１つまたは複数のデータ・ソース１１０は、ユーザ・アプリケーション１２０に情報を提供する。データ・ソース１１０は、例えば、ユーザによるデータの手動エントリ、プログラムによるデータの自動プル、別のアプリケーションに送出されたデータの複製、または他のデータ・ソースなど、データの任意のソースであってもよい。データは、ユーザの様々な面からの情報またはユーザの様々な面に関する情報を含んでもよい。データは、例えば、嗜好１２２、購入履歴１２４、ソーシャル・アダプタ１２６、モノのインターネット（IoT）情報１２８、決定モデル１３０、評価モデル１３２、ビッグデータ分析１３４、処方的分析１３６、機械学習１３８を介して集められたデータ、または同様のものを含んでもよい。

ユーザ・アプリケーション１２０は、オーケストレーション・エンジン１４０にデータを提供してもよい。オーケストレーション・エンジン１４０は、ユーザ・プロファイル・データベース１１２などの他の情報源と通信してもよい。他のデータ・ソースとの通信は、ユーザ・アプリケーション１２０との通信に加えて、またはその代わりとして行われてもよい。情報は、プロファイル・プロセッサ１４２においてコンパイルされてもよく、洞察生成器１４４によって分析されてもよい。洞察生成器１４４からの分析結果は、プロファイル・プロセッサ１４２に送出されるか、または記憶されるか、あるいはその両方であってもよい。プロファイル・プロセッサ１４２は、分析データベース１４６と通信してもよい。分析データベース１４６は、アプリケーション・プログラミング・インターフェース１４８と通信してもよい。

オーケストレーション・エンジン１４０は、ユーザ・デバイス、ユーザ・プライベート・クラウド、サーバ上でユーザのために予約された空間、または同様のものなどのユーザ空間１５０と通信してもよい。オーケストレーション・エンジン１４０またはユーザ・アプリケーション１２０あるいはその両方は、ユーザ空間１５０（例えば、ユーザ・デバイス上のプログラム、もしくはユーザ・クラウド空間内のアプリケーション）内に、もしくはユーザ空間１５０の一部として、または独立して存在してもよい（例えば、独立したコンピュータ端末上に配置されるか、もしくはインターネット上で通信するブラウザ経由でアクセス可能なウェブベースのアプリケーション上に配置されてもよい）。

ユーザ空間１５０は、洞察エンジン１５２、スコア算出器１５４、セグメンタ１５６、または変換器１５８、あるいはその組合せを有してもよい。洞察エンジン１５２は、ユーザ空間１５０に記憶された情報、オーケストレーション・エンジン１４０によって提供された情報、または別の情報源、あるいはその組合せを含み得る情報から、洞察を集めてもよい。洞察エンジン１５２は、例えば、分析データベース１４６からの情報をユーザ空間１５０に記憶された情報と組み合わせて洞察を実現してもよい。洞察エンジン１５２は、データ・ソース１１０からのデータ、洞察生成器１４４からの洞察、ユーザ・プロファイル・データベース１１２からの情報、ユーザ空間１５０内に記憶されたデータ、またはその何らかの組合せを含むがこれらに限定されない様々な情報および情報タイプを使用して、１つまたは複数の洞察を導出してもよい。

スコア算出器１５４は、パーソナライゼーションのためにデータを使用する利点またはそれに関連するリソース・コストあるいはその両方に基づいて、１つまたは複数のスコアを算出してもよい。スコア算出器１５４は、データセット全体、その構成要素、データセットの集計、データセットの構成要素の集計、またはそれの何らかの組合せについてのスコアを算出してもよい。

スコア算出器１５４は、利益対リソース・スコアを算出してもよい。利益対リソース・スコアは、ユーザ利益およびリソース・コストを算出し、次いでユーザ利益をリソース・コストで除算して利益対リソース・スコアを取得することによって計算されてもよい。利益対リソース・スコアは、ユーザ利益対リソース・コスト比、利益対リソース効用比、利益対コスト・スコア、利益対コスト比、利益コスト・スコア、利益コスト・スコア、または利益とその利益を得るために必要なリソースとを比較する同様の用語と呼ばれることもある。典型的には、分数で記述されることが多い比率よりも小数の方が直感的であるので、本開示では主に、容易さを高めるために利益対リソースの比較をスコアとして説明しているが、本開示に従って、定量化可能な利益対コストの任意の表現が使用されてもよい。

ユーザ利益およびリソース・コストの算出は、現在知られているまたは後に開発され得る任意の方式で行われてもよい。本開示では、ユーザ利益およびリソース・コストの正規化された値について説明しているが、必要な場合には、正規化されていない値が使用されてもよい。いくつかの実施形態では、各値の正規化は、ゼロ（０）から１の間の数値のスケール上で行われる。例えば、ユーザ利益値およびリソース・コスト値を１から１０の間で正規化するなど、利益値およびコスト値の他の正規化も使用されてもよい。いくつかの実施形態では、正規化された利益値およびコスト値は、再正規化されてもよい。例えば、いくつかの実施形態では、ユーザは、第１の正規化スケール（例えば、１～５）でフィードバックを提供してもよく、フィードバックは、利益値または利益対コスト・スコアあるいはその両方への実装のために第２の正規化スケール（例えば、０～１）に再正規化される。

利益値は、一般に、アクションまたはプロジェクトから期待される利益の値である。利益値は、あるデータが特定のアプリケーションにとってどれだけ重要であるかに関する測定値であってもよい。利益値は、自動化された手法、手動による手法、または半自動化された手法を使用して算出されてもよい。自動化された手法は、例えば、あるデータを要求する特定のタイプのサービスの数を特定してもよく、あるデータ・セグメントに対する要求が多いほど、利益値は高くなる。代替として、個人が特定のデータ・セグメントの利益値を手動で入力してもよい。半自動化された手法は、データの利益値が自動的に算出されて、ユーザが利益評価を変更するためのフィードバックを提供できるように、自動化された手法と手動による手法とを組み合わせてもよい。フィードバックは、明示的であるか（例えば、調査を介して入力されるか）、または暗黙的であってもよい（例えば、ユーザのアクションまたはアクションをしないことあるいはその両方に基づいて収集されてもよい）。

いくつかの実施形態では、半自動化された利益値の算出は、次のように表されてもよい。

式中、Ｂ_Ｕｓｅｒはユーザの利益値であり、Ｍ_Ｕｓｅｒはユーザの手動入力であり、ｋ_Ｍは手動入力データの正規化定数であり、Ａは自動的に収集されたデータであり、ｋ_Ａは自動的に収集されたデータの正規化定数であり、ｆは補正係数である。

補正係数ｆは、ユーザによって提供されるフィードバックに基づいてもよい。補正係数は、（上記の式で示されているように）データセット全体に影響を与える場合があるか、またはデータセットの一部（１つのデータ点など）にのみ影響を与える場合がある。データセット全体は、（例えば、データセットが有用ではないと判断された場合）最小化されるか、または（例えば、データセットが非常に有用である場合）最大化されてもよい。例えば、引っ越し中に収集された費用データを表す引っ越し費用は、標準的な月次予算を計画するためには有用ではないなど、データセットは、異例であるため有用ではない場合がある。単一のデータ点も同様に、最小化または最大化することによって補正されてもよい。例えば、ユーザは、ある購入が他の人への贈り物であったため、その購入が今後の推奨に影響を与えるべきではないと指示してもよい。

いくつかの実施形態では、ユーザは、利益値を算出するための方法を選択してもよい。例えば、ユーザは、利益値の算出が自動、手動、または半自動のいずれであるかを選択してもよい。いくつかの実施形態では、ユーザは、フィードバックを収集および実装するかどうか、およびその方法を選択してもよい。例えば、ユーザは、自動化された利益評価プロセスに明示的なフィードバックのみが統合され得るように指示してもよい。別の例では、ユーザは、暗黙的なフィードバックのみが収集され得るように指示してもよい。いくつかの実施形態では、ユーザは、収集されるフィードバックのタイプと量との両方を選択してもよい（例えば、明示的なフィードバックは週１回の調査に限定され、暗黙的なフィードバックは、指定された時間内の特定の日にのみ収集されてもよい）。

リソース・コスト値は、一般に、アクションまたはプロジェクトの実施に関する予想されるコストの値である。リソース・コストは、データの収集、維持、または送信、あるいはその組合せに必要なリソースを決定することによって算出されてもよい。いくつかの実施形態では、収集のリソース・コストは、データを収集するのに必要なリソース（例えば、収集プログラムを記憶するのに必要な記憶空間、およびプログラムを実行するのに必要なメモリ）を含んでもよい。いくつかの実施形態では、リソース・コスト値は、データが記憶のためにどれだけの空間を必要とするかを決定することによって算出されてもよい。したがって、例えば、３メガバイトの記憶空間を必要とするデータは、５ギガバイトの記憶空間を必要とするデータよりもリソース・コストが低くなる。いくつかの実施形態では、リソース・コストは、データを送信するために必要な帯域幅を決定することによって算出されてもよい。

いくつかの実施形態では、リソース・コスト値の算出は、次のように表されてもよい。

式中、Ｒ_Ｃｏｓｔはリソース・コストであり、Ｍ_Ｃはデータ収集に必要とされるメモリであり、Ｍ_Ｓはデータを記憶するために必要とされるメモリであり、Ｍ_Ｅはデータを使用するために必要とされるメモリであり、Ｔは送信コストであり、ｋ_Ｒはリソース・コストの正規化定数である。

利益対コスト・スコアは、利益の値とコストの値と組み合わせて数値にしたものであり、この数値は、アクションまたはプロジェクトを進めることの望ましさを表現するために使用されてもよい。利益対コスト比が高いほど、次元削減中のデータ損失が最小限に抑えられるようにデータ次元削減中に維持することが好ましいデータであることを示す。例えば、利益値が高く（例えば、正規化された０～１スケールで０．９）、リソース・コストが低い（例えば、正規化された０～１スケールで０．１）場合、利益対コスト・スコアは比較的高くなり（前述の数値を考慮すると、９であり）、したがって、次元削減中に優先的にデータが維持されてもよい。利益対コスト比が低いほど、リソースを維持するために、データの次元削減中に削減することが望ましいデータであることを示す。例えば、利益値が低く（例えば、正規化された０～１スケールで０．１）、リソース・コストが高い（例えば、正規化された０～１スケールで０．９）場合、利益対コスト・スコアは比較的低くなり（前述の数値を考慮すると、約０．１１１であり）、したがって、リソース消費を削減するために、次元削減中に優先的に削減されてもよい。

高い（または低い、または中程度の）利益対コスト・スコアを構成する閾値は、アプリケーションによって異なる場合がある。例えば、記憶空間が限られているシステムは、データ削減よりもデータ維持を優先するために、より高い利益対コスト・スコア閾値（例えば、最小スコア８）を必要とする場合があり、一方、製品のユーザ向け調整を広範に行うシステムは、次元削減中にデータ維持を優先するために、より低い利益対コスト・スコア閾値（例えば、最小スコア２）を必要とする場合がある。複数の閾値が使用されてもよい。例えば、システムは、データを３つの階層（例えば、利益対コスト・スコアが３未満の場合は圧縮階層（ｃｏｍｐｒｅｓｓｉｏｎｔｉｅｒ）、利益対コスト・スコアが３から９の間の場合はコンパクション（ｃｏｍｐａｃｔｉｏｎ）のみの階層、利益対コスト・スコアが９を超える場合は非圧縮階層）に分割してもよく、その結果、リソースを維持するためにアプリケーションにとって最も重要でないデータは縮小され、ある程度重要なデータは、リソース・コストのバランスを保ちながら維持され、アプリケーションにとって最も重要なデータは維持される。

利益対リソース・スコアの算出は、次のように表されてもよい。

式中、Ｓは利益対リソース・スコアであり、Ｂ_Ｕｓｅｒはユーザにとっての利益であり、Ｒ_Ｃｏｓｔはリソース・コストである。

実際問題としても数値的にも、リソース・コストは、無視できる程度である可能性があるが、ゼロ（０）に等しくすることはできない。実際問題として、データの入力、使用、または保存はいずれも、少なくとも何らかのリソースの使用を必要とし、したがって、リソース・コストがかかる。数値的には、リソース・コストがゼロ（０）に等しい場合、利益対コスト・スコアは未定義となる。

データ、利益値、リソース値、利益対リソース・スコア、および閾値は、ユーザ空間１５０に記憶されてもよい。ユーザ空間１５０は、ユーザが所有する、制御する、またはアクセスできる、あるいはその組合せである、任意のプライベートなまたはその他の指定された空間であってもよい。例えば、ユーザ空間１５０は、ユーザ・デバイス（例えば、個々のユーザのコンピュータもしくはスマートフォン）、ユーザが所有するプライベート・クラウド（例えば、ユーザが会社である場合の、会社が所有するプライベート・クラウド）、またはクラウド内の指定された空間（例えば、個々のユーザに属するアカウントに割り当てられたクラウド記憶空間）であってもよい。

いくつかの実施形態では、ユーザの個人データの利益対リソース・スコアを特定し、その利益対リソース・スコアに比例するデータ損失を考慮してデータの次元を削減することによってリソース制約（例えば、メモリまたはディスク空間の制限）に対処するために、ユーザ・データはユーザ空間１５０（例えば、プライベート・クラウドまたはユーザ・デバイス）に選択的に記憶される。

スコア算出器１５４は、データセットのセグメントに対するスコアを算出してもよい。データセットは、セグメンタ１５６を使用してセグメント化されてもよい。セグメンタ１５６は、１つまたは複数のソースからデータまたはデータセットあるいはその両方を受け取り、データをコンパイルし、データをセグメントに分割してもよい。セグメントはそれぞれ、特定のタイプのデータを含んでもよい。例えば、セグメンタ１５６は、あるセグメントがユーザの連絡先情報を含み、別のセグメントがユーザの嗜好を含み、別のセグメントがソーシャル・メディア上のユーザ対話を含むように、データをセグメント化してもよい。セグメントは、広範なカテゴリ、細かい詳細を集めたもの、または任意の他のレベルのグループ化であってもよい。例えば、セグメンタ１５６は、あるセグメントがユーザの連絡先情報を含み、別のセグメントがユーザの衣類購入履歴を含み、別のセグメントがユーザによって明示的に指示された衣類スタイルの嗜好を含み、別のセグメントが、ソーシャル・メディアに投稿された服装に対するユーザの反応に関連する情報を含むように、データをセグメント化してもよい。

いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについて重み付けを決定することとを含んでもよい。重み付けは、分析サービスの意味論的目的に基づいてもよい。いくつかの実施形態は、重み付けに従って、オートエンコーダ・アーキテクチャにおける変換強度の低減（reduce-transformation intensities）を可能にすることも含んでもよい。

ユーザ空間１５０内のデータは、変換器１５８によって変換されてもよい。変換器１５８は、データ、データ・セグメント、またはそれらの何らかの組合せを変換してもよい。ユーザ空間１５０は、変換済みデータ１６２および関連付けられた変換キー１６４をプロバイダ１７０に配信してもよい。プロバイダ１７０は、情報を要求していてもよく、代替として、プロバイダ１７０は、情報を要求せずに、ユーザ空間１５０から情報を受け入れてもよい。プロバイダ１７０は、サービスまたは製品あるいはその両方を提供してもよい。プロバイダ１７０は、例えば、サービス・プロバイダ１７２および製品プロバイダ１７４などの複数のセグメントを有してもよい。変換済みデータ１６２および変換キー１６４の複数のセットが、同じまたは異なる目的のためにプロバイダ１７０に送出されてもよい。

いくつかの実施形態では、利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるようにオートエンコーダ・アーキテクチャが選択される。

いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することとを含んでもよい。いくつかの実施形態は、データ・セグメントを変換済みデータ・セグメントに変換することと、変換済みデータ・セグメントのうちの１つまたは複数をプロバイダ１７０などのコンテンツ・パーソナライザにストリーミングすることとを含んでもよい。

いくつかの実施形態では、方法は、データセットをデータ・セグメントにセグメント化することと、データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、セグメント利益対リソース・スコアに基づいてデータ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも１つを活用して、データ・セグメントのうちの少なくとも１つを少なくとも１つの変換済みデータ・セグメントに変換することと、データ・セグメントのうちの少なくとも１つを変換することとを含んでもよい。いくつかの実施形態では、少なくとも１つの変換済みデータ・セグメントはプロバイダ１７０であってもよい機械学習サービスにストリーミングされる。

図２は、本開示のいくつかの実施形態による、プライバシ主導型データ共有方法２００を示す。プロバイダ２０２は、情報を求める要求を処理エンジン２１０に送出してもよい。処理エンジン２１０は、プロバイダ２０２によって要求された情報について、ユーザ利益値を定量化し（２１２）、リソース消費値を定量化してもよい（２１４）。処理エンジン２１０は、要求された情報についての利益対リソース・スコアを算出し（２１６）、その情報について算出された利益対リソース・スコアに基づいて、その情報に対する変換関数を決定してもよい（２１８）。

処理エンジン２１０は、変換済みデータおよびその変換関数（１つまたは複数）をストレージ２２０に送信してもよい。ストレージ２２０は、変換済みデータをセグメント化してもよい（２２２）。代替として、変換済みデータは、事前にセグメント化されている場合があるか、または変換済みデータは、セグメント化を必要としない場合がある。変換済みデータおよびその変換関数は、要求に応じてプロバイダ２０２に送信されてもよい（２３０）。

データをエンコードおよびデコードするために、オートエンコーダが使用されてもよい。本開示によるデータの識別、セグメント化、または変換、あるいはその組合せのために、任意の機械学習モデルが使用されてもよい。十分に訓練された機械学習モデルは、次元入力を使用して再構築損失を最小限に抑えることができる。オートエンコーダは、深層学習モデルのハイパーパラメータに基づいたオートエンコーダ・アーキテクチャを有することになる。ハイパーパラメータには、例えば、学習率、ミニバッチ・サイズ、隠れ層の数、隠れユニットの数、エポックの数、および活性化関数、ならびに、知られているまたは今後発見され得る他のハイパーパラメータが含まれることがある。

オートエンコーダ・アーキテクチャは、効用スコア（utility score）に基づいて、変換関数の選択を決定またはガイドしてもよい。オートエンコーダ・アーキテクチャは、効用スコアに基づいたデータ損失許容量を含んでもよい。例えば、利益対コスト・スコアは、特定のデータ・セグメント上のデータの最大１０％の損失が許容されることを示してもよい。その場合、変換関数は、圧縮されたデータ・セグメントの最大１０％の損失を伴うデータ圧縮を可能にすることができる。オートエンコーダ・アーキテクチャは、あるデータ・セグメント（例えば、利益対リソース・スコアが低いセグメント）上の一部のデータの損失を許可すると同時に、他のデータ・セグメント（例えば、利益対リソース・スコアが高いセグメント）上のデータを維持することができる。

図３は、本開示のいくつかの実施形態による、プライバシ主導型データ共有システム３００を示す。プライバシ主導型データ共有システム３００は、セグメンテーション・エンジン３２２と、要求プロセッサ３３０と、セグメント・セレクタ３４０とを包含するストレージ３１０を含んでもよい。ストレージ３１０は、セグメンテーション・エンジン３２２によってセグメント化され得るデータ３１２を包含してもよい。セグメンテーション・エンジン３２２は、データの使用状況を識別し（３２４）、使用状況に基づいてデータをセグメント化してもよい（３２６）。したがって、データ３１２は、セグメント化されたデータ３１４に区分化されてもよい。

プロバイダ３５２は、データ要求３５４を要求プロセッサ３３０に送出してもよい。要求プロセッサ３３０は、要求についてセグメント・セレクタ３４０と通信してもよい。セグメント・セレクタ３４０は、データ要求３５４に応答するために、セグメント化されたデータ３１４からセグメントを選択してもよい。セグメント・セレクタ３４０は、セグメント化されたデータ３１４からデータの１つまたは複数のセグメント３３２を選択し、そのセグメントをプロバイダ３５２に送出して、データ要求３５４に応答してもよい。

セグメント・セレクタ３４０は、ユーザによって与えられた許可３４２およびデータ・セグメントについて算出された効用スコア３４４などの様々な因子に基づいて、セグメントをプロバイダ３５２に送出すべきかどうかを評価してもよい。許可３４２は、例えば、あるデータ・セグメントを任意のプロバイダまたは情報を要求している特定のプロバイダ３５２に公開することをユーザが許可していることを確認するためのチェックを含んでもよい。効用スコア３４４は、例えば、利益対コスト・スコアであってもよい。効用スコア３４４は、データ・セグメントとデータ要求との整合性（例えば、データ・セグメントが特定のデータ要求３５４にどの程度関連しているか）を示してもよい。

図４は、本開示のいくつかの実施形態による、削減を使用したデータ共有方法４００を示す。データ共有方法４００は、ユーザ空間４０２内に維持されるユーザ・データ４１０を含む。効用スコアが抽出されてもよい（４２０）。効用スコアは、様々なツールを使用して抽出されてもよい（４２０）。例えば、サービスとしての消費者洞察（ＣＩＡＡＳ：consumer insight as a service）が、効用スコアを抽出してもよい（４２０）。効用スコアは、例えば、利益対リソース・スコア、特定のクエリに対するデータの関連性を定量化する適切性算出、または同様のものであってもよい。

次元削減が行われてもよい（４３０）。次元削減（４３０）は、抽出された（４２０）効用スコアに依存してもよい。抽出された（４２０）効用スコアまたは所望の次元削減（４３０）あるいはその両方に基づいて、変換関数が決定されてもよい（４４０）。決定された（４４０）変換関数を使用して、ユーザ・データ４１０が変換されてもよい（４５２）。変換済みデータは、プロバイダ４０６に送出されてもよい（４５４）。

プロバイダ４０６は、データから洞察を集めるためにデータを再変換してもよい（４５６）。プロバイダ４０６は、ユーザ空間４０２を介してプロバイダ・データ４６０をユーザに提供してもよい。プロバイダ・データ４６０は、変換されて（４６２）送出されるか（４６４）、または変換（４６２）なしで送出されてもよい（４６４）。プロバイダ４０６は、ユーザと同じ動作を使用してもよい（例えば、プロバイダ４０６は、効用スコアを抽出し、好ましい次元削減を決定し、変換関数を決定してもよい）。プロバイダ４０６は、未変換のデータをユーザ空間４０２に送出してもよい。次いで、ユーザ空間４０２に送出された変換済みデータは、再変換されてもよい（４６６）。データ再変換４５６および４６６は、ユーザ空間４０２、プロバイダ空間、または両方の空間の外側で行われてもよい。

いくつかの実施形態では、方法は、説明可能な機械学習に基づいて次元削減を可能にすることを含んでもよい。いくつかの実施形態では、オートエンコーダ・アーキテクチャは、Ｓｈａｐｌｅｙ加法的説明分析（Ｓｈａｒｐｌｅｙａｄｄｉｔｉｖｅｅｘｐｌａｎａｔｉｏｎｓ）から抽出された主要な特徴にさらに基づいている。

本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装はクラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本開示の実施形態は、現在知られているまたは後に開発される他の任意のタイプのコンピューティング環境と併せて実装されることが可能である。

クラウド・コンピューティングは、最小限の管理労力またはサービスのプロバイダとの最小限の対話で迅速にプロビジョニングおよびリリースされ得る構成可能なコンピューティング・リソース（例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス）の共用プールへの簡便なオンデマンドによるネットワーク・アクセスを可能にするためのサービス提供のモデルである。このクラウド・モデルは、少なくとも５つの特徴、少なくとも３つのサービス・モデル、および少なくとも４つの展開モデルを含み得る。

特徴は、次の通りである。

オンデマンド・セルフサービス：クラウド消費者は、サービス・プロバイダと人間との対話を必要とすることなく、必要に応じて自動的に、サーバ時間およびネットワーク・ストレージなどのコンピューティング機能を一方的にプロビジョニングすることができる。

広範なネットワーク・アクセス：機能は、ネットワーク上で利用可能であり、異種のシン・クライアント・プラットフォームまたはシック・クライアント・プラットフォーム（例えば、携帯電話、ラップトップ、およびＰＤＡ）による使用を促進する標準的なメカニズムを介してアクセスされる。

リソースのプール化：プロバイダのコンピューティング・リソースは、マルチテナント・モデルを使用して複数の消費者にサービス提供するようにプール化され、要求に応じて、異なる物理リソースおよび仮想リソースが動的に割当ておよび再割当てされる。消費者は一般に、提供されたリソースの正確な部分について制御も知識も有していないが、より高い抽象化レベル（例えば、国、州、またはデータセンタ）で部分を特定することが可能であり得るという点で、部分の独立性があるといえる。

迅速な柔軟性：機能を迅速かつ柔軟に、場合によっては自動的にプロビジョニングして、急速にスケール・アウトし、迅速に解放して急速にスケール・インすることができる。消費者にとっては、プロビジョニングに利用可能な機能は、しばしば無制限であるように見え、いつでも任意の数量で購入することができる。

サービスの測定：クラウド・システムは、サービスのタイプ（例えば、ストレージ、処理、帯域幅、およびアクティブなユーザ・アカウント）に適した一定の抽象化レベルでの計量機能を活用することによって、リソースの使用を自動的に制御および最適化する。リソースの使用量を監視、制御、および報告することができ、利用するサービスのプロバイダと消費者との両方に透明性がもたらされる。

サービス・モデルは、次の通りである。

ソフトウェア・アズ・ア・サービス（ＳａａＳ）：クラウド・インフラストラクチャ上で動作しているプロバイダのアプリケーションを使用するために、消費者に提供される機能である。アプリケーションは、ウェブ・ブラウザ（例えば、ウェブ・ベースの電子メール）などのシン・クライアント・インターフェースを介して様々なクライアント・デバイスからアクセス可能である。限定されたユーザ固有のアプリケーション構成設定の想定される例外として、消費者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能をも含む基礎となるクラウド・インフラストラクチャを管理も制御もしない。

プラットフォーム・アズ・ア・サービス（ＰａａＳ）：プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、消費者が作成または取得したアプリケーションをクラウド・インフラストラクチャ上に展開するために、消費者に提供される機能である。消費者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージなどの基礎となるクラウド・インフラストラクチャを管理も制御もしないが、消費者は、展開されたアプリケーション、および場合によっては環境構成をホストするアプリケーションを制御する。

インフラストラクチャ・アズ・ア・サービス（ＩａａＳ）：オペレーティング・システムおよびアプリケーションを含み得る任意のソフトウェアを消費者が展開および実行することができる、処理、ストレージ、ネットワーク、および他の基本的なコンピューティング・リソースをプロビジョニングするために消費者に提供される機能である。消費者は、基礎となるクラウド・インフラストラクチャを管理も制御もしないが、オペレーティング・システム、ストレージ、および展開されたアプリケーションを制御し、消費者は、場合によっては選択されたネットワーク構成要素（例えば、ホスト・ファイアウォール）を限定的に制御する。

展開モデルは、次の通りである。

プライベート・クラウド：クラウド・インフラストラクチャは、ある組織のためだけに運用される。このクラウド・インフラストラクチャは、組織またはサード・パーティによって管理される場合があり、オンプレミスまたはオフプレミスに存在する場合がある。

コミュニティ・クラウド：クラウド・インフラストラクチャは、複数の組織によって共有され、関心事項（例えば、任務、セキュリティ要件、ポリシー、またはコンプライアンス上の考慮事項、あるいはその組合せ）を共有している特定のコミュニティをサポートする。このクラウド・インフラストラクチャは、組織またはサード・パーティによって管理される場合があり、オンプレミスまたはオフプレミスに存在する場合がある。

パブリック・クラウド：クラウド・インフラストラクチャは、一般公衆または大規模な業界グループにとって利用可能であり、クラウド・サービスを販売する組織によって所有される。

ハイブリッド・クラウド：クラウド・インフラストラクチャは、２つ以上のクラウド（プライベート、コミュニティ、またはパブリック）の合成であり、これらのクラウドは、固有のエンティティのままであるが、データおよびアプリケーションの移植性（例えば、クラウド間の負荷分散のためのクラウド・バースティング）を可能にする標準化された技術または専用の技術によって結び付けられる。

クラウド・コンピューティング環境は、ステートレス性、低結合性、モジュール性、および意味的相互運用性に重点を置いたサービス指向型である。クラウド・コンピューティングの中心は、相互接続されたノードのネットワークを含むインフラストラクチャである。

図５は、本開示の実施形態によるクラウド・コンピューティング環境５１０を示す。図示のように、クラウド・コンピューティング環境５１０は、例えば、携帯情報端末（ＰＤＡ：personal digital assistant）もしくは携帯電話５００Ａ、デスクトップ・コンピュータ５００Ｂ、ラップトップ・コンピュータ５００Ｃ、または自動車コンピュータ・システム５００Ｎあるいはその組合せなどのクラウド消費者によって使用されるローカル・コンピューティング・デバイスの通信相手となり得る１つまたは複数のクラウド・コンピューティング・ノード５００を含む。ノード５００は、互いに通信してもよい。これらは、本明細書で上述したようなプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、もしくはハイブリッド・クラウド、またはその組合せなどの１つまたは複数のネットワーク内で物理的にまたは仮想的にグループ化されてもよい（図示せず）。

これにより、クラウド・コンピューティング環境５１０は、インフラストラクチャ、プラットフォーム、またはソフトウェア、あるいはその組合せを、クラウド消費者がローカル・コンピューティング・デバイス上にリソースを保持する必要のないサービスとして提供することが可能になる。図５に示すコンピューティング・デバイス５００Ａ～５００Ｎのタイプが例示のみを意図していること、およびコンピューティング・ノード５００およびクラウド・コンピューティング環境５１０が、任意のタイプのネットワークまたはネットワーク・アドレス指定可能な接続あるいはその両方を介して（例えば、ウェブ・ブラウザを使用して）、任意のタイプのコンピュータ化されたデバイスと通信できることを理解されたい。

図６は、本開示の実施形態による（図５の）クラウド・コンピューティング環境５１０によって提供される抽象化モデル層６００を示す。図６に示す構成要素、層、および機能は、例示のみを意図しており、本開示の実施形態はそれらに限定されないことを予め理解されたい。以下に示すように、次の層および対応する機能が提供される。

ハードウェアおよびソフトウェア層６１５は、ハードウェア構成要素およびソフトウェア構成要素を含む。ハードウェア構成要素の例には、メインフレーム６０２、ＲＩＳＣ（縮小命令セット・コンピュータ）アーキテクチャ・ベースのサーバ６０４、サーバ６０６、ブレード・サーバ６０８、ストレージ・デバイス６１１、ならびにネットワークおよびネットワーキング構成要素６１２が含まれる。いくつかの実施形態では、ソフトウェア構成要素には、ネットワーク・アプリケーション・サーバ・ソフトウェア６１４およびデータベース・ソフトウェア６１６が含まれる。

仮想化層６２０は、抽象化層を提供し、この層から仮想エンティティの以下の例、すなわち、仮想サーバ６２２、仮想ストレージ６２４、仮想プライベート・ネットワークを含む仮想ネットワーク６２６、仮想アプリケーションおよびオペレーティング・システム６２８、ならびに仮想クライアント６３０が提供されてもよい。

一例では、管理層６４０は、以下に記載の機能を提供してもよい。リソース・プロビジョニング６４２は、クラウド・コンピューティング環境内でタスクを実行するために利用されるコンピューティング・リソースおよび他のリソースの動的な調達を提供する。計量および価格決定６４４は、クラウド・コンピューティング環境内でリソースが利用されるときのコスト追跡、およびこれらのリソースの消費に対する課金または請求を提供する。一例では、これらのリソースは、アプリケーション・ソフトウェア・ライセンスを含むことがある。セキュリティは、クラウド消費者およびタスクのための本人確認、ならびにデータおよび他のリソースのための保護を提供する。ユーザ・ポータル６４６は、消費者およびシステム管理者にクラウド・コンピューティング環境へのアクセスを提供する。サービス・レベル管理６４８は、要求されるサービス・レベルが満たされるようなクラウド・コンピューティング・リソースの割当ておよび管理を提供する。サービス・レベル・アグリーメント（ＳＬＡ）の計画および履行６５０は、ＳＬＡに従って将来要求されることが予想されるクラウド・コンピューティング・リソースの事前配置および調達を提供する。

ワークロード層６６０は、クラウド・コンピューティング環境が利用され得る機能の例を提供する。この層から提供され得るワークロードおよび機能の例には、マッピングおよびナビゲーション６６２、ソフトウェア開発およびライフサイクル管理６６４、仮想教室教育配信６６６、データ分析処理６６８、トランザクション処理６７０、ならびにプライバシ主導型ユーザ・データ共有のための１つまたは複数の認知フレームワーク６７２が含まれる。

本開示はクラウド・コンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装はクラウド・コンピューティング環境に限定されないことを理解されたい。むしろ、本開示の実施形態は、現在知られているまたは後に開発され得る他の任意のタイプのコンピューティング環境と併せて実装されることが可能である。

図７は、本開示の実施形態による（例えば、コンピュータの１つもしくは複数のプロセッサ回路またはコンピュータ・プロセッサを使用した）本明細書に記載の方法、ツール、およびモジュール、ならびに任意の関連機能のうちの１つまたは複数を実装する際に使用され得る例示的なコンピュータ・システム７０１の高レベル・ブロック図を示す。いくつかの実施形態では、コンピュータ・システム７０１の主要構成要素には、１つまたは複数の中央処理装置（ＣＰＵ）７０２Ａ、７０２Ｂ、７０２Ｃ、および７０２Ｄを有するプロセッサ７０２、メモリ・サブシステム７０４、端末インターフェース７１２、ストレージ・インターフェース７１６、Ｉ／Ｏ（入力／出力）デバイス・インターフェース７１４、ならびにネットワーク・インターフェース７１８が含まれてもよく、これらはすべて、メモリ・バス７０３、Ｉ／Ｏバス７０８、およびＩ／Ｏバス・インターフェース・ユニット７１０を介した構成要素間通信のために、直接的または間接的に通信可能に結合されてもよい。

コンピュータ・システム７０１は、本明細書ではＣＰＵ７０２と総称される１つまたは複数の汎用プログラマブルＣＰＵ７０２Ａ、７０２Ｂ、７０２Ｃ、および７０２Ｄを含んでもよい。いくつかの実施形態では、コンピュータ・システム７０１は、比較的大規模なシステムに典型的な複数のプロセッサを含んでもよい。しかしながら、他の実施形態では、コンピュータ・システム７０１は、代替として、単一のＣＰＵシステムであってもよい。各ＣＰＵ７０２は、メモリ・サブシステム７０４に記憶された命令を実行してもよく、１つまたは複数のレベルのオンボード・キャッシュを含んでもよい。

システム・メモリ７０４は、ランダム・アクセス・メモリ（ＲＡＭ）７２２またはキャッシュ・メモリ７２４などの揮発性メモリの形式のコンピュータ・システム可読媒体を含んでもよい。コンピュータ・システム７０１は、他の取外し可能／取外し不可能な揮発性／不揮発性コンピュータ・システム記憶媒体をさらに含んでもよい。単なる一例として、「ハード・ドライブ」などの取外し不可能な不揮発性磁気媒体に対する読出しおよび書込みのために、ストレージ・システム７２６を設けることができる。図示されていないが、取外し可能な不揮発性磁気ディスク（例えば、「フロッピ（Ｒ）・ディスク」）に対する読出しおよび書込みのための磁気ディスク・ドライブ、またはＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、もしくは他の光学媒体などの取外し可能な不揮発性光ディスクに対する読出しおよび書込みのための光ディスク・ドライブを設けることができる。加えて、メモリ７０４は、フラッシュ・メモリ、例えばフラッシュ・メモリ・スティック・ドライブまたはフラッシュ・ドライブを含むことができる。メモリ・デバイスは、１つまたは複数のデータ媒体インターフェースによってメモリ・バス７０３に接続されることが可能である。メモリ７０４は、様々な実施形態の機能を実行するように構成されたプログラム・モジュールのセット（例えば、少なくとも１つ）を有する少なくとも１つのプログラム製品を含んでもよい。

メモリ７０４には、それぞれが少なくとも一組のプログラム・モジュール７３０を有する１つまたは複数のプログラム／ユーティリティ７２８が記憶されてもよい。プログラム／ユーティリティ７２８は、ハイパーバイザ（仮想マシン・モニタとも呼ばれる）、１つまたは複数のオペレーティング・システム、１つまたは複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データを含んでもよい。オペレーティング・システム、１つまたは複数のアプリケーション・プログラム、他のプログラム・モジュール、およびプログラム・データのそれぞれ、またはそれらの何らかの組合せは、ネットワーキング環境の実装を含んでもよい。プログラム７２８またはプログラム・モジュール７３０あるいはその両方は、一般に、様々な実施形態の機能または方法論を実行する。

図７においてメモリ・バス７０３は、ＣＰＵ７０２と、メモリ・サブシステム７０４と、Ｉ／Ｏバス・インターフェース７１０との間の直接通信経路を提供する単一のバス構造として示されているが、いくつかの実施形態では、メモリ・バス７０３は、複数の異なるバスまたは通信経路を含んでもよく、これらは、階層型構成、スター型構成、もしくはウェブ型構成のポイント・ツー・ポイント・リンク、複数の階層バス、並列経路および冗長経路、または任意の他の適切なタイプの構成など、様々な形式のいずれかで配置されてもよい。さらに、Ｉ／Ｏバス・インターフェース７１０およびＩ／Ｏバス７０８はそれぞれ単一のユニットとして示されているが、いくつかの実施形態では、コンピュータ・システム７０１は、複数のＩ／Ｏバス・インターフェース・ユニット７１０、複数のＩ／Ｏバス７０８、またはその両方を含んでもよい。さらに、様々なＩ／Ｏデバイスにつながる様々な通信経路からＩ／Ｏバス７０８を分離する複数のＩ／Ｏインターフェース・ユニット７１０が示されているが、他の実施形態では、Ｉ／Ｏデバイスの一部またはすべてが、１つまたは複数のシステムＩ／Ｏバス７０８に直接接続されてもよい。

いくつかの実施形態では、コンピュータ・システム７０１は、マルチユーザ・メイン・フレーム・コンピュータ・システム、シングルユーザ・システム、サーバ・コンピュータ、または直接的なユーザ・インターフェースをほとんどもしくは全く有してないが他のコンピュータ・システム（クライアント）から要求を受け取る同様のデバイスであってもよい。さらに、いくつかの実施形態では、コンピュータ・システム７０１は、デスクトップ・コンピュータ、ポータブル・コンピュータ、ラップトップもしくはノートブック・コンピュータ、タブレット・コンピュータ、ポケット・コンピュータ、電話、スマートフォン、ネットワーク・スイッチもしくはネットワーク・ルータ、または任意の他の適切なタイプの電子デバイスとして実装されてもよい。

図７は、例示的なコンピュータ・システム７０１の代表的な主要構成要素を示すことを意図していることに留意されたい。しかしながら、いくつかの実施形態では、個々の構成要素は、図７に示されるものよりも複雑であっても複雑でなくてもよく、図７に示された構成要素以外の構成要素、または図７に示された構成要素に加えられた構成要素が存在してもよく、このような構成要素の数、タイプ、および構成は、多様であってもよい。

本開示は、任意の可能な技術的詳細の統合レベルでのシステム、方法、またはコンピュータ・プログラム製品あるいはその組合せであってもよい。コンピュータ・プログラム製品は、プロセッサに本開示の態様を実施させるためのコンピュータ可読プログラム命令を有するコンピュータ可読記憶媒体（または複数のコンピュータ可読記憶媒体）を含んでもよい。

コンピュータ可読記憶媒体は、命令実行デバイスが使用するための命令を保持および記憶することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、または上記の任意の好適な組合せとすることができるが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的なリストには以下のもの、すなわち、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ（ＲＡＭ）、読出し専用メモリ（ＲＯＭ）、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭまたはフラッシュ・メモリ）、スタティック・ランダム・アクセス・メモリ（ＳＲＡＭ）、ポータブル・コンパクト・ディスク読出し専用メモリ（ＣＤ－ＲＯＭ）、デジタル・バーサタイル・ディスク（ＤＶＤ）、メモリ・スティック、フロッピ（Ｒ）・ディスク、パンチカードまたは命令が記録された溝内の隆起構造体などの機械的に符号化されたデバイス、および上記の任意の好適な組合せが含まれる。本明細書で使用されるコンピュータ可読記憶媒体は、電波もしくは他の自由に伝播する電磁波、導波路もしくは他の伝送媒体を介して伝播する電磁波（例えば、光ファイバ・ケーブルを通る光パルス）、または電線を介して送信される電気信号などの一過性の信号自体であると解釈されるべきではない。

本明細書に記載のコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング／処理デバイスに、または、ネットワーク、例えばインターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、またはワイヤレス・ネットワークあるいはその組合せを介して外部コンピュータまたは外部記憶デバイスにダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバあるいはその組合せを含んでもよい。各コンピューティング／処理デバイスにおけるネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、そのコンピュータ可読プログラム命令を、それぞれのコンピューティング／処理デバイス内のコンピュータ可読記憶媒体における記憶のために転送する。

本開示の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、インストラクション・セット・アーキテクチャ（ＩＳＡ）命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、または、Ｓｍａｌｌｔａｌｋ（Ｒ）、Ｃ＋＋などのオブジェクト指向プログラミング言語および「Ｃ」プログラミング言語もしくは同様のプログラミング言語などの手続き型プログラミング言語を含む１つまたは複数のプログラミング言語の任意の組合せで記述されたソース・コードもしくはオブジェクト・コードであってもよい。コンピュータ可読プログラム命令は、スタンドアロン・ソフトウェア・パッケージとして全体がユーザのコンピュータ上で、一部がユーザのコンピュータ上で、一部がユーザのコンピュータ上かつ一部がリモート・コンピュータ上で、または全体がリモート・コンピュータ上もしくはサーバ上で実行されてもよい。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク（ＬＡＮ）もしくはワイド・エリア・ネットワーク（ＷＡＮ）を含む任意のタイプのネットワークを介してユーザのコンピュータに接続されてもよく、または（例えば、インターネット・サービス・プロバイダを使用してインターネットを介して）外部コンピュータに対して接続されてもよい。いくつかの実施形態では、本開示の態様を実行するために、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、またはプログラマブル・ロジック・アレイ（ＰＬＡ）を含む電子回路が、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることによって、コンピュータ可読プログラム命令を実行してもよい。

本明細書では、本開示の実施形態による方法、装置（システム）、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照しながら、本開示の態様について説明している。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方におけるブロックの組合せがコンピュータ可読プログラム命令によって実施され得ることが理解されよう。

これらのコンピュータ可読プログラム命令は、コンピュータまたは他のプログラマブル・データ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックで指定された機能／作用を実施するための手段を作り出すように、コンピュータのプロセッサまたは他のプログラマブル・データ処理装置のプロセッサに提供されて、マシンを作り出すものであってもよい。これらのコンピュータ可読プログラム命令はまた、命令が記憶されたコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックで指定された機能／作用の態様を実施する命令を含む製造品を含むように、コンピュータ可読媒体に記憶され、コンピュータ、プログラマブル・データ処理装置、または他のデバイスあるいはその組合せに対して特定の方式で機能するように指示できるものであってもよい。

コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラマブル装置、または他のデバイスで実行される命令が、フローチャートまたはブロック図あるいはその両方の１つまたは複数のブロックで指定された機能／作用を実施するように、コンピュータ実施プロセスを作り出すべくコンピュータ、他のプログラマブル・データ処理装置、または他のデバイスにロードされて、コンピュータ、他のプログラマブル装置、または他のデバイス上で一連の動作ステップを実行させるものであってもよい。

図中のフローチャートおよびブロック図は、本開示の様々な実施形態によるシステム、方法およびコンピュータ・プログラム製品の可能な実装形態のアーキテクチャ、機能性、ならびに動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定された論理機能を実装するための１つまたは複数の実行可能命令を含む、命令のモジュール、セグメント、または一部を表すことがある。いくつかの代替の実装形態では、ブロックに記載された機能は、図に記載された順序とは異なる順序で行われてもよい。例えば、連続して示されている２つのブロックは、実際には、関与する機能性に応じて、１つのステップとして達成されるか、同時に、実質的に同時に、部分的にもしくは全体的に、時間的に重複する様式で実行されてもよく、または場合によっては、それらのブロックが逆の順序で実行されてもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組合せは、指定された機能または作用を実行するか、あるいは専用ハードウェアとコンピュータ命令との組合せを遂行する専用ハードウェア・ベースのシステムによって実装され得ることにも留意されたい。

本開示について特定の実施形態の観点から説明してきたが、当業者にはその変更形態および修正形態が明らかとなることが予想される。本開示の様々な実施形態の説明を例示の目的で提示してきたが、この説明は、網羅的であることも、開示された実施形態に限定されることも意図していない。当業者には、説明した実施形態の範囲および思想から逸脱することなく多くの修正形態および変形形態が明らかであろう。本明細書で使用される用語は、実施形態の原理、実際の適用例、もしくは市場で見られる技術を超える技術的な改良を最もよく説明するように、または本明細書で開示された実施形態を当業者が理解することが可能になるように選択されたものである。したがって、以下の特許請求の範囲は、本開示の真の思想および範囲内にあるようなすべての変更形態および修正形態を包含するものとして解釈されることが意図されている。

Claims

プライバシ主導型データ共有のためのシステムであって、前記システムが、
メモリと、
前記メモリと通信するプロセッサと
を含み、前記プロセッサが、
データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む動作を実行するように構成される、システム。
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの１つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項１に記載のシステム。
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項１に記載のシステム。
前記動作が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも１つを活用して、前記データ・セグメントのうちの少なくとも１つを少なくとも１つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの前記少なくとも１つを変換することと
をさらに含む、請求項１に記載のシステム。
少なくとも１つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項４に記載のシステム。
前記動作が、
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項１に記載のシステム。
前記オートエンコーダ・アーキテクチャが、Ｓｈａｐｌｅｙ加法的説明分析から抽出された主要な特徴にさらに基づく、請求項１に記載のシステム。
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項１に記載のシステム。
プライバシ主導型データ共有のための方法であって、
プロセッサによって、データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む、方法。
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの１つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項９に記載の方法。
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについて重み付けを決定することであって、前記重み付けが分析サービスの意味論的目的に基づく、前記決定することと、
前記重み付けに従って、前記オートエンコーダ・アーキテクチャにおける変換強度の低減を可能にすることと
をさらに含む、請求項９に記載の方法。
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて、前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも１つを活用して、前記データ・セグメントのうちの少なくとも１つを少なくとも１つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの少なくとも１つを変換することと
をさらに含む、請求項９に記載の方法。
少なくとも１つの変換済みデータ・セグメントが機械学習サービスにストリーミングされる、請求項１２に記載の方法。
説明可能な機械学習に基づいて次元削減を可能にすることをさらに含む、請求項９に記載の方法。
前記オートエンコーダ・アーキテクチャが、Ｓｈａｐｌｅｙ加法的説明分析から抽出された主要な特徴にさらに基づく、請求項９に記載の方法。
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項９に記載の方法。
プライバシ主導型データ共有のためのコンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品が、プログラム命令が組み込まれたコンピュータ可読記憶媒体を備え、前記プログラム命令が、プロセッサに機能を実行させるために前記プロセッサによって実行可能であり、前記機能が、
前記プロセッサによって、データセットの利益対リソース・スコアを計算することと、
前記利益対リソース・スコアに基づいてオートエンコーダ・アーキテクチャを選択することであって、前記オートエンコーダ・アーキテクチャが、前記利益対リソース・スコアに基づいて再構築損失の最小化と必要な記憶空間の最小化とのバランスをとる、前記選択することと、
前記オートエンコーダ・アーキテクチャに基づいた変換関数を用いて、前記データセットを変換済みデータに変換することと、
前記変換済みデータをユーザ空間に記憶することと
を含む、コンピュータ・プログラム製品。
前記利益対リソース・スコアが閾値を超えており、再構築損失を最小限に抑えるように前記オートエンコーダ・アーキテクチャが選択される、請求項１７に記載のコンピュータ・プログラム製品。
前記機能が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記セグメント利益対リソース・スコアに基づいて、前記データ・セグメントのそれぞれについてセグメント・オートエンコーダ・アーキテクチャを選択することと、
前記セグメント・オートエンコーダ・アーキテクチャのうちの少なくとも１つを活用して、前記データ・セグメントのうちの少なくとも１つを少なくとも１つの変換済みデータ・セグメントに変換することと、
前記データ・セグメントのうちの前記少なくとも１つを変換することと
をさらに含む、請求項１７に記載のコンピュータ・プログラム製品。
前記機能が、
前記データセットをデータ・セグメントにセグメント化することと、
前記データ・セグメントのそれぞれについてセグメント利益対リソース・スコアを計算することと、
前記データ・セグメントを変換済みデータ・セグメントに変換することと、
前記変換済みデータ・セグメントのうちの１つまたは複数をコンテンツ・パーソナライザにストリーミングすることと
をさらに含む、請求項１７に記載のコンピュータ・プログラム製品。