JP2019514117A - 個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法 - Google Patents

個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法 Download PDF

Info

Publication number
JP2019514117A
JP2019514117A JP2018552031A JP2018552031A JP2019514117A JP 2019514117 A JP2019514117 A JP 2019514117A JP 2018552031 A JP2018552031 A JP 2018552031A JP 2018552031 A JP2018552031 A JP 2018552031A JP 2019514117 A JP2019514117 A JP 2019514117A
Authority
JP
Japan
Prior art keywords
data
ircs
individual
user
social media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018552031A
Other languages
English (en)
Inventor
サンギョン オ,
サンギョン オ,
カルロス エー. ネバレス,
カルロス エー. ネバレス,
ニネリ ホジッチ,
ニネリ ホジッチ,
Original Assignee
ビーピーユー ホールディングス コーポレイション
ビーピーユー ホールディングス コーポレイション
サンギョン オ,
サンギョン オ,
カルロス エー. ネバレス,
カルロス エー. ネバレス,
ニネリ ホジッチ,
ニネリ ホジッチ,
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ビーピーユー ホールディングス コーポレイション, ビーピーユー ホールディングス コーポレイション, サンギョン オ,, サンギョン オ,, カルロス エー. ネバレス,, カルロス エー. ネバレス,, ニネリ ホジッチ,, ニネリ ホジッチ, filed Critical ビーピーユー ホールディングス コーポレイション
Publication of JP2019514117A publication Critical patent/JP2019514117A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本発明は、特定の個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法を対象とする。ある側面では、個人関連コンテンツ検索システムは、その個人の視点に関連する検索結果および情報を提供する。ある側面では、個人関連コンテンツ検索(IRCS)システムは、個人と関連付けられた少なくとも1つのユーザデバイスおよび個人が利用するソーシャルメディアサーバと通信し、個人と関連付けられたユーザデバイスおよびソーシャルメディアアカウントから、情報を取得し、データストリームを作成し、データストリームを分析し、個人の洞察を判定することによって、個人に特有の情報を返すように構成される。

Description

(関連出願の相互参照)
本願は、2016年4月8日に出願された米国仮出願第62/319,905号の利益を主張するものであり、該米国仮出願の全体は、本参照により本明細書中に援用される。
本発明は、ネットワーク検索エンジンに関する。
本質的に、インターネットは、情報をドメイン特有データ、ソーシャルデータ、事業データ、ブログデータ、検索データ等に編成する、データベースのセットである。さらに、情報をそのユーザに提供する、インターネットと関連付けられた多数の検索エンジンが存在する。Google、Yahoo、Bing、Ask.com、および多くのその他等の実際の検索エンジンは、優れた検索システムを構築している。しかしながら、これらのシステムは、「検索対象を検索する」ための方法の提供に成功していない。加えて、返される情報は、検索を行っている個人に関連せず、情報自体だけである。情報は、検索用語の観点からのみ関連する。すなわち、個人に関連する情報は、存在しない。
したがって、個人自体に関連する情報を生産する検索システムならびに検索対象を検索するシステムの必要性がある。
本発明は、特定の個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法を対象とする。ある側面では、個人関連コンテンツ検索システムは、個人の視点に関連する検索結果および情報を提供する。言い換えると、本システムは、ユーザの視点から情報を提供する一方、他の先行技術システムは、大域的視点をもたらす。
ある側面では、個人関連コンテンツ検索(IRCS)システムは、個人と関連付けられた少なくとも1つのユーザデバイスおよび個人が利用するソーシャルメディアサーバと通信し、個人と関連付けられたユーザデバイスおよびソーシャルメディアアカウントから、情報を取得し、データストリームを作成し、データストリームを分析し、個人の洞察を判定することによって、個人に特有の情報を返すように構成される。ある側面では、IRCSシステムは、個人と関連付けられたソーシャルメディアアカウントから、個人に関連するデータを取り出し、データを正規化されたデータ表現にアセンブルすることによって、データストリームを作成することができる。別の側面では、IRCSシステムは、構造化データおよび非構造化データをデータストリームにアセンブルすることによって、データをさらにアセンブルする。別の側面では、IRCSシステムは、構造化データを入手するためのAPIと、非構造化データを入手するためのスクレーパとを使用することができる。別の側面では、IRCSシステムは、ドメイン特有情報およびメタデータを使用して、メタデータおよびコンテンツを分離し、データストリームを形成する、パケットを作成することによって、データをアセンブルすることができる。
ある側面では、IRCSシステムは、データについて学習し、データを分析することによって、データを分析する。そのような側面では、IRCSシステムは、概念辞書をデータに適用し、概念辞書に基づいて、パターンをマッピングすることによって、データについて学習することができる。そのような側面では、IRCSシステムは、個人のパーソナル選好をパターンマップに適用し、および/または概念辞書ならびにパターンマッピングに基づいて、パーソナル辞書を構築することができる。IRCSシステムはまた、データをトークン化することによって、データについて学習することができる。
ある側面では、IRCSシステムは、データの関連性、意味論、センチメント、および意図を判定することによって、データを分析することができる。そのような側面では、IRCSシステムは、用語の頻度および密度を測定することを介して、用語に関する値を作成することを含み得る、データからの用語をともにグループ化し、用語をランク付けすることによって、データの関連性を判定することができる。他の側面では、IRCSシステムは、ユーザにシステムを訓練するように求める(すなわち、フィードバックおよび独自の意味を用語に提供する)ことによって、データの意味論を判定することができる。
本発明のこれらおよび他の側面は、詳細な説明および図面の熟読および理解から実現されることができる。
図1は、本発明の側面による、個人関連コンテンツ検索システムが引き出す、ソーシャルメディアプラットフォームの略図を図示する。
図2は、本発明の側面による、個人関連コンテンツ検索システムの略図を図示する。
図3および5−8は、本発明の側面による、ソーシャルメディアサーバと通信する図2の個人関連コンテンツ検索サーバの略図を図示する。
図4は、本発明の側面による、図2の個人関連コンテンツ検索サーバの略図を図示する。 図3および5−8は、本発明の側面による、ソーシャルメディアサーバと通信する図2の個人関連コンテンツ検索サーバの略図を図示する。 図3および5−8は、本発明の側面による、ソーシャルメディアサーバと通信する図2の個人関連コンテンツ検索サーバの略図を図示する。 図3および5−8は、本発明の側面による、ソーシャルメディアサーバと通信する図2の個人関連コンテンツ検索サーバの略図を図示する。 図3および5−8は、本発明の側面による、ソーシャルメディアサーバと通信する図2の個人関連コンテンツ検索サーバの略図を図示する。
図9は、本発明の側面による、個人コンテンツ検索サーバのデータ採集モジュールによって作成されたデータパケットの略図を図示する。
図10は、本発明の側面による、個人コンテンツ検索サーバのデータ学習モジュールの略図を図示する。
図11は、本発明の側面による、個人コンテンツ検索サーバの分析モジュールの略図である。
図12は、本発明の側面による、個人コンテンツ検索サーバのプロファイリングモジュールの略図である。
図13−14は、それぞれ、本発明の側面による、ユーザデバイスおよび個人コンテンツ検索サーバの略図を図示する。 図13−14は、それぞれ、本発明の側面による、ユーザデバイスおよび個人コンテンツ検索サーバの略図を図示する。
図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。 図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。 図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。 図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。 図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。 図15−20は、本発明の側面による、個人関連コンテンツ検索システムによって生成されたスクリーンショットを捕捉する。
本発明は、ここで、付随の図面を参照して、以降により完全に説明され、これは、本詳細な説明、概要、ならびに具体的に議論または別様に開示される任意の好ましいおよび/または特定の実施形態と併せて熟読されることが意図される。しかしながら、本発明は、多くの異なる形態において具現化されてもよく、本明細書に記載される実施形態に限定されるように解釈されるべきではない。代わりに、これらの実施形態は、例証にすぎず、本開示が徹底的かつ完全となるであろうように提供され、本発明の全範囲を当業者に完全に伝達するであろう。
明細書および添付の請求項において使用されるように、単数形「a」、「an」、および「the」は、文脈によって明確に別様に示されない限り、複数参照も含む。範囲は、本明細書では、「約」ある特定の値からおよび/または「約」別の特定の値までとして表され得る。そのような範囲が表されるとき、別の実施形態は、そのある特定の値からおよび/または他の特定の値までを含む。同様に、値が先行詞「約」の使用によって近似値として表されるとき、特定の値は、別の実施形態を形成することを理解されたい。さらに、範囲のそれぞれの端点は、他の端点に関連して、そして他の端点から独立しての両方において有意であることを理解されたい。
「随意の」または「随意に」とは、続いて説明されるイベントまたは状況が、生じる場合がある、またはそうではない場合があり、説明は、該イベントまたは状況が生じるインスタンスおよび生じないインスタンスを含むことを意味する。
本明細書の説明および請求項全体を通して、単語「comprise(〜を備える)」ならびにその単語の変形例(例えば、「comprising」および「comprises」等)は、「限定ではないが、〜を含む」を意味し、例えば、他の追加物、コンポーネント、整数、またはステップを除外することを意図するものではない。「例示的」とは、「〜の実施例」を意味し、好ましいまたは理想的実施形態のインジケーションを伝達することを意図するものではない。「等」は、限定的意味ではなく、説明目的のために使用される。
開示されるのは、開示される方法およびシステムを実施するために使用され得る、コンポーネントである。これらおよび他のコンポーネントは、本明細書に開示され、これらのコンポーネントの組み合わせ、サブセット、相互作用、グループ等が、開示されるとき、これらの各種々の個々および集合的組み合わせならびに順列の具体的言及が、明示的に開示され得ないが、それぞれ、全ての方法およびシステムに関して本明細書で具体的に検討および説明されることを理解されたい。これは、限定ではないが、開示される方法におけるステップを含む、本願の全ての側面に適用される。したがって、実施され得る種々の付加的ステップが存在する場合、これらの付加的ステップはそれぞれ、開示される方法の任意の特定の実施形態または実施形態の組み合わせを用いて実施されることができることを理解されたい。
当業者によって理解されるように、本方法およびシステムは、完全ハードウェア実施形態、完全ソフトウェア実施形態、またはソフトウェアおよびハードウェア側面を組み合わせる実施形態の形態をとってもよい。さらに、本方法およびシステムは、記憶媒体内に具現化されるコンピュータ可読プログラム命令(例えば、コンピュータソフトウェア)を有する、コンピュータ可読記憶媒体上のコンピュータプログラム製品の形態をとってもよい。より具体的には、本方法およびシステムは、ウェブ実装コンピュータソフトウェアの形態をとってもよい。加えて、本方法およびシステムは、中央に位置するサーバ、遠隔に位置するサーバ、ユーザデバイス、またはクラウドサービスによって実装されてもよい。任意の好適なコンピュータ可読記憶媒体が、利用されてもよく、ハードディスク、CD−ROM、光学記憶デバイス、または磁気記憶デバイスを含む。ある側面では、以下に議論される方法およびシステムは、特定機能機械、コンピュータ、および/またはコンピュータプログラム命令の形態をとることができる。
本方法およびシステムの実施形態は、方法、システム、装置、およびコンピュータプログラム製品のブロック図およびフローチャート図を参照して以下に説明される。ブロック図およびフローチャート図の各ブロックならびにブロック図およびフローチャート図内のブロックの組み合わせはそれぞれ、コンピュータプログラム命令によって実装されることができることを理解されたい。これらのコンピュータプログラム命令は、コンピュータまたは他のプログラマブルデータ処理装置上で実行する命令が、フローチャートブロックまたはブロックに規定された機能を実装するための手段を作成するように、特殊目的コンピュータ、クラウドサービスに見出される特殊目的コンピュータおよびコンポーネント、または機械を生産するための他の特定のプログラマブルデータ処理装置上にロードされてもよい。
これらのコンピュータプログラム命令はまた、コンピュータ可読メモリ内に記憶される命令がフローチャートブロックまたはブロックに規定された機能を実装するためのコンピュータ可読命令を含む製造品を生産するように、コンピュータまたは他のプログラマブルデータ処理装置に、特定の様式において機能するように指図し得る、コンピュータ可読メモリ内に記憶されてもよい。コンピュータプログラム命令はまた、コンピュータまたは他のプログラマブル装置上で実行する命令が、フローチャートブロックまたはブロックに規定された機能を実装するためのステップを提供するように、コンピュータまたは他のプログラマブルデータ処理装置上にロードされ、一連の動作ステップをコンピュータまたは他のプログラマブル装置上で実施させ、コンピュータ実装プロセスを生産してもよい。コンピュータプログラム命令、論理、知能もまた、チップまたは他のハードウェアコンポーネント上で記憶および実装されることができる。
故に、ブロック図およびフローチャート図のブロックは、規定された機能を実施するための手段の組み合わせ、規定された機能を実施するためのステップの組み合わせ、および規定された機能を実施するためのプログラム命令手段をサポートする。また、ブロック図およびフローチャート図の各ブロックならびにブロック図およびフローチャート図内のブロックの組み合わせは、規定された機能またはステップもしくは特殊目的ハードウェアおよびコンピュータ命令の組み合わせを実施する、特殊目的ハードウェアベースのコンピュータシステムによって実装されることができることを理解されたい。
上記に導入され、以下でさらに詳細に議論される、方法およびシステムは、ユニットから成るように説明されており、以降もそのように説明されるであろう。当業者は、これが、機能説明であって、個別の機能が、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせによって実施されることができることを理解されるであろう。ユニットは、ソフトウェア、ハードウェア、またはソフトウェアおよびハードウェアの組み合わせであることができる。1つの例示的側面では、ユニットは、コンピュータを備えることができる。本例示的動作環境は、動作環境の実施例にすぎず、動作環境アーキテクチャの使用または機能性の範囲に関する任意の限定を示唆することを意図するものではない。動作環境のいずれも、例示的動作環境に図示されるコンポーネントの任意の1つまたは組み合わせに関連する任意の依存性または要件を有するものとして解釈されるべきではない。
開示される方法およびシステムの処理は、ソフトウェアコンポーネントによって実施されることができる。開示されるシステムおよび方法は、1つまたはそれを上回るコンピュータまたは他のデバイスによって実行されるプログラムモジュール等のコンピュータ実行可能命令の一般的文脈において説明され得る。概して、プログラムモジュールは、特定のタスクを実施する、または特定の抽象データタイプを実装する、コンピュータコード、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造等を備える。開示される方法はまた、グリッドベースおよび分散型コンピューティング環境においても実践されることができ、タスクは、通信ネットワークを通してリンクされた遠隔処理デバイスによって実施される。分散型コンピューティング環境では、プログラムモジュールは、メモリ記憶デバイスを含む、ローカルおよび遠隔コンピュータ記憶媒体の両方に位置することができる。
個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法が、本明細書に説明される。前述のように、個人関連コンテンツ検索(IRCS)システム10は、図2−20に示されるように、個人に特有の情報をユーザに返すように設計される。ある側面では、IRCSシステム10は、個人の視点に関連する検索結果および情報を提供する。言い換えると、本システムは、ユーザの視点から情報を提供する。IRCSシステム10は、匿名およびセキュアの両方であるパーソナルに識別可能な情報が人間条件を改良するために使用されることを可能にする、インフラストラクチャを提供する。ある意味では、IRCSシステム10は、人間言語と記憶された知識の機械処理を組み合わせることによって、知的になる。ある側面では、新しいタイプの「検索エンジン」である、IRCSシステムは、個々のユーザに関連しており有意義であるものに基づいて、すなわち、あるものについてのユーザの感じ方およびユーザの周囲の世界の感じ方、より重要なこととして、ユーザがその情報を用いて行うことを意図しているものに基づいて、新しい人間アプリケーションを推進するように設計される。
いくつかの場合では、IRCSシステム10は、個人のソーシャルメディアアカウントを利用して、そのような情報を提供することができる。図1は、情報が引き出され得る、いくつかのソーシャルメディアプラットフォームを図示する。しかしながら、図1は、例証的実施例にすぎない。ソーシャルメディアプラットフォームは、限定ではないが、Facebook(R)、Instagram(R)、Twitter(R)、YouTube(R)、Tumblr(R)、Blogger(R)、Pintrest(R)、Google+(R)、Linkedln(R)、Periscope(R)、Meerkat(R)、Vimeo(R)、Snapchat(R)、Blab(R)、Flickr(R)、Medium(R)、WordPress(R)、Reddit(R)、および同等物を含むことができる。IRCSシステム10をGoogleのような十分に確立された検索エンジンのものに対して大局的な視点から見ると、Googleは、森の視点から木がどのようなものであるかを尋ねる。IRCSシステム10は、ある側面によると、木の視点から森がどのようなものであるかを尋ねる。
かなり大まかには、限定ではないが、Google、Facebook、Twitter、および同等物を含む、世の中の全てのソーシャルメディアシステムは、ユーザ、ユーザのコンテンツ(またはその検索)、およびそれらの間の関係の非常に大きなデータベースから成る。これらのソーシャルメディアシステムの全てではないにしても、大部分は、人々、そのグループ、またはそのページ、およびそのポストを検索する方法を提供し、それらの検索に基づいて、他の関連情報を見出す方法を提供する。ある意味では、インターネットは、情報をドメイン特有データ、ソーシャルデータ、事業データ、ブログデータ、検索データ等に編成する、データベースのセットである。本質的に、これらは、ユーザが嗜好するものを見出し(および検索し)、それらの嗜好を識別し、多くの場合、本情報をタグ付けする目的のためのデータベースである。嗜好のインジケーションは、IRCSシステム10によって利用され、ユーザが嗜好または関連するものを識別することができる。例えば、GoogleからFacebook、Facebookからtwitter等、これらのドメインのうちの1つから次のドメインへのデータのリンクを可能にすることによって、個人は、これらの個人に到達するために使用およびさらに活用され得る、識別可能パターンおよび選好を生じさせることになる。最終的に、インターネットと呼ばれる、サービスおよびデータベースの本「クラウド」は、各ユーザについてのまさに全てとなる。
図2は、本発明の側面による、IRCSシステム10を図示する。IRCSシステム10は、種々のユーザと関連付けられたデバイス30と通信するように構成される、IRCSサーバ20を利用することができる。ユーザデバイス30は、デバイス30のユーザがアカウントを有する、ソーシャルメディアサーバ(S.M.)40とコンタクトする。加えて、ソーシャルメディアサーバ40は、ユーザデバイス30のユーザによって提供される許可を介して、IRCSサーバ20によってアクセスされることができる。いくつかの側面では、他の第三者(3rdP.)サーバ50(例えば、マーケティングおよびコンテンツプロバイダ)は、ユーザデバイス30およびソーシャル中間サーバ40を通して、IRCSサーバ20によってアクセスされることができる。
IRCSサーバ20は、以下により詳細に説明される、IRCSシステム10の機能性および分析の大部分を提供するように構成される。しかしながら、いくつかの側面では、IRCSシステム10は、以下により詳細に議論される、IRCSサーバ20およびユーザデバイス30を介して、かつ自蔵処理機械(SCPM)35を介して、異なる関係者間でいくつかの機能性を共有するように構成される。いくつかの側面では、IRCSシステム10のあるソフトウェアおよびハードウェアコンポーネントは、同時に、ユーザデバイス30およびIRCSサーバ20間で共有、分割、および/またはホストされることができる。
ある側面では、IRCSシステム10は、個人に関連するソーシャルメディアプラットフォーム/サーバ40を含む、種々のソースから集められたデータ41を分析し、個人に基づいて、結果を返すように構成される。他の側面では、IRCSシステム10は、データ41を分析し、全てのユーザの結果または一部のみを返すことができる。IRCSシステム10は、図3−4に示されるように、いくつかのモジュールを利用して、種々の分析および機能を実施する。ある側面では、IRCSシステム10は、データ採集モジュール100と、データ学習モジュール200と、分析モジュール300と、データ保持モジュール400と、プロファイリングモジュール500とを含むことができる。図4に示されるようなこれらのモジュールは、他のコンポーネントとともに、種々の手段を通してデータストリームを準備し、収集されたデータを分析し、データについて知的洞察を行い、種々の他のタイプのサービスを提供することができる。前述のように、これらのモジュールおよび機能性は、コンポーネントによって提供される機能性に応じてIRCSサーバ20およびユーザデバイス30/SCPM35間で共有される、コンポーネントによって遂行されることができる。
データ採集モジュール100は、図4および5に示されるように、構造化41aまたは非構造化41bされ、データストリームを形成し得る、データ41のストリームをインバウンドさせるために使用される、非常に適合性のあるモジュールである。データ採集モジュール100は、情報/データ41を引き出す、種々のソーシャルメディアプラットフォーム/サーバ40の必要要件を学習するように構成され、IRCSシステム10の他のモジュールによって承認され得る、データストリーム80を生産するために、これらのプラットフォーム/サーバ40上の必要インターフェースに適合することができる。IRCSシステム10は、かなりのフレキシビリティをサポートする。データ41は、いくつかの場合では、データ60がストリームとして利用可能ではないことがあり得るため、ストリーム「スクレーパ」インターフェース102、またはAPIを使用して、「適合」されることができ、いくつかの場合では、以下に議論されるように、実際には、サブミットされる前に、データを解析および事前処理する必要があり得る。これは、データ採集モジュール100外では、IRCSシステム10がインバウンドデータ41をデータストリーム80と見なすという点において、IRCSシステム10を大幅に簡略化する。いったんストリーム80が準備できると、インバウンドおよび準備サービスが、引き継ぐ。例えば、特定のストリームにアクセスするために、個々の人にログインさせることを必要としてもよい。
データストリーム80の使用は、いくつかの利点を有する。ある側面では、1つの利点は、データストリーム80が分析のために別個に蓄積および記憶される必要がない、すなわち、データ41が、データストリーム80の形態において、そのまま取り込まれることである。加えて、データストリーム80は、複数回(例えば、再帰的に)、IRCSシステム10内にフィードされ、毎回、データストリーム80をさらに精緻化することができ、これは、典型的には大規模データセットを通してシフトするときに作成される「雑音」を排除する。
インターネット上のデータ41は、問題を呈する。すなわち、データ41のフォーマットおよび構造が、サイト毎に変動する。加えて、多数のコンテンツサイト(例えば、ソーシャルメディアサーバ40によってホストされるInstagram、Facebook等)に伴って、データは、ますますタグ付けされた状態になる。したがって、IRCSシステム10、より具体的には、データ採集モジュール100は、必ずしも、データ自体に目を向ける必要なく、データ41についてのますます多くの手掛かりを有する。しかしながら、インターネットユーザは、物事を異なるように解釈し、ソーシャルメディアプラットフォーム/サーバ40から収集される(ユーザデバイス30のユーザのアカウントを介して)データ41の大部分がパブリックであることを前提として、自発的情報は、あまり信頼性があるものではない。データ採集モジュール100は、自動化された方法を利用して、データ41をより良好に理解する。
かなり大まかには、データ採集モジュール100は、構造化データ41aと非構造化データ41bを判別する。ある側面では、データ採集モジュール100は、これらの異なるタイプのデータ41を識別することができる。そのような側面では、各タイプのデータが、図5に示されるように、異なるタイプのアダプタまたはエージェント、すなわち、構造化アダプタ/エージェント110a、および非構造化アダプタ/エージェント110bを要求することが可能性として考えられる。これらのアダプタ110が行うジョブの1つは、データ41をソーシャルメディアサーバ40から取り出し、それをデータストリーム80に変換することである。このように、以下に議論される、リアルタイムプロセッサ130およびバッチプロセッサ140は、種々のソーシャルメディアサーバ40からのデータ41の異なるタイプについて心配する必要はない。すなわち、構造化41aまたは非構造化41bされるデータ41は、単一データストリーム80を通して示される。処理は、リアルタイムプロセッサ130を介してリアルタイムで発生するか、または、バッチプロセッサ140を介して、いくつかのスケジュールされた時間において、プロセスが起動し、ストリーム80を解釈し、必要分析を抽出することを意味する、「バッチ」モードで発生するかのいずれかとなる。
図4−6に示されるように、データエージェント/アダプタ110の唯一のジョブは、いずれのソース40(非構造化データである、FB、Twitter、YouTube(登録商標)、Naver)からであろうと、データ41を適合させ、次いで、データストリーム80となる、正規化されたデータ表現を作成することである。本正規化は、単に、データをあるフォーマットから別のフォーマットに変換することだけではない。すなわち、インバウンドデータアダプタ110は、解釈のために、データ41のコンテキストをチェックする。すなわち、データアダプタ110は、データ41と関連付けられたユーザのバイアスおよび選好がIRCSシステム10のものより優先されるべきであるかどうかを判定する。ある側面では、ユーザが、データの解釈を補助するために、アダプタ110と関連付けられた設定を構成し、データ学習モジュール200(以下でさらに議論される)内に見出されるパーソナル辞書または一般的辞書により多いまたはより少ない加重を与えることができる。
ある側面では、データストリーム80は、内部データベースのセットであり、その一部は、「リアル」タイムで動作し、一部は、「バッチ」モードで動作する。その点を超えると、以下に議論される、データ分析モジュール/エンジン300は、関連性およびセンチメントを判定するための共通アルゴリズム(以下に詳細に議論される)と、傾向の維持、スコア化、および長期報告のための共通サービスとを使用する(共通とは、本文脈では、アーキテクチャの異なるコンポーネント間で共有されることを意味する)。IRCSシステム10はまた、採集しているデータをモデル化することによって、「知能」基盤を形成し始める。
前述のように、データエージェント/アダプタ110は、データ41の内容を理解する、データ採集モジュール100の一部である。ある側面では、データエージェント110は、ドメイン特有情報およびメタデータを使用して、メタデータ41c(ポストについてのデータ)およびポスト41dの実際のコンテンツ(ポストデータ)を表す構造を作成する(図6参照)。全てのこれらの構造を集約することによって、パケットのデータストリーム80が、形成される。
データ採集モジュール100を知的にする、データ採集モジュール100の別の興味深い側面が存在する。通常、本タイプのアーキテクチャが使用されるとき、データエージェント/アダプタ110は、言語特有である。言い換えると、サポートされる言語毎に、Facebookエージェントが存在し、すなわち、FB Spanish、FB English、FB Korean等が存在する。これらのデータエージェント/アダプタ110を相互に完全に独立させることに関する問題は、それらの間の任意の潜在的な意味論的な相乗効果が喪失されることである。これは、IRCSシステム10、具体的には、データ学習モジュール200が、データ採集モジュール100のデータエージェント110とともに、「学習」し、人間がIRCSシステム10に教示することを可能にする、人との相互作用を有する場合である。
ある側面では、データ学習モジュール200は、データ採集モジュール100からの補助を受けて、概念辞書210を確立し、概念に基づいて、情報のパターン220をマッピングまたは確立することを通して、データ41を理解するようになることができる(図8参照)。概念は、インバウンドポスト/データ41をマッピングするために使用され得る、言語独立構造体である。さらに、データ学習モジュール200は、次いで、概念を取り込み、コンセンサスが1人から全てのユーザへと付加的データから判定され得るかどうかを確認するであろう。より多くのコンセンサスが特定の概念の「意味」について構築されるほど、採集の間に行われる必要がある作業が少なくなる。いったんコンセンサスが構築されると、データ学習モジュール200は、次いで、証明された概念を用いて見出された他の情報を同一概念にマッピングし始めることができる。
例えば、ハートの絵文字は、愛の概念にリンクされることができる。データ採集モジュール100はまた、ユーザが、IRCSシステム10に、ハートが愛を表すことを示唆することを可能にすることができる。IRCSシステム10は、次いで、概念辞書210および/またはパターン220内の一般的考慮点のための概念(すなわち、ハートの絵文字が愛と等しい)を提案する。ユーザならびに他のユーザのますます多くのデータが、その絵文字が愛と等しいことを示すにつれて、コンセンサスが、構築されることになる。例えば、学習モジュール200は、たくさんのハートを含む、ポスト41が、愛についてである可能性が高いかどうかを確認し、高確率で愛についてであることが該当するであろう。いったん概念が、構築され、ある程度、検証されると、データ学習モジュール200は、次いで、ポストをさらに処理し、自然言語を頻繁に愛と関連付けられる用語にマッピングすることができる。したがって、意味論メタデータをデータストリーム80の中に取り込むことが可能となる。さらに、メタデータは、地理的場所、人口統計、時系列、デバイス、ソース等、または、分析の値の増加に役立つそのデータ41について取得され得るものを含む。
ある側面では、データ採集モジュール100のデータアダプタ110を利用する、データ学習モジュール200は、2つの主な方法、すなわち、(1)パーソナル選好を着信データを理解するために使用される概念辞書210に適用することと、(2)同一概念およびパターンに遭遇するとき、将来的に適用されるための概念「マップ」およびパターン220を構築することとにおいて、知能を使用する。これらのステップは、図8に示されるように、データ学習モジュール200内で行われる。これらの概念/辞書210およびパターン/マップ220は、次いで、分析モジュール300によって後に使用され、IRCSシステム10を使用して、さらなる作業を実施し、さらにより多くのサービスを人に提供することができる。言い換えると、データ採集モジュール100は、データを検出し、データ学習モジュール200は、概念およびパターンを入手する。
ユーザデバイス30が、最初に、IRCSシステム10を使用するとき、IRCSシステム10は、ユーザの知識を有しておらず、接続/概念をユーザのデータ41に強制する。しかしながら、いったんIRCSシステム10が、データストリーム80内のパターンおよび概念のうちのいくつか(データ保持モジュール400内に保持されることができる)を学習すると、IRCSシステム10は、データ学習モジュール200を呼び出し、これらの概念(例えば、概念辞書210から)をデータ採集モジュール100にフィードバックすることができ、したがって、データ採集モジュール100は、行う作業があまりなく、認識された概念をスキップする。
ある側面では、データアダプタ110は、フィードリーダ111を含み、これは、フィード41のコンテンツを、図6および9に示されるように、Facebook、Twitter、YouTube(登録商標)等の特定のソースから入手する。多くの場合、これらのフィード41は、API112を有し、データアダプタ110は、人がフィード41を閲覧しているかのように、単に、人のログイン証明書を使用して、ユーザをシミュレートし、フィード41を取得する。しかし、時として、API112を使用不能または利用不可能であって、フィードリーダ111は、スクレーパ102と一般に称されるものを使用する。スクレーパ102は、通常、HTMLにおけるネイティブコンテンツを解析し、コンテンツを視覚的フォーマットから分離することができる。ネイティブ検索能力もまた、ユーザのアカウントの使用を通して、コンテンツを読み出すために使用されることができる。
リーダ111は、データ構造のパブリックまたは内部知識を使用して、メタデータを各個人ポストの実際のコンテンツから分離する、「パケット」81を作成する。これは、分析のためのコンテンツの解析(すなわち、データストリーム80の形成)に先立って行われる。ある側面では、本タイプの処理は、ユーザデバイス30上の分散型エージェントの形態でユーザにより近づき、より多くの「事前分析」が、本初期採集フェーズに押し込まれるであろう。本プロセスを通して、ソーシャルメディアサーバ40からのデータ41は、ファイアホースから生じているわけではない。すなわち、データ41は、IRCSシステム10とアカウントを設定するとユーザによって認可される、個人の個人アカウントから「スクレープ」されている。データ採集モジュール100は、構築されるにつれて知能を使用するための合理的場所を提供する。さらに、データ採集モジュール100は、データ学習モジュール200とともに、ユーザの個人ベースでデータ41を取り込み、そのようなデータ入手と関連付けられた通常のビッグデータ問題を回避する。ある側面では、いったんデータ41が、以下に詳細に議論されるように分析されると、データ41は、迅速に消える。言い換えると、ポストの処理は、処理短期メモリに類似する一方、長期メモリは、概念学習を覚え込むことである。
ある側面では、データ採集モジュール100およびデータ学習モジュール200の組み合わせは、概念210およびパターン220の言語独立データベースを作成する。全ての個人は、通信するとき、個人言語パターンに従う。データ採集モジュール100のデータアダプタ110は、多くの場合、個人に「扮する」ため、データ41が分析フェーズにおいて後にデータを「再度読み取る」必要なく、読み取られるにつれて、概念およびパターン知能(すなわち、データ学習モジュール200)をデータ採集モジュール100内に埋め込むことが効率的である。ある側面では、2つのモジュール100および200が、ユーザのデバイス30上のSCPM35に見出されることができる。そのような側面では、パーソナルパターン認識(データ採集と学習モジュール100および200の組み合わせ)をユーザデバイス30上に分散させることは、IRCSサーバ20上の負荷を低下させる一方、IRCSサーバ20に重い負担をかけずに、個人パターンおよび選好との類似性を増加させる。
図7および9−10は、データ学習モジュール200のコンポーネント間の情報のフローの実施例を図示する。ある個人が、「I just love「ハートの絵文字(heart emoji)」pretty flowers in the spring」という文41をFacebook上にポストしたとする。一般的言語辞書205および概念210を利用する、共通言語パーサ230が、オリジナル文41をトークン化し、単純言語分析を使用して、トークン化された文84を作成し、トークン85を含有するデータ構造(リンクされたリスト、ツリー等)を作成する。この場合、個人は、Facebookがハートとして表示する、ハートの絵文字を使用している。ハートの絵文字は、Facebookユーザに理解されるが、自然言語パーサには理解されない。したがって、ここで、ドメイン特有情報(図7参照)を使用することによって、知能が使用され、自然言語を他のアーチファクトから分離する必要がある。同様に、同一個人が、ハッシュタグの使用を開始し、したがって、そのポストを「I just #love「ハートの絵文字」pretty #flowers in the #spring」のように書き換える場合、ドメイン特有情報が、「ハートの絵文字」#love、#flowers、および#springをメタデータの中に記述アーチファクトとして捕捉し、通常、標準パーサにとって多くの問題をもたらすであろう、全てのエスケープ文字を伴わない、自然言語をプロセッサ130/140に再ポストし直すために使用される必要がある。さらに、本プロセスは、ローカライズされ、各言語がツールによってサポートされるように適合され、したがって、口語体、文化的参照、ならびに他のローカル言語および文化的バイアスが、考慮されることができる。
オリジナル文「I just love「ハートの絵文字」pretty flowers in the spring」に戻ると、データ学習モジュール200は、パーサ240とともに、依然として、概念辞書210を使用して、パーソナル辞書245を構築し、文の意味を捕捉する(図10参照)。ユーザは、彼女のみが美しい花が好きであることを意味しているのか?花が全て美しいため全ての花が好きなのか?花を「単に好き」であって、任意の他の心情はないのか?または春にだけ美しい花が好きなのか?示されるように、意味論は、個人に対して非常にコンテキスト依存であることができる。本タイプのパーソナル化解析240は、一般的解析を除外しない。しかしながら、パーソナル辞書245ルールによってすでに解析される言語の部分とトークン85を置換することによって、一般的パーサ230は、行う作業があまりない。
文のトークン化は、図10に示されるように、付加的サイクルのために継続することができる。解析における各「サイクル」は、個人が真に意味するものを理解するために、ますます多くの「知能」を追加する。経時的に、ますます多くの言語パターンが個人によって確立されるにつれて、個人がその概念を精査し、その意味論マッチングをスコア化するための方法を提供することによって、エンジンは、それらのパターン、概念、および意味論のより正確な理解のために訓練されることができる。
トークン85は、文が実際の分析のために分解されると強力となり、付加的作業を行い、トークンが「意味」するものを理解する必要性を排除する。例えば、自然言語解析(一般的言語パーサ230によって行われる)は、言語要素(例えば、名詞、動詞、形容詞等)に分解し、次いで、言語要素を発話パターンにマッチングさせ、述べられている内容を確立することを要求する。トークン85を用いることで、トークン85がすでに「マッチング」されているため、これは、もはや必要ない。したがって、経時的に、人々がその言語において反復的パターンを使用するため、事前処理によって、そのポストがそのパターンのうちの1つに迅速にマッチングされ(パターン/マップ220を介して)、より高速であるだけではなく、非常に正確な処理をもたらすにつれて、実際の「核心に入っていく」解析は、ますます必要なくなる。
データ学習モジュール200はさらに、データについてのより多くのデータを抽出し、データ構造(すなわち、パケット)81をストリーム80内に作成し、データストリーム80の処理をスケジューリングすることができる(図9参照)。パターン認識および他のアルゴリズムも、データのより良好な理解のために使用されることができる。本タイプのデータ分析は、マーケティングメッセージをより良好に標的化するため、ならびに特定のコンテンツとは対照的に、パターンに基づく商業およびソーシャルアクティビティを可能にするために有用である。
全てのパケット81が、データストリーム80に入れられた後、パケット81は、次いで、分析モジュール300によって受信される。分析モジュール300は、そのデータストリーム80のための要求または構成に応じて、多様な分析(センチメント、意味論等)を実施することができる。分析モジュール300は、複数の分析モジュール/エンジンから成ることができる。例えば、異なるタイプのセンチメント分析エンジンが、存在し、いくつかは、twitterフィードを分析することができるが、その他は、そうではなく、したがって、異なるエンジンを「プラングアンドプレイ」可能であることが重要である。また、いくつかのエンジンは、自然言語処理アルゴリズムに基づく一方、その他は、コンテキストおよびメタデータに焦点を当てる。このため、データストリーム80は、処理経路に沿って移動するにつれてデータに作用する、一連のプロセッサと見なされることができる。プロセッサ/エンジンは、意味論分析であるかまたはメタデータ抽出であるかにかかわらず、それらが行う内容に限定されず、分析は、データストリーム80に適用されるルールによってのみ限定される。分析モジュール300はまた、処理のスケジューリングが、リアルタイム、バッチモード、またはオフラインで発生することを可能にする。処理は、連続して発生する必要はなく、分散されることができる。スケジューリングシステムはまた、異なるサービスプロバイダとの同期を管理する。
本発明のIRCSシステム10は、個人に関連する検索結果を生産する。IRCSシステム10は、分析モジュール300を介して、これらの検索および分析を実施し、これは、図11に示されるように、4つのメイン概念および関連サブモジュール、すなわち、関連性310、意味論320、センチメント330、および意図340に基づき、かつそれらを使用する。
(関連性)
関連性は、広義の用語である。IRCSシステム10の検索に適用されると、関連性は、関連性サブモジュール310を介して、用語をともにグループ化するために使用される。したがって、例えば、ある人が、「Hillary」とタイプする場合、IRCSシステム10は、次いで、検索が返す内容を見つけ、「Hillary」の次に使用される最も一般的な用語をランク付けするであろう。用語の本ランク付けは、頻度、「Clinton」が「Hillary」後にポストに出現する回数は?「President」または「Candidate」の回数は?のような異なる要因に目を向けることによって行われることができる。文書中の検索単語出現頻度(単語の重要度を反映することが意図される、数値統計)が、本ランク付けのために利用されることができる。
用語に割り当てられ得る全てのこれらの異なる値は、語句、段落、および文書全体に拡張されるように複合されることができる。文書の数値モデルを作成することによって、用語を相互に比較する必要なく、または用語の出現を検索することさえなく、比較が行われることができる。例えば、単純バイナリエンコーディング(ASCII)が、用語「関連性」のために使用されると仮定する。16進法72656C6576616E6365が、生産され、これは、0と1に容易に拡張され得、次いで、単純バイナリ数学(OR、XOR等)を使用して、他の用語に対して容易かつ迅速に評価されることができ、また、単純値と他の単語の単純値を比較することによって、ツリー構造に迅速に編成されることができる。
語句または文書さえ本方式で編成することによって、関連性サブモジュール310は、次いで、ビットマップを作成し、これらの完全な文書を表すことができる。さらに、比較は、文字毎の比較を試みるのではなく、ビットレベルで行われることができる。付加的関数、すなわち、密度、加重、頻度を値に追加することによって、実際には、単語自体に個々に目を向ける必要なく、従来の数学が、コンテンツのこれらの「物理的」特性を比較するために使用されることができる。しかしながら、任意の2つのビットマップが類似する、または同じでさえあることを前提として、それらが非常に類似するものを表す尤度は、非常に高く、逆に、それらがマッチングしない場合、それらは、全く類似しないであろう。これは、IRCSシステム10が、「学習された」トピック全体のライブラリを作成することを可能にし、単に、ビットマップを比較することによって、類似パターンを迅速に識別することができる。
加えて、関連性サブモジュール310はまた、密度の概念、すなわち、ポストの任意の所与のグループにおいて、頻度が高いかまたは分散されているかを考慮することができる(あるポストは、多くの言及を有し、その他は、あまり有していない)。要するに、数学が構築される方法にかかわらず、試験および訓練(すなわち、ユーザフィードバックを取り込み、ある用語と別の用語の相対的値の判定を試みる際にアルゴリズムによって使用され得る、ユーザまたは可能性としてドメイン特有辞書を作成する、ユーザ機能)後、「一般に」関連性を指すであろう内容を生成するであろう、アルゴリズムまたはアルゴリズムのセットが、作成されることができる。これは、いくつかの特定の時間値にわたって適用される頻度および密度の計算に基づく数値となるであろう。したがって、頻繁かつ高密度で使用される用語は、めったに使用されない用語よりユーザと関連性を有する。IRCSシステム10は、単に、一般に使用される用語の識別を試みるのではなく、パターンを生成および識別する。
他の用語とオリジナル用語の関連性を判定するために、または実際の用語と個人の関連性を計算するために、IRCSシステム10は、関連性サブモジュール310を介して、ユーザ自身の使用に、すなわち、ユーザのメッセージ、ポスト、検索等における経時的に類似する頻度および密度測定値に目を向ける。ユーザの友人のストリームに目を向けることによって、IRCSシステム10は、用語が友人の輪の中に出現している頻度を判定し、同一用語を検索および使用しているユーザが有する友人により関連させることができる。
IRCSシステム10が、用語だけではなく、ユーザ(人々)間の関係の捕捉を開始するにつれて、IRCSシステム10は、関係について測定された頻度、加重、体積、密度等の属性を要素に追加し始めてもよい。前述のように、用語がユーザの友人にとって重要である場合(彼らがある時間期間にわたってそれを頻繁または高密度に使用するため)、IRCSシステム10は、関連性サブモジュール310を介して、その「パターン」をユーザにマッチングさせ、友人およびユーザの類似性を確認することができる。頻度が正弦波である瞬間を可視化するとき、密度は、ピーク(およびトラフ)間の距離である。密度が高い場合、波は、相互に非常に接近するピークの束のように見える。密度が低い場合、波は、長く見えるであろう。
これらの「波」パターンに目を向けることによって、パターンは、関数に変換されることができる。関数は、次いで、他の関数と比較され、パターンを検出および比較することができ、これは、全ての波が正弦関数にマッピングされる得るため、数学的に容易に行われることができ、その機能およびIRCSシステム10の関数の側面を比較することによって、波自体を比較する必要性を回避することができる。f(i)=x(i)等の関数の比較は、バイナリで単純である。さらに、単語を数学的構造体(例えば、波)に変換することによって、IRCSシステム10が、新しい数学を考案する必要なく、十分に確立された数学を使用することを可能にする。
各用語を数学的関数または値にマッピングすることによって、単純質問が、尋ねられることができる。すなわち、等しい、それ未満、またはそれを上回るか等である。IRCSシステム10は、関連性サブモジュール310を介して、次いで、数直線上の他の用語に対する用語の位置を確立し、したがって、特定の個人により関連する、またはあまり関連しない、数直線の部分を判定することができる。IRCSシステム10は、関連性および意味論モデルを使用して、言語構造体を容易に評価される単純関数に変換することによって、人の言語パターンおよびシグネチャを識別する属性を作成することができる。また、関数を評価することによって、実際の言語は、絶対的に必要であるときのみ評価される。大域的言語パターンが開発されるにつれて、ロケールを横断した言語および文化的差異の回避を通して、驚くべき効率がもたらされる。
例えば、人々の間の関係を検出するための主要ドライバとしてFacebookから始めるとすると、「私」は、IRCSシステム10を使用する人である。IRCSシステム10の他のユーザは、そのFacebookアカウントを使用して、その「友人」、その「嗜好」、その「フォロワー」、およびその「言及」に目を通す。それらの要素のみに基づいて、IRCSシステム10は、それらの人々のマップを構築し、彼らが「私」のポストに「いいね」をした回数またはそれを他者と共有した回数に基づいて、関連性スコアを割り当てることができる。実際、次元グラフから、「私」と最も相互作用を行った人々が「私」に「より近く」、その他は、より遠いことが分かる。
IRCSシステム10はまた、それらのポストのセンチメント(以下に議論される)をスコア化(およびそのスコア化を経時的に保持する)し、「私」(すなわち、ユーザ)についての人々の真の感情と彼らの発言および行動に基づいて「私」に同意する可能性が高い人々とをより正確に表し得る、組み合わせられたセンチメント−関連性スコアを作成することができるという点において異なる。同様に、逆もまた、当てはまり得る。得られたユーザidのポスト/共有/「いいね」からの情報が、次いで、実際に、関連性およびセンチメントに関して、他のユーザのポストのテキストと比較される。ある側面では、IRCSシステム10は、ユーザのポストを追跡し、エントリを分析し、ユーザがある単語を使用するときの意味およびユーザに関連する用語を判定する。ユーザのパーソナル辞書が構築されるにつれて、システムの知能も構築される。
しかし、関連性分析が適切に機能するために、ユーザがIRCSシステム10を訓練することが可能であることが重要である。最初は、IRCSシステム10は、特に、語句または用語の全ての口語体および現代的使用を伴う、自然言語に目を向けている場合、「推測」を行うことしかできない。したがって、IRCSシステム10は、よりユーザが行うように「思考」するようにユーザがエンジンを「訓練する」能力を提供する。ある側面では、データ学習モジュール200が、教示プロセスにおいて利用されることができる。例えば、語句「Hillary Clinton is hot」は、曖昧である。すなわち、語句が、彼女の外見、彼女の投票率の上昇、またはSavannah, GA滞在時の彼女の感情を指すかどうか明らかではない。IRCSシステム10は、データ学習モジュール200を介して、自動的に、語句が含意する内容を推測するであろう。ある側面では、IRCSシステム10は、ユーザに、ユーザの思考が実際に意味する内容、次いで、ユーザがそのセンチメントに同意するかどうかに関するヒントを与えさせることができる。IRCSシステム10は、意味論(意味論は、意味する内容である)をセンチメント(感情)から分離することができ、これは、重要な区別である。IRCSシステム10は、以下により詳細に示される異なる数学を用いて、それらをモデル化する。これは、他のアプローチからの重要な区別である。
さらに、IRCSシステム10によって本分析(例えば、分析モジュール300)において利用されるアルゴリズムは両方とも、「プラガブル(pluggable)」であって、ユーザは、それらのアルゴリズムの使用をレベルで考察することができる。例えば、自然言語辞書を用いて、IRCSシステム10は、Urban Dictionaryを「意味論」の第1のレベルとして、Wikipediaのようなより一般的辞書を第2のレベルとして、次いで、パーソナル辞書を第3のレベルとして使用することができる。ユーザは、センチメントをスコア化するときにより大きい加重を課す辞書、次いで、それらをスコア化アルゴリズムと併用するときの第2の辞書等、カスタマイズすることができる。これは、ユーザデバイス30のユーザによって、彼らがIRCSシステム10を使用する(例えば、IRCSシステム10のコンポーネント(SCPM35)をユーザデバイス30上にダウンロードする)ことに合意すると、行われることができ、ユーザは、最初に、IRCSシステム10を構成し、継続的に、ユーザは、より重要性が置かれるべきもの、パーソナル辞書、またはその他に関するその選好を示す。これはまた、IRCSシステム10が、ユーザのパーソナル辞書を捕捉し、「パーソナル検索エンジン」を形成する機能性を有することを意味する。ユーザは、ユーザが検索からより期待する内容であるように結果を認識するようにIRCSシステム10を訓練することができる。
(意味論)
分析モジュール300は、IRCSサーバ20の意味論サブモジュール320を介して、種々の異なる意味論モデルおよびアルゴリズムを開発、実装、および捕捉するように構成される。ある側面では、分析モジュール300は、自然言語処理(NLP)を利用する。NLPは、人間言語のあらゆるニュアンスを伴って、それ自体でも困難である。しかしながら、同様に、言語の意味を判定し、かつ言語境界に及ぶ意味を掘り下げようとすることを含む、越えるべき付加的ハードルも存在する。これらの課題の全てにもかかわらず、真のNLPは、ますます現実に近づきつつある。例えば、SiriおよびCortanaは、大きな発展を遂げており、両方とも作業のためにオンライン接続を要求するという事実によって判断されているものの、処理能力は、我々のより小さいデバイス上に適合する限界をはるかに超えると想定される。
分析モジュール300、より具体的には、意味論サブモジュール320は、コンテンツのストリームを通して読み取るとき、人間が意味する内容についての自然言語の解釈に関わる。IRCSシステム10は、インターネット上に書き込まれるポストの解釈に関わるだけではないため、単語コンテンツが、使用される。すなわち、IRCSシステム10は、音楽およびビデオ内の音ならびに画像に埋め込まれ得る用語さえ理解対象として構築されるように構成される。
ある側面では、IRCSシステム10、より具体的には、分析モジュール300の意味論サブモジュール320は、分析を(1)コンテンツストリームのトークン化および解析と、(2)実際の統語論分析と、(3)コンテキストまたは概念マッピングとの3つに分割する。言語構造を取り出し、それらを言語障壁を超越する概念にマッピングすることは、困難である。多くの場合、社会的または文化的差異等の他の人間要因は、不一致をもたらし得る。加えて、プロセスは、変換を伴い得、これは、近似値であって、また、機械エラーを受けやすい。しかしながら、IRCSシステム10の相互作用性質を前提として、人間は、機械に命令する(すなわち、IRCSシステム10に教示する)ことができ、アルゴリズムが、人間体験から精緻化されることができる。
人間言語は、IRCSシステム10および分析モジュール300が理解するビットおよびバイトである、データに変換され、分析モジュール300によって採用されるアルゴリズムが、次いで、それを全て解明する。意味論ツリー、意味論特性評価、またはさらにより複雑なモデル化も全て、機械認識可能データストリーム80に変換される必要があり、計算アルゴリズムは、入力を取り出し、それを出力に変換するであろう。
多くの人々は、相互に理解することに(多くの場合、彼ら自体を理解することに)奮闘しているため、コンピュータも同様に、ユーザを理解することに問題を有し得る。本「理解」の概念とは?これは、非常に分かりにくい。IRCSシステム10は、ユーザが自身をモデル化することを可能であるように補助するように構成され、彼らの個人の物事の理解および意味は、非常に有益である(例えば、感情および心情的センチメントを解釈する際)。
分析モジュール300の意味論サブモジュール320は、個人が、人が実際に思考し、感じるように、物事を解釈するように分析モジュールのエンジン/モジュール/プロセスを「訓練」することを可能にする。内面化プロセスは、コンテンツをカスタマイズする単純プロセスの範囲を超える。すなわち、入力が同一であっても、出力が、有益な無限大の数学的構造体の変換に回され、数学が嘘をつかないため、実際のコードの状態、結果が処理される方法等を変化させる。
(センチメント)
関連性および意味論と同様に、IRCSシステム10の分析モジュール300のセンチメントサブモジュール330は、ポスト、画像、ビデオ、および他のコンテンツを捕捉し、それらをセンチメントに関して分析する。コンテンツは、前述のように、データストリーム80に変化され、用語をマッチングさせ、ストリームを通して「読み取り」、メタデータ(すなわち、ポストについてのデータ)を抽出し、エントリのコンテンツをスコア化することを含む、分析のために、センチメントエンジン/サブモジュール330を通して送信される。ある側面では、センチメントサブモジュール330は、スコアスケールを使用する。スケールの使用は、算出を負のセンチメントの計算における実際の実数より非常に高速にする。数直線に沿って中央の数は、計算がより高速である。ある側面では、スコアは、1〜100の範囲であって、1は、負であって、100は、正であって、50は、中立である。したがって、1〜49は、逆向きにおける−49〜−1と等しく、51〜100は、正の1〜49であり、誤った場所に取り込まれ得る負の値の必要性を排除する。整数の数学の使用は、処理の速度を増加させるだけではなく、また、そのような処理のコストを低減させる。
ある側面では、IRCSシステム10は、センチメントサブモジュール330を介して、種々のパブリック辞書(例えば、Urban Dictonary、Webter、Wikipedia等)、開発されたパーソナル辞書(IRCSシステム10によって作成された)、および他の類似サービスを使用し、言語および通信パターンのユーザ自身の使用により緊密に基づいてセンチメントを捕捉するために、分析の際にその用語の「値」を判定する。
センチメントの本スコア化は、基本的であるが、意味論の「意味」の初期概念を作成する。同様に、センチメントサブモジュール330も、IRCSシステム10のユーザによって教示されることができる。人間がスコア化に同意または不同意することを可能にすることによって、センチメントサブモジュール/エンジン330は、人のセンチメントにマッチングする多くのものを「学習」することができ、経時的に、人は、パーソナルセンチメント「パターン」に他の辞書によって提供されるものより高い加重を与えるようにシステムを設定することによって、結果に影響を及ぼすことができる。
加えて、IRCSシステム10は、センチメントサブモジュール330を介して、「パターン」、異なる人々間の「フットプリント」を比較し、人々が共有意味論に集中するにつれて、IRCSシステム10は、類似性を発見し、意味論上発散するトピックに関するコンセンサスを構築することにさえ役立つ1つの方法になることができる。2人の人々の意味論スコア化が、根本的に異なるが、何らかの点において、彼らのセンチメント分析が他方にマッチングする状況を想像されたい。可能性として、異なる視点から問題を見ることが、実際には、センチメントに基づいて、意味論発散を収束させ得る。
(意図)
コンテンツをスキャンし、意味およびセンチメントを判定することと、それらの入力から「新しい」ものを作成する、すなわち、入力の意図を判定することは別のことである。IRCSシステム10、より具体的には、分析モジュール300の意図サブモジュール340は、非常に詳細かつパーソナル入力を分析し、入力の意図を判定する。
例えば、ある人が、車について調査している場合、車の購入を意図しているのか、またはそれらの車両を単に眺めるだけなのか?可能性として、すでに1台所有しており、その車、それを保守する方法、またはそれを改良する方法についてより詳しく学習することを所望している。IRCSシステム10が、ユーザのコンテンツの消費および生産「理由」についてますます学習するにつれて、IRCSシステム10は、分析モジュール300の意図サブモジュール340を介して、次いで、そのようなより多くのコンテンツ、さらに、潜在的協力者、指導者、または生徒となり得る、より多くの個人を見出すことができる。意図は、システムによって補正され得る、裏付けられた推測に基づいて、またはユーザが何らかのものを入手または除去することを意図するとき、IRCSシステム10に最も基本的な意図指定子として伝える、アーチファクト(例えば、「いいね」ボタン)をユーザに提供することを通して、見出されることができる。
(他の機能性)
IRCSシステム10は、匿名およびセキュアの両方であるパーソナルに識別可能な情報が人間条件を改良するために使用されることを可能にする、インフラストラクチャを提供する。ある意味では、IRCSシステム10は、人間言語と記憶された知識の機械処理を組み合わせることによって、知的になる。
前述のように、データストリーム80の大部分は、記憶されずに、IRCSシステム10を通して移動する。しかしながら、いくつかの側面では、いくつかのデータは、検索の履歴および個人の結果として保持され、パーソナルパブリッシュポータルによって利用されることができる。したがって、ユーザは、重要かつ彼らに関連する物事についてインフォグラフィックを作成し、それを世界に表示し、友人および家族を招待すること等を行うことができる。実際、人は、異なる「見解」を作成し、異なる人々が「私」の検索の異なる側面を閲覧することが可能となるであろう。
IRCSシステム10の別の重要な側面は、システムリソースが個人ユーザによって使用されている量ならびにその集計を判定するその能力である(すなわち、ユーザデバイス30のユーザが、IRCSシステム10にSCPM35を介してそのリソースを使用させることに合意するとき)。実際、本タイプの計測は、予算目的のためにユーザ毎のコストを判定することに役立つIRCシステム10の重要な部分となる。IRCSシステム10はまた、ユーザのタイプに基づいて、リソースの公正な使用を柔軟に考慮することを可能にする、または経時的に、その使用パターンに基づいて、顧客がより多くのまたはより優れたリソースを購入することを可能にする、内蔵課金モジュール(図示せず)を有する。課金モジュールは、経時的にユーザ毎にcpu、ram、およびディスク使用を追跡する、IRCSシステム10の基本部分であって、これは、多くのリソースを使いすぎているとき、ユーザに知らせ、任意のある時点で割り当てられ得るリソースの量を決定する、内部課金モジュールである。ある側面では、課金モジュールは、IRCSシステム10が、システムのリソースのユーザの使用に関する料金スケジュールを決定することを可能にする。
いったんストリーム80が、データモデル(メタデータおよびポスト自体から成るデータパケット)に編成されると、さらなる知能を適用するために利用可能である。データ学習モジュール200によって提供される4つのメイン機能(とりわけ)(プロファイルの識別、パターン、パーソナル化、および報告として図10に示されるように)が存在し、主な機能は、パターンを見出すことである。パターンが、コンテキスト依存であるため、分析モジュール300のエンジンは、パターン経路を設計するために、確率アルゴリズムに非常に依存し、これらのコンテキストサービス(すなわち、パターン認識サービス)は、知識ドメインにカスタマイズされ、これらの知識ドメインもまた、多形態であって、パターンセットを横断して適用されることができる。IRCSシステム10は、個人に非常に限られるため、経時的に集められたパターンおよび知能に基づいてパーソナル化を構築する、パーソナルおよびグループプロファイリングモジュール500(図12参照)を強化する。本時間ベースの知能は、IRCSシステム10における学習の基礎を形成する。最大のフレキシビリティのために、知能プラットフォームは、フレキシブルな報告プラットフォームを提供し、ユーザおよび企業によって要求される多くの側面をカスタマイズし、監視、ソーシャルメディアプラットフォームとグループまたは個人の関連付け、関係分析ならびにコア分析(分析モジュール300からの結果)の提供、およびパーソナル購入を可能にする(図12参照)。
プラットフォーム(すなわち、基本動作環境(図4の下位層参照))自体は、非常に軽量(例えば、効率目的のために合理化された機能性)であって、基本サービスを提供し、プラットフォームの異なるコンポーネントが、通信し、そのジョブを実施し、ユニフォームセキュリティモデルを施行することを可能にする。ある側面では、セキュリティモデルは、ユーザに依存する。IRCSシステム10は、複数の非関連インスタンスを有することができる、または複数の関連インスタンスを有することができ、最終的には、目標は、非常に少ない中央処理を有し、代わりに、大規模な分散型コンピューティングデータ知能プラットフォームを有することである。
前述のように、IRCSシステム10は、IRCSシステム10の一部を採用するいくつかのユーザデバイス30から成る、分散型システムであることができる。分散型システムの目標は、問題をバイトサイズチャンクに分割することである。ビッグデータ問題(Big Data Whales)を解く目的のために、IRCSシステム10は、自蔵処理機械(SCPM)35をユーザデバイス30上に実装することができる。ある側面では、SCPM35は、ハードウェア、ソフトウェア、または両方に実装されることができる。SCPM35は、自発ベースのネットワークを使用して、ともに結び付けられることができる。SCPM35は、リソース(CPU、メモリ、記憶装置、およびネットワークアクセス)が利用可能な任意の場所で動作することができる。SCPM35は、前述の機能の任意および全てを実施することができる。
SCPM35のネットワークは、処理能力および知能をネットワーク上の異なるノードにわたって分散させる。SCPM35は、個人に、低リソース消費およびフットプリントを任意のデバイス上に有する「仮想」機械をホストする能力を提供する。フットプリントは、各SCPM35によって評価されるべきデータセットのサイズに基づいて制御されることができる。ユーザおよび事業がSCPM35をサポートするためのその未使用リソースの部分を供与するための動機付けを提供するために、それぞれ、個々のクレジットおよび認識を獲得し得る、ゲーミフィケーションシステムに参加することができる。企業は、ユーザに報酬を与えることができ、ユーザは、相互に報酬を与えることができ、IRCSシステム10も同様に、報奨物を提供し、いくつかの観点からコミュニティに参加することができる。
ユーザが、SCPM35をユーザデバイス30上にインストールすると、ユーザは、コミュニティサポートを可能にするオプションを有する。本モードでは、SCPM35は、ユーザ独自の問題および調査に取り組みながら、この大域的知能ブレインに向かってユーザのリソースを最小限に利用する。ある側面では、SCPM35は、ユーザがコミュニティモードに入るまで、人の独自の処理タスクにのみ取り組むように設定されることができる。ある側面では、ユーザは、SCPM35、一般に、IRCSシステム10に、リソースのあるパーセンテージをその問題対コミュニティに配分するように伝えることができる。これが行われると、SCPM35は、プラットフォームを訓練し、他に適当な言葉がないが、その「コミュニティ精神」を把握する。また、ユーザがデータ学習モジュール200を訓練するにつれて、IRCSシステム10は、コミュニティ内にコンセンサスを構築し得るそれらの概念を比較し、ユーザに、コミュニティ承認概念に合致しているかまたはそれに対して非合致であるとしてフラグすることができる。したがって、同時に、ユーザと世界の対比を学習する。
SCPM35は、ユーザの関連性および有意性の観点において、単に、「良好または不良」(モラル)の観点から判断しない。本プライベートかつセキュアな仮想機械は、ユーザがそれを別様に認可しない限り匿名で通信する。言い換えると、全ての作業は、ユーザがその流布を認可するまで、ユーザの識別を開示せずに行われる。加えて、SCPM35は、ユーザの情報を学習し、セキュアに集め(例えば、暗号化されたデータパケットを送信する)、ユーザが、参加、協力、および寄与することを可能にする。
ユーザが、結果をコミュニティに提供するとき、ユーザはまた、その「洞察」および「意見」を世界と共有することができる。人がポストのみを共有することができる、公知のソーシャルメディアプラットフォームと異なり、IRCSシステムは、ポストについての洞察も共有する。洞察を共有することの重要性は、正のコメントが負として解釈され得るように、時として、ユーザの言語が自然言語パターンと非常に異なり得ることである。ユーザが「意味」する内容およびユーザに関連するものに関してIRCSシステム10を訓練することによって、IRCSシステム10は、ここで、ユーザが離れている間でも、さらにより良好なコンテンツを配信可能となる。ある側面では、IRCSシステム10が、検索の結果を表示するとき、視覚的キューが、大域的センチメントへの一致ならびに欠如を示すために利用されることができる。ある側面では、IRCSシステム10はまた、関連トピックを提案し、それらの発見に基づいて検索することができる。IRCSシステム10がコンテンツ自体を変化させなくても、IRCSシステム10は、パーソナル化された洞察を配信することによって、IRCSシステム10がユーザに現在の状況を伝えることを可能にする、UIアーチファクトを提示する。その「洞察」を世界と共有することによって、ユーザは、そのコンテンツ以外にも共有する。すなわち、ユーザは、そのコンテンツについて知能を共有する。本当の意味で、IRCSシステム10は、「共有」知能クラウドを構築する。例えば、政治運動では、人々は、ユーザがそのセンチメントをソーシャルメディア上でもたらすとき、優勢な公開情報と比較して議論されているトピックのユーザのスコア化を確認することができる。
これまで、インターネットは、異なるネットワーク(電子メール、ソーシャル、金融等)によって作成された情報サイロから構築されている。データモデルは、静的であって、意味論は、アプリケーション内の奥深くのソースコードの内側に埋め込まれている。IRCSシステム10は、その知能をこれらのサイロから取り出し、人々に、その独自のリソースおよびその独自の情報の制御だけではなく、知能を成長させ、知的関係(ネットワーク)をその基準にマッチングする他の人々と作成する能力を提供する。IRCSシステム10は、目的に伴って、これらのネットワーク形態を動的にする方法を提供する。ある側面では、IRCSシステム10は、自動的に接続を行う、または少なくともユーザが接続を確認するためのマッチングをユーザに提示することができる。これは、意図と呼ばれるものである。意図は、ユーザが遂行を所望するものを表現することを可能にし、IRCSシステム10は、他者がユーザがその意図を遂行することに役立ち得るように、ユーザがその意図を表現することを可能にする。
個人以外にも、これらのネットワークは、グループ、チーム、または他の協力構造において作用する能力を提供する。ある側面では、ユーザは、協力構造を形成することができ、そのコンテキストの意味論を採用し、共有辞書を作成し、したがって、パターン、概念、およびプロセスのセットを共有することに合意する。IRCSシステム10は、ランク付けおよび進歩のレベルを提供し、首位者(leader)と見なされる首位者ならびにIRCSシステム10コミュニティまたはその確立された関係内のそのリソースに寄与する首位者の両方を認識する。その考えは、あまり推測を伴わずに、実際のデータおよび実際の情報を用いて、物事を測定し、分析し、変化を生じさせることである。また、IRCSシステム10が、推測しなければならない場合、それらの推測の結果を捕捉することによって、したがって、システム10は、同一誤りを何度も繰り返す必要がない。人の収集された知能が、IRCSシステム10上に構築されるにつれて、IRCSシステム10は、全ての電話呼、全ての電子メール等を用いて、より知的に成長する。また、互恵的に、IRCSシステム10の全てのSCPM35は、より知的に成長し、バイラル知能を形成する。
ある側面では、SCPM35を含む、IRCSシステム10全体が、プライベートネットワークによって、促進、協調、管理、セキュア化、および動作される。プライベートネットワークに加わるとき、人は、そのSCPM35の能力(コンピュータ、モバイルデバイス、インターネットサービス(ブログ、ウェブサイト、ページ等)内で動作することができる)をネットワークの能力に追加する。本大規模処理ネットワークは、ビッグデータに増加的に対処することができる。ルールは、リソースの確保を管理することに対処することができ、アクセス制御は、データが安全に保護されていることを確実にすることに対処することができる。プライベートネットワークを経由したSCPM35の使用を通して、IRCSシステム10は、セキュリティ問題を回避するために、問題の全ての重要な部分を不明瞭にする。企業が、処理をその会社リソースに限定することを所望する場合、SCPM35のプライベートネットワークは、全てのデータがその企業の指定されたリソース内に留まることを保証することができる。
ユーザデバイス30は、限定ではないが、パーソナルコンピュータ(デスクトップおよびラップトップ)、タブレット、スマートフォン、PDA、ハンドヘルドコンピュータ、ウェアラブルコンピュータ、ならびに処理能力およびネットワークへのアクセスを有する、任意のデバイスを含むことができる。図13に示されるように、ユーザデバイス30は、組み合わせ無線インターフェースコントローラ51と、無線送受信機52とを含むことができる。無線インターフェースコントローラ(W.I.C.)51は、無線送受信機52の接続ならびにIRCSサーバ20、ソーシャルメディアサーバ40、および他のサーバ50からおよびそこへの情報の受信ならびに転送を含む、無線送受信機(R.T.)52の動作を制御するように構成される。無線送受信機52は、広範囲のパブリック周波数で通信してもよく、限定ではないが、周波数帯2.4GHzおよび/または5GHz−5.8GHzを含む。加えて、無線送受信機52はまた、無線インターフェースコントローラ51の補助を受けて、種々のパブリックプロトコルを利用してもよい。例えば、本発明のいくつかの実施形態では、組み合わせ無線インターフェースコントローラ51および無線送受信機52は、種々の既存および提案されるIEEE無線プロトコルで動作してもよく、限定ではないが、それぞれ、1lMbps/54Mbps/600Mbps/54MBps/lGBpsの最大理論データ転送レート/スループットを伴う、IEEE802.11b/g/n/a/acを含む。ある側面では、無線送受信機52は、セルラーネットワーク上で通信するように構成される、無線セルラーモデム52を含むことができる。セルラーネットワークは、限定ではないが、GPRS、GSM(登録商標)、UMTS、EDGE、HSPA、CDMA2000、EVDO Rev 0、EVDO Rev A、HSPA+、およびWiMAX、LTEを含むことができる。
ある側面では、ユーザデバイス30は、種々のネットワークを経由して他のデバイスと通信するように構成される。ユーザデバイス30は、限定ではないが、ローカルエリアネットワーク(LAN)および一般的広域ネットワーク(WAN)、ならびにインターネットを含む、論理接続を使用してネットワーク化された環境内で動作することができる。そのようなネットワーク接続は、ネットワークアダプタ(Nwk.Adp.)76を通して行われることができる。ネットワークアダプタ76は、有線および無線環境の両方内で実装されることができる。そのようなネットワーキング環境は、従来通りであって、オフィス、企業間コンピュータネットワーク、イントラネット、セルラーネットワークおよびインターネットにおいて一般的である。
ユーザデバイス30は、ウェブブラウザアプリケーション56および種々のその他を含む、1つまたはそれを上回るソフトウェアアプリケーション54を有してもよい。ある側面では、ユーザデバイス30はまた、SCPM35を含むことができ、これは、前述のモジュールの全てを含むことができる。ユーザデバイス30は、ウェブブラウザアプリケーション56を含む、種々のアプリケーション54を記憶することができる、システムメモリ58と、オペレーティングシステム60とを含む。システムメモリ58はまた、種々のソフトウェアアプリケーション54によってアクセス可能なデータ62を含んでもよい。システムメモリ58は、ランダムアクセスメモリ(RAM)または読取専用メモリ(ROM)を含むことができる。ユーザデバイス30上に記憶されるデータ62は、任意のタイプの読出可能データであってもよい。データは、関係データベースを含む、様々なデータベース内に記憶されてもよく、限定ではないが、Microsoft AccessおよびSQL Server、MySQL、INGRES、DB2、INFORMIX、Oracle、PostgreSQL、Sybase11、Linux(登録商標)データ記憶装置手段、および同等物を含む。
ユーザデバイス30は、記憶デバイス64を含む、種々の他のコンピュータ可読メディアを含むことができる。記憶デバイス64は、コンピュータコード、コンピュータ可読命令、プログラムモジュール、およびユーザデバイス30のための他のデータ62を記憶するために使用されることができ、ウェブブラウザアプリケーション56およびSCPM35を含む、オペレーティングシステム60および/または他のアプリケーション54をバックアップするためにまたは代替として起動させるために使用されることができる。記憶デバイス54は、ハードディスク、種々の磁気記憶デバイス、例えば、磁気カセットまたはディスク、ソリッドステートフラッシュドライブ、または他の光学記憶装置、ランダムアクセスメモリ、および同等物を含んでもよい。
ユーザデバイス30は、ユーザデバイス30の種々のコンポーネントをシステムメモリ58および記憶デバイス64ならびに相互に接続する、システムバス68を含んでもよい。ユーザデバイス30の他のコンポーネントは、1つまたはそれを上回るプロセッサまたは処理ユニット70と、ユーザインターフェース72と、1つまたはそれを上回る入力/出力インターフェース74とを含んでもよい。ユーザは、1つまたはそれを上回る入力デバイス(図示せず)を通して、ユーザインターフェース72を介して、ユーザデバイス30と相互作用することができ、これは、限定ではないが、キーボード、マウス、タッチスクリーン、マイクロホン、スキャナ、ジョイスティック、および同等物を含む。
加えて、ユーザデバイス30は、電源78を含み、限定ではないが、バッテリまたは外部電源を含む。ある側面では、ユーザデバイス30はまた、全地球測位システム(GPS)チップ79を含むことができ、これは、ユーザデバイス30の場所を見出すように構成されることができる。
図14は、ある側面による、IRCSサーバ20を図示する。IRCSサーバ20は、ユーザデバイス30のように、前述のモジュールの全てを含む。一般に、IRCSサーバ20は、いくつかのノードまたはサーバの要素および/またはモジュールを利用してもよい。いずれの場合も、IRCSサーバ20は、ユーザデバイス30、ソーシャルメディアサーバ40、および他のサーバ50と別個の複数のモジュール、ソフトウェアアプリケーション、サーバ、および他のコンポーネントを包含すると解釈されるべきである。
IRCSサーバ20は、前述のモジュールを含む、オペレーティングシステム24および種々のソフトウェアアプリケーション26を記憶する、システムメモリ22を含むことができる。IRCSサーバ20はまた、ソフトウェアアプリケーション26によってアクセス可能なデータ32を含んでもよい。IRCSサーバ20は、大容量記憶デバイス34を含んでもよい。大容量記憶デバイス34は、コンピュータコード、コンピュータ可読命令、プログラムモジュール(前述のものを含む)、種々のデータベース36、およびIRCSサーバ20のための他のデータを記憶するために使用されることができる。大容量記憶デバイス34は、オペレーティングシステム24および/または他のソフトウェアアプリケーション26をバックアップするためにまたは代替として起動するために使用されることができる。大容量記憶デバイス34は、ハードディスク、種々の磁気記憶デバイス、例えば、磁気カセットまたはディスク、ソリッドステートフラッシュドライブ、CD−ROM、DVD、または他の光学記憶装置、ランダムアクセスメモリ、および同等物を含んでもよい。
IRCSサーバ20は、IRCSサーバ20の種々のコンポーネントをシステムメモリ22および大容量記憶デバイス34ならびに相互に接続する、システムバス38を含んでもよい。ある側面では、大容量記憶デバイス34は、同一IRCSサーバ20上に見出されることができる。別の側面では、大容量記憶デバイス34は、IRCSサーバ20と別個に見出される、複数の大容量記憶デバイス34を備えることができる。しかしながら、そのような側面では、IRCSサーバ20は、アクセスを提供されることができる。
IRCSサーバ20の他のコンポーネントは、1つまたはそれを上回るプロセッサまたは処理ユニット42と、ユーザインターフェース44と、入力/出力インターフェース46と、ユーザデバイス30、ソーシャルメディアサーバ40、および他のサーバ50、ならびに同等物を含む、他のデバイスと通信するように構成される、ネットワークアダプタ48とを含んでもよい。ネットワークアダプタ48は、種々のネットワークを経由して通信することができる。加えて、IRCSサーバ20は、画像およびテキストを種々のフォーマットで提示するコンピュータモニタならびに他のデバイス等、ディスプレイデバイス49と通信する、ディスプレイアダプタ47を含んでもよい。システムアドミニストレータは、1つまたはそれを上回る入力デバイス(図示せず)を通して、ユーザインターフェース44を介して、IRCSサーバ20と相互作用することができ、該入力デバイスは、限定ではないが、キーボード、マウス、タッチスクリーン、マイクロホン、スキャナ、ジョイスティック、および同等物を含む。
図15−20は、一実施形態による、IRCSシステム10の実装のスクリーンショットを図示する。本実施形態では、IRCSシステム10(「GoSocial」と呼ばれる)は、協働またはパブリック使用のために容易にカスタマイズされることができる、ソーシャル分析ツールを提供する。しかしながら、Googleと異なり、GoSocialは、そのソーシャルアカウントを使用して、個人の視点、すなわち、その視点から学習され得る内容を提供する。ソーシャルグラフのこの反転的発見は、強力な洞察を提供する。
ユーザは、図15に示されるように、レギュラーアクセスページを通して、IRCSシステム10にアクセスすることができる。いったんサインインすると、インターフェース(図16参照)は、Googleのように、非常に単純な検索「bar」となる。Goの初期実装は、Twitter、Facebook、Flickr、およびYou Tube(登録商標)からのデータとの相関に焦点を当てるが、非常にフレキシブルである。新しいデータストリームが、容易に追加されることができる。データは、構造化または非構造化されることができ、アルゴリズムは、言語独立であって、訓練エンジンは、オープンかつ拡張可能である。その考えは、ユーザインターフェースが、タグおよび用語の使用のための利用可能なデータストリームを「検索」するための単純方法を提供することであって、それらが発見されると、アルゴリズムは、センチメントに関して各「ポスト」(データストリームによって提示される任意の文法構造体であることができる)をスコア化し、傾向を経時的にマップする。
図17は、ある側面による、用語「Iron Man」を使用したIRCSシステム10からの検索結果を図示する。示されるように、検索が実施された特定の瞬間、より人気のある用語は、Lego MovieからのキャラクタIron Manであって、概して、センチメントは、良好であることが明白である。tweetsに目を向けると、Google play上に公開されているウォールペーパーの定期的ポストが存在する。米国内の投稿者は、主に、CaliforniaまたはNew Yorkであって、tweetsのタイミングが与えられると、人々は、ソーシャルメディアネットワーク内のトピックについて積極的に議論している。このような情報は、自らの評判を成長させることに注目しているブランド所有者ならびにブランド競合他者の両方にとって非常に有益であり得る。
図18に示されるように、IRCSシステム10は、GoSocial分析ダッシュボードを介して、統計、傾向、および分析予測を経時的に管理するためにより適した強力なインターフェースを提供する。IRCSシステム10は、デバイスのタイプ、時刻または週、言語、性別等別のはるかに良好な分類を伴って、より良好な人口統計、地理的、およびインフォグラフィック能力を有する。このようなサービスは、マーケティングキャンペーン、政治的センチメント、および社会挙動分析等のロケール依存傾向を監視するために使用されることができる。
図19に示されるように、センチメント傾向化能力を使用することによって、センチメントにおける総計および分散に目を向けることができる。この場合、本用語は、平均スコア50から約80まで上昇している。ある者が本発生を見つけ、これが予想外に発生した場合には、本発生理由が追及されなければならない、または、キャンペーンが開始されている場合には、これは、そのようなキャンペーンの成功または失敗を示し得る。
異なる可視化技法を使用して、ある時間期間にわたる傾向の動向を観察することができる。例えば、図20に示されるように、用語は、champ、sprite、およびbracket、および3つの組み合わせである。示されるように、最も優勢な用語は、spriteであって、次の関連用語は、bracketであって、この場合、それらの2日にわたって、ある競技大会が開催され、bracketsがソーシャルサークル内で監視およびフォローされていたことを示すであろう。
IRCSシステム10は、頻度を検索することによりキーワードをランク付けすることによって、Googleのように「一般的」パブリックインターフェースを使用して、着目用語を集めるおよび訓練する能力を提供する。IRCSシステム10は、最も検索された用語を追跡し、関心を示すために使用されることができ、それ以外にも、個人見解およびセンチメントを集約するために使用されることができる、または単にソーシャルネットワーク内の用語の「個人の視点」を閲覧するために使用されることができる。
したがって、例示的実施形態が、説明されたが、本開示は、例示にすぎず、種々の他の代替、適合、および修正が、本開示の範囲内で行われ得ることが、当業者によって留意されるはずである。故に、本発明は、本明細書に図示されるような特定の実施形態に限定されず、以下の請求項によってのみ限定される。

Claims (20)

  1. 個人に特有の情報を返すように構成される個人関連コンテンツ検索(IRCS)システムであって、前記システムは、
    a.前記個人と関連付けられた少なくとも1つのユーザデバイスおよび前記個人が利用するソーシャルメディアサーバと通信することと、
    b.前記個人と関連付けられたユーザデバイスおよびソーシャルメディアアカウントから、情報を取得し、データストリームを作成することと、
    c.前記データストリームを分析し、前記個人の洞察を判定することと
    を行うように構成される、システム。
  2. 前記データストリームの作成は、前記個人と関連付けられたソーシャルメディアアカウントから、前記個人に関連するデータを取り出し、前記データを正規化されたデータ表現にアセンブルすることを含む、請求項1に記載のIRCSシステム。
  3. 前記データのアセンブルはさらに、構造化データおよび非構造化データを前記データストリームにアセンブルすることを含む、請求項2に記載のIRCSシステム。
  4. ドメイン特有情報およびメタデータを使用して、前記メタデータおよびコンテンツを分離し、前記データストリームを形成する、パケットを作成することをさらに含む、請求項3に記載のIRCSシステム。
  5. APIが、前記構造化データを入手するために使用され、スクレーパが、前記非構造化データを入手するために使用される、請求項2に記載のIRCSシステム。
  6. 前記個人ソーシャルメディアアカウントに関連するデータの取り出しはさらに、各ソーシャルメディアサーバの必要要件を学習し、前記データを引き出すことを含む、請求項2に記載のIRCSシステム。
  7. 前記データの分析は、
    i.前記データについて学習することと、
    ii.前記データを分析することと
    を含む、請求項1に記載のIRCSシステム。
  8. 前記データについての学習は、概念辞書を前記データに適用し、前記概念辞書に基づいて、パターンをマッピングすることを含む、請求項7に記載のIRCSシステム。
  9. 前記個人のパーソナル選好を前記パターンマップに適用することをさらに含む、請求項8に記載のIRCSシステム。
  10. 前記概念辞書およびパターンマッピングに基づいて、パーソナル辞書を構築することをさらに含む、請求項8に記載のIRCSシステム。
  11. 前記データについての学習は、前記データをトークン化することを含む、請求項7に記載のIRCSシステム。
  12. 前記データの分析は、前記データの関連性を判定することを含む、請求項7に記載のIRCSシステム。
  13. 前記データの関連性の判定は、前記データからの用語をともにグループ化し、前記用語をランク付けすることを含む、請求項7に記載のIRCSシステム。
  14. 前記用語のランク付けは、前記用語に関する値を作成することを含む、請求項13に記載のIRCSシステム。
  15. 前記値の作成はさらに、前記用語の頻度および密度を測定することを含む、請求項14に記載のIRCSシステム。
  16. 前記データの分析はさらに、前記データの意味論を判定することを含む、請求項7に記載のIRCSシステム。
  17. 前記意味論の判定はさらに、前記ユーザに前記システムを訓練するように求めることを含む、請求項16に記載のIRCSシステム。
  18. 前記データの分析はさらに、前記データのセンチメントを判定することを含む、請求項7に記載のIRCSシステム。
  19. 前記データの分析はさらに、前記データから前記ユーザの意図を判定することを含む、請求項7に記載のIRCSシステム。
  20. 前記データの分析はさらに、前記データの関連性、意味論、およびセンチメント、ならびに前記データからの前記ユーザの意図を判定することを含む、請求項7に記載のIRCSシステム。
JP2018552031A 2016-04-08 2017-04-10 個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法 Pending JP2019514117A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662319905P 2016-04-08 2016-04-08
US62/319,905 2016-04-08
PCT/US2017/026789 WO2017177222A1 (en) 2016-04-08 2017-04-10 A system and method for searching and matching content over social networks relevant to an individual

Publications (1)

Publication Number Publication Date
JP2019514117A true JP2019514117A (ja) 2019-05-30

Family

ID=59998206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018552031A Pending JP2019514117A (ja) 2016-04-08 2017-04-10 個人に関連するソーシャルネットワークにわたってコンテンツを検索し、マッチングさせるためのシステムおよび方法

Country Status (7)

Country Link
US (2) US20170293864A1 (ja)
EP (1) EP3440621A4 (ja)
JP (1) JP2019514117A (ja)
KR (1) KR20190017739A (ja)
CN (1) CN109416826A (ja)
IL (1) IL262157A (ja)
WO (1) WO2017177222A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11475076B2 (en) 2014-10-22 2022-10-18 Narrative Science Inc. Interactive and conversational data exploration
US11238090B1 (en) 2015-11-02 2022-02-01 Narrative Science Inc. Applied artificial intelligence technology for using narrative analytics to automatically generate narratives from visualization data
US11222184B1 (en) 2015-11-02 2022-01-11 Narrative Science Inc. Applied artificial intelligence technology for using narrative analytics to automatically generate narratives from bar charts
US11232268B1 (en) 2015-11-02 2022-01-25 Narrative Science Inc. Applied artificial intelligence technology for using narrative analytics to automatically generate narratives from line charts
US11188588B1 (en) 2015-11-02 2021-11-30 Narrative Science Inc. Applied artificial intelligence technology for using narrative analytics to interactively generate narratives from visualization data
US10853583B1 (en) 2016-08-31 2020-12-01 Narrative Science Inc. Applied artificial intelligence technology for selective control over narrative generation from visualizations of data
US10585983B1 (en) 2017-02-17 2020-03-10 Narrative Science Inc. Applied artificial intelligence technology for determining and mapping data requirements for narrative stories to support natural language generation (NLG) using composable communication goals
US11954445B2 (en) 2017-02-17 2024-04-09 Narrative Science Llc Applied artificial intelligence technology for narrative generation based on explanation communication goals
US11068661B1 (en) 2017-02-17 2021-07-20 Narrative Science Inc. Applied artificial intelligence technology for narrative generation based on smart attributes
US11568148B1 (en) 2017-02-17 2023-01-31 Narrative Science Inc. Applied artificial intelligence technology for narrative generation based on explanation communication goals
US10943069B1 (en) 2017-02-17 2021-03-09 Narrative Science Inc. Applied artificial intelligence technology for narrative generation based on a conditional outcome framework
US20180253762A1 (en) * 2017-03-03 2018-09-06 International Business Machines Corporation Cognitive method to select a service
US11599521B2 (en) 2017-05-25 2023-03-07 Zeta Global Corp. Systems and methods for providing real-time discrepancies between disparate execution platforms
US11042708B1 (en) 2018-01-02 2021-06-22 Narrative Science Inc. Context saliency-based deictic parser for natural language generation
US11023689B1 (en) 2018-01-17 2021-06-01 Narrative Science Inc. Applied artificial intelligence technology for narrative generation using an invocable analysis service with analysis libraries
US11062239B2 (en) * 2018-02-17 2021-07-13 Bank Of America Corporation Structuring computer-mediated communication and determining relevant case type
US10755046B1 (en) 2018-02-19 2020-08-25 Narrative Science Inc. Applied artificial intelligence technology for conversational inferencing
WO2019227099A1 (en) * 2018-05-25 2019-11-28 Bpu Holdings Corp. Method and system for building artificial and emotional intelligence systems
US10614406B2 (en) 2018-06-18 2020-04-07 Bank Of America Corporation Core process framework for integrating disparate applications
US11232270B1 (en) 2018-06-28 2022-01-25 Narrative Science Inc. Applied artificial intelligence technology for using natural language processing to train a natural language generation system with respect to numeric style features
US11341330B1 (en) 2019-01-28 2022-05-24 Narrative Science Inc. Applied artificial intelligence technology for adaptive natural language understanding with term discovery
US11321360B2 (en) 2020-01-17 2022-05-03 Microsoft Technology Licensing, Llc Intelligently identifying a user's relationship with a document
US11392594B2 (en) 2020-03-18 2022-07-19 Microsoft Technology Licensing, Llc Intelligent ranking of search results
US11886443B2 (en) 2020-05-22 2024-01-30 Microsoft Technology Licensing, Llc Intelligently identifying and grouping relevant files and providing an event representation for files
US11328116B2 (en) * 2020-06-30 2022-05-10 Microsoft Technology Licensing, Llc Intelligently identifying collaborators for a document
US11914630B2 (en) * 2021-09-30 2024-02-27 Paypal, Inc. Classifier determination through label function creation and unsupervised learning

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8341223B1 (en) * 2011-06-07 2012-12-25 Banjo, Inc. Method for relevant content discovery
US9547832B2 (en) * 2012-01-10 2017-01-17 Oracle International Corporation Identifying individual intentions and determining responses to individual intentions
US8832092B2 (en) * 2012-02-17 2014-09-09 Bottlenose, Inc. Natural language processing optimized for micro content
US11093984B1 (en) * 2012-06-29 2021-08-17 Reputation.Com, Inc. Determining themes
US9229977B2 (en) * 2012-08-02 2016-01-05 Rule 14 Real-time and adaptive data mining
US9367607B2 (en) * 2012-12-31 2016-06-14 Facebook, Inc. Natural-language rendering of structured search queries
CN104537113B (zh) * 2015-01-21 2018-05-04 成都佑丰科技有限公司 社交网络系统搜索方法

Also Published As

Publication number Publication date
WO2017177222A8 (en) 2017-11-16
CN109416826A (zh) 2019-03-01
WO2017177222A1 (en) 2017-10-12
IL262157A (en) 2018-11-29
EP3440621A4 (en) 2019-10-30
US20170293864A1 (en) 2017-10-12
EP3440621A1 (en) 2019-02-13
US20200410401A1 (en) 2020-12-31
KR20190017739A (ko) 2019-02-20

Similar Documents

Publication Publication Date Title
US20200410401A1 (en) System and Method for Searching and Matching Content Over Social Networks to an Individual
CN111931062B (zh) 一种信息推荐模型的训练方法和相关装置
US10832008B2 (en) Computerized system and method for automatically transforming and providing domain specific chatbot responses
US11782985B2 (en) Constructing imaginary discourse trees to improve answering convergent questions
CN112313644B (zh) 基于会话数据构建定制的用户简档
US20240112008A1 (en) Active Federated Learning for Assistant Systems
CN110209897B (zh) 智能对话方法、装置、存储介质及设备
CN110612525A (zh) 通过使用交流话语树启用修辞分析
US11861319B2 (en) Chatbot conducting a virtual social dialogue
US20160203221A1 (en) System and apparatus for an application agnostic user search engine
US20200304433A1 (en) Interactive virtual conversation interface systems and methods
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
EP3676728B1 (en) Consolidation of responses from queries to disparate data sources
US11269665B1 (en) Method and system for user experience personalization in data management systems using machine learning
Ali et al. Automatic text‐to‐gesture rule generation for embodied conversational agents
US20200184965A1 (en) Cognitive triggering of human interaction strategies to facilitate collaboration, productivity, and learning
Bhardwaj et al. Conversational AI—a State‐of‐the‐Art review
US20200356605A1 (en) Converting a document into a chatbot-accessible form via the use of communicative discourse trees
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
KR20190109361A (ko) 사업 보조 서비스를 제공하기 위한 소셜 마케팅 방법
Khandelwal et al. Surfacing privacy settings using semantic matching
JP7003481B2 (ja) ソーシャル・メディア・アカウントおよびコンテンツの相互に補強するランキング
Al-Abri et al. Aggregation and mapping of social media attribute names extracted from chat conversation for personalized e-learning
US20240330796A1 (en) Question generation for groups
Skënderi Text Representation Methods for Big Social Data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190920

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190920

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200417