JP2022517521A - データサーチ及び検索を強化するデータ処理システム及び強化されたデータストレージ - Google Patents
データサーチ及び検索を強化するデータ処理システム及び強化されたデータストレージ Download PDFInfo
- Publication number
- JP2022517521A JP2022517521A JP2021535158A JP2021535158A JP2022517521A JP 2022517521 A JP2022517521 A JP 2022517521A JP 2021535158 A JP2021535158 A JP 2021535158A JP 2021535158 A JP2021535158 A JP 2021535158A JP 2022517521 A JP2022517521 A JP 2022517521A
- Authority
- JP
- Japan
- Prior art keywords
- data
- processing system
- user
- data processing
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 242
- 238000013500 data storage Methods 0.000 title description 26
- 230000004044 response Effects 0.000 claims abstract description 66
- 230000003993 interaction Effects 0.000 claims abstract description 17
- 238000003860 storage Methods 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 claims description 23
- 238000013475 authorization Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000013480 data collection Methods 0.000 description 79
- 238000011160 research Methods 0.000 description 49
- 230000015654 memory Effects 0.000 description 38
- 238000004891 communication Methods 0.000 description 20
- 238000000034 method Methods 0.000 description 20
- 230000003190 augmentative effect Effects 0.000 description 18
- 230000008520 organization Effects 0.000 description 15
- 238000004590 computer program Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 5
- 238000013145 classification model Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/547—Remote procedure calls [RPC]; Web services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本願は、米国特許法第119条(e)の下、2019年1月23日付けで出願された米国仮特許出願第62/795,674号に対する優先権を主張するものであり、この内容全体は、参照により本明細書に援用される。
本開示は、データ処理に関し、より詳細には記憶及び検索のためのデータの強化に関する。
サーチエンジンは、ユーザが、ネットワーク接続された計算システム中のデータにアクセスすることを可能にする。ユーザは、クライアント計算デバイスを通して、データ要求(例えば、サーチクエリ)を別の計算システムに提出し得る。サーチ要求を受信する計算システムは、通常、サーバシステム又は他のリモート計算システムを含むが、場合により、ユーザは、ローカルシステムからのデータを要求していることがある。他の計算システムは、要求を受信し、サーチ結果を識別し、クライアントデバイスを通してサーチ結果をユーザに提供する。
本明細書は、データサーチ及びデータ検索を強化し、データアクセスを促進するように強化されたデータ記憶を提供するデータ処理システムを記載する。多くの場合、従来のサーチシステムのユーザがコンテンツを見つけようとする(例えば、リサーチプロジェクトのために)場合、サーチは、使用中の特定のサーチシステムが利用可能な特定のリソースに制限される。リソースの完全サーチが行われたことを保証するために、ユーザは、一連のサーチシステム(例えば、プロプライエタリデータベース、サーチエンジン等)に順次アクセスする必要があり得る。ユーザが第1のリソースを使用してサーチを完了し、第2のリソースに進む場合、ユーザは、プロセスを繰り返し、多くの場合、冗長サーチを各システムで実行して、全てのリソースが見つけられたことを保証する。更に、ユーザは、サーチが関連する結果を返すことを保証するために、異なる各リソースに特定のシンタックスでサーチクエリを入力する必要があり得、これは、時間が掛かる恐れがある。
データ処理システムは、データサーチ及びデータ検索を強化し、データアクセスを促進する強化されたデータストレージを提供する。データ処理システムは、ユーザが複数の異なるデータソースを同時にサーチし、ユーザに返され提示されるデータの関連度を上げられるようにするように、ユーザにより提供されたデータ要求を予め処理し、増補するように構成される。データ処理システムは、データ要求に応答して受信したデータをキュレートするに当たりユーザを支援し、キュレートされた結果を記憶する強化されたストレージをユーザに提供するように構成される。データ処理システムは、ユーザをプロファイリングして同様のユーザを識別し、ユーザが受信する結果データの関連度を上げ、応答データがどのようにキュレートされ記憶されるかを構成する。
図1は、データ処理システム200の一例のネットワーク化された計算環境100を示す。データ処理システム200は、データソース104とインターフェースするように構成されたデータ処理エンジン202(図2に示される)を含む。データ処理システム200は、ユーザデバイス等のクライアントデバイス102で実行することができる。この例では、クライアントデバイス102は、データ処理システム200の論理を実行する。本明細書では、データがデータ処理システム200のユーザに送信される場合、データがユーザのクライアントデバイス102に送信されることを意味することが意図される。同様に、ユーザがデータ(例えば、データ要求)を別のデバイスに送信する場合、データ要求がユーザのクライアントデバイス102により別のデバイスに送信されていることを意味することが意図される。幾つかの実装形態では、データ処理システム200は、サーバシステム等、クライアントデバイス102からリモートのデバイスで実施される(例えば、図1に示されるように)。ユーザは、ウェブポータル又はクライアントデバイス102上の他の手段を通してデータ処理システム200にアクセスする一方、サーバシステムは、実際には、データ処理システム200の論理を実行する。幾つかの実装形態では、データ処理システム200の論理の部分は、クライアントデバイス102により実行され、データ処理システム200の論理の別の部分は、サーバシステムにより実行される。
データ処理システム200のネットワーク化された計算環境100は、1つ又は複数のデータソース104を含む。データソース104は、ユーザにとって(例えば、ユーザのクライアントデバイス102にとって)ローカル及び/又はプライベートであるか、又はユーザにとってリモート及び/又はパブリックであるネットワーク化された計算環境における任意のデータソースを含むことができる。例えば、データソース104は、パブリック(例えば、ウェストロー、JSTOR、フォレスター等)又はプライベート(例えば、企業バージョン制御リポジトリ、シェアポイント、企業電子メールサーバ、企業クラウドストレージ等)のデータリポジトリの1つ又は複数を含むことができる。データソースは、ウェブクローラ、サーチエンジン、コンテンツパブリッシャ(例えば、ウェブサイト)、パブリック又はプライベートデータベース等を含むこともできる。
ユーザがデータ要求(例えば、サーチクエリ)を1つ又は複数のデータソース104に送信すると、データ処理システム200は、更に詳細に後述するように、要求を分析し、コンテキストデータで要求を増補する。関連するデータ要求のグループは、本明細書ではリサーチセッション、サーチセッション、リサーチタスク等と呼ばれることもある。リサーチセッションのデータ要求は、明示的に関連する(例えば、「別段の指定がない限り、全てのサーチは、特定のデータコレクションに関連する」ことをユーザが示すことにより)か、又は黙示的に関連することができる(例えば、時間、トピック等に関連する)。例えば、閲覧セッションにおけるユーザのサーチの全て(例えば、ブラウザが開かれたときから閉じられるときまでの)は、関連するものとして識別することができる。別の例では、ユーザは、コレクションに関連するものとしてサーチを指定し得るか、又は特定のコレクションについてリサーチしている時間期間を示し得る(したがって、例えば、その時間期間中に行われたサーチは、関連するものとして識別され得る)。
幾つかの実装形態では、データ処理システム200は、必要に応じて、異なるデータソース104に向けてデータ要求をフォーマットすることによりユーザを支援する。例えば、異なるリポジトリは、それらのリポジトリでサーチを行うために異なるサーチシンタックス又は異なるアプリケーションプログラミングインターフェース(API)を有し得る。データ処理システム200は、ユーザが利用可能なデータソース104のそれぞれの要件に準拠するようにデータ要求をフォーマットし、それにより、ユーザは、1つのロケーションから包括的なリサーチを行い得る(例えば、特定のサーチエンジン、ウェブポータル等を使用して)。したがって、データ処理システム200は、リサーチタスクのコンテキストデータがデータ処理システム200に提供されることを所与として、データが利用可能な全てのデータソース104から検索され、検索されたデータが、現在のリサーチタスクに高度に関連することを保証することにより、ユーザによるデータ要求(例えば、サーチ)の範囲を改善する。
更に、ネットワーク化された計算環境100は、ユーザによるデータ要求に応答して受信されるデータ(例えば、サーチ結果又は要求に応答して受信される任意の他のコンテンツ)を記憶するように構成されたデータストレージ106を含む。応答データの全てがデータストレージ106に記憶されるわけではなく、むしろ、データストレージ106は、データコレクション206にキュレートされたデータを記憶する。幾つかの実装形態では、データコレクション206を含むデータストレージは、データ処理システム200をホストするサーバシステム及び/又はクライアントデバイス102とは別個の計算システムである。幾つかの実装形態では、データストレージは、サーバシステム及び/又はクライアントデバイス102の一部である。幾つかの実装形態では、データストレージ106は、幾つかのネットワーク化された計算システムに分散する。幾つかの実装形態では、データストレージ106は、データ処理システム200を通してユーザがアクセス可能な1つの計算システムである。
データ処理システム200は、データソース104から受信した応答データをキュレートし、キュレートされたデータをデータストレージ106のデータコレクション206に記憶するように構成される。データキュレーションは、ユーザがデータ要求を送信する際に自動的に、ユーザが応答データと対話する際に手動で又は両方の組合せで行うことができる。キュレートされた応答データは、1つ又は複数のデータコレクション206として記憶される。データコレクション206は、リサーチの1つ若しくは複数のトピック等のユーザにより実行中の特定のリサーチ又はサーチセッションにユーザが指定したように関連付けられる。例えば、データコレクション206の1つ又は複数は、ユーザにより定義されたプロジェクトに関連付けることができ、データコレクション206の1つ又は複数は、所与の時間枠中の、特定のデータソース104からの、特定のクライアントデバイス102等からのユーザの全てのデータ対話を含む。このようにして、リサーチプロジェクトを構成するものの制限は、ユーザにより定義することができる。ユーザにより提供される(又はユーザ、企業等に向けてデータ処理システム200のデフォルト設定により指定される)定義内のユーザによるあらゆる活動は、分析され、データコレクション206のデータがどのようにキュレートされるかを決めるために使用される。例えば、特定のリサーチセッションでユーザが特定のデータソースからのデータを繰り返し選択する場合、そのデータソースからのデータは、その特定のリサーチセッションに関して強調することができる。この例では、ユーザは、そのデータソースからの応答データをより多く見ることができ、データ処理システム200は、他のデータソースからの応答データと比較して、データコレクション206への記録にそのデータソースからの応答データを重く重み付けされ得る。
特定のデータソースの重み付けは、データ処理システム200及び/又はユーザによる定義されるように特定のリサーチセッションに個人化される。幾つかの実装形態では、特定のデータソースの重み付けは、複数のリサーチセッションにわたり1人のユーザに又はユーザの組(例えば、特定のデータソースを好む企業における)に向けて個人化することができる。例えば、関連するユーザ(例えば、特定の組織からの)が、通常、第2のデータソースよりも高頻度で第1のデータソースからの応答データを保存する場合、データ処理システム200は、その企業のユーザに対して、第2のデータソースからのデータよりも第1のデータソースからの応答データを重く重み付けすることができる。幾つかの実装形態では、制限されたデータソース104からのデータが応答データにおいてユーザに提供されないように、信頼できない、コストが掛かりすぎると思われるデータソース104等の特定のデータソースに対して制限を実施することができる。
データコレクション206にキュレートされたデータは、データ処理システム200の他の認可ユーザに提供することができる。他のユーザは、データコレクションが複数の認可ユーザの挙動に基づいてキュレートされるように、データコレクション206を見る/データコレクション206に追加する明示的な許可を有し得る。
データ処理システム200の各ユーザは、ユーザに関連付けられたユーザプロファイルを作成することができる。ユーザプロファイルは、ユーザについてのデータを含む。ユーザプロファイルは、ユーザにより明示的に提供される両方のデータ(例えば、明示的なフィードバック、フォームへの答え等)を含む。ユーザプロファイルは、ユーザ活動のモニタリングに応答して、時間の経過に伴って黙示的に特定されるユーザの好み等のユーザについて学習されたデータを含む。ユーザプロファイルは、何れのデータコレクション206がユーザからアクセス可能であり、各データコレクションに関するそのユーザの特定の好みを示すメタデータを記憶することを指定する。幾つかの実装形態では、ユーザプロファイルは、ユーザプロファイルに関連付けられた各データコレクションへの異なる好みを示すことができる(例えば、ローカル嗜好)。幾つかの実装形態では、ユーザプロファイルは、ユーザにより完了された全てのリサーチタスクにとってグローバルな好みを示すことができる。ユーザがより多くのデータ要求を実行するにつれて、プロファイルは、そのリサーチタスクに関して(且つ該当する場合にはグローバルに)更に発達する。ユーザの好みが浮上すると(例えば、ユーザは、特定のリポジトリからの応答データを好み得る)、データ処理システム200は、何れの応答データがユーザに提示されるか及び/又は応答データがユーザにどのように提示されるかを調整する。例えば、データ処理システム200は、ある応答データを他の応答データよりも重く重み付けし、サーチ結果ページでその応答データをより高くより大きいフォントで示し、その応答データのより大きい部分を示し(例えば、ウェブページ又は記事のより大きい部分を提示し)、その応答データの特定の部分を提示する(例えば、テキストではなく画像を示す)ことができる等である。データ処理システム200は、発展しつつあるユーザプロファイルに従って応答データを自動的にキュレートすることができる。
ユーザプロファイルは、データソースにアクセスするのに使用することができる任意のデータを更に含むことができる。例えば、ユーザプロファイルは、ユーザが結果データを閲覧している間、受動的に又はデータ要求の受信に応答してアクセスされるデータソースのレジストリを含むことができる。データ処理エンジン202は、追加のプロンプトがユーザに提示されることなくデータソースにアクセスすることができるように、登録されたデータソースのそれぞれに関連付けられた証明書データを記憶することができる。レジストリは、該当する場合、各データソースのAPIを記述するデータを含むこともできる。データ処理エンジン202は、記憶されたデータを使用して、各データソースのAPIに適切なシンタックスにデータ要求を翻訳することができる。
データ処理システム200は、同様のリサーチセッションを実行している同様のユーザを識別し得る。幾つかの実装形態では、データ処理システム200は、複数のユーザが各ユーザのデータコレクション206を1つのコレクションに結合し、データコレクション206のキュレートで一緒に作業することを示唆し得る。この場合、ユーザは、同様のリサーチタスクで作業している異なる複数のユーザであり得、データコレクション206の結合は、冗長リサーチ労力を低減することができる。幾つかの実装形態では、ユーザは、両方とも共通の組織(例えば、プライベート組織)からのものであり得、1つのコレクションは、機密情報を含むことができる。
データ処理システム200の実際例について説明する。この例は、例示を目的とした特定の1つの実施形態であり、態様について以下に詳細に更に説明する。この実施形態例は、部分的に又は全体的に、本開示全体を通して説明される他の特徴と任意の組合せで組み合わせることができる。実施形態では、組織(例えば、企業)は、トピックの組からなる分類基準をデータ処理システム200に提供する。各トピックは、分類基準にシードするために使用される1つ又は複数の関連付けられた例を有する。データ処理システム200を種々のアプリケーション(例えば、クエリ及び応答)について個々のユーザ(例えば従業員)に提供する前に、データ処理システムは、各トピックの例を処理するように構成される。データ処理システム200は、各トピックの例を使用して、各トピックの各分類モデルを作成する。一例では、分類モデルは、DL4J又は他のディープニューラルネットワーク(DNN)等のそのようなDNNを使用して構築することができる。一例では、分類モデルは、各トピックについての優先語(PT)及び非優先語(NPT)の組を含む。一例では、優先語は、「ブロックチェーン」であり得る一方、非優先語は、「分散台帳」であり得る。
データ処理システム200は、続けて更に詳細に説明するように、データストレージ106に含まれる所与のデータリソースについてトピックを推奨するように構成される。この例を続けると、従業員(又は他のユーザ)は、リソース(例えば、文書)を収集し、文書についてのトピックを即座に選択しない。データ処理システム200は、全てのトピックについて生成されたマップ(例えば、モデル)と突き合わせてリソースを分類する。データ処理システム200は、各トピックについての類似度スコアのリストを生成する。この例では、任意のスコアが最小分類信頼閾値を超える場合、データ処理システム200は、それらのトピックの1つにそのリソースを配置することを推奨する。一例では、文書は、信頼スコア(0.91)を有するトピック番号3を推奨し得る。
この実施形態を続けると、各推奨について、データ処理システム200は、従業員#1及び#2等のユーザがフィードバックを提供できるようにするメカニズムを提供する。フィードバックは、二進数0/1又は1~5等の範囲であり得る。データ処理システム200は、機械学習を使用して、以下のようにこれらのフィードバックを使用して推奨を定期的に改善することができる:肯定的な各評価について、肯定ベースライントピックモデル(BT+N)と呼ばれるそのトピックのモデルに例が追加される。否定的な各評価について、データ処理システム200は、あらゆる否定的な例を追加する前に例をベースライントピックモデル(BT)と比較する。ベースライントピックモデルにおいて優先語ではない又は非優先語ではない例に固有の用語は、否定的特徴として新しく提案されるモデルである否定的ベースライントピックモデル(BT-N)に追加される。この例では、BT-N及びBT+Nは、データ処理システム200によりテストされて、新しい例を所与として両方ともBTよりも良好であることを保証する。両方ともBTよりも良好である場合、BT-N及びBT+Nは、BTNに統合され、BTNがBTよりも優れる場合、BTNに取って代わる。BTNがBTよりも優れない場合、人間エディタが派遣されて問題を分析し、データ処理システムに変更は、供給されない。これらの改善は、増補サーチ機能(後述)並びに生の精度及びリコールに関してデータ処理システム200の最良ソースアプリケーションの選択の両方に流れる。
幾つかの実装形態では、新しいトピック及びユーザによりそのトピックに収集された3つの新しい文書例を所与として、データ処理システム200は、サーチ増補機能を提供するように構成することができる。例えば、データ処理システム200は、3つの文書から分類モデルを作成するように構成される。このモデルがあるトピックの既存のモデルと少なくとも同様である(例えば、有価値ソース閾値により判断される)場合、システムは、代わりにそのモデルを使用するように構成される。このモデルがあるトピックの既存のモデルと少なくとも同様ではない(例えば、有価値ソース閾値により判断される)場合、データ処理システム200は、上述した技法を使用して、トピックモデルのトップソースを識別する(VSTを介して)。この例では、データ処理システム200は、モデルに優先語を使用して各トップソースに問い合わせるように構成される(VSTを介して)。データ処理システム200は、上位N個の「最も関連する」用語及び上位N個の「最新情報」リソースを収集するように構成される。データ処理システム200は、結果を重複排除し、モデルと突き合わせて各文書の第1のセクションを分類し、少なくとも最小ソース閾値を有すると分類されないものを除去し、以下:リソース又は文書のタイトルにおける優先語、リソース又は文書のタイトルにおける非優先語、他の全てのリソース等に基づいて文書をランク付けしコレクションに追加するように構成される。
図2を参照すると、データ処理システム200の一例が示されている。示されるデータ処理システム200は、データ処理システム200の論理を実行するように構成されたデータ処理エンジン202を含む。データ処理エンジン202は、データストレージ106、クライアントデバイス102及び第三者サービス218と通信するように構成される。図2はスタンドアロンエンジンとしてデータ処理エンジン202を示すが、データ処理エンジンは、クライアントデバイス102の別のアプリケーションの一部であり得るか、又はクライアントデバイス102のスタンドアロンアプリケーションであり得る。幾つかの実装形態では、データ処理システム200の各部分は、サーバシステム等の1つの計算システムでホストされるように構成される。幾つかの実装形態では、データ処理システム200は、分散計算システムのネットワークによりホストされるように構成される。例えば、データ処理エンジン202は、クライアントデバイス102でホストすることができる一方、データストレージ106は、サーバシステム(図示せず)でホストすることができる。幾つかの実装形態では、データ処理エンジン202は、例えば、ウェブポータル、ローカルにホストされるアプリケーション等を通してクライアントデバイス102から受信されるコマンドに応答して、サーバシステムにより実行される。
データ処理エンジン202は、リサーチセッション中、ユーザ活動をモニタするように構成される。例えば、データ処理エンジン202は、サーチで使用されるキーワード(例えば、単語、用語、句等)をモニタするように構成される。データ処理エンジン202は、クライアントデバイス102のユーザにより入力されたキーワードの用語集を構築し、それらのキーワードを関連する用語で増補することができる。関連する用語は、同義語であり得るが、キーワードの1つ又は複数と同様の対象分野にある用語であり得る。例えば、ユーザが、車に関連する1つのブランド名(又は幾つかのブランド名)を入力する場合、データ処理エンジン202は、車の部品、車の企業、車の製造及びモデル等に関連する追加のキーワードでサーチを増補し得る。ユーザがリサーチセッションを続けるにつれて、増補は、定期的に(例えば、連続して、指定された時間間隔で、ユーザ行動に応答して等)、そのリサーチセッション(したがって関連するデータコレクション206)の用語集を更新する。サーチ増補の一部分は、後述するように、テキスト分析エンジン210により実行することができる。
データ処理エンジン202により受信された対話データ250は、1つ又は複数のデータソース104(例えば、第三者サービス218からの)から追加データ要求を生成するために、少なくとも推奨エンジン204に送信される。追加のデータは、データソース104及びデータストレージ106から利用可能な任意のリソースを含むことができる。追加のデータは、対話データ250の複数のメトリックに基づいて対話データ250を追加のデータに関連付ける重み付けシステムに基づいて選択することができる。複数のメトリックは、対話データ250において識別された1つ又は複数のリソースの1つ又は部分(例えば、上述したようにユーザが対話した結果データの)を抽出することにより、データ処理エンジン202により識別される。対話データ250において識別されたリソースの1つ又は複数の部分は、結果データのリソースからのコンテンツの部分及び/又はリソースに関連付けられたメタデータを含むことができる。
応答データのリソース/結果に関してユーザによりとられた各行動又は行動の組合せについて、データ処理エンジン202はそのリソースに関連付けられた重み付けを調整することができる。幾つかの実装形態では、重みは、結果が、ユーザのリサーチセッションに対応するデータコレクション206に自動的に追加されるか否かの判断に使用することができる。例えば、重みは、ユーザがリソースと対話するにつれて徐々に増大することができ、重み値が閾値を超えるとき、リソースは、データコレクション206に追加することができる。そのような重み方式では、閾値は、プロファイルが発展するにつれて、結果が時間の経過に伴って追加及びコレクションから削除され、データコレクション206に最も関連する結果のみを保持するように動的であり得る。
推奨エンジン204は、クライアントデバイス102のユーザと同様のリサーチを行っている可能性がある他のユーザを推奨することもできる。推奨エンジン204は、同様のユーザ(例えば、組織内)のリストを含む関連ユーザデータ258を生成することができ、それにより、クライアントデバイス102のユーザは、コラボレーション又は何らかの他の目的で他のユーザに働きかけることができる。
要約エンジン208は、テキスト分析エンジン210から受信したデータを要約するように構成される。
言語検出器220は、ユーザが何れの言語を好むかを突き止めるように構成され、クライアントデバイス102のユーザにより使用されている1次言語以外の言語である、結果への増補されたサーチを開始し得る。
言語モデル224は、結果データのサーチ及び検索に使用されている言語の1つ又は複数のモデルを含む。言語モデル224は、ある言語での単語の互いとの関連付けを含むことができる。言語モデル224は、それぞれの言語のシンタックスルールを含むことができる。言語モデル224は、データ処理エンジン202がデータ要求をパースして、要求において指定された単語を単に含む結果ではなく、要求の意味を反映した結果データを返せるようにすることができる。
結果コンパイラ212は、クライアントデバイス102がアクセス可能なフォーマットに結果データをパッケージするように構成される。例えば、結果データは、クライアントデバイス102のハードウェア要件、クライアントデバイス102のソフトウェア要件(例えば、クライアントデバイス102がデータの送受信に何れの種類のブラウザ又はアプリケーションを使用しているか)、ネットワーク要件等に基づいてフォーマットすることができる。例えば、結果コンパイラ212は、クライアントデバイス102により受信され開かれるダウンロード可能なパッケージに結果データを編纂することができる。
データストレージ106は、組織言語モデル232、一般言語モデル234、ドメイン言語モデル236、言語モデルデータ244、項目プロファイルデータ238、ユーザプロファイルデータ240、キャッシュ242、プロファイルデータ246及び推奨エンジンキャッシュ248を含む。データストレージ106は、各ユーザプロファイルのデータコレクション206を記憶する。
トレンド分析エンジン214は、ユーザ又は同様のユーザによる活動のトレンドを識別するか、結果データを重み付けするか、又は追加の結果データを示唆するように構成される。トレンド分析エンジン214は、多くのデータコレクション206にわたる多くのユーザによるリサーチでのギャップを識別し、そのギャップを埋める結果データを示唆することができる。ギャップは、先のデータ要求(例えば、先のサーチクエリ)、言語モデル及び他のデータを分析して、高度に関連するサーチ用語が省かれていたか否か、又は関連する可能性があるデータの部分がユーザにより無視又は見過ごされたか否かを判断することにより識別することができる。
Claims (25)
- データ要求を増補するように構成されたデータ処理システムであって、
推奨エンジンであって、
クライアントデバイスからネットワークを介して、1つ又は複数のデータソースとのユーザ対話に関連する対話データを受信することと、
前記1つ又は複数のデータソースの少なくとも1つのリソースの1つ又は複数の部分を含む抽出データを生成することであって、前記抽出データは、前記対話データに基づいて生成される、生成することと、
前記抽出データをパースして、前記抽出データの1つ又は複数のメトリックを識別することであって、前記1つ又は複数のメトリックは、前記抽出データに関連する追加のデータを示す、識別することと、
前記1つ又は複数のデータソースから、前記メトリックに基づいて前記追加のデータを検索することと
を行うように構成された推奨エンジンと、
結果コンパイラであって、
前記クライアントデバイスからデータ要求を受信することと、
前記要求に応答して、前記クライアントデバイスによって提示するために前記追加のデータを前記クライアントデバイスに送信することと
を行うように構成された結果コンパイラと
を含むデータ処理システム。 - 結果コンパイラは、
第三者サーチエンジンからサーチ結果を検索することであって、前記サーチ結果は、前記クライアントデバイスからの前記データ要求の1つ又は複数のキーワードに応答する、検索することと、
前記サーチ結果と共に提示するための、前記データ要求の前記1つ又は複数のキーワードに応答する前記追加のデータの部分を選択することと、
前記クライアントデバイスのユーザインターフェースの別個の領域に提示するために、前記クライアントデバイスに前記追加のデータの前記部分及び前記サーチ結果を送信することと
を行うように更に構成される、請求項1に記載のデータ処理システム。 - 前記1つ又は複数のメトリックは、前記抽出データのデータタイプ、前記抽出データのデータソース、前記抽出データで表される1つ又は複数のトピック、前記抽出データで表される言語タイプ及び前記抽出データにおける追加のリソースへの1つ又は複数のリンクを含む、請求項1に記載のデータ処理システム。
- 前記抽出データの前記データタイプは、画像を含み、前記抽出データをパースすることは、画像処理を前記画像に対して実行して、前記画像の特徴を抽出することを含み、前記特徴は、前記抽出データに関連する前記追加のデータを示す、請求項3に記載のデータ処理システム。
- 前記対話データは、前記クライアントデバイスによって提示されるリソースの識別子、前記リソースが前記クライアントデバイスによって提示される時間の長さ、前記リソースの部分の選択、前記リソースにおける実行可能コードの実行、前記リソースにおけるメディアの再生、前記リソースのブックマーク及び前記リソースの前記部分のダウンロードの1つ又は複数を含む、請求項1に記載のデータ処理システム。
- プロファイルエンジンを更に含み、前記プロファイルエンジンは、
ユーザに関連する前記対話データ及び実行データをユーザプロファイルに記憶することと、
前記記憶された対話及び実行データの特徴セットを特定することであって、前記特徴セットは、他のトピックと比較して関連度が高い1つ又は複数のトピック、前記ユーザによって好まれる1つ又は複数のデータソース及び前記ユーザによって好まれる1つ又は複数のコンテンツタイプの少なくとも1つを示す、特定することと、
前記ユーザプロファイルの前記特徴セットへの閾値類似度内にある別の特徴セットを有する別のユーザプロファイルを特定することと、
前記クライアントデバイスに対して前記他のユーザプロファイルを識別することと
を行うように構成される、請求項1に記載のデータ処理システム。 - 前記プロファイルエンジンは、
前記他のユーザプロファイルに記憶された1つ又は複数のリソースを識別することと、
前記1つ又は複数のリソースを前記クライアントデバイスに送信することと
を行うように更に構成される、請求項6に記載のデータ処理システム。 - テキスト分析エンジンを更に含み、前記テキスト分析エンジンは、
前記データ要求を前記クライアントデバイスから受信することと、
言語モデルを前記データ要求に適用して、1つ又は複数の追加のトピックを識別することと、
前記1つ又は複数の追加のトピックを前記推奨エンジンに送信することと
を行うように構成される、請求項1に記載のデータ処理システム。 - 前記テキスト分析エンジンは、
前記要求を別の言語に翻訳することと、
前記翻訳された要求を使用して、前記1つ又は複数のデータソースからデータを要求することと
を行うように更に構成される、請求項8に記載のデータ処理システム。 - トレンド分析エンジンを更に含み、前記トレンド分析エンジンは、
前記推奨エンジンによって受信された複数のデータ要求を分析することと、
前記複数の要求から、前記クライアントデバイスによる将来のデータ要求を推測することと、
前記将来のデータ要求に応答して結果データを検索することと
を行うように構成される、請求項1に記載のデータ処理システム。 - 前記1つ又は複数のデータソースのそれぞれについて、前記推奨エンジンは、
前記それぞれのデータソースのシンタックスに準拠するように前記データ要求を翻訳することと、
前記翻訳されたデータ要求を用いて前記1つ又は複数のデータソースから追加の応答データを要求することと、
前記追加のデータと、前記追加の応答データの前記要求に応答して前記1つ又は複数のデータソースから受信される前記追加の応答データを結合することと、
前記追加の応答データと結合された前記追加のデータを前記クライアントデバイスに送信することと
を行うように構成される、請求項1に記載のデータ処理システム。 - データ処理システムであって、
ユーザインターフェースであって、
1つ又は複数のデータソースからネットワークコンテンツを表示する提示パネルであって、前記ネットワークコンテンツは、1つ又は複数のリソースを含む、提示パネルと、
前記ネットワークコンテンツとの対話を可能にする1つ又は複数の制御手段と
を含むユーザインターフェースと、
データ処理エンジンと
を含み、前記データ処理エンジンは、
前記ユーザインターフェースから、前記ネットワークコンテンツの前記1つ又は複数のリソースのうちのリソースの少なくとも部分とのユーザ対話を示す信号を受信することと、
前記信号を受信することに応答して、前記ネットワークコンテンツから前記リソースの前記部分を抽出することと、
前記ネットワークコンテンツから抽出される前記リソースの前記部分をパースして、前記リソースの前記部分で表される1つ又は複数のキーワードを取得することと、
前記1つ又は複数のキーワードに関連する1つ又は複数のローカルリソースについて、前記データ処理エンジンにネットワーク接続される1つ又は複数のローカルデータソースの第1のサーチを実行することと、
前記1つ又は複数のキーワードに関連する1つ又は複数のリモートリソースについて、前記データ処理エンジンにネットワーク接続される1つ又は複数のリモートデータソースの第2のサーチを実行することと、
前記第1のサーチ及び前記第2のサーチを実行することに応答して、少なくとも1つのローカルリソース又は少なくとも1つのリモートリソースの一方又は両方を含む1つ又は複数のサーチ結果を受信することと、
前記提示パネルに前記1つ又は複数のサーチ結果を提示させることと
を行うように構成される、データ処理システム。 - 前記ユーザインターフェースからの前記信号は、前記1つ又は複数の制御手段の選択、前記リソースの前記部分が閲覧される時間の長さを表すデータ、前記リソースの前記部分から別のリソースへのリンクの選択を示すデータ、前記リソースの前記部分の選択を示すデータ及び前記リソースの前記部分に含まれる実行可能コードの実行を示すデータの1つ又は複数を含む、請求項12に記載のデータ処理システム。
- 前記信号は、前記リソースの前記部分のデータタイプ、前記リソースの前記部分の前にアクセスされる1つ若しくは複数の他のリソース又は前記リソースの前記部分のデータソースの1つ又は複数を示すメタデータを含む、請求項12に記載のデータ処理システム。
- 前記第1のサーチを実行することは、
前記1つ又は複数のローカルデータソースのローカルデータソースにアクセスするための認可データを検索することと、
前記認可データを前記ローカルデータソースに提供することと、
前記ローカルデータソースからローカル結果データを受信することと
を含む、請求項12に記載のデータ処理システム。 - 前記認可データは、ローカルストレージから検索される、請求項15に記載のデータ処理システム。
- 前記第2のサーチを実行することは、
前記1つ又は複数のリモートソースのそれぞれのアプリケーションプログラミングインターフェース(API)に準拠するようにデータ要求を構成することと、
前記構成された要求を前記1つ又は複数のリモートデータソースのそれぞれに送信することと、
前記1つ又は複数のリモートデータソースから結果データを受信することと
を含む、請求項12に記載のデータ処理システム。 - 前記1つ又は複数のリモートデータソースは、データソースのレジストリから前記信号を受信することに応答して識別される、請求項17に記載のデータ処理システム。
- 前記リソースの前記部分は、画像を含み、前記リソースの前記部分をパースすることは、画像処理を前記画像に対して実行して、前記画像の1つ又は複数の特徴を抽出することを含み、前記1つ又は複数の特徴は、前記1つ又は複数のキーワードを示す、請求項12に記載のデータ処理システム。
- 前記リソースの前記部分は、テキストの集合を含み、前記1つ又は複数のキーワードは、前記テキストの集合中の言葉である、請求項12に記載のデータ処理システム。
- 前記1つ又は複数のサーチ結果は、特定のリソースの特定の部分を含み、前記特定の部分は、前記ネットワークコンテンツから抽出される前記リソースの前記部分に関連付けられた1つ又は複数のメトリックに基づく、請求項12に記載のデータ処理システム。
- 前記1つ又は複数のメトリックは、データのタイプを含み、前記リソースの前記部分及び前記特定のリソースの前記特定の部分は、前記データのタイプを含む、請求項21に記載のデータ処理システム。
- 前記提示パネルに前記1つ又は複数のサーチ結果を提示させることは、前記1つ又は複数のサーチ結果を、第三者サーチエンジンによって提供された1つ又は複数の他のサーチ結果と共に前記ユーザインターフェースに提示させることを含む、請求項12に記載のデータ処理システム。
- 前記提示パネルに前記1つ又は複数のサーチ結果を提示させることは、前記1つ又は複数のサーチ結果を前記リソースの前記部分と共に提示させることを含む、請求項12に記載のデータ処理システム。
- 前記1つ又は複数のサーチ結果の各サーチ結果は、それぞれのリソースを表し、及び前記提示パネルに前記1つ又は複数のサーチ結果を提示させることは、前記1つ又は複数のリソースのそれぞれの部分を提示することを含む、請求項12に記載のデータ処理システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962795674P | 2019-01-23 | 2019-01-23 | |
US62/795,674 | 2019-01-23 | ||
PCT/US2020/014829 WO2020154529A1 (en) | 2019-01-23 | 2020-01-23 | Data processing system for data search and retrieval augmentation and enhanced data storage |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022517521A true JP2022517521A (ja) | 2022-03-09 |
JPWO2020154529A5 JPWO2020154529A5 (ja) | 2023-04-13 |
Family
ID=69740546
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021535158A Pending JP2022517521A (ja) | 2019-01-23 | 2020-01-23 | データサーチ及び検索を強化するデータ処理システム及び強化されたデータストレージ |
Country Status (7)
Country | Link |
---|---|
US (2) | US11625445B2 (ja) |
EP (1) | EP3915023A1 (ja) |
JP (1) | JP2022517521A (ja) |
CN (1) | CN113646755A (ja) |
AU (1) | AU2020212023A1 (ja) |
CA (1) | CA3123888A1 (ja) |
WO (1) | WO2020154529A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202124B (zh) * | 2015-05-08 | 2019-12-31 | 广州市动景计算机科技有限公司 | 网页分类方法及装置 |
EP3915023A1 (en) * | 2019-01-23 | 2021-12-01 | Keeeb Inc. | Data processing system for data search and retrieval augmentation and enhanced data storage |
US11233855B2 (en) * | 2020-03-10 | 2022-01-25 | Bank Of America Corporation | System for application control using distributed servers |
US11829911B2 (en) * | 2020-05-08 | 2023-11-28 | Optum Services (Ireland) Limited | Resource scoring and recommendation system |
CN111950264B (zh) * | 2020-08-05 | 2024-04-26 | 广东工业大学 | 文本数据增强方法及知识元抽取方法 |
US20230084294A1 (en) * | 2021-09-15 | 2023-03-16 | Google Llc | Determining multilingual content in responses to a query |
US12008133B1 (en) * | 2022-08-29 | 2024-06-11 | CAPEIT.ai, inc. | Compliance and privacy enforcement (CAPE): AI planning based data subject request (DSR) processing system and methods |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001229180A (ja) | 2000-02-17 | 2001-08-24 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ検索装置 |
CN100521822C (zh) | 2001-12-21 | 2009-07-29 | 艾利森电话股份有限公司 | 传送消息的电信系统和方法、消息源设备 |
US20050086219A1 (en) * | 2003-03-25 | 2005-04-21 | Claria Corporation | Generation of keywords for searching in a computer network |
US20060074883A1 (en) | 2004-10-05 | 2006-04-06 | Microsoft Corporation | Systems, methods, and interfaces for providing personalized search and information access |
US20060122976A1 (en) | 2004-12-03 | 2006-06-08 | Shumeet Baluja | Predictive information retrieval |
US20060271520A1 (en) * | 2005-05-27 | 2006-11-30 | Ragan Gene Z | Content-based implicit search query |
US20120173373A1 (en) * | 2005-09-14 | 2012-07-05 | Adam Soroca | System for retrieving mobile communication facility user data from a plurality of providers |
US7456471B2 (en) | 2006-09-15 | 2008-11-25 | International Business Machines Corporation | Field effect transistor with raised source/drain fin straps |
US8799307B2 (en) | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
US10269024B2 (en) * | 2008-02-08 | 2019-04-23 | Outbrain Inc. | Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content |
KR20130009754A (ko) * | 2010-02-01 | 2013-01-23 | 점프탭, 인크. | 통합형 광고 시스템 |
US20120166415A1 (en) * | 2010-12-23 | 2012-06-28 | Microsoft Corporation | Supplementing search results with keywords derived therefrom |
JP2012168653A (ja) | 2011-02-10 | 2012-09-06 | M-Warp Inc | 情報提供システム |
US10084841B2 (en) * | 2015-04-02 | 2018-09-25 | Scripps Networks Interactive, Inc. | Systems and methods for managing media content playback |
US11188841B2 (en) * | 2016-04-08 | 2021-11-30 | Pearson Education, Inc. | Personalized content distribution |
US10853887B2 (en) * | 2016-09-27 | 2020-12-01 | Adobe Inc. | Determination of paywall metrics |
US10896395B2 (en) * | 2016-09-30 | 2021-01-19 | Genesys Telecommunications Laboratories, Inc. | System and method for automatic quality management and coaching |
JP6327682B1 (ja) | 2017-01-30 | 2018-05-23 | クックパッド株式会社 | 情報処理システム、情報処理装置、情報処理方法、及びプログラム |
US10997259B2 (en) * | 2017-10-06 | 2021-05-04 | Realpage, Inc. | Concept networks and systems and methods for the creation, update and use of same in artificial intelligence systems |
AU2018271424A1 (en) * | 2017-12-13 | 2019-06-27 | Playable Pty Ltd | System and Method for Algorithmic Editing of Video Content |
US10776377B2 (en) * | 2018-03-26 | 2020-09-15 | Splunk Inc. | User interface and process to generate journey instance based on one or more pivot identifiers and one or more step identifiers |
US10887640B2 (en) * | 2018-07-11 | 2021-01-05 | Adobe Inc. | Utilizing artificial intelligence to generate enhanced digital content and improve digital content campaign design |
US11017764B1 (en) * | 2018-09-28 | 2021-05-25 | Splunk Inc. | Predicting follow-on requests to a natural language request received by a natural language processing system |
US10992612B2 (en) * | 2018-11-12 | 2021-04-27 | Salesforce.Com, Inc. | Contact information extraction and identification |
US11176191B2 (en) * | 2019-01-22 | 2021-11-16 | Amazon Technologies, Inc. | Search result image selection techniques |
EP3915023A1 (en) * | 2019-01-23 | 2021-12-01 | Keeeb Inc. | Data processing system for data search and retrieval augmentation and enhanced data storage |
CA3134269A1 (en) * | 2019-04-03 | 2020-10-08 | ICX Media, Inc. | Method for optimizing media and marketing content using cross-platform video intelligence |
US11016650B1 (en) * | 2019-09-20 | 2021-05-25 | Tableau Software, Inc. | Building data metric objects through user interactions with data marks of displayed visual representations of data sources |
US10616413B1 (en) * | 2019-10-07 | 2020-04-07 | Nice Ltd | System and method for distributing an agent interaction for evaluation based on the quality of service |
WO2023049905A1 (en) * | 2021-09-24 | 2023-03-30 | Accretive Media LLC | Automated measurement and analytics software for out of home content delivery |
US20230244783A1 (en) * | 2022-01-31 | 2023-08-03 | Walmart Apollo, Llc | Systems and methods for automated rule-based detection |
-
2020
- 2020-01-23 EP EP20708745.3A patent/EP3915023A1/en not_active Ceased
- 2020-01-23 CN CN202080010414.6A patent/CN113646755A/zh active Pending
- 2020-01-23 WO PCT/US2020/014829 patent/WO2020154529A1/en unknown
- 2020-01-23 JP JP2021535158A patent/JP2022517521A/ja active Pending
- 2020-01-23 US US16/750,771 patent/US11625445B2/en active Active
- 2020-01-23 AU AU2020212023A patent/AU2020212023A1/en active Pending
- 2020-01-23 CA CA3123888A patent/CA3123888A1/en active Pending
-
2023
- 2023-03-02 US US18/116,618 patent/US11971940B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11625445B2 (en) | 2023-04-11 |
AU2020212023A1 (en) | 2021-07-08 |
CA3123888A1 (en) | 2020-07-30 |
US20200233917A1 (en) | 2020-07-23 |
WO2020154529A1 (en) | 2020-07-30 |
EP3915023A1 (en) | 2021-12-01 |
CN113646755A (zh) | 2021-11-12 |
US11971940B2 (en) | 2024-04-30 |
US20230315796A1 (en) | 2023-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11971940B2 (en) | Data processing system for data search and retrieval augmentation and enhanced data storage | |
US10102254B2 (en) | Confidence ranking of answers based on temporal semantics | |
US8874552B2 (en) | Automated generation of ontologies | |
US8060513B2 (en) | Information processing with integrated semantic contexts | |
US10438172B2 (en) | Automatic ranking and scoring of meetings and its attendees within an organization | |
TWI493367B (zh) | 搜尋結果之先進過濾方法 | |
US20160306798A1 (en) | Context-sensitive content recommendation using enterprise search and public search | |
US8868558B2 (en) | Quote-based search | |
RU2419858C2 (ru) | Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации | |
US9715531B2 (en) | Weighting search criteria based on similarities to an ingested corpus in a question and answer (QA) system | |
US20100005087A1 (en) | Facilitating collaborative searching using semantic contexts associated with information | |
US10762140B2 (en) | Identifying content in a content management system relevant to content of a published electronic document | |
US20170011112A1 (en) | Entity page generation and entity related searching | |
EP3837618A1 (en) | User-centric contextual information for browser | |
US9251473B2 (en) | Identifying salient items in documents | |
AU2014318151B2 (en) | Smart search refinement | |
US10127322B2 (en) | Efficient retrieval of fresh internet content | |
US10579630B2 (en) | Content creation from extracted content | |
US11783003B2 (en) | User interfaces for surfacing web browser history data | |
US20240220560A1 (en) | Data processing system for data search and retrieval augmentation and enhanced data storage | |
US11120096B2 (en) | Method and system for generating an object card |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230405 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20230508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230511 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230508 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240131 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20240425 |