WO2021034320A1

WO2021034320A1 - Optimisation d'analyse de données à grande échelle

Info

Publication number: WO2021034320A1
Application number: PCT/US2019/047393
Authority: WO
Inventors: Evgeny SKVORTSOV; Jeffrey Wilhelm; Yip Man TSANG; William George Kahn BRADBURY; Andreas Ulbrich; Zhaosheng BAO; Stuart Kendrick HARRELL
Original assignee: Google Llc
Priority date: 2019-08-21
Filing date: 2019-08-21
Publication date: 2021-02-25
Also published as: JP7098735B2; EP3799638A1; KR20210023795A; US11768752B2; CN112771512A; JP2022500714A; US20220171693A1

Abstract

La présente invention concerne des procédés, des systèmes et un appareil, y compris des programmes d'ordinateur codés sur un support de stockage informatique, qui facilitent une analyse efficace de ressource et d'espace d'ensembles de données à grande échelle. Les procédés consistent à obtenir des données d'activité pour des objets dans un ensemble de données. Pour chaque élément de données dans l'ensemble de données, un paramètre ayant fait l'objet d'un hachage ayant une représentation binaire est généré à l'aide d'un identificateur pour l'objet. Un registre est identifié parmi un ensemble de registres sur la base du paramètre ayant fait l'objet d'un hachage. Il est déterminé que le paramètre ayant fait l'objet d'un hachage pour l'objet contribue à une quantité d'agrégation qui spécifie un nombre d'occurrences de l'objet dans l'ensemble de données. Sur la base de cette détermination, une quantité d'agrégation stockée dans le registre est mise à jour. Sur la base de quantités d'agrégation stockées dans l'ensemble de registres, une sortie de rapport est générée, laquelle fournit une distribution agrégée des objets dans l'ensemble de données sur la base des données d'activité pour les objets.