RU2012101682A - Масштабируемая кластерная база данных - Google Patents

Масштабируемая кластерная база данных Download PDF

Info

Publication number
RU2012101682A
RU2012101682A RU2012101682/08A RU2012101682A RU2012101682A RU 2012101682 A RU2012101682 A RU 2012101682A RU 2012101682/08 A RU2012101682/08 A RU 2012101682/08A RU 2012101682 A RU2012101682 A RU 2012101682A RU 2012101682 A RU2012101682 A RU 2012101682A
Authority
RU
Russia
Prior art keywords
nodes
data
subset
processors
segments
Prior art date
Application number
RU2012101682/08A
Other languages
English (en)
Inventor
Роберт Брин ДОЛ
Грегори Б. ЛИНДАЛ
Майкл МАРКСОН
Кит ПИТЕРС
Роберт Майкл САЛИБА
Рич СКРЕНТА
Роберт Н. ТРУЭЛ
Original Assignee
БЛЕККО, Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by БЛЕККО, Инк. filed Critical БЛЕККО, Инк.
Publication of RU2012101682A publication Critical patent/RU2012101682A/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

1. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:прием энного числа запросов от одного или нескольких узлов системы баз данных;объединение энного числа запросов до инициирования операций обслуживания энного числа запросов;сокращение числа операций обслуживания энного числа запросов; ивыполнение сокращенного числа операций обслуживания энного числа запросов.2. Способ по п.1, в котором система баз данных содержит поисковый механизм.3. Способ по п.2, в котором поисковый механизм содержит децентрализованную роевую систему, в которой используется один или несколько роевых алгоритмов.4. Способ по п.1, в котором:энное число запросов включает энное число запросов суммирования для суммирования со значением в строке, хранящейся в системе баз данных;при объединении энного числа запросов до инициирования операций обслуживания энного числа запросов объединяется энное число запросов суммирования со значением в строке, хранящейся в системе баз данных; ипри выполнении сокращенного числа операций выполняется операция суммирования со значением в строке, хранящейся в системе баз данных, для энного числа запросов суммирования за менее чем N транзакций.5. Способ управлении системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорам

Claims (136)

1. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
прием энного числа запросов от одного или нескольких узлов системы баз данных;
объединение энного числа запросов до инициирования операций обслуживания энного числа запросов;
сокращение числа операций обслуживания энного числа запросов; и
выполнение сокращенного числа операций обслуживания энного числа запросов.
2. Способ по п.1, в котором система баз данных содержит поисковый механизм.
3. Способ по п.2, в котором поисковый механизм содержит децентрализованную роевую систему, в которой используется один или несколько роевых алгоритмов.
4. Способ по п.1, в котором:
энное число запросов включает энное число запросов суммирования для суммирования со значением в строке, хранящейся в системе баз данных;
при объединении энного числа запросов до инициирования операций обслуживания энного числа запросов объединяется энное число запросов суммирования со значением в строке, хранящейся в системе баз данных; и
при выполнении сокращенного числа операций выполняется операция суммирования со значением в строке, хранящейся в системе баз данных, для энного числа запросов суммирования за менее чем N транзакций.
5. Способ управлении системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих комбинатор множеств, включающий:
прием множества значений, соответствующих энному числу процессов, от одного или нескольких узлов системы баз данных;
объединение энного числа процессов до инициирования операций над множествами, чтобы задать значения в таблице, хранящейся в запоминающем устройстве системы баз данных;
сокращение числа операций над множествами, чтобы задать значения энного числа процессов; и
выполнение сокращенного числа операций над множествами.
6. Способ подсчета элементов в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
определение кратного М числа элементов;
подсчет однозначно определяемых элементов из кратного М числа элементов;
определение подсчета регистрации для однозначно определяемых элементов из кратного М числа элементов; и
сохранение подсчета регистрации для однозначно определяемых элементов.
7. Способ по п.6, в котором при определении подсчета регистрации:
каждый из однозначно определяемых элементов из кратного М числа элементов разбивается на множество из энного числа частей, каждая из которых содержит подмножество однозначно определяемых элементов из кратного М числа элементов, при этом каждое подмножество однозначно определяемых элементов выражено в виде количества битов;
определяется младший незаданный бит в каждом энном числе частей для каждого подмножества кратного М числа элементов;
задается значение младшего бита в виде N промежуточных величин для каждого подмножества однозначно определяемых элементов из множества N частей;
усредняются значения младших незаданных битов из N промежуточных величин для каждого множества N частей; и
усредненное значение применяется в качестве значения числа регистрации, возведенного в квадрат.
8. Способ по п.7, в котором в памяти базы данных сохраняются N промежуточных величин, и выполняется завершающая стадия применения усредненного значения в качестве значения числа регистрации, возведенного в квадрат.
9. Способ по п.6, в котором при определении подсчета регистрации определяется приблизительный подсчет множества однозначно определяемых элементов с точностью приблизительно до плюс или минус 50%.
10. Способ по п.6, в котором при определении подсчета регистрации:
каждый из однозначно определяемых элементов из кратного М числа элементов разбивается на множество из энного числа частей, каждая из которых содержит подмножество однозначно определяемых элементов из кратного М числа элементов, при этом каждое подмножество однозначно определяемых элементов выражено в виде количества битов;
определяется младший незаданный бит в каждом энном числе частей для каждого подмножества кратного М числа элементов;
выбирается бит, который задается для N промежуточных величин с использованием произвольного экспоненциального фактора затухания;
усредняются значения младших незаданных битов из N промежуточных величин для каждого множества N частей; и
усредненное значение применяется в качестве значения числа регистрации, выраженных в виде произвольного основания, согласующегося с произвольным экспоненциальным фактором затухания.
11. Способ по п.6, в котором для N промежуточных величин старшие биты задаются с меньшей вероятностью, чем младшие биты.
12. Способ по п.6, в котором каждая из N частей из множества N частей содержит 32 бита, а общий объем, необходимый для хранения подсчета регистрации, составляет 128 битов.
13. Способ по п.6, в котором кратное М число элементов содержит URL входящих ссылок на веб-сайт.
14. Способ по п.6, в котором в кратное М число элементов входят получатели сообщений электронной почты с заданной подписью, используемой для обнаружения передаваемого по электронной почте спама.
15. Способ по п.6, в котором в кратное М число элементов входят IP-сети класса С отправителей сообщений электронной почты с заданной подписью, используемой для обнаружения передаваемого по электронной почте спама сетевыми агентами-роботами.
16. Способ по п.6, в котором в кратное М число элементов входят географические местонахождения веб-страниц с привязкой к веб-странице.
17. Способ по п.6, в котором кратное М число элементов входят IP-подсети Интернет-серверов, содержащие веб-страницы с привязкой к веб-странице.
18. Способ использования одного или нескольких комбинаторов в поисковом механизме, в который входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих один или несколько комбинаторов, включающий:
прием запроса на поиск;
поиск в поисковом механизме в ответ на принятый запрос на поиск, исходя из одного или нескольких предварительно заданных критериев, связанных с одним или несколькими критериями поиска из запроса на поиск, при этом каждый из предварительно заданных критериев связан с одним или несколькими комбинаторами; и
объединение одного или несколько предварительно заданных критериев, чтобы генерировать результат поиска.
19. Способ по п.18, в котором один или несколько предварительно заданных критериев, связанных с одним или несколькими критериями поиска, представляют собой подмножество из группы, в которой:
веб-сайты ранжированы по показателю, основанному на критерии качества веб-сайтов, который согласуется с запросом на поиск;
веб-сайты ранжированы по показателю, основанному на дате;
веб-сайты ранжированы по показателю, основанному на последних по времени веб-сайтах, соответствующих одному или нескольким критериям из запроса на поиск; и
веб-сайты ранжированы по показателю, основанному на значимости.
20. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме.
21. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме, с использованием таблицы схем.
22. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме, с использованием таблицы числовых значений.
23. Способ по п.18, в котором один или несколько предварительно заданных критериев содержат комбинатор показателей, связанных с каждым из критериев, который сконфигурирован на объединение первого показателя, связанного с первым критерием, и одного или нескольких последующих показателей, связанных с соответствующими критериями.
24. Способ по п.23, в котором комбинатор показателей, связанных с каждым из соответствующих критериев, содержит множество послойных комбинаторов, сконфигурированных на вызов данных из множества местонахождений в поисковом механизме.
25. Способ по п.24, в котором множества местонахождений в поисковом механизме включают одно или несколько средств типа демона для поискового механизма.
26. Способ по п.18, в котором один или несколько комбинаторов включают заголовок списка полноразмерных сжатых данных плюс хвост списка данных, которые представляют собой подмножество битов полноразмерных сжатых данных.
27. Способ по п.26, в котором данные заголовка списка содержат 32-байта данных в сжатой форме, а данные хвоста списка представляют собой подмножество из 4 байтов данных заголовка списка.
28. Способ ускорения операций чтения дисков и записи на диски в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, при этом данные в базе данных разбиты на один или несколько сегментов, и по меньшей мере два дубликата каждого сегмента данных хранятся в различных запоминающих устройствах одного или нескольких узлов, включающий:
определение подмножества запоминающих устройств, которые будут выделены для записи, при этом сохраняется выделенным для чтения по меньшей мере один дубликат каждого сегмента; и
выделение для чтения по меньшей мере значительной части остальных запоминающих устройств.
29. Способ по п.28, дополнительно включающий:
генерирование схемы отображения, в которой определено, какие из одного или нескольких сегментов одного или нескольких узлов доступны для чтения, и какие из одного или нескольких сегментов одного или нескольких узлов доступны для записи;
распределение схемы отображения одному или нескольким узлам; и
локальное использование схемы отображения в пределах каждого узла, чтобы сообщать каждому сегменту, следует ли ему выполнять операцию чтения или записи.
30. Способ по п.29, в котором по истечении заданного периода времени генерируется заменяющая схема отображения, которая распределяется одному или нескольким узлам.
31. Способ по п.30, включающий синхронизирование одного или нескольких узлов посредством соответствующих часов и применение заменяющей схемы отображения, когда показания соответствующих часов одного или нескольких узлов достигают вторичного граничного значения N.
32. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи сегменты для записи выбираются, исходя из времени, истекшего после последнего события записи в соответствующий сегмент.
33. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи:
определяется цикл, начиная с одного или нескольких узлов, запись в которых была сделана наиболее давно, и, заканчивая одним или несколькими узлами, запись в которых была сделана последней по времени;
определяется, каким сегментам каждого одного или нескольких узлов из цикла требуются операции чтения; и,
если ни одному из сегментов соответствующего одного или нескольких узлов не требуются операции чтения, выделяется узел для выполнения множества операций записи.
34. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи:
формируется множество зон из одного или нескольких сегментов; и
поочередно выполняются операции только записи в каждой из множество зон, при этом по меньшей мере одна из множества зон, в которой содержится один дубликат по меньшей мере из двух дубликатов данных, выделяется для операций только чтения.
35. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
передачу от первого из множества узлов одной или нескольких задач второму из множества узлов, при этом ни первый узел, ни второй узел не является главным узлом; и
выполнение вторым узлом одной или нескольких задач.
36. Способ по п.35, включающий формирование из одного или нескольких узлов по меньшей мере двух кластеров.
37. Способ по п.36, в котором при формировании по меньшей мере двух кластеров осуществляется виртуальное структурирование одного или нескольких узлов.
38. Способ по п.36, в котором по меньшей мере два кластера имеют различные географические местоположения.
39. Способ по п.36, в котором по меньшей мере два кластера имеют одинаковое географическое местоположение.
40. Способ по п.35, в котором для связи используют локальную вычислительную сеть.
41. Способ по п.35, в котором для связи используют глобальную вычислительную сеть.
42. Способ по п.35, в котором для связи используют беспроводную связь.
43. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
поддержание связи между подмножеством одного или нескольких узлов с целью принятия коллективных решений в системе баз данных без указаний от главного узла; и
выполнение одного или нескольких действий в ответ на решения подмножества из одного или нескольких узлов.
44. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает прием команд записи в каждом узле и ответ на запросы чтения по мере их приема.
45. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает передачу между ними сообщения о состоянии, содержащим сведения о подмножестве из группы, включающей число файлов, типы файлов, доступность приема новых файлов и перечень неисправностей.
46. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает передачу данных схемы отображения, идентифицирующих местонахождение строк в соответствующих узлах.
47. Способ по п.46, в котором данные схемы передаются после того, как узлу становится известно от других из подмножества узлов местонахождение сегментов в каждом узле.
48. Способ по п.43, в котором к подмножеству узлов дополнительно присоединяется новый узел, который сообщает о доступности приема файлов и задач от других из подмножества узлов.
49. Способ по п.48, в котором новый узел сообщает другим узлам о нулевой конфигурации в качестве протокола широковещательной адресации с указанием того, что она является новой для подмножества узлов, при этом нулевая конфигурация не является конфигурационным файлом.
50. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
дублирование данных в двух или более различных сегментах, которые содержат запоминающие компоненты в соответствующих узлах, при этом в одном и том же узле из одного или нескольких узлов не хранятся два дубликата одного и того же сегмента; и
передачу другим из одного или нескольких узлов служебной информации о дубликате, хранящемся в соответствующем узле.
51. Способ по п.50, в котором при дублировании данных записываются копии данных в строке таблицы, находящейся в одном из узлов.
52. Способ по п.51, включающий распределение одного или нескольких узлов по множеству физических групп, в каждую из которых входит подмножество из одного или нескольких узлов, при этом в одной физической группе хранится один дубликат данных.
53. Способ по п.51, включающий распределение одного или нескольких узлов по множеству логических групп, в каждую из которых входит подмножество из одного или нескольких узлов, при этом в одной логической группе хранится один дубликат данных.
54. Способ по п.52, включающий распределение множества физических групп по меньшей мере по двум зонам, в каждую из которых входит подмножество физических групп, при этом в одной по меньшей мере из двух зон хранится один дубликат данных.
55. Способ по п.50, включающий дублирование данных по меньшей мере в трех различных сегментах, расположенных в непосредственной близости друг от друга.
56. Способ по п.50, дополнительно включающий:
обнаружение ошибки в отказавшем узле, в сегменте которого содержится дубликат данных;
передачу служебной информации доступным узлам, в сегментах которых содержится другой дубликат данных по сравнению с отказавшим узлом; и
обход отказавшего узла.
57. Способ по п.56, дополнительно включающий активизирование демона для устранения неисправностей, который осуществляет диагностику неисправности в отказавшем узле и определяет операцию для исправления отказавшего узла.
58. Способ по п.57, в котором демон для устранения неисправностей определяет, следует ли дублировать данные в другом доступном узле или заменить данные в отказавшем узле.
59. Способ по п.50, дополнительно включающий:
отображение данных по меньшей мере в трех различных сегментах с использованием хеш-функции, которая генерирует множество идентификаторов, отображаемых в таблице в каждом из одного или нескольких узлов; и
локальное ведение и обновление таблицы в каждом узле.
60. Способ по п.59, в котором идентификатор включает подмножество идентификаторов из группы, включающей пары ключ - значение, ключи строки, код местонахождения, имя сегмента и согласованные хеш-слоты.
61. Способ по п.59, в котором хеш-функция преобразует ключ произвольного размера в двоичные хешированные выходные данные фиксированного размера.
62. Способ по п.50, в котором один или несколько узлов содержат множество сегментов переменного размера.
63. Способ по п.62, в котором во множестве сегментов переменного размера содержится по меньшей мере подмножество вложенных сегментов.
64. Способ определения местонахождения строки в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
хеширование ключа строки;
определение префикса хешированного ключа строки;
идентифицирование списка сегментов, содержащих строку, исходя из префикса;
определение, какие из одного или нескольких узлов сообщили о том, что в них хранятся сегменты, идентифицированные в списке сегментов; и
определение по меньшей мере одного сегмента, содержащего дубликат строки.
65. Способ формирования данных в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
идентифицирование данных для сохранения в одной или нескольких таблицах в сегменте, который отображает распределение памяти с разбиением в одном или нескольких узлах;
присваивание каждым из идентифицированных данных идентификатора и одного иерархического уровня хранения из множества иерархических уровней; и
отображение в виде индекса и сохранение каждых из данных в соответствии с индексом и присвоенным иерархическим уровнем.
66. Способ по п.65, в котором множество иерархических уровней включает:
первый уровень, отображающий самые старые данные в одной или нескольких таблицах в сегменте;
второй уровень, отображающий более новые данные в одной или нескольких таблицах в сегменте; и
третий уровень, отображающий последние по времени данные в одной или нескольких таблицах в сегменте.
67. Способ по п.65, в котором при сохранении каждых данных осуществляется запись данных в строке таблицы в сегменте одного или нескольких узлов посредством демона для записи, и регистрируется операция записи в журнале транзакций узла.
68. Способ по п.67, в котором демон для записи задерживает операцию записи в соответствующий сегмент, чтобы накопить дополнительные операции записи, предназначенные для того же соответствующего сегмента.
69. Способ по п.67, выполняемый с помощью компьютера и в котором от демона для записи дополнительно принимаются операции записи, а посредством демона сегмента объединяются задачи записи в сегмент в течение заданного периода времени.
70. Способ по п.69, в котором заданный период времени определяется периодом времени для накопления демоном сегмента операций записи, соответствующих заданному размеру файла.
71. Способ по п.69, в котором демон сегмента записывает данные в накопленные операции записи на третий иерархический уровень; объединяет данные, сохраненные как данные третьего иерархического уровня, с данными второго иерархического уровня по истечении первого заданного периода времени; и объединяет данные второго иерархического уровня с данными первого иерархического уровня по истечении второго заданного периода времени.
72. Способ по п.71, дополнительно включающий:
указание в одной или нескольких таблицах сегмента предельного значения объединения, которое является признаком одного из множества иерархических уровней; и
ограничение объединения файлов в соответствии с указанным предельным значением объединения путем отказа от объединения файлов данных на следующем уровне, если достигнуто предельное значение объединения.
73. Способ по п.72, дополнительно включающий:
сохранение фильтра Блума для ключей строк каждого иерархического уровня; и
использование фильтра Блума для определения, должен ли заданный ключ строки находиться на заданном иерархическом уровне хранения.
74. Способ по п.69, в котором при объединении задач записи в сегмент дополнительно дозируются объединенные задачи записи, чтобы предотвратить использование при записи в запоминающее устройство преимущественно всех доступных читающих/записывающих способностей запоминающего устройства.
75. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
передачу запроса на чтение данных от первого узла по меньшей мере подмножеству узлов из одного или нескольких узлов;
проверку идентификатора посредством каждого соответствующего узла по меньшей мере из подмножества узлов, чтобы определить, хранятся ли запрошенные данные чтения в соответствующем узле; и
предоставление данных чтения первому узлу, если данные чтения содержатся в соответствующем узле по меньшей мере из подмножества узлов.
76. Способ по п.75, в дополнительно включающий проверку кэш-памяти каждого соответствующего узла по меньшей мере из подмножества узлов до проверки других ячеек запоминающего устройства соответствующего узла.
77. Способ по п.76, дополнительно включающий управление одной или несколькими операциями чтения посредством демона для чтения, связанного с каждым соответствующим узлом по меньшей мере из подмножества узлов.
78. Способ по п.76, в котором кэш-памятью является одно из устройств из группы, включающей ОЗУ, запоминающее устройство сервера, флэш-память на твердотельном накопителе и флэш-память на плате для шины присоединения периферийных устройств.
79. Способ по п.76, в котором кэш-памятью управляет демон кэш-памяти.
80. Способ по п.75, в котором при передаче запроса на чтение данных передается запрос на извлечение данных из строки хешированных ключей в таблице, хранящейся в сегменте соответствующего узла по меньшей мере из подмножества узлов, а при проверке идентификатора каждым соответствующим узлом хешируется ключ строки в качестве идентификатора, чтобы определить, в каком одном или нескольких сегментах одного из подмножества узлов содержатся запрошенные данные.
81. Способ по п.75, в котором данные чтения сохраняются в подмножестве узлов в виде множества дубликатов данных чтения, а в кэш-памяти одного из подмножества узлов сохраняется по меньшей мере один из дубликатов.
82. Способ по п.75, в котором подмножество узлов поддерживает связь друг с другом для определения местонахождения данных чтения.
83. Способ по п.75, в котором данные чтения сохраняются на множестве иерархических уровней, начиная с сохраненных последними по времени данных и заканчивая сохраненными первыми по времени данными, а при передаче запроса на чтение данных указывается иерархический уровень для поиска данных чтения согласно указанному иерархическому уровню в каждом из подмножества узлов.
84. Способ обработки запроса в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
прием запроса от одного из узлов роевой системы баз данных;
хеширование ключа строки, чтобы определить, доступен ли один или несколько сегментов для обслуживания запроса, которые отображают распределение памяти в соответствующем одном или нескольких узлах;
запрос первого из одного или нескольких узлов, содержащего один из одного или нескольких сегментов, доступных для обслуживания запроса;
запрос второго узла, содержащего один из одного или нескольких сегментов, доступных для обслуживания запроса, если первый узел не способен обслужить запрос или в течение заданного периода времени задерживает ответ на запрос обслуживания; и
передачу запроса последующим узлам, содержащим один из одного или нескольких сегментов, доступных для обслуживания запроса, пока запрос не будет обслужен одним или несколькими узлами.
85. Способ по п.84, включающий распределение одного или нескольких узлов по множеству подмножеств узлов.
86. Способ по п.85, в котором первый узел, второй узел и последующие узлы находятся в одной группе узлов.
87. Способ по п.84, дополнительно включающий предложение первому узлу, второму узлу и последующим узлам на одновременное обслуживание принятого запроса, и обслуживание запроса первым ответившим узлом.
88. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
вычисление целевого числа сегментов, доступных для обслуживания запросов, при этом сегмент отображает распределение памяти в одном или нескольких узлах;
определение, следует ли реорганизовать или перераспределить сегменты и размеры сегментов, исходя из вычисленного целевого числа сегментов;
определение одного или нескольких сегментов для обязательного дублирования;
дублирование одного или нескольких сегментов для обязательного дублирования в один или несколько целевых сегментов, доступных для обслуживания запросов; и
определение одного или нескольких узлов или запоминающих устройств, перегруженных ввиду того, что в них содержится больше сегментов, чем вычисленное целевое число сегментов.
89. Способ по п.88, дополнительно включающий:
определение одного или нескольких избыточных сегментов, в которых могут содержаться дополнительные дубликаты данных и устаревшие данные; и
отбрасывание одного или нескольких избыточных сегментов.
90. Способ по п.89, в котором при отбрасывании одного или нескольких избыточных сегментов удаляются дополнительные дубликаты данных и устаревшие данные.
91. Способ по п.88, в котором каждый из одного или нескольких узлов содержит демон для устранения неисправностей для вычисления целевого числа сегментов для каждого соответствующего узла.
92. Способ по п.91, в котором демон для устранения неисправностей сконфигурирован на обслуживание соответствующего узла путем предоставления подмножества услуг из группы, включающей устранение неисправностей из-за отказа главных компьютеров, устранение неисправностей из-за отказа дисков, восстановление поврежденных сегментов, перемещение сегментов из узлов со слишком большим числом сегментов в узлы со слишком малым числом сегментов и введение нового узла в роевую систему баз данных.
93. Способ по п.88, в котором при определении одного или нескольких сегментов для обязательного дублирования определяется число дубликатов данных, которое входит в заданное число дубликатов данных.
94. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
определение одного или нескольких файлов данных для удаления;
перемещение одного или нескольких файлов данных для удаления в папку для "мусора";
разделение одного или нескольких более крупных файлов данных для удаления на файлы меньшего размера посредством демона для "мусора"; и
удаление файлов меньшего размера посредством локальной операционной системы.
95. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
разделение одной или нескольких задач обслуживания по меньшей мере двух сегментов различных узлов в одном или нескольких узлах на два или более фрагментов; и
осуществление параллельного обслуживания по меньшей мере двух сегментов различных узлов.
96. Способ по п.95, в котором обслуживание по меньшей мере двух сегментов включает операции чтения и операции записи.
97. Способ по п.95, в котором обслуживание по меньшей мере двух сегментов включает операцию чтения всех строк в таблице в порядке хеширования.
98. Способ по п.95, дополнительно включающий генерирование ответа путем ввода данных в систему баз данных или возврата данных в главный процесс.
99. Способ по п.95, дополнительно включающий использование одного или нескольких комбинаторов для выполнения деления одной или нескольких задач на два или более фрагментов и осуществление параллельного обслуживания по меньшей мере двух сегментов различных узлов.
100. Способ управления системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих комбинатор ранжирования, включающий:
прием одного или нескольких критериев ранжирования;
ранжирование множества элементов, исходя из одного или нескольких критериев ранжирования, при этом число элементов из множества ограничено заданным числом N; и
замена ранжирования с целью обновления множества элементов, исходя из заданного периода времени.
101. Способ по п.100, в котором при ранжировании множества элементов используется комбинатор подсчета регистрации для подсчета и обновления однозначно определяемых элементов при ранжировании множества элементов.
102. Способ по п.100, в котором каждый элемент из множества элементов ранжируется согласно имени скалярной переменной и номеру ранга.
103. Способ по п.102, в котором каждый элемент из множества элементов дополнительно ранжируется согласно дополнительной структуре данных, используемой для регистрации дополнительной информации об имени скалярной переменной.
104. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
разбивку на множество строк и присваивание каждому узлу из подмножества одного или нескольких узлов однозначно определяемого подмножества из множества строк, которое включает недублированные строки; и
обеспечение локального доступа к подмножеству сдублированных данных из однозначно определяемого подмножества из множества строк без поддержания связи с другими узлами из подмножества одного или нескольких узлов.
105. Способ сжатия данных в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
генерирование первой версии первой таблицы сжатия имен и типов столбцов;
генерирование второй версии второй таблицы сжатия имен и типов столбцов;
прием данных для сжатия и анализ принятых данных, исходя из первой таблицы сжатия и второй таблицы сжатия;
выбор версии таблицы сжатия, которая обеспечивает наименьший размер данных в сжатой форме на выходе; и
сжатие данных согласно выбранной таблице сжатия.
106. Способ по п.105, дополнительно включающий генерирование множества версий таблицы сжатия с вариациями имен и типов столбцов.
107. Способ по п.105, в котором имена столбцов включают по меньшей мере одно имя столбца с указанием номера из нумерованной таблицы коротких строк, сконфигурированной на дополнительное сжатие коротких строк в данные и содержащей группу данных коротких строк, которым присвоено однозначно определяемое числовое значение.
108. Способ по п.105, в котором имена столбцов содержат по меньшей мере одно имя столбца с использованием одного или нескольких структурированных значений столбцов.
109. Способ управления поисковым механизмом, использующим роевую систему баз данных и содержащим один или несколько процессоров и память, в которой хранится одна или несколько программ для выполнения одним или несколькими процессорами, содержащих один или несколько комбинаторов, включающий:
прием энного числа задач обслуживания;
объединение энного числа задач обслуживания до инициирования операций их выполнения;
сокращение числа операций выполнения энного числа задач обслуживания; и
осуществление сокращенного числа операций выполнения энного числа задач обслуживания.
110. Способ по п.109, в котором при приеме энного числа задач обслуживания от пользователя поискового механизма принимается запрос на поиск.
111. Способ по п.109, в котором задачи обслуживания включают ранжирование элементов данных комбинатором ранжирования, который ранжирует множество элементов данных и сохраняет энное число верхних из множества элементов данных.
112. Способ по п.109, в котором задачи обслуживания включают ведение одним или несколькими комбинаторами одного или нескольких журналов регистрации, в которых осуществляется сбор данных числа посещений вебсайтов и формирование итоговой информации о веб-страницах.
113. Способ по п.112, в котором при ведении одним или несколькими комбинаторами одного или нескольких журналов регистрации используется один или несколько комбинаторов присоединения, которые присоединяют строки текста к существующему множеству строк текста.
114. Способ по п.112, в котором при ведении одним или несколькими комбинаторами одного или нескольких журналов регистрации используется один или несколько суммирующих комбинаторов, которые сконфигурированы на подсчет числа элементов и объединение подсчитанного числа с существующими данными.
115. Способ по п.109, в котором задачи обслуживания включают обнаружение передаваемого по электронной почте спама с использованием одного или нескольких комбинаторов спама, которые вычисляют множество подписей, исходя из заголовков и содержания сообщений электронной почты, и выясняют, содержатся ли такие же подписи в большом числе сообщений, передаваемых большому числу адресатов.
116. Способ по п.115, дополнительно включающий использование комбинатора подсчета регистрации, который подсчитывает число адресатов из большого числа адресатов, получивших сообщение с одинаковой подписью, и определяет, что сообщение с этой подписью является спамом, если достигнуто заданное большое подсчитанное число.
117. Способ по п.109, в котором энное число задач обслуживания включает поиск URL на веб-странице одним или несколькими комбинаторами подсчета регистрации, которые подсчитывают однозначно определяемые элементы из множества категорий элементов.
118. Способ по п.117, в котором множество категорий элементов включает подмножество из группы, включающей уровни географических местонахождений, географические IP-адреса, IP-сети класса С со ссылкой на домены, привязки входящих ссылок, рекламные сообщения торговых вебстраниц и фасеты.
119. Способ управления пользовательским интерфейсом в поисковом механизме, осуществляемый в роевой системе баз данных, содержащей поисковый механизм, имеющий один или несколько процессоров и память, в которой хранится одна или несколько программ для выполнения одним или несколькими процессорами, содержащих один или несколько комбинаторов, включающий:
генерирование результата поиска в ответ на прием запроса на поиск; и
формирование результата поиска согласно по меньшей мере двум категориям для отображения веб-браузером по меньшей мере в двух вкладках, в каждой из которых содержится ранжированный список результатов поиска согласно соответствующей категории.
120. Способ по п.119, в котором каждый элемент-результат поиска представлен в в двухстрочном формате, в котором:
на первой строке содержится имя URL страницы, содержащей гиперссылку на URL соответствующей страницы; и
на второй строке содержится по меньшей мере подмножество из группы, включающей название веб-сайта, один или несколько тегов содержимого, один или несколько тегов сайта и необязательный фрагмент.
121. Способ по п.119, в котором один или несколько тегов сайта, отображаемых веб-браузером, содержат по меньшей мере подмножество из группы, включающей ссылки, SEO, RSS, кэш-память, источник, IP-адрес, ранг и ранг узла.
122. Способ по п.121, в котором при использовании тега SEO дополнительно предоставляется информация о сайте, являющемся элементом-результатом поиска, релевантным для системы баз данных путем.
123. Способ по п.121, в котором тег SEO отображает в веб-браузере подмножество из множества категорий SEO, отображаемых в соответствующих вкладках, при этом множество тегов SEO содержат:
обзорную вкладку, отображающую информацию, релевантную для системы баз данных, включая последнюю найденную дату, длину страницы, входящие ссылки, ранг страницы, и IP-адрес;
вкладку входящих ссылок, отображающую все найденные страницы со ссылкой на эту конкретную страницу результирующего сайта, включая текст привязки, исходный IP-адрес, ранг сайтов в базе данных и другие ссылочные страницы;
вкладку исходящих ссылок, отображающую информацию о ссылках, генерированных этой конкретной страницей, на URL или узлы третьих лиц;
вкладку доменов, содержащую информацию о домене; и
вкладку разделов, отображающую информацию о том, как поисковый механизм анализирует информацию о конкретной странице результирующего сайта.
124. Способ просмотра содержимого для отображения веб-браузером, включающий:
генерирование результата поиска в ответ на прием запроса на поиск; и
формирование результата поиска согласно списку избирательных фильтров, содержащему множество тегов категорий для формирования результата поиска.
125. Способ по п.124, в котором каждый выбранный тег категорий содержит подмножество элементов результата поиска, релевантного для соответствующего тега категорий.
126. Способ по п.124, в котором множество тегов категорий содержит подмножество из группы, включающей новости, блоги, RSS, комментарии, звук, видео, торговлю, фотографии, содержимое для взрослых, локальное содержимое и оскорбительное содержимое.
127. Способ реализации запроса на поиск для отображения веб-браузером, включающий прием одного или нескольких критериев поиска и слэш-оператора, выбранного из множества слэш-операторов, и генерирование результата поиска, исходя из одного или нескольких критериев поиска и слэш-оператора.
128. Способ по п.127, в котором при генерировании результата поиска представляется список результатов поиска, в котором содержимое сформировано, исходя из одного или нескольких критериев поиска, которые входят в категорию, определенную слэш-оператором.
129. Способ по п.127, в котором множество слэш-операторов содержит основные операторы.
130. Способ по п.127, в котором множество слэш-операторов содержит операторы содержания.
131. Способ по п.127, в котором множество слэш-операторов содержит операторы фасет.
132. Способ по п.127, в котором множество слэш-операторов содержит URL- операторы.
133. Способ по п.127, в котором множество слэш-операторов содержит операторы списков.
134. Способ по п.127, в котором при генерировании результата поиска используются общие фильтры предварительного пересечения.
135. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
прием одной или нескольких задач обслуживания, предусматривающих одну или несколько цепочечных операций;
использование одного или нескольких конечных автоматов для реализации цепочечных операций, работа которых разбивается на N подзадач, каждая из которых образована соответствующим множеством фреймов; и
выполнение одной или нескольких цепочечных операций одним или несколькими конечными автоматами в форме соответствующего множества фреймов.
136. Способ по п.135, в котором соответствующее множество фреймов дополнительно содержит указатель, находящийся в точке, в которой необходимо блокирование, пока не будет получен результат для перехода к следующей подзадаче.
RU2012101682/08A 2009-06-19 2010-06-21 Масштабируемая кластерная база данных RU2012101682A (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US21888909P 2009-06-19 2009-06-19
US61/218,889 2009-06-19
PCT/US2010/039395 WO2010148415A1 (en) 2009-06-19 2010-06-21 Scalable cluster database

Related Child Applications (2)

Application Number Title Priority Date Filing Date
RU2013150523/08A Division RU2013150523A (ru) 2009-06-19 2013-11-13 Способ управления системой баз данных (варианты)
RU2013150524/08A Division RU2013150524A (ru) 2009-06-19 2013-11-13 Способ подсчета элементов в системе баз данных (варианты)

Publications (1)

Publication Number Publication Date
RU2012101682A true RU2012101682A (ru) 2013-07-27

Family

ID=43356797

Family Applications (3)

Application Number Title Priority Date Filing Date
RU2012101682/08A RU2012101682A (ru) 2009-06-19 2010-06-21 Масштабируемая кластерная база данных
RU2013150523/08A RU2013150523A (ru) 2009-06-19 2013-11-13 Способ управления системой баз данных (варианты)
RU2013150524/08A RU2013150524A (ru) 2009-06-19 2013-11-13 Способ подсчета элементов в системе баз данных (варианты)

Family Applications After (2)

Application Number Title Priority Date Filing Date
RU2013150523/08A RU2013150523A (ru) 2009-06-19 2013-11-13 Способ управления системой баз данных (варианты)
RU2013150524/08A RU2013150524A (ru) 2009-06-19 2013-11-13 Способ подсчета элементов в системе баз данных (варианты)

Country Status (5)

Country Link
US (12) US9298782B2 (ru)
EP (3) EP2665002A3 (ru)
CN (3) CN103488680B (ru)
RU (3) RU2012101682A (ru)
WO (1) WO2010148415A1 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2699400C2 (ru) * 2015-02-11 2019-09-05 Бэст Коллект, С.А. Де К.В. Автоматизируемый интеллектуальный сбор и сверка данных
US10685003B2 (en) 2016-06-29 2020-06-16 International Business Machines Corporation Building and using an atomic key with partial key searching capability

Families Citing this family (183)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10726083B2 (en) 2010-10-30 2020-07-28 International Business Machines Corporation Search query transformations
US10007705B2 (en) 2010-10-30 2018-06-26 International Business Machines Corporation Display of boosted slashtag results
EP2665002A3 (en) 2009-06-19 2014-04-02 Blekko, Inc. A method of counting unique items in a database system
US8935129B1 (en) * 2010-06-04 2015-01-13 Bentley Systems, Incorporated System and method for simplifying a graph'S topology and persevering the graph'S semantics
US9355109B2 (en) * 2010-06-11 2016-05-31 The Research Foundation For The State University Of New York Multi-tier caching
US9201890B2 (en) * 2010-10-04 2015-12-01 Dell Products L.P. Storage optimization manager
CN105956116B (zh) * 2010-10-30 2020-02-28 国际商业机器公司 用于处理将要显示的内容的方法和系统
US8819168B2 (en) * 2010-12-14 2014-08-26 Microsoft Corporation Link expansion service
US20120166515A1 (en) * 2010-12-22 2012-06-28 Pradeep Iyer Providing and Resolving an IP Address for Swarm-Based Services
US8577963B2 (en) 2011-06-30 2013-11-05 Amazon Technologies, Inc. Remote browsing session between client browser and network based browser
US8706860B2 (en) 2011-06-30 2014-04-22 Amazon Technologies, Inc. Remote browsing session management
US9621406B2 (en) 2011-06-30 2017-04-11 Amazon Technologies, Inc. Remote browsing session management
US8799412B2 (en) 2011-06-30 2014-08-05 Amazon Technologies, Inc. Remote browsing session management
US8843469B2 (en) * 2011-08-04 2014-09-23 International Business Machines Corporation Faceted and selectable tabs within ephemeral search results
US9037696B2 (en) 2011-08-16 2015-05-19 Amazon Technologies, Inc. Managing information associated with network resources
US9195768B2 (en) 2011-08-26 2015-11-24 Amazon Technologies, Inc. Remote browsing session management
US10089403B1 (en) 2011-08-31 2018-10-02 Amazon Technologies, Inc. Managing network based storage
US8589385B2 (en) 2011-09-27 2013-11-19 Amazon Technologies, Inc. Historical browsing session management
US8914514B1 (en) 2011-09-27 2014-12-16 Amazon Technologies, Inc. Managing network based content
US9383958B1 (en) 2011-09-27 2016-07-05 Amazon Technologies, Inc. Remote co-browsing session management
US9641637B1 (en) 2011-09-27 2017-05-02 Amazon Technologies, Inc. Network resource optimization
US8849802B2 (en) 2011-09-27 2014-09-30 Amazon Technologies, Inc. Historical browsing session management
US9178955B1 (en) 2011-09-27 2015-11-03 Amazon Technologies, Inc. Managing network based content
US9152970B1 (en) 2011-09-27 2015-10-06 Amazon Technologies, Inc. Remote co-browsing session management
US9298843B1 (en) 2011-09-27 2016-03-29 Amazon Technologies, Inc. User agent information management
US10693991B1 (en) 2011-09-27 2020-06-23 Amazon Technologies, Inc. Remote browsing session management
US8615431B1 (en) 2011-09-29 2013-12-24 Amazon Technologies, Inc. Network content message placement management
US9053067B2 (en) * 2011-09-30 2015-06-09 International Business Machines Corporation Distributed data scalable adaptive map-reduce framework
US9313100B1 (en) 2011-11-14 2016-04-12 Amazon Technologies, Inc. Remote browsing session management
US8949664B2 (en) 2011-11-18 2015-02-03 Nokia Corporation Method and apparatus for providing information consistency in distributed computing environments
US8972477B1 (en) 2011-12-01 2015-03-03 Amazon Technologies, Inc. Offline browsing session management
US9117002B1 (en) 2011-12-09 2015-08-25 Amazon Technologies, Inc. Remote browsing session management
US9009334B1 (en) 2011-12-09 2015-04-14 Amazon Technologies, Inc. Remote browsing session management
US9330188B1 (en) 2011-12-22 2016-05-03 Amazon Technologies, Inc. Shared browsing sessions
US10860563B2 (en) * 2012-01-06 2020-12-08 Microsoft Technology Licensing, Llc Distributed database with modular blocks and associated log files
US9336321B1 (en) 2012-01-26 2016-05-10 Amazon Technologies, Inc. Remote browsing and searching
US9509783B1 (en) 2012-01-26 2016-11-29 Amazon Technlogogies, Inc. Customized browser images
US8839087B1 (en) 2012-01-26 2014-09-16 Amazon Technologies, Inc. Remote browsing and searching
US8627195B1 (en) 2012-01-26 2014-01-07 Amazon Technologies, Inc. Remote browsing and searching
US9092405B1 (en) 2012-01-26 2015-07-28 Amazon Technologies, Inc. Remote browsing and searching
US9087024B1 (en) 2012-01-26 2015-07-21 Amazon Technologies, Inc. Narration of network content
US9183258B1 (en) 2012-02-10 2015-11-10 Amazon Technologies, Inc. Behavior based processing of content
US9037975B1 (en) 2012-02-10 2015-05-19 Amazon Technologies, Inc. Zooming interaction tracking and popularity determination
US20130212089A1 (en) * 2012-02-10 2013-08-15 Google Inc. Search Result Categorization
US9137210B1 (en) 2012-02-21 2015-09-15 Amazon Technologies, Inc. Remote browsing session management
US9374244B1 (en) 2012-02-27 2016-06-21 Amazon Technologies, Inc. Remote browsing session management
US10296558B1 (en) 2012-02-27 2019-05-21 Amazon Technologies, Inc. Remote generation of composite content pages
US9208316B1 (en) 2012-02-27 2015-12-08 Amazon Technologies, Inc. Selective disabling of content portions
US9460220B1 (en) 2012-03-26 2016-10-04 Amazon Technologies, Inc. Content selection based on target device characteristics
US9307004B1 (en) 2012-03-28 2016-04-05 Amazon Technologies, Inc. Prioritized content transmission
US8965921B2 (en) * 2012-06-06 2015-02-24 Rackspace Us, Inc. Data management and indexing across a distributed database
US9137141B2 (en) 2012-06-12 2015-09-15 International Business Machines Corporation Synchronization of load-balancing switches
CN103514229A (zh) * 2012-06-29 2014-01-15 国际商业机器公司 用于在分布式数据库系统中处理数据库数据的方法和装置
US9058326B1 (en) 2012-06-29 2015-06-16 Emc Corporation Recovery and flush of endurant cache
US8862642B1 (en) * 2012-06-29 2014-10-14 Emc Corporation Endurant cache
WO2014008468A2 (en) 2012-07-06 2014-01-09 Blekko, Inc. Searching and aggregating web pages
KR101700820B1 (ko) * 2012-07-11 2017-02-01 한국전자통신연구원 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
GB2504112A (en) * 2012-07-18 2014-01-22 Ibm Generating database sequences in a replicated database environment
US8572051B1 (en) * 2012-08-08 2013-10-29 Oracle International Corporation Making parallel execution of structured query language statements fault-tolerant
US9772979B1 (en) 2012-08-08 2017-09-26 Amazon Technologies, Inc. Reproducing user browsing sessions
US8943197B1 (en) 2012-08-16 2015-01-27 Amazon Technologies, Inc. Automated content update notification
US8938521B2 (en) * 2012-08-29 2015-01-20 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Bi-directional synchronization enabling active-active redundancy for load-balancing switches
US20140067751A1 (en) * 2012-08-31 2014-03-06 Nikhil Shirish Ketkar Compressed set representation for sets as measures in olap cubes
US8533167B1 (en) * 2012-08-31 2013-09-10 Guavus, Inc. Compressed set representation for sets as measures in OLAP cubes
EP2915070A1 (en) * 2012-11-02 2015-09-09 GE Intelligent Platforms, Inc. Apparatus and method for intelligent querying and filtering
WO2014081824A2 (en) * 2012-11-21 2014-05-30 Blekko, Inc. Search engine results
US9087085B2 (en) * 2012-12-10 2015-07-21 International Business Machines Corporation Pre-assimilation values and post-assimilation values in hardware instance identifiers
CN103064899B (zh) * 2012-12-17 2016-06-22 北京奇虎科技有限公司 一种分发信息数据库系统
CN103064901B (zh) * 2012-12-18 2017-02-22 中兴通讯股份有限公司 一种ram、网络处理系统和一种ram查表方法
CN103136360B (zh) * 2013-03-07 2016-09-07 北京宽连十方数字技术有限公司 一种互联网行为标注引擎及对应该引擎的行为标注方法
US9740390B2 (en) 2013-03-11 2017-08-22 Spikes, Inc. Dynamic clip analysis
US20140283071A1 (en) * 2013-03-12 2014-09-18 Spikes, Inc. Application malware isolation via hardware separation
US20140280375A1 (en) * 2013-03-15 2014-09-18 Ryan Rawson Systems and methods for implementing distributed databases using many-core processors
US10152463B1 (en) 2013-06-13 2018-12-11 Amazon Technologies, Inc. System for profiling page browsing interactions
US9578137B1 (en) 2013-06-13 2017-02-21 Amazon Technologies, Inc. System for enhancing script execution performance
US9053167B1 (en) 2013-06-19 2015-06-09 Amazon Technologies, Inc. Storage device selection for database partition replicas
US10776375B2 (en) 2013-07-15 2020-09-15 Microsoft Technology Licensing, Llc Retrieval of attribute values based upon identified entities
US9483560B2 (en) * 2013-07-31 2016-11-01 Longsand Limited Data analysis control
US9690671B2 (en) * 2013-11-01 2017-06-27 Cloudera, Inc. Manifest-based snapshots in distributed computing environments
CN104679796A (zh) * 2013-12-03 2015-06-03 方正信息产业控股有限公司 一种选举方法、装置及数据库镜像集群节点
US9477699B2 (en) 2013-12-30 2016-10-25 Sybase, Inc. Static row identifier space partitioning for concurrent data insertion in delta memory store
US9323809B2 (en) 2014-03-10 2016-04-26 Interana, Inc. System and methods for rapid data analysis
CN104915353B (zh) * 2014-03-13 2018-03-23 中国电信股份有限公司 分布式数据库下全局主键生成方法和系统
US20150271072A1 (en) * 2014-03-24 2015-09-24 Cisco Technology, Inc. Method and apparatus for rate controlled content streaming from cache
CN104021161B (zh) * 2014-05-27 2018-06-15 华为技术有限公司 一种聚簇存储方法及装置
US10043208B2 (en) 2014-05-30 2018-08-07 Walmart Apollo, Llc Smart order management and database sharding
US10346897B2 (en) 2014-05-30 2019-07-09 Walmart Apollo, Llc Method and system for smart order management and application level sharding
US9659079B2 (en) 2014-05-30 2017-05-23 Wal-Mart Stores, Inc. Shard determination logic for scalable order and inventory management architecture with a sharded transactional database
US10410169B2 (en) 2014-05-30 2019-09-10 Walmart Apollo, Llc Smart inventory management and database sharding
US9635041B1 (en) 2014-06-16 2017-04-25 Amazon Technologies, Inc. Distributed split browser content inspection and analysis
US9811546B1 (en) * 2014-06-30 2017-11-07 EMC IP Holding Company LLC Storing data and metadata in respective virtual shards on sharded storage systems
US20160026712A1 (en) * 2014-07-22 2016-01-28 Netapp, Inc. Prefix matching using distributed tables for storage services compatibility
US11290524B2 (en) * 2014-08-13 2022-03-29 Microsoft Technology Licensing, Llc Scalable fault resilient communications within distributed clusters
US10009237B1 (en) * 2014-08-24 2018-06-26 Virtual Instruments Worldwide Cross silo time stiching
US9898504B1 (en) * 2014-10-21 2018-02-20 Amdocs Software Systems Limited System, method, and computer program for accessing data on a big data platform
CN109918021B (zh) * 2014-11-05 2022-01-07 超聚变数字技术有限公司 数据处理方法和装置
CN104408086B (zh) * 2014-11-07 2018-02-06 北京奇虎科技有限公司 数据全局处理系统和方法
US10282371B1 (en) * 2014-12-02 2019-05-07 Western Digital Technologies, Inc. Object storage device with probabilistic data structure
CN104580393B (zh) * 2014-12-18 2017-12-15 北京蓝汛通信技术有限责任公司 用于服务器集群系统的扩容方法、装置及服务器集群系统
US9471237B1 (en) * 2015-02-04 2016-10-18 Amazon Technologies, Inc. Memory consumption tracking
US10296507B2 (en) 2015-02-12 2019-05-21 Interana, Inc. Methods for enhancing rapid data analysis
US10395179B2 (en) 2015-03-20 2019-08-27 Fuji Xerox Co., Ltd. Methods and systems of venue inference for social messages
US10042914B2 (en) * 2015-06-10 2018-08-07 International Business Machines Corporation Database index for constructing large scale data level of details
CN104899312B (zh) * 2015-06-15 2018-07-31 国家电网公司 一种多层分类数据体系的数据更新方法
US10515054B2 (en) * 2015-06-19 2019-12-24 Hitachi Vantara Corporation Fast and efficient multi-threaded algorithm for deleting an arbitrarily wide and deep directory tree using limited system resources
US10649850B1 (en) * 2015-06-29 2020-05-12 Amazon Technologies, Inc. Heterogenous media storage and organization in automated data storage systems
US10318884B2 (en) * 2015-08-25 2019-06-11 Fuji Xerox Co., Ltd. Venue link detection for social media messages
US10747753B2 (en) 2015-08-28 2020-08-18 Swirlds, Inc. Methods and apparatus for a distributed database within a network
US9529923B1 (en) * 2015-08-28 2016-12-27 Swirlds, Inc. Methods and apparatus for a distributed database within a network
US9390154B1 (en) 2015-08-28 2016-07-12 Swirlds, Inc. Methods and apparatus for a distributed database within a network
US10838911B1 (en) 2015-12-14 2020-11-17 Amazon Technologies, Inc. Optimization of data request processing for data storage systems
US11062129B2 (en) * 2015-12-30 2021-07-13 Veritas Technologies Llc Systems and methods for enabling search services to highlight documents
CN106933659B (zh) * 2015-12-30 2020-06-26 华为技术有限公司 管理进程的方法和装置
DK3435271T3 (da) 2016-03-22 2022-01-03 Assemblogue Inc Adgangsstyringsmetode, informationsbehandlingsanordning, program og optagemedium
US11681770B2 (en) 2016-05-16 2023-06-20 International Business Machines Corporation Determining whether to process identified uniform resource locators
TWI625715B (zh) * 2016-05-31 2018-06-01 瑞鼎科技股份有限公司 顯示驅動裝置及其運作方法
US10228995B2 (en) * 2016-07-28 2019-03-12 Hewlett Packard Enterprise Development Lp Last writers of datasets in storage array errors
US10242002B2 (en) 2016-08-01 2019-03-26 International Business Machines Corporation Phenomenological semantic distance from latent dirichlet allocations (LDA) classification
US10229184B2 (en) 2016-08-01 2019-03-12 International Business Machines Corporation Phenomenological semantic distance from latent dirichlet allocations (LDA) classification
US10423387B2 (en) 2016-08-23 2019-09-24 Interana, Inc. Methods for highly efficient data sharding
US10146835B2 (en) 2016-08-23 2018-12-04 Interana, Inc. Methods for stratified sampling-based query execution
CN106294861B (zh) * 2016-08-23 2019-08-09 武汉烽火普天信息技术有限公司 面向大规模数据的情报系统中文本聚合及展现方法及系统
US11567993B1 (en) 2016-09-26 2023-01-31 Splunk Inc. Copying buckets from a remote shared storage system to memory associated with a search node for query execution
US11550847B1 (en) 2016-09-26 2023-01-10 Splunk Inc. Hashing bucket identifiers to identify search nodes for efficient query execution
US11416528B2 (en) 2016-09-26 2022-08-16 Splunk Inc. Query acceleration data store
US11860940B1 (en) 2016-09-26 2024-01-02 Splunk Inc. Identifying buckets for query execution using a catalog of buckets
US10956415B2 (en) 2016-09-26 2021-03-23 Splunk Inc. Generating a subquery for an external data system using a configuration file
US11586627B2 (en) 2016-09-26 2023-02-21 Splunk Inc. Partitioning and reducing records at ingest of a worker node
US11593377B2 (en) 2016-09-26 2023-02-28 Splunk Inc. Assigning processing tasks in a data intake and query system
US11604795B2 (en) 2016-09-26 2023-03-14 Splunk Inc. Distributing partial results from an external data system between worker nodes
US11562023B1 (en) 2016-09-26 2023-01-24 Splunk Inc. Merging buckets in a data intake and query system
US20180089324A1 (en) 2016-09-26 2018-03-29 Splunk Inc. Dynamic resource allocation for real-time search
US11620336B1 (en) 2016-09-26 2023-04-04 Splunk Inc. Managing and storing buckets to a remote shared storage system based on a collective bucket size
US11599541B2 (en) 2016-09-26 2023-03-07 Splunk Inc. Determining records generated by a processing task of a query
US11442935B2 (en) 2016-09-26 2022-09-13 Splunk Inc. Determining a record generation estimate of a processing task
US11874691B1 (en) * 2016-09-26 2024-01-16 Splunk Inc. Managing efficient query execution including mapping of buckets to search nodes
US11663227B2 (en) 2016-09-26 2023-05-30 Splunk Inc. Generating a subquery for a distinct data intake and query system
US10353965B2 (en) 2016-09-26 2019-07-16 Splunk Inc. Data fabric service system architecture
US11580107B2 (en) 2016-09-26 2023-02-14 Splunk Inc. Bucket data distribution for exporting data to worker nodes
US11615104B2 (en) 2016-09-26 2023-03-28 Splunk Inc. Subquery generation based on a data ingest estimate of an external data system
EP4027251A1 (en) 2016-11-10 2022-07-13 Swirlds, Inc. Methods and apparatus for a distributed database including anonymous entries
US20180137124A1 (en) * 2016-11-15 2018-05-17 Twiggle Ltd. Translation of a search query into search operators
CN116820695A (zh) 2016-12-19 2023-09-29 海德拉哈希图有限责任公司 用于启用事件删除的分布式数据库的方法和设备
US10754872B2 (en) * 2016-12-28 2020-08-25 Palantir Technologies Inc. Automatically executing tasks and configuring access control lists in a data transformation system
US11170014B2 (en) * 2016-12-29 2021-11-09 Google Llc Method and system for preview of search engine processing
US10402786B2 (en) 2016-12-30 2019-09-03 Dropbox, Inc. Managing projects in a content management system
US10819810B2 (en) 2017-01-05 2020-10-27 International Business Machines Corporation Event affinity detangling with broadcasts rolling over time zones
US9905315B1 (en) * 2017-01-24 2018-02-27 Nxp B.V. Error-resilient memory device with row and/or column folding with redundant resources and repair method thereof
US10678817B2 (en) * 2017-02-03 2020-06-09 DataJaguar, Inc Systems and methods of scalable distributed databases
US10073888B1 (en) * 2017-02-27 2018-09-11 Timescacle, Inc. Adjusting partitioning policies of a database system in view of storage reconfiguration
US10534652B1 (en) * 2017-06-29 2020-01-14 Amazon Technologies, Inc. Efficient movement of virtual nodes during reconfiguration of computing cluster
US10375037B2 (en) 2017-07-11 2019-08-06 Swirlds, Inc. Methods and apparatus for efficiently implementing a distributed database within a network
US11921672B2 (en) 2017-07-31 2024-03-05 Splunk Inc. Query execution at a remote heterogeneous data store of a data fabric service
US11989194B2 (en) 2017-07-31 2024-05-21 Splunk Inc. Addressing memory limits for partition tracking among worker nodes
US10896182B2 (en) 2017-09-25 2021-01-19 Splunk Inc. Multi-partitioning determination for combination operations
US10726095B1 (en) 2017-09-26 2020-07-28 Amazon Technologies, Inc. Network content layout using an intermediary system
US10664538B1 (en) 2017-09-26 2020-05-26 Amazon Technologies, Inc. Data security and data access auditing for network accessible content
US10585915B2 (en) 2017-10-25 2020-03-10 International Business Machines Corporation Database sharding
CA3076257A1 (en) 2017-11-01 2019-05-09 Swirlds, Inc. Methods and apparatus for efficiently implementing a fast-copyable database
US11334543B1 (en) 2018-04-30 2022-05-17 Splunk Inc. Scalable bucket merging for a data intake and query system
CN110535898B (zh) * 2018-05-25 2022-10-04 许继集团有限公司 大数据存储中副本存放、补全、节点选择方法及管理系统
CN108846129B (zh) * 2018-07-02 2023-04-18 腾讯科技(深圳)有限公司 存储数据访问方法、装置及存储介质
US11023178B2 (en) * 2018-07-24 2021-06-01 Weka, Io Ltd Implementing coherency and page cache support for a storage system spread across multiple data centers
US11463361B2 (en) * 2018-09-27 2022-10-04 Hewlett Packard Enterprise Development Lp Rate adaptive transactions
CN109408509A (zh) * 2018-10-15 2019-03-01 北京金山云网络技术有限公司 数据存储方法、装置及计算机设备
WO2020220216A1 (en) 2019-04-29 2020-11-05 Splunk Inc. Search time estimate in data intake and query system
US11715051B1 (en) 2019-04-30 2023-08-01 Splunk Inc. Service provider instance recommendations using machine-learned classifications and reconciliation
US11475150B2 (en) 2019-05-22 2022-10-18 Hedera Hashgraph, Llc Methods and apparatus for implementing state proofs and ledger identifiers in a distributed database
US11714900B2 (en) * 2019-09-13 2023-08-01 Jpmorgan Chase Bank, N.A. System and method for implementing re-run dropped detection tool
US11144290B2 (en) * 2019-09-13 2021-10-12 Huawei Technologies Co., Ltd. Method and apparatus for enabling autonomous acceleration of dataflow AI applications
US11494380B2 (en) 2019-10-18 2022-11-08 Splunk Inc. Management of distributed computing framework components in a data fabric service system
CN110955710B (zh) * 2019-11-26 2023-12-26 杭州数梦工场科技有限公司 一种数据交换作业中脏数据的处理方法及装置
US11922222B1 (en) 2020-01-30 2024-03-05 Splunk Inc. Generating a modified component for a data intake and query system using an isolated execution environment image
US11256713B2 (en) * 2020-04-27 2022-02-22 International Business Machines Corporation Virtual transaction queues for database replication
KR102202792B1 (ko) * 2020-08-06 2021-01-15 (주)시큐레이어 클러스터 기반 처리 시스템을 이용해 동종 및 이기종 데이터 소스에 대해 멀티 캐싱을 수행하는 방법 및 장치
CN116529724B (zh) * 2020-10-14 2024-04-12 甲骨文国际公司 在无共享分布式数据库中快速检测和修复故障的系统和方法
US11704313B1 (en) 2020-10-19 2023-07-18 Splunk Inc. Parallel branch operation using intermediary nodes
US11487668B2 (en) * 2021-04-06 2022-11-01 Thoughtspot, Inc. Approximate unique count
CN113391948B (zh) * 2021-06-29 2022-10-21 西安电子科技大学 一种折叠式可扩展分布式存储编码及修复、扩展方法
US20230023255A1 (en) * 2021-07-23 2023-01-26 Here Global B.V. Controlled ingestion of map update data
CN113839814B (zh) * 2021-09-22 2022-02-18 银河麒麟软件(长沙)有限公司 去中心化的Kubernetes集群联邦实现方法及系统
CN114089917A (zh) * 2021-11-19 2022-02-25 中国电信集团系统集成有限责任公司 分布式对象存储集群及其扩容方法、装置及电子设备
US11489725B1 (en) * 2022-04-24 2022-11-01 Uab 360 It Optimized updating of a client application

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4972349A (en) 1986-12-04 1990-11-20 Kleinberger Paul J Information retrieval system and method
US5446855A (en) * 1994-02-07 1995-08-29 Buslogic, Inc. System and method for disk array data transfer
US5835757A (en) * 1994-03-30 1998-11-10 Siemens Telecom Networks Distributed database management system for servicing application requests in a telecommunications switching system
WO1997004391A1 (en) * 1995-07-20 1997-02-06 Novell, Inc. Transaction log management in a disconnectable computer and network
US5696961A (en) 1996-05-22 1997-12-09 Wang Laboratories, Inc. Multiple database access server for application programs
US6295541B1 (en) * 1997-12-16 2001-09-25 Starfish Software, Inc. System and methods for synchronizing two or more datasets
US6411967B1 (en) * 1999-06-18 2002-06-25 Reliable Network Solutions Distributed processing system with replicated management information base
JP4206586B2 (ja) 1999-11-12 2009-01-14 株式会社日立製作所 データベース管理方法および装置並びにデータベース管理プログラムを記録した記憶媒体
IL133588A0 (en) 1999-12-19 2001-04-30 Infobit Ltd Apparatus and method for retrieval of documents
US20040073617A1 (en) * 2000-06-19 2004-04-15 Milliken Walter Clark Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail
US6954778B2 (en) 2000-07-12 2005-10-11 Microsoft Corporation System and method for accessing directory service via an HTTP URL
US6925476B1 (en) * 2000-08-17 2005-08-02 Fusionone, Inc. Updating application data including adding first change log to aggreagate change log comprising summary of changes
US6954765B2 (en) * 2000-12-30 2005-10-11 Intel Corporation Updating a file in a fragmented file system
US7509322B2 (en) 2001-01-11 2009-03-24 F5 Networks, Inc. Aggregated lock management for locking aggregated files in a switched file system
US20020133720A1 (en) 2001-03-16 2002-09-19 Clickgarden Method for filtering the transmission of data on a computer network to Web domains
US7398271B1 (en) * 2001-04-16 2008-07-08 Yahoo! Inc. Using network traffic logs for search enhancement
US7003514B2 (en) * 2001-09-13 2006-02-21 International Business Machines Corporation Method and apparatus for restricting a fan-out search in a peer-to-peer network based on accessibility of nodes
US20030130994A1 (en) * 2001-09-26 2003-07-10 Contentscan, Inc. Method, system, and software for retrieving information based on front and back matter data
US6978278B2 (en) 2002-01-18 2005-12-20 Bea Systems, Inc. System and method for heterogeneous caching
US7010526B2 (en) 2002-05-08 2006-03-07 International Business Machines Corporation Knowledge-based data mining system
US20030229675A1 (en) * 2002-06-06 2003-12-11 International Business Machines Corporation Effective garbage collection from a Web document distribution cache at a World Wide Web source site
US7188094B2 (en) * 2002-07-08 2007-03-06 Sun Microsystems, Inc. Indexing virtual attributes in a directory server system
EP1396797A1 (en) * 2002-09-04 2004-03-10 Sony International (Europe) GmbH Database query set-up tool and method for setting up a query
EP1547009A1 (en) * 2002-09-20 2005-06-29 Board Of Regents The University Of Texas System Computer program products, systems and methods for information discovery and relational analyses
US8311980B2 (en) * 2002-12-09 2012-11-13 Hewlett-Packard Development Company, L.P. Namespace consistency for a wide-area file system
US7111000B2 (en) * 2003-01-06 2006-09-19 Microsoft Corporation Retrieval of structured documents
US20040153481A1 (en) 2003-01-21 2004-08-05 Srikrishna Talluri Method and system for effective utilization of data storage capacity
US7406502B1 (en) * 2003-02-20 2008-07-29 Sonicwall, Inc. Method and system for classifying a message based on canonical equivalent of acceptable items included in the message
EP1611534A4 (en) 2003-04-04 2010-02-03 Yahoo Inc SYSTEM FOR PRODUCING SEARCH RESULTS, INCLUDING SEARCH FOR SUB-DOMAIN NOTES AND PROVIDING SPONSORED RESULTS BY SUB-DOMAIN
WO2004097624A1 (en) * 2003-04-24 2004-11-11 Neopath Networks, Inc. Large file support for a network file server
US7502779B2 (en) * 2003-06-05 2009-03-10 International Business Machines Corporation Semantics-based searching for information in a distributed data processing system
CA2442190A1 (en) * 2003-09-24 2005-03-24 Enquiro Search Solutions Inc. Dynamic web page referrer tracking and ranking
US7225208B2 (en) 2003-09-30 2007-05-29 Iron Mountain Incorporated Systems and methods for backing up data files
US7752210B2 (en) * 2003-11-13 2010-07-06 Yahoo! Inc. Method of determining geographical location from IP address information
US8135683B2 (en) * 2003-12-16 2012-03-13 International Business Machines Corporation Method and apparatus for data redundancy elimination at the block level
US8005850B2 (en) * 2004-03-15 2011-08-23 Yahoo! Inc. Search systems and methods with integration of user annotations
CA2561130C (en) * 2004-03-26 2018-01-30 Absolute Software Corporation Persistent servicing agent
US7397766B2 (en) * 2004-03-31 2008-07-08 Lucent Technologies Inc. High-speed traffic measurement and analysis methodologies and protocols
US8219531B2 (en) 2004-04-05 2012-07-10 George Eagan Knowledge archival and recollection systems and methods
US8788528B2 (en) * 2004-07-13 2014-07-22 Blue Coat Systems, Inc. Filtering cached content based on embedded URLs
WO2006011819A1 (en) 2004-07-30 2006-02-02 Eurekster, Inc. Adaptive search engine
US7490082B2 (en) * 2004-09-16 2009-02-10 International Business Machines Corporation System and method for searching internet domains
US7464103B2 (en) * 2004-10-29 2008-12-09 Microsoft Corporation Multi-level nested open hashed data stores
US7469241B2 (en) * 2004-11-30 2008-12-23 Oracle International Corporation Efficient data aggregation operations using hash tables
GB0426847D0 (en) 2004-12-08 2005-01-12 Ibm Method and system of committing operations of a synchronised transaction
US7698331B2 (en) 2005-01-18 2010-04-13 Yahoo! Inc. Matching and ranking of sponsored search listings incorporating web search technology and web content
US20060184718A1 (en) * 2005-02-16 2006-08-17 Sinclair Alan W Direct file data programming and deletion in flash memories
US8135728B2 (en) 2005-03-24 2012-03-13 Microsoft Corporation Web document keyword and phrase extraction
US7765186B1 (en) 2005-04-13 2010-07-27 Progress Software Corporation Update-anywhere replication of distributed systems
US7711916B2 (en) 2005-05-11 2010-05-04 Oracle International Corporation Storing information on storage devices having different performance capabilities with a storage system
US7822751B2 (en) * 2005-05-27 2010-10-26 Google Inc. Scoring local search results based on location prominence
US7984058B2 (en) 2005-06-02 2011-07-19 Genius.Com Incorporated Database query construction and handling
JP2006338421A (ja) * 2005-06-03 2006-12-14 Fujitsu Ltd リモートデータベース操作プログラム、リモートデータベース操作方法、およびリモートデータベース操作装置
US7428524B2 (en) 2005-08-05 2008-09-23 Google Inc. Large scale data storage in sparse tables
US20070078835A1 (en) * 2005-09-30 2007-04-05 Boloto Group, Inc. Computer system, method and software for creating and providing an individualized web-based browser interface for wrappering search results and presenting advertising to a user based upon at least one profile or user attribute
US8392400B1 (en) 2005-12-29 2013-03-05 Amazon Technologies, Inc. Method and apparatus for stress management in a searchable data service
US7801912B2 (en) * 2005-12-29 2010-09-21 Amazon Technologies, Inc. Method and apparatus for a searchable data service
US7757045B2 (en) 2006-03-13 2010-07-13 Intel Corporation Synchronizing recency information in an inclusive cache hierarchy
US7475069B2 (en) 2006-03-29 2009-01-06 International Business Machines Corporation System and method for prioritizing websites during a webcrawling process
US8307286B2 (en) * 2006-05-07 2012-11-06 Wellcomemat Llc Methods and systems for online video-based property commerce
US20080024520A1 (en) * 2006-07-26 2008-01-31 Rudd Michael L Digital image file transmission
JP2008052413A (ja) * 2006-08-23 2008-03-06 Hitachi Ltd 販売計画の評価支援システム
US7788243B2 (en) 2006-09-08 2010-08-31 Sybase, Inc. System and methods for optimizing data transfer among various resources in a distributed environment
EP2067104A1 (en) * 2006-09-28 2009-06-10 Xeround Systems Ltd. Apparatus and method for a distributed storage global database
US8041730B1 (en) * 2006-10-24 2011-10-18 Google Inc. Using geographic data to identify correlated geographic synonyms
US7831772B2 (en) 2006-12-12 2010-11-09 Sybase, Inc. System and methodology providing multiple heterogeneous buffer caches
US8150870B1 (en) 2006-12-22 2012-04-03 Amazon Technologies, Inc. Scalable partitioning in a multilayered data service framework
US8150800B2 (en) 2007-03-28 2012-04-03 Netapp, Inc. Advanced clock synchronization technique
US7809610B2 (en) * 2007-04-09 2010-10-05 Platformation, Inc. Methods and apparatus for freshness and completeness of information
US7743013B2 (en) * 2007-06-11 2010-06-22 Microsoft Corporation Data partitioning via bucketing bloom filters
US20090006347A1 (en) * 2007-06-29 2009-01-01 Lucent Technologies Inc. Method and apparatus for conditional search operators
US9141435B2 (en) 2007-07-30 2015-09-22 Sybase, Inc. System and methodology providing workload management in database cluster
US7970872B2 (en) 2007-10-01 2011-06-28 Accenture Global Services Limited Infrastructure for parallel programming of clusters of machines
US9407693B2 (en) * 2007-10-03 2016-08-02 Microsoft Technology Licensing, Llc Network routing of endpoints to content based on content swarms
US20090113160A1 (en) 2007-10-25 2009-04-30 Disk Trix Incorporated, A South Carolina Corporation Method and System for Reorganizing a Storage Device
US20090271283A1 (en) 2008-02-13 2009-10-29 Catholic Content, Llc Network Media Distribution
WO2009105735A2 (en) * 2008-02-21 2009-08-27 Globalenglish Corporation Web-based tool for collaborative, social learning
US20100070474A1 (en) * 2008-09-12 2010-03-18 Lad Kamleshkumar K Transferring or migrating portions of data objects, such as block-level data migration or chunk-based data migration
US8818992B2 (en) * 2008-09-12 2014-08-26 Nokia Corporation Method, system, and apparatus for arranging content search results
US8239359B2 (en) 2008-09-23 2012-08-07 Disney Enterprises, Inc. System and method for visual search in a video media player
US9449078B2 (en) 2008-10-01 2016-09-20 Microsoft Technology Licensing, Llc Evaluating the ranking quality of a ranked list
US8515950B2 (en) 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
US8041733B2 (en) 2008-10-14 2011-10-18 Yahoo! Inc. System for automatically categorizing queries
CN101388044A (zh) * 2008-11-05 2009-03-18 北京启明星辰信息技术股份有限公司 匹配规则包含或运算符的并行多模式匹配的方法及系统
US9386089B2 (en) 2008-11-11 2016-07-05 Nbcuniversal Media, Llc Early detection of high volume peer-to-peer swarms
US20100153371A1 (en) 2008-12-16 2010-06-17 Yahoo! Inc. Method and apparatus for blending search results
JP4670968B2 (ja) * 2009-01-22 2011-04-13 富士ゼロックス株式会社 情報管理プログラム及び情報管理システム
US9639609B2 (en) 2009-02-24 2017-05-02 Microsoft Technology Licensing, Llc Enterprise search method and system
US8078825B2 (en) 2009-03-11 2011-12-13 Oracle America, Inc. Composite hash and list partitioning of database tables
US10152504B2 (en) * 2009-03-11 2018-12-11 Actian Netherlands B.V. Column-store database architecture utilizing positional delta tree update system and methods
EP2665002A3 (en) 2009-06-19 2014-04-02 Blekko, Inc. A method of counting unique items in a database system
US8918365B2 (en) 2009-06-19 2014-12-23 Blekko, Inc. Dedicating disks to reading or writing

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2699400C2 (ru) * 2015-02-11 2019-09-05 Бэст Коллект, С.А. Де К.В. Автоматизируемый интеллектуальный сбор и сверка данных
US10685003B2 (en) 2016-06-29 2020-06-16 International Business Machines Corporation Building and using an atomic key with partial key searching capability

Also Published As

Publication number Publication date
US11176114B2 (en) 2021-11-16
US10877950B2 (en) 2020-12-29
CN103488680A (zh) 2014-01-01
US20120210047A1 (en) 2012-08-16
US11055270B2 (en) 2021-07-06
US10997145B2 (en) 2021-05-04
US11487735B2 (en) 2022-11-01
CN103488680B (zh) 2017-09-29
EP2443574A1 (en) 2012-04-25
EP2665002A2 (en) 2013-11-20
US10437808B2 (en) 2019-10-08
US20190012338A1 (en) 2019-01-10
US20130091144A1 (en) 2013-04-11
US20120158694A1 (en) 2012-06-21
US9298782B2 (en) 2016-03-29
US11080256B2 (en) 2021-08-03
RU2013150523A (ru) 2015-05-20
CN102667761A (zh) 2012-09-12
US10078650B2 (en) 2018-09-18
US8666991B2 (en) 2014-03-04
US20190005081A1 (en) 2019-01-03
US20160364425A1 (en) 2016-12-15
CN102667761B (zh) 2015-05-27
US20120150819A1 (en) 2012-06-14
US20160188722A1 (en) 2016-06-30
CN103488681A (zh) 2014-01-01
EP2665002A3 (en) 2014-04-02
EP2443574A4 (en) 2014-05-07
US20120158800A1 (en) 2012-06-21
RU2013150524A (ru) 2015-05-20
EP2665003A1 (en) 2013-11-20
US9607085B2 (en) 2017-03-28
US20190370243A1 (en) 2019-12-05
US20120150844A1 (en) 2012-06-14
US10095725B2 (en) 2018-10-09
US20210279224A1 (en) 2021-09-09
WO2010148415A1 (en) 2010-12-23

Similar Documents

Publication Publication Date Title
RU2012101682A (ru) Масштабируемая кластерная база данных
JP5661104B2 (ja) 検索エンジンインデクシング及びインデックスを使用する検索のための方法とシステム
US7895325B2 (en) Server architecture and methods for storing and serving event data
US20180253484A1 (en) Computer Implemented Method for Dynamic Sharding
US20180285167A1 (en) Database management system providing local balancing within individual cluster node
JP2012053903A (ja) 分散型検索方法、アーキテクチャ、システム、およびソフトウェア
WO2020087082A1 (en) Trace and span sampling and analysis for instrumented software
US9015414B2 (en) Load balancing based upon data usage
JP6607963B2 (ja) 集計されたメトリクスの測定値のデータストア
CN112579552A (zh) 日志存储及调用方法、装置及系统
CN113835613B (zh) 一种文件读取方法、装置、电子设备和存储介质
AU2013206478B2 (en) Distributed search methods, architectures, systems, and software
CN114461646A (zh) 一种运行指标数据的处理方法及系统
CN117354141A (zh) 应用服务管理方法、设备和计算机可读存储介质
JP2011040102A (ja) 割当システム、割当装置、及び、割当プログラム

Legal Events

Date Code Title Description
FA94 Acknowledgement of application withdrawn (non-payment of fees)

Effective date: 20160801