RU2012101682A - Масштабируемая кластерная база данных - Google Patents
Масштабируемая кластерная база данных Download PDFInfo
- Publication number
- RU2012101682A RU2012101682A RU2012101682/08A RU2012101682A RU2012101682A RU 2012101682 A RU2012101682 A RU 2012101682A RU 2012101682/08 A RU2012101682/08 A RU 2012101682/08A RU 2012101682 A RU2012101682 A RU 2012101682A RU 2012101682 A RU2012101682 A RU 2012101682A
- Authority
- RU
- Russia
- Prior art keywords
- nodes
- data
- subset
- processors
- segments
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
- G06F16/273—Asynchronous replication or reconciliation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Debugging And Monitoring (AREA)
Abstract
1. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:прием энного числа запросов от одного или нескольких узлов системы баз данных;объединение энного числа запросов до инициирования операций обслуживания энного числа запросов;сокращение числа операций обслуживания энного числа запросов; ивыполнение сокращенного числа операций обслуживания энного числа запросов.2. Способ по п.1, в котором система баз данных содержит поисковый механизм.3. Способ по п.2, в котором поисковый механизм содержит децентрализованную роевую систему, в которой используется один или несколько роевых алгоритмов.4. Способ по п.1, в котором:энное число запросов включает энное число запросов суммирования для суммирования со значением в строке, хранящейся в системе баз данных;при объединении энного числа запросов до инициирования операций обслуживания энного числа запросов объединяется энное число запросов суммирования со значением в строке, хранящейся в системе баз данных; ипри выполнении сокращенного числа операций выполняется операция суммирования со значением в строке, хранящейся в системе баз данных, для энного числа запросов суммирования за менее чем N транзакций.5. Способ управлении системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорам
Claims (136)
1. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
прием энного числа запросов от одного или нескольких узлов системы баз данных;
объединение энного числа запросов до инициирования операций обслуживания энного числа запросов;
сокращение числа операций обслуживания энного числа запросов; и
выполнение сокращенного числа операций обслуживания энного числа запросов.
2. Способ по п.1, в котором система баз данных содержит поисковый механизм.
3. Способ по п.2, в котором поисковый механизм содержит децентрализованную роевую систему, в которой используется один или несколько роевых алгоритмов.
4. Способ по п.1, в котором:
энное число запросов включает энное число запросов суммирования для суммирования со значением в строке, хранящейся в системе баз данных;
при объединении энного числа запросов до инициирования операций обслуживания энного числа запросов объединяется энное число запросов суммирования со значением в строке, хранящейся в системе баз данных; и
при выполнении сокращенного числа операций выполняется операция суммирования со значением в строке, хранящейся в системе баз данных, для энного числа запросов суммирования за менее чем N транзакций.
5. Способ управлении системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих комбинатор множеств, включающий:
прием множества значений, соответствующих энному числу процессов, от одного или нескольких узлов системы баз данных;
объединение энного числа процессов до инициирования операций над множествами, чтобы задать значения в таблице, хранящейся в запоминающем устройстве системы баз данных;
сокращение числа операций над множествами, чтобы задать значения энного числа процессов; и
выполнение сокращенного числа операций над множествами.
6. Способ подсчета элементов в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
определение кратного М числа элементов;
подсчет однозначно определяемых элементов из кратного М числа элементов;
определение подсчета регистрации для однозначно определяемых элементов из кратного М числа элементов; и
сохранение подсчета регистрации для однозначно определяемых элементов.
7. Способ по п.6, в котором при определении подсчета регистрации:
каждый из однозначно определяемых элементов из кратного М числа элементов разбивается на множество из энного числа частей, каждая из которых содержит подмножество однозначно определяемых элементов из кратного М числа элементов, при этом каждое подмножество однозначно определяемых элементов выражено в виде количества битов;
определяется младший незаданный бит в каждом энном числе частей для каждого подмножества кратного М числа элементов;
задается значение младшего бита в виде N промежуточных величин для каждого подмножества однозначно определяемых элементов из множества N частей;
усредняются значения младших незаданных битов из N промежуточных величин для каждого множества N частей; и
усредненное значение применяется в качестве значения числа регистрации, возведенного в квадрат.
8. Способ по п.7, в котором в памяти базы данных сохраняются N промежуточных величин, и выполняется завершающая стадия применения усредненного значения в качестве значения числа регистрации, возведенного в квадрат.
9. Способ по п.6, в котором при определении подсчета регистрации определяется приблизительный подсчет множества однозначно определяемых элементов с точностью приблизительно до плюс или минус 50%.
10. Способ по п.6, в котором при определении подсчета регистрации:
каждый из однозначно определяемых элементов из кратного М числа элементов разбивается на множество из энного числа частей, каждая из которых содержит подмножество однозначно определяемых элементов из кратного М числа элементов, при этом каждое подмножество однозначно определяемых элементов выражено в виде количества битов;
определяется младший незаданный бит в каждом энном числе частей для каждого подмножества кратного М числа элементов;
выбирается бит, который задается для N промежуточных величин с использованием произвольного экспоненциального фактора затухания;
усредняются значения младших незаданных битов из N промежуточных величин для каждого множества N частей; и
усредненное значение применяется в качестве значения числа регистрации, выраженных в виде произвольного основания, согласующегося с произвольным экспоненциальным фактором затухания.
11. Способ по п.6, в котором для N промежуточных величин старшие биты задаются с меньшей вероятностью, чем младшие биты.
12. Способ по п.6, в котором каждая из N частей из множества N частей содержит 32 бита, а общий объем, необходимый для хранения подсчета регистрации, составляет 128 битов.
13. Способ по п.6, в котором кратное М число элементов содержит URL входящих ссылок на веб-сайт.
14. Способ по п.6, в котором в кратное М число элементов входят получатели сообщений электронной почты с заданной подписью, используемой для обнаружения передаваемого по электронной почте спама.
15. Способ по п.6, в котором в кратное М число элементов входят IP-сети класса С отправителей сообщений электронной почты с заданной подписью, используемой для обнаружения передаваемого по электронной почте спама сетевыми агентами-роботами.
16. Способ по п.6, в котором в кратное М число элементов входят географические местонахождения веб-страниц с привязкой к веб-странице.
17. Способ по п.6, в котором кратное М число элементов входят IP-подсети Интернет-серверов, содержащие веб-страницы с привязкой к веб-странице.
18. Способ использования одного или нескольких комбинаторов в поисковом механизме, в который входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих один или несколько комбинаторов, включающий:
прием запроса на поиск;
поиск в поисковом механизме в ответ на принятый запрос на поиск, исходя из одного или нескольких предварительно заданных критериев, связанных с одним или несколькими критериями поиска из запроса на поиск, при этом каждый из предварительно заданных критериев связан с одним или несколькими комбинаторами; и
объединение одного или несколько предварительно заданных критериев, чтобы генерировать результат поиска.
19. Способ по п.18, в котором один или несколько предварительно заданных критериев, связанных с одним или несколькими критериями поиска, представляют собой подмножество из группы, в которой:
веб-сайты ранжированы по показателю, основанному на критерии качества веб-сайтов, который согласуется с запросом на поиск;
веб-сайты ранжированы по показателю, основанному на дате;
веб-сайты ранжированы по показателю, основанному на последних по времени веб-сайтах, соответствующих одному или нескольким критериям из запроса на поиск; и
веб-сайты ранжированы по показателю, основанному на значимости.
20. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме.
21. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме, с использованием таблицы схем.
22. Способ по п.18, в котором при осуществлении поиска в поисковом механизме в ответ на принятый запрос на поиск идентифицируются веб-сайты по одному или нескольким показателям, содержащим данные в сжатой форме, с использованием таблицы числовых значений.
23. Способ по п.18, в котором один или несколько предварительно заданных критериев содержат комбинатор показателей, связанных с каждым из критериев, который сконфигурирован на объединение первого показателя, связанного с первым критерием, и одного или нескольких последующих показателей, связанных с соответствующими критериями.
24. Способ по п.23, в котором комбинатор показателей, связанных с каждым из соответствующих критериев, содержит множество послойных комбинаторов, сконфигурированных на вызов данных из множества местонахождений в поисковом механизме.
25. Способ по п.24, в котором множества местонахождений в поисковом механизме включают одно или несколько средств типа демона для поискового механизма.
26. Способ по п.18, в котором один или несколько комбинаторов включают заголовок списка полноразмерных сжатых данных плюс хвост списка данных, которые представляют собой подмножество битов полноразмерных сжатых данных.
27. Способ по п.26, в котором данные заголовка списка содержат 32-байта данных в сжатой форме, а данные хвоста списка представляют собой подмножество из 4 байтов данных заголовка списка.
28. Способ ускорения операций чтения дисков и записи на диски в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, при этом данные в базе данных разбиты на один или несколько сегментов, и по меньшей мере два дубликата каждого сегмента данных хранятся в различных запоминающих устройствах одного или нескольких узлов, включающий:
определение подмножества запоминающих устройств, которые будут выделены для записи, при этом сохраняется выделенным для чтения по меньшей мере один дубликат каждого сегмента; и
выделение для чтения по меньшей мере значительной части остальных запоминающих устройств.
29. Способ по п.28, дополнительно включающий:
генерирование схемы отображения, в которой определено, какие из одного или нескольких сегментов одного или нескольких узлов доступны для чтения, и какие из одного или нескольких сегментов одного или нескольких узлов доступны для записи;
распределение схемы отображения одному или нескольким узлам; и
локальное использование схемы отображения в пределах каждого узла, чтобы сообщать каждому сегменту, следует ли ему выполнять операцию чтения или записи.
30. Способ по п.29, в котором по истечении заданного периода времени генерируется заменяющая схема отображения, которая распределяется одному или нескольким узлам.
31. Способ по п.30, включающий синхронизирование одного или нескольких узлов посредством соответствующих часов и применение заменяющей схемы отображения, когда показания соответствующих часов одного или нескольких узлов достигают вторичного граничного значения N.
32. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи сегменты для записи выбираются, исходя из времени, истекшего после последнего события записи в соответствующий сегмент.
33. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи:
определяется цикл, начиная с одного или нескольких узлов, запись в которых была сделана наиболее давно, и, заканчивая одним или несколькими узлами, запись в которых была сделана последней по времени;
определяется, каким сегментам каждого одного или нескольких узлов из цикла требуются операции чтения; и,
если ни одному из сегментов соответствующего одного или нескольких узлов не требуются операции чтения, выделяется узел для выполнения множества операций записи.
34. Способ по п.28, в котором при выделении по меньшей мере одного сегмента для записи:
формируется множество зон из одного или нескольких сегментов; и
поочередно выполняются операции только записи в каждой из множество зон, при этом по меньшей мере одна из множества зон, в которой содержится один дубликат по меньшей мере из двух дубликатов данных, выделяется для операций только чтения.
35. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
передачу от первого из множества узлов одной или нескольких задач второму из множества узлов, при этом ни первый узел, ни второй узел не является главным узлом; и
выполнение вторым узлом одной или нескольких задач.
36. Способ по п.35, включающий формирование из одного или нескольких узлов по меньшей мере двух кластеров.
37. Способ по п.36, в котором при формировании по меньшей мере двух кластеров осуществляется виртуальное структурирование одного или нескольких узлов.
38. Способ по п.36, в котором по меньшей мере два кластера имеют различные географические местоположения.
39. Способ по п.36, в котором по меньшей мере два кластера имеют одинаковое географическое местоположение.
40. Способ по п.35, в котором для связи используют локальную вычислительную сеть.
41. Способ по п.35, в котором для связи используют глобальную вычислительную сеть.
42. Способ по п.35, в котором для связи используют беспроводную связь.
43. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
поддержание связи между подмножеством одного или нескольких узлов с целью принятия коллективных решений в системе баз данных без указаний от главного узла; и
выполнение одного или нескольких действий в ответ на решения подмножества из одного или нескольких узлов.
44. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает прием команд записи в каждом узле и ответ на запросы чтения по мере их приема.
45. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает передачу между ними сообщения о состоянии, содержащим сведения о подмножестве из группы, включающей число файлов, типы файлов, доступность приема новых файлов и перечень неисправностей.
46. Способ по п.43, в котором поддержание связи между подмножеством одного или нескольких узлов включает передачу данных схемы отображения, идентифицирующих местонахождение строк в соответствующих узлах.
47. Способ по п.46, в котором данные схемы передаются после того, как узлу становится известно от других из подмножества узлов местонахождение сегментов в каждом узле.
48. Способ по п.43, в котором к подмножеству узлов дополнительно присоединяется новый узел, который сообщает о доступности приема файлов и задач от других из подмножества узлов.
49. Способ по п.48, в котором новый узел сообщает другим узлам о нулевой конфигурации в качестве протокола широковещательной адресации с указанием того, что она является новой для подмножества узлов, при этом нулевая конфигурация не является конфигурационным файлом.
50. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
дублирование данных в двух или более различных сегментах, которые содержат запоминающие компоненты в соответствующих узлах, при этом в одном и том же узле из одного или нескольких узлов не хранятся два дубликата одного и того же сегмента; и
передачу другим из одного или нескольких узлов служебной информации о дубликате, хранящемся в соответствующем узле.
51. Способ по п.50, в котором при дублировании данных записываются копии данных в строке таблицы, находящейся в одном из узлов.
52. Способ по п.51, включающий распределение одного или нескольких узлов по множеству физических групп, в каждую из которых входит подмножество из одного или нескольких узлов, при этом в одной физической группе хранится один дубликат данных.
53. Способ по п.51, включающий распределение одного или нескольких узлов по множеству логических групп, в каждую из которых входит подмножество из одного или нескольких узлов, при этом в одной логической группе хранится один дубликат данных.
54. Способ по п.52, включающий распределение множества физических групп по меньшей мере по двум зонам, в каждую из которых входит подмножество физических групп, при этом в одной по меньшей мере из двух зон хранится один дубликат данных.
55. Способ по п.50, включающий дублирование данных по меньшей мере в трех различных сегментах, расположенных в непосредственной близости друг от друга.
56. Способ по п.50, дополнительно включающий:
обнаружение ошибки в отказавшем узле, в сегменте которого содержится дубликат данных;
передачу служебной информации доступным узлам, в сегментах которых содержится другой дубликат данных по сравнению с отказавшим узлом; и
обход отказавшего узла.
57. Способ по п.56, дополнительно включающий активизирование демона для устранения неисправностей, который осуществляет диагностику неисправности в отказавшем узле и определяет операцию для исправления отказавшего узла.
58. Способ по п.57, в котором демон для устранения неисправностей определяет, следует ли дублировать данные в другом доступном узле или заменить данные в отказавшем узле.
59. Способ по п.50, дополнительно включающий:
отображение данных по меньшей мере в трех различных сегментах с использованием хеш-функции, которая генерирует множество идентификаторов, отображаемых в таблице в каждом из одного или нескольких узлов; и
локальное ведение и обновление таблицы в каждом узле.
60. Способ по п.59, в котором идентификатор включает подмножество идентификаторов из группы, включающей пары ключ - значение, ключи строки, код местонахождения, имя сегмента и согласованные хеш-слоты.
61. Способ по п.59, в котором хеш-функция преобразует ключ произвольного размера в двоичные хешированные выходные данные фиксированного размера.
62. Способ по п.50, в котором один или несколько узлов содержат множество сегментов переменного размера.
63. Способ по п.62, в котором во множестве сегментов переменного размера содержится по меньшей мере подмножество вложенных сегментов.
64. Способ определения местонахождения строки в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
хеширование ключа строки;
определение префикса хешированного ключа строки;
идентифицирование списка сегментов, содержащих строку, исходя из префикса;
определение, какие из одного или нескольких узлов сообщили о том, что в них хранятся сегменты, идентифицированные в списке сегментов; и
определение по меньшей мере одного сегмента, содержащего дубликат строки.
65. Способ формирования данных в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
идентифицирование данных для сохранения в одной или нескольких таблицах в сегменте, который отображает распределение памяти с разбиением в одном или нескольких узлах;
присваивание каждым из идентифицированных данных идентификатора и одного иерархического уровня хранения из множества иерархических уровней; и
отображение в виде индекса и сохранение каждых из данных в соответствии с индексом и присвоенным иерархическим уровнем.
66. Способ по п.65, в котором множество иерархических уровней включает:
первый уровень, отображающий самые старые данные в одной или нескольких таблицах в сегменте;
второй уровень, отображающий более новые данные в одной или нескольких таблицах в сегменте; и
третий уровень, отображающий последние по времени данные в одной или нескольких таблицах в сегменте.
67. Способ по п.65, в котором при сохранении каждых данных осуществляется запись данных в строке таблицы в сегменте одного или нескольких узлов посредством демона для записи, и регистрируется операция записи в журнале транзакций узла.
68. Способ по п.67, в котором демон для записи задерживает операцию записи в соответствующий сегмент, чтобы накопить дополнительные операции записи, предназначенные для того же соответствующего сегмента.
69. Способ по п.67, выполняемый с помощью компьютера и в котором от демона для записи дополнительно принимаются операции записи, а посредством демона сегмента объединяются задачи записи в сегмент в течение заданного периода времени.
70. Способ по п.69, в котором заданный период времени определяется периодом времени для накопления демоном сегмента операций записи, соответствующих заданному размеру файла.
71. Способ по п.69, в котором демон сегмента записывает данные в накопленные операции записи на третий иерархический уровень; объединяет данные, сохраненные как данные третьего иерархического уровня, с данными второго иерархического уровня по истечении первого заданного периода времени; и объединяет данные второго иерархического уровня с данными первого иерархического уровня по истечении второго заданного периода времени.
72. Способ по п.71, дополнительно включающий:
указание в одной или нескольких таблицах сегмента предельного значения объединения, которое является признаком одного из множества иерархических уровней; и
ограничение объединения файлов в соответствии с указанным предельным значением объединения путем отказа от объединения файлов данных на следующем уровне, если достигнуто предельное значение объединения.
73. Способ по п.72, дополнительно включающий:
сохранение фильтра Блума для ключей строк каждого иерархического уровня; и
использование фильтра Блума для определения, должен ли заданный ключ строки находиться на заданном иерархическом уровне хранения.
74. Способ по п.69, в котором при объединении задач записи в сегмент дополнительно дозируются объединенные задачи записи, чтобы предотвратить использование при записи в запоминающее устройство преимущественно всех доступных читающих/записывающих способностей запоминающего устройства.
75. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
передачу запроса на чтение данных от первого узла по меньшей мере подмножеству узлов из одного или нескольких узлов;
проверку идентификатора посредством каждого соответствующего узла по меньшей мере из подмножества узлов, чтобы определить, хранятся ли запрошенные данные чтения в соответствующем узле; и
предоставление данных чтения первому узлу, если данные чтения содержатся в соответствующем узле по меньшей мере из подмножества узлов.
76. Способ по п.75, в дополнительно включающий проверку кэш-памяти каждого соответствующего узла по меньшей мере из подмножества узлов до проверки других ячеек запоминающего устройства соответствующего узла.
77. Способ по п.76, дополнительно включающий управление одной или несколькими операциями чтения посредством демона для чтения, связанного с каждым соответствующим узлом по меньшей мере из подмножества узлов.
78. Способ по п.76, в котором кэш-памятью является одно из устройств из группы, включающей ОЗУ, запоминающее устройство сервера, флэш-память на твердотельном накопителе и флэш-память на плате для шины присоединения периферийных устройств.
79. Способ по п.76, в котором кэш-памятью управляет демон кэш-памяти.
80. Способ по п.75, в котором при передаче запроса на чтение данных передается запрос на извлечение данных из строки хешированных ключей в таблице, хранящейся в сегменте соответствующего узла по меньшей мере из подмножества узлов, а при проверке идентификатора каждым соответствующим узлом хешируется ключ строки в качестве идентификатора, чтобы определить, в каком одном или нескольких сегментах одного из подмножества узлов содержатся запрошенные данные.
81. Способ по п.75, в котором данные чтения сохраняются в подмножестве узлов в виде множества дубликатов данных чтения, а в кэш-памяти одного из подмножества узлов сохраняется по меньшей мере один из дубликатов.
82. Способ по п.75, в котором подмножество узлов поддерживает связь друг с другом для определения местонахождения данных чтения.
83. Способ по п.75, в котором данные чтения сохраняются на множестве иерархических уровней, начиная с сохраненных последними по времени данных и заканчивая сохраненными первыми по времени данными, а при передаче запроса на чтение данных указывается иерархический уровень для поиска данных чтения согласно указанному иерархическому уровню в каждом из подмножества узлов.
84. Способ обработки запроса в системе баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
прием запроса от одного из узлов роевой системы баз данных;
хеширование ключа строки, чтобы определить, доступен ли один или несколько сегментов для обслуживания запроса, которые отображают распределение памяти в соответствующем одном или нескольких узлах;
запрос первого из одного или нескольких узлов, содержащего один из одного или нескольких сегментов, доступных для обслуживания запроса;
запрос второго узла, содержащего один из одного или нескольких сегментов, доступных для обслуживания запроса, если первый узел не способен обслужить запрос или в течение заданного периода времени задерживает ответ на запрос обслуживания; и
передачу запроса последующим узлам, содержащим один из одного или нескольких сегментов, доступных для обслуживания запроса, пока запрос не будет обслужен одним или несколькими узлами.
85. Способ по п.84, включающий распределение одного или нескольких узлов по множеству подмножеств узлов.
86. Способ по п.85, в котором первый узел, второй узел и последующие узлы находятся в одной группе узлов.
87. Способ по п.84, дополнительно включающий предложение первому узлу, второму узлу и последующим узлам на одновременное обслуживание принятого запроса, и обслуживание запроса первым ответившим узлом.
88. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
вычисление целевого числа сегментов, доступных для обслуживания запросов, при этом сегмент отображает распределение памяти в одном или нескольких узлах;
определение, следует ли реорганизовать или перераспределить сегменты и размеры сегментов, исходя из вычисленного целевого числа сегментов;
определение одного или нескольких сегментов для обязательного дублирования;
дублирование одного или нескольких сегментов для обязательного дублирования в один или несколько целевых сегментов, доступных для обслуживания запросов; и
определение одного или нескольких узлов или запоминающих устройств, перегруженных ввиду того, что в них содержится больше сегментов, чем вычисленное целевое число сегментов.
89. Способ по п.88, дополнительно включающий:
определение одного или нескольких избыточных сегментов, в которых могут содержаться дополнительные дубликаты данных и устаревшие данные; и
отбрасывание одного или нескольких избыточных сегментов.
90. Способ по п.89, в котором при отбрасывании одного или нескольких избыточных сегментов удаляются дополнительные дубликаты данных и устаревшие данные.
91. Способ по п.88, в котором каждый из одного или нескольких узлов содержит демон для устранения неисправностей для вычисления целевого числа сегментов для каждого соответствующего узла.
92. Способ по п.91, в котором демон для устранения неисправностей сконфигурирован на обслуживание соответствующего узла путем предоставления подмножества услуг из группы, включающей устранение неисправностей из-за отказа главных компьютеров, устранение неисправностей из-за отказа дисков, восстановление поврежденных сегментов, перемещение сегментов из узлов со слишком большим числом сегментов в узлы со слишком малым числом сегментов и введение нового узла в роевую систему баз данных.
93. Способ по п.88, в котором при определении одного или нескольких сегментов для обязательного дублирования определяется число дубликатов данных, которое входит в заданное число дубликатов данных.
94. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
определение одного или нескольких файлов данных для удаления;
перемещение одного или нескольких файлов данных для удаления в папку для "мусора";
разделение одного или нескольких более крупных файлов данных для удаления на файлы меньшего размера посредством демона для "мусора"; и
удаление файлов меньшего размера посредством локальной операционной системы.
95. Способ управления системой баз данных, осуществляемый в роевой системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, и включающий:
разделение одной или нескольких задач обслуживания по меньшей мере двух сегментов различных узлов в одном или нескольких узлах на два или более фрагментов; и
осуществление параллельного обслуживания по меньшей мере двух сегментов различных узлов.
96. Способ по п.95, в котором обслуживание по меньшей мере двух сегментов включает операции чтения и операции записи.
97. Способ по п.95, в котором обслуживание по меньшей мере двух сегментов включает операцию чтения всех строк в таблице в порядке хеширования.
98. Способ по п.95, дополнительно включающий генерирование ответа путем ввода данных в систему баз данных или возврата данных в главный процесс.
99. Способ по п.95, дополнительно включающий использование одного или нескольких комбинаторов для выполнения деления одной или нескольких задач на два или более фрагментов и осуществление параллельного обслуживания по меньшей мере двух сегментов различных узлов.
100. Способ управления системой баз данных с использованием одного или нескольких комбинаторов, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами и содержащих комбинатор ранжирования, включающий:
прием одного или нескольких критериев ранжирования;
ранжирование множества элементов, исходя из одного или нескольких критериев ранжирования, при этом число элементов из множества ограничено заданным числом N; и
замена ранжирования с целью обновления множества элементов, исходя из заданного периода времени.
101. Способ по п.100, в котором при ранжировании множества элементов используется комбинатор подсчета регистрации для подсчета и обновления однозначно определяемых элементов при ранжировании множества элементов.
102. Способ по п.100, в котором каждый элемент из множества элементов ранжируется согласно имени скалярной переменной и номеру ранга.
103. Способ по п.102, в котором каждый элемент из множества элементов дополнительно ранжируется согласно дополнительной структуре данных, используемой для регистрации дополнительной информации об имени скалярной переменной.
104. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
разбивку на множество строк и присваивание каждому узлу из подмножества одного или нескольких узлов однозначно определяемого подмножества из множества строк, которое включает недублированные строки; и
обеспечение локального доступа к подмножеству сдублированных данных из однозначно определяемого подмножества из множества строк без поддержания связи с другими узлами из подмножества одного или нескольких узлов.
105. Способ сжатия данных в системе баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
генерирование первой версии первой таблицы сжатия имен и типов столбцов;
генерирование второй версии второй таблицы сжатия имен и типов столбцов;
прием данных для сжатия и анализ принятых данных, исходя из первой таблицы сжатия и второй таблицы сжатия;
выбор версии таблицы сжатия, которая обеспечивает наименьший размер данных в сжатой форме на выходе; и
сжатие данных согласно выбранной таблице сжатия.
106. Способ по п.105, дополнительно включающий генерирование множества версий таблицы сжатия с вариациями имен и типов столбцов.
107. Способ по п.105, в котором имена столбцов включают по меньшей мере одно имя столбца с указанием номера из нумерованной таблицы коротких строк, сконфигурированной на дополнительное сжатие коротких строк в данные и содержащей группу данных коротких строк, которым присвоено однозначно определяемое числовое значение.
108. Способ по п.105, в котором имена столбцов содержат по меньшей мере одно имя столбца с использованием одного или нескольких структурированных значений столбцов.
109. Способ управления поисковым механизмом, использующим роевую систему баз данных и содержащим один или несколько процессоров и память, в которой хранится одна или несколько программ для выполнения одним или несколькими процессорами, содержащих один или несколько комбинаторов, включающий:
прием энного числа задач обслуживания;
объединение энного числа задач обслуживания до инициирования операций их выполнения;
сокращение числа операций выполнения энного числа задач обслуживания; и
осуществление сокращенного числа операций выполнения энного числа задач обслуживания.
110. Способ по п.109, в котором при приеме энного числа задач обслуживания от пользователя поискового механизма принимается запрос на поиск.
111. Способ по п.109, в котором задачи обслуживания включают ранжирование элементов данных комбинатором ранжирования, который ранжирует множество элементов данных и сохраняет энное число верхних из множества элементов данных.
112. Способ по п.109, в котором задачи обслуживания включают ведение одним или несколькими комбинаторами одного или нескольких журналов регистрации, в которых осуществляется сбор данных числа посещений вебсайтов и формирование итоговой информации о веб-страницах.
113. Способ по п.112, в котором при ведении одним или несколькими комбинаторами одного или нескольких журналов регистрации используется один или несколько комбинаторов присоединения, которые присоединяют строки текста к существующему множеству строк текста.
114. Способ по п.112, в котором при ведении одним или несколькими комбинаторами одного или нескольких журналов регистрации используется один или несколько суммирующих комбинаторов, которые сконфигурированы на подсчет числа элементов и объединение подсчитанного числа с существующими данными.
115. Способ по п.109, в котором задачи обслуживания включают обнаружение передаваемого по электронной почте спама с использованием одного или нескольких комбинаторов спама, которые вычисляют множество подписей, исходя из заголовков и содержания сообщений электронной почты, и выясняют, содержатся ли такие же подписи в большом числе сообщений, передаваемых большому числу адресатов.
116. Способ по п.115, дополнительно включающий использование комбинатора подсчета регистрации, который подсчитывает число адресатов из большого числа адресатов, получивших сообщение с одинаковой подписью, и определяет, что сообщение с этой подписью является спамом, если достигнуто заданное большое подсчитанное число.
117. Способ по п.109, в котором энное число задач обслуживания включает поиск URL на веб-странице одним или несколькими комбинаторами подсчета регистрации, которые подсчитывают однозначно определяемые элементы из множества категорий элементов.
118. Способ по п.117, в котором множество категорий элементов включает подмножество из группы, включающей уровни географических местонахождений, географические IP-адреса, IP-сети класса С со ссылкой на домены, привязки входящих ссылок, рекламные сообщения торговых вебстраниц и фасеты.
119. Способ управления пользовательским интерфейсом в поисковом механизме, осуществляемый в роевой системе баз данных, содержащей поисковый механизм, имеющий один или несколько процессоров и память, в которой хранится одна или несколько программ для выполнения одним или несколькими процессорами, содержащих один или несколько комбинаторов, включающий:
генерирование результата поиска в ответ на прием запроса на поиск; и
формирование результата поиска согласно по меньшей мере двум категориям для отображения веб-браузером по меньшей мере в двух вкладках, в каждой из которых содержится ранжированный список результатов поиска согласно соответствующей категории.
120. Способ по п.119, в котором каждый элемент-результат поиска представлен в в двухстрочном формате, в котором:
на первой строке содержится имя URL страницы, содержащей гиперссылку на URL соответствующей страницы; и
на второй строке содержится по меньшей мере подмножество из группы, включающей название веб-сайта, один или несколько тегов содержимого, один или несколько тегов сайта и необязательный фрагмент.
121. Способ по п.119, в котором один или несколько тегов сайта, отображаемых веб-браузером, содержат по меньшей мере подмножество из группы, включающей ссылки, SEO, RSS, кэш-память, источник, IP-адрес, ранг и ранг узла.
122. Способ по п.121, в котором при использовании тега SEO дополнительно предоставляется информация о сайте, являющемся элементом-результатом поиска, релевантным для системы баз данных путем.
123. Способ по п.121, в котором тег SEO отображает в веб-браузере подмножество из множества категорий SEO, отображаемых в соответствующих вкладках, при этом множество тегов SEO содержат:
обзорную вкладку, отображающую информацию, релевантную для системы баз данных, включая последнюю найденную дату, длину страницы, входящие ссылки, ранг страницы, и IP-адрес;
вкладку входящих ссылок, отображающую все найденные страницы со ссылкой на эту конкретную страницу результирующего сайта, включая текст привязки, исходный IP-адрес, ранг сайтов в базе данных и другие ссылочные страницы;
вкладку исходящих ссылок, отображающую информацию о ссылках, генерированных этой конкретной страницей, на URL или узлы третьих лиц;
вкладку доменов, содержащую информацию о домене; и
вкладку разделов, отображающую информацию о том, как поисковый механизм анализирует информацию о конкретной странице результирующего сайта.
124. Способ просмотра содержимого для отображения веб-браузером, включающий:
генерирование результата поиска в ответ на прием запроса на поиск; и
формирование результата поиска согласно списку избирательных фильтров, содержащему множество тегов категорий для формирования результата поиска.
125. Способ по п.124, в котором каждый выбранный тег категорий содержит подмножество элементов результата поиска, релевантного для соответствующего тега категорий.
126. Способ по п.124, в котором множество тегов категорий содержит подмножество из группы, включающей новости, блоги, RSS, комментарии, звук, видео, торговлю, фотографии, содержимое для взрослых, локальное содержимое и оскорбительное содержимое.
127. Способ реализации запроса на поиск для отображения веб-браузером, включающий прием одного или нескольких критериев поиска и слэш-оператора, выбранного из множества слэш-операторов, и генерирование результата поиска, исходя из одного или нескольких критериев поиска и слэш-оператора.
128. Способ по п.127, в котором при генерировании результата поиска представляется список результатов поиска, в котором содержимое сформировано, исходя из одного или нескольких критериев поиска, которые входят в категорию, определенную слэш-оператором.
129. Способ по п.127, в котором множество слэш-операторов содержит основные операторы.
130. Способ по п.127, в котором множество слэш-операторов содержит операторы содержания.
131. Способ по п.127, в котором множество слэш-операторов содержит операторы фасет.
132. Способ по п.127, в котором множество слэш-операторов содержит URL- операторы.
133. Способ по п.127, в котором множество слэш-операторов содержит операторы списков.
134. Способ по п.127, в котором при генерировании результата поиска используются общие фильтры предварительного пересечения.
135. Способ управления системой баз данных, в которую входит один или несколько узлов, содержащих один или несколько процессоров и память, в которой хранится одна или несколько программ, выполняемых одним или несколькими процессорами, включающий:
прием одной или нескольких задач обслуживания, предусматривающих одну или несколько цепочечных операций;
использование одного или нескольких конечных автоматов для реализации цепочечных операций, работа которых разбивается на N подзадач, каждая из которых образована соответствующим множеством фреймов; и
выполнение одной или нескольких цепочечных операций одним или несколькими конечными автоматами в форме соответствующего множества фреймов.
136. Способ по п.135, в котором соответствующее множество фреймов дополнительно содержит указатель, находящийся в точке, в которой необходимо блокирование, пока не будет получен результат для перехода к следующей подзадаче.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US21888909P | 2009-06-19 | 2009-06-19 | |
US61/218,889 | 2009-06-19 | ||
PCT/US2010/039395 WO2010148415A1 (en) | 2009-06-19 | 2010-06-21 | Scalable cluster database |
Related Child Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013150523/08A Division RU2013150523A (ru) | 2009-06-19 | 2013-11-13 | Способ управления системой баз данных (варианты) |
RU2013150524/08A Division RU2013150524A (ru) | 2009-06-19 | 2013-11-13 | Способ подсчета элементов в системе баз данных (варианты) |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2012101682A true RU2012101682A (ru) | 2013-07-27 |
Family
ID=43356797
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012101682/08A RU2012101682A (ru) | 2009-06-19 | 2010-06-21 | Масштабируемая кластерная база данных |
RU2013150523/08A RU2013150523A (ru) | 2009-06-19 | 2013-11-13 | Способ управления системой баз данных (варианты) |
RU2013150524/08A RU2013150524A (ru) | 2009-06-19 | 2013-11-13 | Способ подсчета элементов в системе баз данных (варианты) |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013150523/08A RU2013150523A (ru) | 2009-06-19 | 2013-11-13 | Способ управления системой баз данных (варианты) |
RU2013150524/08A RU2013150524A (ru) | 2009-06-19 | 2013-11-13 | Способ подсчета элементов в системе баз данных (варианты) |
Country Status (5)
Country | Link |
---|---|
US (12) | US9298782B2 (ru) |
EP (3) | EP2665002A3 (ru) |
CN (3) | CN103488680B (ru) |
RU (3) | RU2012101682A (ru) |
WO (1) | WO2010148415A1 (ru) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2699400C2 (ru) * | 2015-02-11 | 2019-09-05 | Бэст Коллект, С.А. Де К.В. | Автоматизируемый интеллектуальный сбор и сверка данных |
US10685003B2 (en) | 2016-06-29 | 2020-06-16 | International Business Machines Corporation | Building and using an atomic key with partial key searching capability |
Families Citing this family (183)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10726083B2 (en) | 2010-10-30 | 2020-07-28 | International Business Machines Corporation | Search query transformations |
US10007705B2 (en) | 2010-10-30 | 2018-06-26 | International Business Machines Corporation | Display of boosted slashtag results |
EP2665002A3 (en) | 2009-06-19 | 2014-04-02 | Blekko, Inc. | A method of counting unique items in a database system |
US8935129B1 (en) * | 2010-06-04 | 2015-01-13 | Bentley Systems, Incorporated | System and method for simplifying a graph'S topology and persevering the graph'S semantics |
US9355109B2 (en) * | 2010-06-11 | 2016-05-31 | The Research Foundation For The State University Of New York | Multi-tier caching |
US9201890B2 (en) * | 2010-10-04 | 2015-12-01 | Dell Products L.P. | Storage optimization manager |
CN105956116B (zh) * | 2010-10-30 | 2020-02-28 | 国际商业机器公司 | 用于处理将要显示的内容的方法和系统 |
US8819168B2 (en) * | 2010-12-14 | 2014-08-26 | Microsoft Corporation | Link expansion service |
US20120166515A1 (en) * | 2010-12-22 | 2012-06-28 | Pradeep Iyer | Providing and Resolving an IP Address for Swarm-Based Services |
US8577963B2 (en) | 2011-06-30 | 2013-11-05 | Amazon Technologies, Inc. | Remote browsing session between client browser and network based browser |
US8706860B2 (en) | 2011-06-30 | 2014-04-22 | Amazon Technologies, Inc. | Remote browsing session management |
US9621406B2 (en) | 2011-06-30 | 2017-04-11 | Amazon Technologies, Inc. | Remote browsing session management |
US8799412B2 (en) | 2011-06-30 | 2014-08-05 | Amazon Technologies, Inc. | Remote browsing session management |
US8843469B2 (en) * | 2011-08-04 | 2014-09-23 | International Business Machines Corporation | Faceted and selectable tabs within ephemeral search results |
US9037696B2 (en) | 2011-08-16 | 2015-05-19 | Amazon Technologies, Inc. | Managing information associated with network resources |
US9195768B2 (en) | 2011-08-26 | 2015-11-24 | Amazon Technologies, Inc. | Remote browsing session management |
US10089403B1 (en) | 2011-08-31 | 2018-10-02 | Amazon Technologies, Inc. | Managing network based storage |
US8589385B2 (en) | 2011-09-27 | 2013-11-19 | Amazon Technologies, Inc. | Historical browsing session management |
US8914514B1 (en) | 2011-09-27 | 2014-12-16 | Amazon Technologies, Inc. | Managing network based content |
US9383958B1 (en) | 2011-09-27 | 2016-07-05 | Amazon Technologies, Inc. | Remote co-browsing session management |
US9641637B1 (en) | 2011-09-27 | 2017-05-02 | Amazon Technologies, Inc. | Network resource optimization |
US8849802B2 (en) | 2011-09-27 | 2014-09-30 | Amazon Technologies, Inc. | Historical browsing session management |
US9178955B1 (en) | 2011-09-27 | 2015-11-03 | Amazon Technologies, Inc. | Managing network based content |
US9152970B1 (en) | 2011-09-27 | 2015-10-06 | Amazon Technologies, Inc. | Remote co-browsing session management |
US9298843B1 (en) | 2011-09-27 | 2016-03-29 | Amazon Technologies, Inc. | User agent information management |
US10693991B1 (en) | 2011-09-27 | 2020-06-23 | Amazon Technologies, Inc. | Remote browsing session management |
US8615431B1 (en) | 2011-09-29 | 2013-12-24 | Amazon Technologies, Inc. | Network content message placement management |
US9053067B2 (en) * | 2011-09-30 | 2015-06-09 | International Business Machines Corporation | Distributed data scalable adaptive map-reduce framework |
US9313100B1 (en) | 2011-11-14 | 2016-04-12 | Amazon Technologies, Inc. | Remote browsing session management |
US8949664B2 (en) | 2011-11-18 | 2015-02-03 | Nokia Corporation | Method and apparatus for providing information consistency in distributed computing environments |
US8972477B1 (en) | 2011-12-01 | 2015-03-03 | Amazon Technologies, Inc. | Offline browsing session management |
US9117002B1 (en) | 2011-12-09 | 2015-08-25 | Amazon Technologies, Inc. | Remote browsing session management |
US9009334B1 (en) | 2011-12-09 | 2015-04-14 | Amazon Technologies, Inc. | Remote browsing session management |
US9330188B1 (en) | 2011-12-22 | 2016-05-03 | Amazon Technologies, Inc. | Shared browsing sessions |
US10860563B2 (en) * | 2012-01-06 | 2020-12-08 | Microsoft Technology Licensing, Llc | Distributed database with modular blocks and associated log files |
US9336321B1 (en) | 2012-01-26 | 2016-05-10 | Amazon Technologies, Inc. | Remote browsing and searching |
US9509783B1 (en) | 2012-01-26 | 2016-11-29 | Amazon Technlogogies, Inc. | Customized browser images |
US8839087B1 (en) | 2012-01-26 | 2014-09-16 | Amazon Technologies, Inc. | Remote browsing and searching |
US8627195B1 (en) | 2012-01-26 | 2014-01-07 | Amazon Technologies, Inc. | Remote browsing and searching |
US9092405B1 (en) | 2012-01-26 | 2015-07-28 | Amazon Technologies, Inc. | Remote browsing and searching |
US9087024B1 (en) | 2012-01-26 | 2015-07-21 | Amazon Technologies, Inc. | Narration of network content |
US9183258B1 (en) | 2012-02-10 | 2015-11-10 | Amazon Technologies, Inc. | Behavior based processing of content |
US9037975B1 (en) | 2012-02-10 | 2015-05-19 | Amazon Technologies, Inc. | Zooming interaction tracking and popularity determination |
US20130212089A1 (en) * | 2012-02-10 | 2013-08-15 | Google Inc. | Search Result Categorization |
US9137210B1 (en) | 2012-02-21 | 2015-09-15 | Amazon Technologies, Inc. | Remote browsing session management |
US9374244B1 (en) | 2012-02-27 | 2016-06-21 | Amazon Technologies, Inc. | Remote browsing session management |
US10296558B1 (en) | 2012-02-27 | 2019-05-21 | Amazon Technologies, Inc. | Remote generation of composite content pages |
US9208316B1 (en) | 2012-02-27 | 2015-12-08 | Amazon Technologies, Inc. | Selective disabling of content portions |
US9460220B1 (en) | 2012-03-26 | 2016-10-04 | Amazon Technologies, Inc. | Content selection based on target device characteristics |
US9307004B1 (en) | 2012-03-28 | 2016-04-05 | Amazon Technologies, Inc. | Prioritized content transmission |
US8965921B2 (en) * | 2012-06-06 | 2015-02-24 | Rackspace Us, Inc. | Data management and indexing across a distributed database |
US9137141B2 (en) | 2012-06-12 | 2015-09-15 | International Business Machines Corporation | Synchronization of load-balancing switches |
CN103514229A (zh) * | 2012-06-29 | 2014-01-15 | 国际商业机器公司 | 用于在分布式数据库系统中处理数据库数据的方法和装置 |
US9058326B1 (en) | 2012-06-29 | 2015-06-16 | Emc Corporation | Recovery and flush of endurant cache |
US8862642B1 (en) * | 2012-06-29 | 2014-10-14 | Emc Corporation | Endurant cache |
WO2014008468A2 (en) | 2012-07-06 | 2014-01-09 | Blekko, Inc. | Searching and aggregating web pages |
KR101700820B1 (ko) * | 2012-07-11 | 2017-02-01 | 한국전자통신연구원 | 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법 |
GB2504112A (en) * | 2012-07-18 | 2014-01-22 | Ibm | Generating database sequences in a replicated database environment |
US8572051B1 (en) * | 2012-08-08 | 2013-10-29 | Oracle International Corporation | Making parallel execution of structured query language statements fault-tolerant |
US9772979B1 (en) | 2012-08-08 | 2017-09-26 | Amazon Technologies, Inc. | Reproducing user browsing sessions |
US8943197B1 (en) | 2012-08-16 | 2015-01-27 | Amazon Technologies, Inc. | Automated content update notification |
US8938521B2 (en) * | 2012-08-29 | 2015-01-20 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | Bi-directional synchronization enabling active-active redundancy for load-balancing switches |
US20140067751A1 (en) * | 2012-08-31 | 2014-03-06 | Nikhil Shirish Ketkar | Compressed set representation for sets as measures in olap cubes |
US8533167B1 (en) * | 2012-08-31 | 2013-09-10 | Guavus, Inc. | Compressed set representation for sets as measures in OLAP cubes |
EP2915070A1 (en) * | 2012-11-02 | 2015-09-09 | GE Intelligent Platforms, Inc. | Apparatus and method for intelligent querying and filtering |
WO2014081824A2 (en) * | 2012-11-21 | 2014-05-30 | Blekko, Inc. | Search engine results |
US9087085B2 (en) * | 2012-12-10 | 2015-07-21 | International Business Machines Corporation | Pre-assimilation values and post-assimilation values in hardware instance identifiers |
CN103064899B (zh) * | 2012-12-17 | 2016-06-22 | 北京奇虎科技有限公司 | 一种分发信息数据库系统 |
CN103064901B (zh) * | 2012-12-18 | 2017-02-22 | 中兴通讯股份有限公司 | 一种ram、网络处理系统和一种ram查表方法 |
CN103136360B (zh) * | 2013-03-07 | 2016-09-07 | 北京宽连十方数字技术有限公司 | 一种互联网行为标注引擎及对应该引擎的行为标注方法 |
US9740390B2 (en) | 2013-03-11 | 2017-08-22 | Spikes, Inc. | Dynamic clip analysis |
US20140283071A1 (en) * | 2013-03-12 | 2014-09-18 | Spikes, Inc. | Application malware isolation via hardware separation |
US20140280375A1 (en) * | 2013-03-15 | 2014-09-18 | Ryan Rawson | Systems and methods for implementing distributed databases using many-core processors |
US10152463B1 (en) | 2013-06-13 | 2018-12-11 | Amazon Technologies, Inc. | System for profiling page browsing interactions |
US9578137B1 (en) | 2013-06-13 | 2017-02-21 | Amazon Technologies, Inc. | System for enhancing script execution performance |
US9053167B1 (en) | 2013-06-19 | 2015-06-09 | Amazon Technologies, Inc. | Storage device selection for database partition replicas |
US10776375B2 (en) | 2013-07-15 | 2020-09-15 | Microsoft Technology Licensing, Llc | Retrieval of attribute values based upon identified entities |
US9483560B2 (en) * | 2013-07-31 | 2016-11-01 | Longsand Limited | Data analysis control |
US9690671B2 (en) * | 2013-11-01 | 2017-06-27 | Cloudera, Inc. | Manifest-based snapshots in distributed computing environments |
CN104679796A (zh) * | 2013-12-03 | 2015-06-03 | 方正信息产业控股有限公司 | 一种选举方法、装置及数据库镜像集群节点 |
US9477699B2 (en) | 2013-12-30 | 2016-10-25 | Sybase, Inc. | Static row identifier space partitioning for concurrent data insertion in delta memory store |
US9323809B2 (en) | 2014-03-10 | 2016-04-26 | Interana, Inc. | System and methods for rapid data analysis |
CN104915353B (zh) * | 2014-03-13 | 2018-03-23 | 中国电信股份有限公司 | 分布式数据库下全局主键生成方法和系统 |
US20150271072A1 (en) * | 2014-03-24 | 2015-09-24 | Cisco Technology, Inc. | Method and apparatus for rate controlled content streaming from cache |
CN104021161B (zh) * | 2014-05-27 | 2018-06-15 | 华为技术有限公司 | 一种聚簇存储方法及装置 |
US10043208B2 (en) | 2014-05-30 | 2018-08-07 | Walmart Apollo, Llc | Smart order management and database sharding |
US10346897B2 (en) | 2014-05-30 | 2019-07-09 | Walmart Apollo, Llc | Method and system for smart order management and application level sharding |
US9659079B2 (en) | 2014-05-30 | 2017-05-23 | Wal-Mart Stores, Inc. | Shard determination logic for scalable order and inventory management architecture with a sharded transactional database |
US10410169B2 (en) | 2014-05-30 | 2019-09-10 | Walmart Apollo, Llc | Smart inventory management and database sharding |
US9635041B1 (en) | 2014-06-16 | 2017-04-25 | Amazon Technologies, Inc. | Distributed split browser content inspection and analysis |
US9811546B1 (en) * | 2014-06-30 | 2017-11-07 | EMC IP Holding Company LLC | Storing data and metadata in respective virtual shards on sharded storage systems |
US20160026712A1 (en) * | 2014-07-22 | 2016-01-28 | Netapp, Inc. | Prefix matching using distributed tables for storage services compatibility |
US11290524B2 (en) * | 2014-08-13 | 2022-03-29 | Microsoft Technology Licensing, Llc | Scalable fault resilient communications within distributed clusters |
US10009237B1 (en) * | 2014-08-24 | 2018-06-26 | Virtual Instruments Worldwide | Cross silo time stiching |
US9898504B1 (en) * | 2014-10-21 | 2018-02-20 | Amdocs Software Systems Limited | System, method, and computer program for accessing data on a big data platform |
CN109918021B (zh) * | 2014-11-05 | 2022-01-07 | 超聚变数字技术有限公司 | 数据处理方法和装置 |
CN104408086B (zh) * | 2014-11-07 | 2018-02-06 | 北京奇虎科技有限公司 | 数据全局处理系统和方法 |
US10282371B1 (en) * | 2014-12-02 | 2019-05-07 | Western Digital Technologies, Inc. | Object storage device with probabilistic data structure |
CN104580393B (zh) * | 2014-12-18 | 2017-12-15 | 北京蓝汛通信技术有限责任公司 | 用于服务器集群系统的扩容方法、装置及服务器集群系统 |
US9471237B1 (en) * | 2015-02-04 | 2016-10-18 | Amazon Technologies, Inc. | Memory consumption tracking |
US10296507B2 (en) | 2015-02-12 | 2019-05-21 | Interana, Inc. | Methods for enhancing rapid data analysis |
US10395179B2 (en) | 2015-03-20 | 2019-08-27 | Fuji Xerox Co., Ltd. | Methods and systems of venue inference for social messages |
US10042914B2 (en) * | 2015-06-10 | 2018-08-07 | International Business Machines Corporation | Database index for constructing large scale data level of details |
CN104899312B (zh) * | 2015-06-15 | 2018-07-31 | 国家电网公司 | 一种多层分类数据体系的数据更新方法 |
US10515054B2 (en) * | 2015-06-19 | 2019-12-24 | Hitachi Vantara Corporation | Fast and efficient multi-threaded algorithm for deleting an arbitrarily wide and deep directory tree using limited system resources |
US10649850B1 (en) * | 2015-06-29 | 2020-05-12 | Amazon Technologies, Inc. | Heterogenous media storage and organization in automated data storage systems |
US10318884B2 (en) * | 2015-08-25 | 2019-06-11 | Fuji Xerox Co., Ltd. | Venue link detection for social media messages |
US10747753B2 (en) | 2015-08-28 | 2020-08-18 | Swirlds, Inc. | Methods and apparatus for a distributed database within a network |
US9529923B1 (en) * | 2015-08-28 | 2016-12-27 | Swirlds, Inc. | Methods and apparatus for a distributed database within a network |
US9390154B1 (en) | 2015-08-28 | 2016-07-12 | Swirlds, Inc. | Methods and apparatus for a distributed database within a network |
US10838911B1 (en) | 2015-12-14 | 2020-11-17 | Amazon Technologies, Inc. | Optimization of data request processing for data storage systems |
US11062129B2 (en) * | 2015-12-30 | 2021-07-13 | Veritas Technologies Llc | Systems and methods for enabling search services to highlight documents |
CN106933659B (zh) * | 2015-12-30 | 2020-06-26 | 华为技术有限公司 | 管理进程的方法和装置 |
DK3435271T3 (da) | 2016-03-22 | 2022-01-03 | Assemblogue Inc | Adgangsstyringsmetode, informationsbehandlingsanordning, program og optagemedium |
US11681770B2 (en) | 2016-05-16 | 2023-06-20 | International Business Machines Corporation | Determining whether to process identified uniform resource locators |
TWI625715B (zh) * | 2016-05-31 | 2018-06-01 | 瑞鼎科技股份有限公司 | 顯示驅動裝置及其運作方法 |
US10228995B2 (en) * | 2016-07-28 | 2019-03-12 | Hewlett Packard Enterprise Development Lp | Last writers of datasets in storage array errors |
US10242002B2 (en) | 2016-08-01 | 2019-03-26 | International Business Machines Corporation | Phenomenological semantic distance from latent dirichlet allocations (LDA) classification |
US10229184B2 (en) | 2016-08-01 | 2019-03-12 | International Business Machines Corporation | Phenomenological semantic distance from latent dirichlet allocations (LDA) classification |
US10423387B2 (en) | 2016-08-23 | 2019-09-24 | Interana, Inc. | Methods for highly efficient data sharding |
US10146835B2 (en) | 2016-08-23 | 2018-12-04 | Interana, Inc. | Methods for stratified sampling-based query execution |
CN106294861B (zh) * | 2016-08-23 | 2019-08-09 | 武汉烽火普天信息技术有限公司 | 面向大规模数据的情报系统中文本聚合及展现方法及系统 |
US11567993B1 (en) | 2016-09-26 | 2023-01-31 | Splunk Inc. | Copying buckets from a remote shared storage system to memory associated with a search node for query execution |
US11550847B1 (en) | 2016-09-26 | 2023-01-10 | Splunk Inc. | Hashing bucket identifiers to identify search nodes for efficient query execution |
US11416528B2 (en) | 2016-09-26 | 2022-08-16 | Splunk Inc. | Query acceleration data store |
US11860940B1 (en) | 2016-09-26 | 2024-01-02 | Splunk Inc. | Identifying buckets for query execution using a catalog of buckets |
US10956415B2 (en) | 2016-09-26 | 2021-03-23 | Splunk Inc. | Generating a subquery for an external data system using a configuration file |
US11586627B2 (en) | 2016-09-26 | 2023-02-21 | Splunk Inc. | Partitioning and reducing records at ingest of a worker node |
US11593377B2 (en) | 2016-09-26 | 2023-02-28 | Splunk Inc. | Assigning processing tasks in a data intake and query system |
US11604795B2 (en) | 2016-09-26 | 2023-03-14 | Splunk Inc. | Distributing partial results from an external data system between worker nodes |
US11562023B1 (en) | 2016-09-26 | 2023-01-24 | Splunk Inc. | Merging buckets in a data intake and query system |
US20180089324A1 (en) | 2016-09-26 | 2018-03-29 | Splunk Inc. | Dynamic resource allocation for real-time search |
US11620336B1 (en) | 2016-09-26 | 2023-04-04 | Splunk Inc. | Managing and storing buckets to a remote shared storage system based on a collective bucket size |
US11599541B2 (en) | 2016-09-26 | 2023-03-07 | Splunk Inc. | Determining records generated by a processing task of a query |
US11442935B2 (en) | 2016-09-26 | 2022-09-13 | Splunk Inc. | Determining a record generation estimate of a processing task |
US11874691B1 (en) * | 2016-09-26 | 2024-01-16 | Splunk Inc. | Managing efficient query execution including mapping of buckets to search nodes |
US11663227B2 (en) | 2016-09-26 | 2023-05-30 | Splunk Inc. | Generating a subquery for a distinct data intake and query system |
US10353965B2 (en) | 2016-09-26 | 2019-07-16 | Splunk Inc. | Data fabric service system architecture |
US11580107B2 (en) | 2016-09-26 | 2023-02-14 | Splunk Inc. | Bucket data distribution for exporting data to worker nodes |
US11615104B2 (en) | 2016-09-26 | 2023-03-28 | Splunk Inc. | Subquery generation based on a data ingest estimate of an external data system |
EP4027251A1 (en) | 2016-11-10 | 2022-07-13 | Swirlds, Inc. | Methods and apparatus for a distributed database including anonymous entries |
US20180137124A1 (en) * | 2016-11-15 | 2018-05-17 | Twiggle Ltd. | Translation of a search query into search operators |
CN116820695A (zh) | 2016-12-19 | 2023-09-29 | 海德拉哈希图有限责任公司 | 用于启用事件删除的分布式数据库的方法和设备 |
US10754872B2 (en) * | 2016-12-28 | 2020-08-25 | Palantir Technologies Inc. | Automatically executing tasks and configuring access control lists in a data transformation system |
US11170014B2 (en) * | 2016-12-29 | 2021-11-09 | Google Llc | Method and system for preview of search engine processing |
US10402786B2 (en) | 2016-12-30 | 2019-09-03 | Dropbox, Inc. | Managing projects in a content management system |
US10819810B2 (en) | 2017-01-05 | 2020-10-27 | International Business Machines Corporation | Event affinity detangling with broadcasts rolling over time zones |
US9905315B1 (en) * | 2017-01-24 | 2018-02-27 | Nxp B.V. | Error-resilient memory device with row and/or column folding with redundant resources and repair method thereof |
US10678817B2 (en) * | 2017-02-03 | 2020-06-09 | DataJaguar, Inc | Systems and methods of scalable distributed databases |
US10073888B1 (en) * | 2017-02-27 | 2018-09-11 | Timescacle, Inc. | Adjusting partitioning policies of a database system in view of storage reconfiguration |
US10534652B1 (en) * | 2017-06-29 | 2020-01-14 | Amazon Technologies, Inc. | Efficient movement of virtual nodes during reconfiguration of computing cluster |
US10375037B2 (en) | 2017-07-11 | 2019-08-06 | Swirlds, Inc. | Methods and apparatus for efficiently implementing a distributed database within a network |
US11921672B2 (en) | 2017-07-31 | 2024-03-05 | Splunk Inc. | Query execution at a remote heterogeneous data store of a data fabric service |
US11989194B2 (en) | 2017-07-31 | 2024-05-21 | Splunk Inc. | Addressing memory limits for partition tracking among worker nodes |
US10896182B2 (en) | 2017-09-25 | 2021-01-19 | Splunk Inc. | Multi-partitioning determination for combination operations |
US10726095B1 (en) | 2017-09-26 | 2020-07-28 | Amazon Technologies, Inc. | Network content layout using an intermediary system |
US10664538B1 (en) | 2017-09-26 | 2020-05-26 | Amazon Technologies, Inc. | Data security and data access auditing for network accessible content |
US10585915B2 (en) | 2017-10-25 | 2020-03-10 | International Business Machines Corporation | Database sharding |
CA3076257A1 (en) | 2017-11-01 | 2019-05-09 | Swirlds, Inc. | Methods and apparatus for efficiently implementing a fast-copyable database |
US11334543B1 (en) | 2018-04-30 | 2022-05-17 | Splunk Inc. | Scalable bucket merging for a data intake and query system |
CN110535898B (zh) * | 2018-05-25 | 2022-10-04 | 许继集团有限公司 | 大数据存储中副本存放、补全、节点选择方法及管理系统 |
CN108846129B (zh) * | 2018-07-02 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 存储数据访问方法、装置及存储介质 |
US11023178B2 (en) * | 2018-07-24 | 2021-06-01 | Weka, Io Ltd | Implementing coherency and page cache support for a storage system spread across multiple data centers |
US11463361B2 (en) * | 2018-09-27 | 2022-10-04 | Hewlett Packard Enterprise Development Lp | Rate adaptive transactions |
CN109408509A (zh) * | 2018-10-15 | 2019-03-01 | 北京金山云网络技术有限公司 | 数据存储方法、装置及计算机设备 |
WO2020220216A1 (en) | 2019-04-29 | 2020-11-05 | Splunk Inc. | Search time estimate in data intake and query system |
US11715051B1 (en) | 2019-04-30 | 2023-08-01 | Splunk Inc. | Service provider instance recommendations using machine-learned classifications and reconciliation |
US11475150B2 (en) | 2019-05-22 | 2022-10-18 | Hedera Hashgraph, Llc | Methods and apparatus for implementing state proofs and ledger identifiers in a distributed database |
US11714900B2 (en) * | 2019-09-13 | 2023-08-01 | Jpmorgan Chase Bank, N.A. | System and method for implementing re-run dropped detection tool |
US11144290B2 (en) * | 2019-09-13 | 2021-10-12 | Huawei Technologies Co., Ltd. | Method and apparatus for enabling autonomous acceleration of dataflow AI applications |
US11494380B2 (en) | 2019-10-18 | 2022-11-08 | Splunk Inc. | Management of distributed computing framework components in a data fabric service system |
CN110955710B (zh) * | 2019-11-26 | 2023-12-26 | 杭州数梦工场科技有限公司 | 一种数据交换作业中脏数据的处理方法及装置 |
US11922222B1 (en) | 2020-01-30 | 2024-03-05 | Splunk Inc. | Generating a modified component for a data intake and query system using an isolated execution environment image |
US11256713B2 (en) * | 2020-04-27 | 2022-02-22 | International Business Machines Corporation | Virtual transaction queues for database replication |
KR102202792B1 (ko) * | 2020-08-06 | 2021-01-15 | (주)시큐레이어 | 클러스터 기반 처리 시스템을 이용해 동종 및 이기종 데이터 소스에 대해 멀티 캐싱을 수행하는 방법 및 장치 |
CN116529724B (zh) * | 2020-10-14 | 2024-04-12 | 甲骨文国际公司 | 在无共享分布式数据库中快速检测和修复故障的系统和方法 |
US11704313B1 (en) | 2020-10-19 | 2023-07-18 | Splunk Inc. | Parallel branch operation using intermediary nodes |
US11487668B2 (en) * | 2021-04-06 | 2022-11-01 | Thoughtspot, Inc. | Approximate unique count |
CN113391948B (zh) * | 2021-06-29 | 2022-10-21 | 西安电子科技大学 | 一种折叠式可扩展分布式存储编码及修复、扩展方法 |
US20230023255A1 (en) * | 2021-07-23 | 2023-01-26 | Here Global B.V. | Controlled ingestion of map update data |
CN113839814B (zh) * | 2021-09-22 | 2022-02-18 | 银河麒麟软件(长沙)有限公司 | 去中心化的Kubernetes集群联邦实现方法及系统 |
CN114089917A (zh) * | 2021-11-19 | 2022-02-25 | 中国电信集团系统集成有限责任公司 | 分布式对象存储集群及其扩容方法、装置及电子设备 |
US11489725B1 (en) * | 2022-04-24 | 2022-11-01 | Uab 360 It | Optimized updating of a client application |
Family Cites Families (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4972349A (en) | 1986-12-04 | 1990-11-20 | Kleinberger Paul J | Information retrieval system and method |
US5446855A (en) * | 1994-02-07 | 1995-08-29 | Buslogic, Inc. | System and method for disk array data transfer |
US5835757A (en) * | 1994-03-30 | 1998-11-10 | Siemens Telecom Networks | Distributed database management system for servicing application requests in a telecommunications switching system |
WO1997004391A1 (en) * | 1995-07-20 | 1997-02-06 | Novell, Inc. | Transaction log management in a disconnectable computer and network |
US5696961A (en) | 1996-05-22 | 1997-12-09 | Wang Laboratories, Inc. | Multiple database access server for application programs |
US6295541B1 (en) * | 1997-12-16 | 2001-09-25 | Starfish Software, Inc. | System and methods for synchronizing two or more datasets |
US6411967B1 (en) * | 1999-06-18 | 2002-06-25 | Reliable Network Solutions | Distributed processing system with replicated management information base |
JP4206586B2 (ja) | 1999-11-12 | 2009-01-14 | 株式会社日立製作所 | データベース管理方法および装置並びにデータベース管理プログラムを記録した記憶媒体 |
IL133588A0 (en) | 1999-12-19 | 2001-04-30 | Infobit Ltd | Apparatus and method for retrieval of documents |
US20040073617A1 (en) * | 2000-06-19 | 2004-04-15 | Milliken Walter Clark | Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail |
US6954778B2 (en) | 2000-07-12 | 2005-10-11 | Microsoft Corporation | System and method for accessing directory service via an HTTP URL |
US6925476B1 (en) * | 2000-08-17 | 2005-08-02 | Fusionone, Inc. | Updating application data including adding first change log to aggreagate change log comprising summary of changes |
US6954765B2 (en) * | 2000-12-30 | 2005-10-11 | Intel Corporation | Updating a file in a fragmented file system |
US7509322B2 (en) | 2001-01-11 | 2009-03-24 | F5 Networks, Inc. | Aggregated lock management for locking aggregated files in a switched file system |
US20020133720A1 (en) | 2001-03-16 | 2002-09-19 | Clickgarden | Method for filtering the transmission of data on a computer network to Web domains |
US7398271B1 (en) * | 2001-04-16 | 2008-07-08 | Yahoo! Inc. | Using network traffic logs for search enhancement |
US7003514B2 (en) * | 2001-09-13 | 2006-02-21 | International Business Machines Corporation | Method and apparatus for restricting a fan-out search in a peer-to-peer network based on accessibility of nodes |
US20030130994A1 (en) * | 2001-09-26 | 2003-07-10 | Contentscan, Inc. | Method, system, and software for retrieving information based on front and back matter data |
US6978278B2 (en) | 2002-01-18 | 2005-12-20 | Bea Systems, Inc. | System and method for heterogeneous caching |
US7010526B2 (en) | 2002-05-08 | 2006-03-07 | International Business Machines Corporation | Knowledge-based data mining system |
US20030229675A1 (en) * | 2002-06-06 | 2003-12-11 | International Business Machines Corporation | Effective garbage collection from a Web document distribution cache at a World Wide Web source site |
US7188094B2 (en) * | 2002-07-08 | 2007-03-06 | Sun Microsystems, Inc. | Indexing virtual attributes in a directory server system |
EP1396797A1 (en) * | 2002-09-04 | 2004-03-10 | Sony International (Europe) GmbH | Database query set-up tool and method for setting up a query |
EP1547009A1 (en) * | 2002-09-20 | 2005-06-29 | Board Of Regents The University Of Texas System | Computer program products, systems and methods for information discovery and relational analyses |
US8311980B2 (en) * | 2002-12-09 | 2012-11-13 | Hewlett-Packard Development Company, L.P. | Namespace consistency for a wide-area file system |
US7111000B2 (en) * | 2003-01-06 | 2006-09-19 | Microsoft Corporation | Retrieval of structured documents |
US20040153481A1 (en) | 2003-01-21 | 2004-08-05 | Srikrishna Talluri | Method and system for effective utilization of data storage capacity |
US7406502B1 (en) * | 2003-02-20 | 2008-07-29 | Sonicwall, Inc. | Method and system for classifying a message based on canonical equivalent of acceptable items included in the message |
EP1611534A4 (en) | 2003-04-04 | 2010-02-03 | Yahoo Inc | SYSTEM FOR PRODUCING SEARCH RESULTS, INCLUDING SEARCH FOR SUB-DOMAIN NOTES AND PROVIDING SPONSORED RESULTS BY SUB-DOMAIN |
WO2004097624A1 (en) * | 2003-04-24 | 2004-11-11 | Neopath Networks, Inc. | Large file support for a network file server |
US7502779B2 (en) * | 2003-06-05 | 2009-03-10 | International Business Machines Corporation | Semantics-based searching for information in a distributed data processing system |
CA2442190A1 (en) * | 2003-09-24 | 2005-03-24 | Enquiro Search Solutions Inc. | Dynamic web page referrer tracking and ranking |
US7225208B2 (en) | 2003-09-30 | 2007-05-29 | Iron Mountain Incorporated | Systems and methods for backing up data files |
US7752210B2 (en) * | 2003-11-13 | 2010-07-06 | Yahoo! Inc. | Method of determining geographical location from IP address information |
US8135683B2 (en) * | 2003-12-16 | 2012-03-13 | International Business Machines Corporation | Method and apparatus for data redundancy elimination at the block level |
US8005850B2 (en) * | 2004-03-15 | 2011-08-23 | Yahoo! Inc. | Search systems and methods with integration of user annotations |
CA2561130C (en) * | 2004-03-26 | 2018-01-30 | Absolute Software Corporation | Persistent servicing agent |
US7397766B2 (en) * | 2004-03-31 | 2008-07-08 | Lucent Technologies Inc. | High-speed traffic measurement and analysis methodologies and protocols |
US8219531B2 (en) | 2004-04-05 | 2012-07-10 | George Eagan | Knowledge archival and recollection systems and methods |
US8788528B2 (en) * | 2004-07-13 | 2014-07-22 | Blue Coat Systems, Inc. | Filtering cached content based on embedded URLs |
WO2006011819A1 (en) | 2004-07-30 | 2006-02-02 | Eurekster, Inc. | Adaptive search engine |
US7490082B2 (en) * | 2004-09-16 | 2009-02-10 | International Business Machines Corporation | System and method for searching internet domains |
US7464103B2 (en) * | 2004-10-29 | 2008-12-09 | Microsoft Corporation | Multi-level nested open hashed data stores |
US7469241B2 (en) * | 2004-11-30 | 2008-12-23 | Oracle International Corporation | Efficient data aggregation operations using hash tables |
GB0426847D0 (en) | 2004-12-08 | 2005-01-12 | Ibm | Method and system of committing operations of a synchronised transaction |
US7698331B2 (en) | 2005-01-18 | 2010-04-13 | Yahoo! Inc. | Matching and ranking of sponsored search listings incorporating web search technology and web content |
US20060184718A1 (en) * | 2005-02-16 | 2006-08-17 | Sinclair Alan W | Direct file data programming and deletion in flash memories |
US8135728B2 (en) | 2005-03-24 | 2012-03-13 | Microsoft Corporation | Web document keyword and phrase extraction |
US7765186B1 (en) | 2005-04-13 | 2010-07-27 | Progress Software Corporation | Update-anywhere replication of distributed systems |
US7711916B2 (en) | 2005-05-11 | 2010-05-04 | Oracle International Corporation | Storing information on storage devices having different performance capabilities with a storage system |
US7822751B2 (en) * | 2005-05-27 | 2010-10-26 | Google Inc. | Scoring local search results based on location prominence |
US7984058B2 (en) | 2005-06-02 | 2011-07-19 | Genius.Com Incorporated | Database query construction and handling |
JP2006338421A (ja) * | 2005-06-03 | 2006-12-14 | Fujitsu Ltd | リモートデータベース操作プログラム、リモートデータベース操作方法、およびリモートデータベース操作装置 |
US7428524B2 (en) | 2005-08-05 | 2008-09-23 | Google Inc. | Large scale data storage in sparse tables |
US20070078835A1 (en) * | 2005-09-30 | 2007-04-05 | Boloto Group, Inc. | Computer system, method and software for creating and providing an individualized web-based browser interface for wrappering search results and presenting advertising to a user based upon at least one profile or user attribute |
US8392400B1 (en) | 2005-12-29 | 2013-03-05 | Amazon Technologies, Inc. | Method and apparatus for stress management in a searchable data service |
US7801912B2 (en) * | 2005-12-29 | 2010-09-21 | Amazon Technologies, Inc. | Method and apparatus for a searchable data service |
US7757045B2 (en) | 2006-03-13 | 2010-07-13 | Intel Corporation | Synchronizing recency information in an inclusive cache hierarchy |
US7475069B2 (en) | 2006-03-29 | 2009-01-06 | International Business Machines Corporation | System and method for prioritizing websites during a webcrawling process |
US8307286B2 (en) * | 2006-05-07 | 2012-11-06 | Wellcomemat Llc | Methods and systems for online video-based property commerce |
US20080024520A1 (en) * | 2006-07-26 | 2008-01-31 | Rudd Michael L | Digital image file transmission |
JP2008052413A (ja) * | 2006-08-23 | 2008-03-06 | Hitachi Ltd | 販売計画の評価支援システム |
US7788243B2 (en) | 2006-09-08 | 2010-08-31 | Sybase, Inc. | System and methods for optimizing data transfer among various resources in a distributed environment |
EP2067104A1 (en) * | 2006-09-28 | 2009-06-10 | Xeround Systems Ltd. | Apparatus and method for a distributed storage global database |
US8041730B1 (en) * | 2006-10-24 | 2011-10-18 | Google Inc. | Using geographic data to identify correlated geographic synonyms |
US7831772B2 (en) | 2006-12-12 | 2010-11-09 | Sybase, Inc. | System and methodology providing multiple heterogeneous buffer caches |
US8150870B1 (en) | 2006-12-22 | 2012-04-03 | Amazon Technologies, Inc. | Scalable partitioning in a multilayered data service framework |
US8150800B2 (en) | 2007-03-28 | 2012-04-03 | Netapp, Inc. | Advanced clock synchronization technique |
US7809610B2 (en) * | 2007-04-09 | 2010-10-05 | Platformation, Inc. | Methods and apparatus for freshness and completeness of information |
US7743013B2 (en) * | 2007-06-11 | 2010-06-22 | Microsoft Corporation | Data partitioning via bucketing bloom filters |
US20090006347A1 (en) * | 2007-06-29 | 2009-01-01 | Lucent Technologies Inc. | Method and apparatus for conditional search operators |
US9141435B2 (en) | 2007-07-30 | 2015-09-22 | Sybase, Inc. | System and methodology providing workload management in database cluster |
US7970872B2 (en) | 2007-10-01 | 2011-06-28 | Accenture Global Services Limited | Infrastructure for parallel programming of clusters of machines |
US9407693B2 (en) * | 2007-10-03 | 2016-08-02 | Microsoft Technology Licensing, Llc | Network routing of endpoints to content based on content swarms |
US20090113160A1 (en) | 2007-10-25 | 2009-04-30 | Disk Trix Incorporated, A South Carolina Corporation | Method and System for Reorganizing a Storage Device |
US20090271283A1 (en) | 2008-02-13 | 2009-10-29 | Catholic Content, Llc | Network Media Distribution |
WO2009105735A2 (en) * | 2008-02-21 | 2009-08-27 | Globalenglish Corporation | Web-based tool for collaborative, social learning |
US20100070474A1 (en) * | 2008-09-12 | 2010-03-18 | Lad Kamleshkumar K | Transferring or migrating portions of data objects, such as block-level data migration or chunk-based data migration |
US8818992B2 (en) * | 2008-09-12 | 2014-08-26 | Nokia Corporation | Method, system, and apparatus for arranging content search results |
US8239359B2 (en) | 2008-09-23 | 2012-08-07 | Disney Enterprises, Inc. | System and method for visual search in a video media player |
US9449078B2 (en) | 2008-10-01 | 2016-09-20 | Microsoft Technology Licensing, Llc | Evaluating the ranking quality of a ranked list |
US8515950B2 (en) | 2008-10-01 | 2013-08-20 | Microsoft Corporation | Combining log-based rankers and document-based rankers for searching |
US8041733B2 (en) | 2008-10-14 | 2011-10-18 | Yahoo! Inc. | System for automatically categorizing queries |
CN101388044A (zh) * | 2008-11-05 | 2009-03-18 | 北京启明星辰信息技术股份有限公司 | 匹配规则包含或运算符的并行多模式匹配的方法及系统 |
US9386089B2 (en) | 2008-11-11 | 2016-07-05 | Nbcuniversal Media, Llc | Early detection of high volume peer-to-peer swarms |
US20100153371A1 (en) | 2008-12-16 | 2010-06-17 | Yahoo! Inc. | Method and apparatus for blending search results |
JP4670968B2 (ja) * | 2009-01-22 | 2011-04-13 | 富士ゼロックス株式会社 | 情報管理プログラム及び情報管理システム |
US9639609B2 (en) | 2009-02-24 | 2017-05-02 | Microsoft Technology Licensing, Llc | Enterprise search method and system |
US8078825B2 (en) | 2009-03-11 | 2011-12-13 | Oracle America, Inc. | Composite hash and list partitioning of database tables |
US10152504B2 (en) * | 2009-03-11 | 2018-12-11 | Actian Netherlands B.V. | Column-store database architecture utilizing positional delta tree update system and methods |
EP2665002A3 (en) | 2009-06-19 | 2014-04-02 | Blekko, Inc. | A method of counting unique items in a database system |
US8918365B2 (en) | 2009-06-19 | 2014-12-23 | Blekko, Inc. | Dedicating disks to reading or writing |
-
2010
- 2010-06-21 EP EP13180595.4A patent/EP2665002A3/en not_active Withdrawn
- 2010-06-21 EP EP10790334.6A patent/EP2443574A4/en not_active Withdrawn
- 2010-06-21 CN CN201310356876.5A patent/CN103488680B/zh active Active
- 2010-06-21 CN CN201080037040.3A patent/CN102667761B/zh active Active
- 2010-06-21 CN CN201310357201.2A patent/CN103488681A/zh active Pending
- 2010-06-21 EP EP13180596.2A patent/EP2665003A1/en not_active Withdrawn
- 2010-06-21 WO PCT/US2010/039395 patent/WO2010148415A1/en active Application Filing
- 2010-06-21 RU RU2012101682/08A patent/RU2012101682A/ru not_active Application Discontinuation
-
2011
- 2011-12-16 US US13/328,464 patent/US9298782B2/en active Active
- 2011-12-16 US US13/328,682 patent/US10437808B2/en not_active Expired - Fee Related
- 2011-12-16 US US13/328,750 patent/US11055270B2/en active Active
- 2011-12-16 US US13/328,648 patent/US9607085B2/en not_active Expired - Fee Related
- 2011-12-16 US US13/328,500 patent/US10877950B2/en active Active
- 2011-12-16 US US13/328,547 patent/US8666991B2/en not_active Expired - Fee Related
-
2013
- 2013-11-13 RU RU2013150523/08A patent/RU2013150523A/ru not_active Application Discontinuation
- 2013-11-13 RU RU2013150524/08A patent/RU2013150524A/ru not_active Application Discontinuation
-
2016
- 2016-03-07 US US15/063,376 patent/US10095725B2/en active Active
- 2016-08-25 US US15/247,749 patent/US10078650B2/en active Active
-
2018
- 2018-07-12 US US16/034,193 patent/US10997145B2/en active Active
- 2018-09-10 US US16/127,059 patent/US11080256B2/en active Active
-
2019
- 2019-07-31 US US16/528,445 patent/US11176114B2/en active Active
-
2021
- 2021-05-12 US US17/318,725 patent/US11487735B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2699400C2 (ru) * | 2015-02-11 | 2019-09-05 | Бэст Коллект, С.А. Де К.В. | Автоматизируемый интеллектуальный сбор и сверка данных |
US10685003B2 (en) | 2016-06-29 | 2020-06-16 | International Business Machines Corporation | Building and using an atomic key with partial key searching capability |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2012101682A (ru) | Масштабируемая кластерная база данных | |
JP5661104B2 (ja) | 検索エンジンインデクシング及びインデックスを使用する検索のための方法とシステム | |
US7895325B2 (en) | Server architecture and methods for storing and serving event data | |
US20180253484A1 (en) | Computer Implemented Method for Dynamic Sharding | |
US20180285167A1 (en) | Database management system providing local balancing within individual cluster node | |
JP2012053903A (ja) | 分散型検索方法、アーキテクチャ、システム、およびソフトウェア | |
WO2020087082A1 (en) | Trace and span sampling and analysis for instrumented software | |
US9015414B2 (en) | Load balancing based upon data usage | |
JP6607963B2 (ja) | 集計されたメトリクスの測定値のデータストア | |
CN112579552A (zh) | 日志存储及调用方法、装置及系统 | |
CN113835613B (zh) | 一种文件读取方法、装置、电子设备和存储介质 | |
AU2013206478B2 (en) | Distributed search methods, architectures, systems, and software | |
CN114461646A (zh) | 一种运行指标数据的处理方法及系统 | |
CN117354141A (zh) | 应用服务管理方法、设备和计算机可读存储介质 | |
JP2011040102A (ja) | 割当システム、割当装置、及び、割当プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA94 | Acknowledgement of application withdrawn (non-payment of fees) |
Effective date: 20160801 |