RU2236699C1 - Способ поиска и выборки информации с повышенной релевантностью - Google Patents

Способ поиска и выборки информации с повышенной релевантностью Download PDF

Info

Publication number
RU2236699C1
RU2236699C1 RU2003105262/09A RU2003105262A RU2236699C1 RU 2236699 C1 RU2236699 C1 RU 2236699C1 RU 2003105262/09 A RU2003105262/09 A RU 2003105262/09A RU 2003105262 A RU2003105262 A RU 2003105262A RU 2236699 C1 RU2236699 C1 RU 2236699C1
Authority
RU
Russia
Prior art keywords
documents
rating
document
sorted
database
Prior art date
Application number
RU2003105262/09A
Other languages
English (en)
Other versions
RU2003105262A (ru
Inventor
А.В. Баранов (RU)
А.В. Баранов
Original Assignee
Открытое акционерное общество "Телепортал. Ру"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Открытое акционерное общество "Телепортал. Ру" filed Critical Открытое акционерное общество "Телепортал. Ру"
Priority to RU2003105262/09A priority Critical patent/RU2236699C1/ru
Publication of RU2003105262A publication Critical patent/RU2003105262A/ru
Application granted granted Critical
Publication of RU2236699C1 publication Critical patent/RU2236699C1/ru

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Изобретение относится к средствам поиска и идентификации документов по их описаниям, находящимся в различных базах данных и информационных ресурсах с различными стандартами формирования документов. Технический результат заключается в сокращение объема информации, выводимой на дисплей пользовательского терминала по запросу пользователя, и уменьшение интеллектуальных трудозатрат на анализ полученной информации и принятия решения. Способ заключается в том, что проводят сортировку по отдельным папкам всех однородных документов из различных баз данных, определяют рейтинги каждого документа внутри папки, затем находят число совпадений признаков отдельных документов в различных папках и определяют окончательный рейтинг каждого документа с учетом числа пересечений, сортируют документы в соответствии с этим рейтингом и направляют эти документы на компьютер пользователя. 5 з.п.ф-лы, 1 ил., 3 табл.

Description

Заявленное изобретение относится к средствам поиска и идентификации документов по их описаниям, находящимся в различных базах данных и информационных ресурсах с различными стандартами формирования документов.
Известны способы идентификации документов по их описаниям, заключающиеся в преобразовании текстов естественного языка в заданных областях знаний в сигналы, пригодные для машинной обработки, формировании запроса в виде выборки ключевых слов и сравнении выборки ключевых слов запроса с тезаурусами текстов, хранящихся в базе данных (см., например, полезную модель RU 8819, патенты РФ №2107942, патент США №6460034, поисковая база данных Яндекс).
Недостатком известных способов является ограниченность одной базой данных с известным стандартом формирования.
Наиболее близким аналогом, принятым за прототип, является способ обработки запросов в системе поиска и выборки информации, описанный в патенте RU 2167450, в соответствии с которым: 1) сохраняют множество объектов в хранилище документов, в котором каждый объект документа определен признаками, заключенными в документе, так что упомянутые объекты, хранимые в документе, определяют общее содержание данного документа; 2) обрабатывают запрос, который включает по меньшей мере один элемент запроса, для выбора по меньшей мере одного документа, релевантного по меньшей мере к упомянутому одному элементу запроса; 3) идентифицируют из множества объектов по меньшей мере один документ; 4) представляют пользователю идентифицированный по меньшей мере один документ, при этом сходство документов оценивают различными способами ранжирования.
Недостатком прототипа является отсутствие оценки объектов и документов по их значимости применительно к заданному элементу запроса, т.е. оценки релевантности.
Равновероятность всех выбранных объектов и документов приводит к росту объема отобранной информации и росту информационного шума, что в конечном счете увеличивает затраты интеллектуального труда на обработку отобранной информации пользователем.
Кроме того, в случае работы с множеством хранилищ документов с различными стандартами формирования документов идентификация объектов становится трудно выполнимой.
Техническим результатом заявленного изобретения является сокращение объема информации, выводимой на дисплей пользовательского терминала по запросу пользователя, и уменьшение интеллектуальных трудозатрат на анализ полученной информации и принятие решения.
Технический результат достигается за счет того, что способ поиска и выборки информации из баз данных, включающий формирование пользователем на своем рабочем месте по меньшей мере одного поискового запроса, передачу сформированного пользователем запроса в поисковую систему, обработку поисковой системой сформированных пользователем поисковых запросов путем выбора документов из базы данных, дополнительно включает следующие операции: поисковая система сортирует упомянутые выбранные документы по тематикам и формирует папки, каждая из которых содержит упомянутые документы, отсортированные по одной тематике, для каждого отсортированного документа выделяют признаки, характеризующие этот документ, внутри каждой папки поисковая система определяет рейтинг каждого признака, содержащегося в каждом отсортированном документе, после чего поисковая система определяет число совпадений признаков отдельных отсортированных документов одной папки с признаками других документов, содержащихся в других папках, определяет окончательный рейтинг каждого отсортированного документа с учетом числа совпадений признаков и с учетом весового коэффициента базы данных, после чего поисковая система снова сортирует упомянутые отсортированные документы с учетом окончательного рейтинга и направляет отсортированные в соответствии с окончательным рейтингом документы на рабочее место пользователя.
В частном варианте выполнения заявленного изобретения окончательный рейтинг упомянутого отсортированного (i-го) документа рассчитывают по формуле:
Figure 00000002
где Xi,j - рейтинг i-го документа в j-ой базе данных; аi - рейтинг j-ой базы данных; li - количество рейтингов i-го документа не равных нулю из всех баз данных; сi - количество совпадений признаков отдельных документов в различных папках.
Еще в одном частном варианте выполнения рейтинг j-ой базы данных варьируется в диапазоне от 0,1 до 1,0.
В другом частном варианте выполнения упомянутыми признаками документов являются авторы, организации, новости, события, все виды научно-технической литературы и патентной документации.
Еще в одном частном варианте выполнения видами научно-технической литературы являются статьи в периодических изданиях, монографии, сборники работ, труды конференций и других научных собраний.
В другом частном варианте выполнения упомянутый окончательный рейтинг документов устанавливают с помощью контрольного тестирования.
Сущность заявленного изобретения поясняется чертежом, на котором представлена блок-схема поисковой системы, реализующей заявленный способ.
Заявленный способ включает следующую последовательность операций:
1) формирование пользователем на своем рабочем месте, представляющем собой любой персональный компьютер, имеющий доступ к различным базам данных, по меньшей мере одного поискового запроса;
2) передачу сформированного пользователем запроса в поисковую систему;
3) обработку поисковой системой сформированных пользователем поисковых запросов путем выбора документов из базах данных;
4) поисковая система сортирует упомянутые выбранные документы по тематикам и формирует папки, каждая из которых содержит упомянутые документы, отсортированные по одной тематике;
5) для каждого отсортированного документа выделяют признаки, характеризующие этот документ;
6) внутри каждой папки поисковая система определяет рейтинг каждого признака, содержащегося в каждом отсортированном документе;
7) после чего поисковая система определяет число совпадений признаков отдельных отсортированных документов одной папки с признаками других документов, содержащихся в других папках;
8) определяет окончательный рейтинг каждого отсортированного документа с учетом числа совпадений признаков и с учетом весового коэффициента базы данных;
9) после чего поисковая система снова сортирует упомянутые отсортированные документы с учетом окончательного рейтинга и направляет отсортированные в соответствии с окончательным рейтингом документы на рабочее место пользователя.
Предложенный способ реализуется поисковой системой, которая показана на чертеже.
Система состоит из следующих элементов: рабочее место пользователя (терминал компьютера) 1, блок "Преобразователь запросов" 2, базы данных "Стандарты баз данных" 3, базы данных "Поисковые информационные ресурсы" 4, блок "Интегратор документов" 5, блок "Единое хранилище" 6, блок "Сортировка документов" 7, блок "Папки" 8, блок "Восстановления структуры предметной области" 9, блок "Объекты" 10, блок "Восстановления структуры" 11, блок "Оценки пересечений" 12, блок "Рейтинг" 13, блок "Блок формирования результатов" 14, блок "Формирования рейтингов баз данных" 15.
Рабочее место пользователя (терминал компьютера) 1, как уже было указано выше, представляет собой любой персональный компьютер, например, компании IBM, состоящий из системного блока, к которому подключен монитор, клавиатура и манипулятор типа “мышь”.
Терминал компьютера 1 должен иметь доступ к базам данных 3, 4, которые могут быть как удаленными, так и локальными. Доступ к базам данных можно осуществить посредством подключения терминала 1 к сети глобальной сети Интернет или локальной сети, например, Intranet.
Базы данных 4 могут быть как однородными, каждая из которых содержит документы только по одной тематике, например патентная база данных, так и неоднородными, которые содержат документы по разным тематикам, например Яндекс.
База данных "Стандарты баз данных" 3, блоки "Единое хранилище" 6, блок "Папки" 8, блок "Объекты" 10 представляют собой базы данных, хранящиеся в памяти ЭВМ, например, на жестком диске.
Блоки "Преобразователь запросов" 2, "Интегратор документов" 5, "Сортировка документов" 7, "Восстановления структуры предметной области" 9, "Восстановления структуры" 11, "Оценки пересечений" 12, "Рейтинг" 13, "Блок формирования результатов" 14, блок "Формирования рейтингов баз данных" 15 представляют собой обычные 32-битовые машины (Linux, Solaris, FreeBSD, Win32).
Указанное устройство поиска информации работает следующим образом.
Пользователь вводит с терминала компьютера 1 запрос в виде ключевого слова или набора ключевых слов, например "Экологический мониторинг".
Сформированный запрос поступает в блок "Преобразователь запросов" 2, который обрабатывает полученный запрос, как, например, это выполняет поисковая система Fast, реализующая известную логику прямого поиска. Поисковая система Fast разработана и поставляется на рынок норвежской компанией "Fast Search & Transfer ASA".
Далее блок 2 обращается к базе данных "Стандарты баз данных" 3. В блоке 3 хранится информация о структуре и адресах поисковых информационных ресурсов (поисковых машин Интернета и информационных баз данных). Например, формат обращения через Интернет к базе данных патентов США USPTO имеет следующий вид:
"http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HI-TOFF&p=1&u=%2Fnetahtml%2Fsearch-bool.html&r=0&f=S&l=50&TERM1="ключевое cлово"&FIELD1=&col=AND&TERM2=&FIELD2=&d=ptxt"
Формат обращения на языке SQL по локальной сети к локальным, корпоративным и другим базам данных, хранящимся на жестком диске или на CD-ROM, имеет следующий стандартный вид:
"DECLARE @FIELD1 VARCHAR(100),@FIELD2
VARCHAR(100),@FIELD3 VARCHAR(100)
SET @FIELD1='%'
SET @FIELD2='%'
SET @FIELD3='%'
SELECT*FROM<TABLE_NAME>
WHERE<FIELD1>LIKE @FIELD1
AND<FIELD2> LIKE @FIELD2
AND<FIELD3> LIKE @FIELD3"
В соответствии с приведенными примерами блок "Преобразователь запросов" 2 формирует различные по своей структуре “вторичные запросы”, которые направляются последовательно в соответствующие информационные ресурсы 4, 4’ в порядке убывания рейтинга баз данных.
Например, если пользователь вводит в систему ключевое слово "Garbage" (мусор), то вторичные запросы могут выглядеть следующим образом:
к базе данных USPTO
"http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=l&u=%2Fnetahtml%2Fsearch-bool.html&r=0&f=S&l=50&TERM1="garbage"&FIELD1=&col=AND&TERM2=&FIELD2=&d=ptxt";
к базе данных "COMPENDEX"
"DECLARE @FIELD1 VARCHAR(100),@FIELD2
VARCHAR(100),@FIELD3 VARCHAR(100)
SET @FIELD1='GARBAGE'
SET @FIELD2='GARBAGE'
SET @FIELD3='GARBAGE'
SELECT*FROM COMPENDEX
WHERE TITLE LIKE @FIELD1
AND CONFERENCE TITLE LIKE @FIELD2
AND ABSTRACT LIKE @FIELD3"
По результатам вторичных запросов из информационных ресурсов 4 в блоке "Интегратор документов" 5 собираются отобранные в информационных ресурсах 4 записи, состоящие из названия, электронного адреса, краткого описания и других данных, определяемых стандартами информационных ресурсов.
Примеры записей, полученных из информационных баз данных:
Из базы данных USPTO:
Inventors: Lieberman; Noah (Boulder, CO)
Assignee: Sun Microsystems, Inc. (Santa Clara, CA)
Appl No: 39101
Current U.S. Class: 709/225; 709/229; 709/2
Intern’l Class: G 06 F 015/173; G 06 F 015/16
Abstract: A content provider manager has been develop for use in an information services such as a portal or desktop application to provide for "pluggable" content that may be modified simply through....
Из базы данных COMPENDEX:
DIALOG №04265680 EI Monthly №EIP95102889590
Title: Cache performance of fast-allocating programs
Author: Goncalves, Marcelo J.R.; Appel, Andrew W.
Corporate Source: Princeton Univ
Conference Title: Conference Record of Conference on Functional Programming
Languages and Computer Architecture
Conference Location: La Jolla, CA, USA
Conference Sponsor: ACM SIGPLAN; ACM SIGARCH; IFIP
Source: Conf Rec Conf Funct Program Lang Comput Archit 1995. ACM. p. 293-305
Publication Year: 1995
Language: English
Conference Number: 43744
Document Type: CA; (Conference Article) Treatment Code: X; (Experimental)
Abstract: We study the cache performance of a set of ML programs, compiled by the Standard ML of New Jersey compiler. We find that more than half of the reads are for objects that have just been allocated...
Descriptors: *Program compilers; Buffer storage; Storage allocation (computer); Computer software; Computer hardware; Performance; Computer architecture
Identifiers: Cache performance; New Jersey compiler; Garbage collection frequency; Runtime systems"
"Интегратор документов" 5 объединяет все отобранные документы в единый массив, который размещается в блоке "Единое хранилище" 6 с сохранением структуры каждого документа.
На этой стадии работы поисковой системы указанный единый массив отобранных документов 6 обладает избыточностью информационных материалов, так как один и тот же документ мог быть отобран в различных поисковых ресурсах или базах данных и неоднократно повторяется в едином массиве 6.
Далее единый массив документов из блока "Единого хранилища" 6 направляется в блок "Сортировки документов" 7, где на основании формальных данных из блока "Стандарты баз данных" 3 производится сортировка отобранных материалов по тематикам и формируются папки, каждая из которых содержит отобранные материалы, отсортированные по одной тематике.
Каждая папка соответствует одной тематике, представляющей реальный объект предметной области: автор, организация, событие, новость, статья, книга и т.д. (см. блок 8 на чертеже).
Отсортированные по папкам блоком 7 материалы помещаются в блок "Папки" 8.
Далее материалы из каждой папки блока "Папки" 8 поочередно передаются в блок "Восстановления структуры предметной области" 9, который предназначен для формирования списков объектов и сортировки списков на основании определения веса каждого объекта. Блок 9 работает следующим образом.
Материалы одной из папок поступают в блок 9 из блока 8. Одновременно в блок 9 поступает информация из блока 3 о структуре документов. В результате сопоставления информации из блока 3 и блока 9, из анализируемых материалов извлекается информация об объекте и его атрибутах, т.е. выделяются признаки документа. Эти атрибуты включают в себя: название объекта, адреса документов, связанных с объектом, а также статистику о порядковых номерах адресов документов в списках поисковых информационных ресурсов.
После обработки всего массива одной папки устанавливается предварительный рейтинг каждого объекта. В таблице 1 приведен пример рейтинга документов в одной папке.
Figure 00000003
Списки объектов и их атрибутов хранятся в блоке "Объекты" 10. После завершения работы с одной папкой начинается обработка блоком 9 следующей папки из блока 8. Обработка папок производится последовательно пока не будет обработана последняя папка.
Далее блок "Восстановления структуры" 11 получает списки объектов из блока 10 и присоединяет к этим объектам соответствующие документы, хранящиеся в блоке 6.
Таким образом, в блоке 11 производится предварительное определение релевантности первоначально отобранных в блоке 5 документов.
Далее в блоке "Оценки пересечений" 12 проводится анализ существующих пересечений между отдельными папками. Так, например, два автора L.Cotton и J.Smith (табл. 2) ссылаются в своих статьях на материалы одной и той же конференции (Intl.Conf. of Building Official). Данная конференция находится в списке конференций (табл. 3) под номером 4. Общее число пересечений суммируется по каждому из объектов и учитывается в окончательном расчете рейтинга расчете рейтинга объектов.
Figure 00000004
Figure 00000005
Блок "Рейтинг" 13 устанавливает окончательный рейтинг каждого объекта, рассчитывая его по формуле:
Figure 00000006
где хi,j - рейтинг i-го документа в j-ой базе данных; aj - рейтинг j-ой базы данных; li - количество рейтингов i-го документа не равных нулю из всех возможных баз данных; сi - количество совпадений признаков отдельных документов в различных папках. Рейтинг j-ой базы данных aj варьируется в диапазоне от 0,1 до 1,0.
Отсортированные в соответствии с рейтингом документы сохраняются в блоке "Блок формирования результатов" 14. Из блока 14 документы в окончательном виде представляются пользователю на дисплее его компьютера 1.
Блок "Формирования рейтингов баз данных" 15 на основе информации из блока 14 устанавливает рейтинг использованных баз данных. Рейтинг базы данных тем выше, чем больше наиболее релевантных документов отобрано из этой базы данных. Окончательный рейтинг баз данных устанавливают с помощью контрольного тестирования, которое основано на измерении времени отклика базы данных на запрос. Чем больше время отклика, тем ниже рейтинг базы данных.
Применение предложенного способа позволяет сократить машинное время поиска, повысить релевантность выборки документов запросу, снизить затраты интеллектуального труда при анализе выборки документов.

Claims (6)

1. Способ поиска и выборки информации из баз данных, включающий формирование пользователем на своем рабочем месте по меньшей мере одного поискового запроса, передачу сформированного пользователем запроса в поисковую систему, обработку поисковой системой сформированных пользователем поисковых запросов путем выбора документов из баз данных, отличающийся тем, что поисковая система сортирует упомянутые выбранные документы по тематикам и формирует папки, каждая из которых содержит упомянутые документы, отсортированные по одной тематике, для каждого отсортированного документа выделяют признаки, характеризующие этот документ, внутри каждой папки поисковая система определяет рейтинг каждого признака, содержащегося в каждом отсортированном документе, после чего поисковая система определяет число совпадений признаков отдельных отсортированных документов одной папки с признаками других документов, содержащихся в других папках, определяет окончательный рейтинг каждого отсортированного документа с учетом числа совпадений признаков и с учетом весового коэффициента базы данных, после чего поисковая система снова сортирует упомянутые отсортированные документы с учетом окончательного рейтинга и направляет отсортированные в соответствии с окончательным рейтингом документы на рабочее место пользователя.
2. Способ по п.1, отличающийся тем, что окончательный рейтинг упомянутого отсортированного (i-го) документа рассчитывают по формуле
Figure 00000007
где x i,j - рейтинг i-го документа в j-й базе данных;
a j - рейтинг j-й базы данных;
l i - количество рейтингов i-го документа не равных нулю из всех баз данных;
с i - количество совпадений признаков отдельных документов в различных папках.
3. Способ по п.2, отличающийся тем, что рейтинг j-й базы данных a j варьируется в диапазоне от 0,1 до 1,0.
4. Способ по одному из предыдущих пунктов, отличающийся тем, что упомянутыми признаками документов являются авторы, организации, новости, события, все виды научно-технической литературы и патентной документации.
5. Способ по п.4, отличающийся тем, что видами научно-технической литературы являются статьи в периодических изданиях, монографии, сборники работ, труды конференций и других научных собраний.
6. Способ по одному из предыдущих пунктов, отличающийся тем, что окончательный рейтинг баз данных устанавливают с помощью контрольного тестирования.
RU2003105262/09A 2003-02-25 2003-02-25 Способ поиска и выборки информации с повышенной релевантностью RU2236699C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2003105262/09A RU2236699C1 (ru) 2003-02-25 2003-02-25 Способ поиска и выборки информации с повышенной релевантностью

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003105262/09A RU2236699C1 (ru) 2003-02-25 2003-02-25 Способ поиска и выборки информации с повышенной релевантностью

Publications (2)

Publication Number Publication Date
RU2003105262A RU2003105262A (ru) 2004-08-20
RU2236699C1 true RU2236699C1 (ru) 2004-09-20

Family

ID=33433549

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003105262/09A RU2236699C1 (ru) 2003-02-25 2003-02-25 Способ поиска и выборки информации с повышенной релевантностью

Country Status (1)

Country Link
RU (1) RU2236699C1 (ru)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2443015C2 (ru) * 2006-07-31 2012-02-20 Майкрософт Корпорейшн Функции ранжирования, использующие модифицированный наивный байесовский классификатор запросов с инкрементным обновлением
RU2444781C1 (ru) * 2010-07-30 2012-03-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Ульяновский государственный технический университет" Устройство поиска информации
RU2447506C2 (ru) * 2008-09-03 2012-04-10 Елена Валерьевна Папченко Способ повышения популярности творческих проектов и компьютерный сервер для его реализации
RU2447483C2 (ru) * 2006-06-26 2012-04-10 Майкрософт Корпорейшн Пользовательский интерфейс с настраиваемым параметром
RU2451329C2 (ru) * 2007-02-16 2012-05-20 Майкрософт Корпорейшн Контекстно-зависимые поиски и функциональные возможности для приложений немедленной передачи текстовых сообщений
RU2451999C2 (ru) * 2006-07-31 2012-05-27 Майкрософт Корпорейшн Оптимизация извлечения факта с использованием многоэтапного подхода
RU2452001C1 (ru) * 2011-03-15 2012-05-27 Общество С Ограниченной Ответственностью "Виси Рус" Способ отображения рекламы на ресурсах интернет в зависимости от их комбинированного содержания
RU2454712C2 (ru) * 2007-03-30 2012-06-27 Майкрософт Корпорейшн Генерация запроса с использованием конфигурации среды
RU2456661C2 (ru) * 2006-09-15 2012-07-20 Майкрософт Корпорейшн Эффективная навигация результатов поиска
RU2473120C1 (ru) * 2009-05-25 2013-01-20 Ракутен, Инк. Устройство обработки информации, способ обработки информации и программа обработки информации
RU2473119C1 (ru) * 2011-08-05 2013-01-20 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Способ и система семантического поиска электронных документов
RU2487404C2 (ru) * 2006-12-19 2013-07-10 Молдтэк Онтверпен Б.В. Способ классификации веб-страниц и организации соответствующего информационного наполнения
US8713444B2 (en) 2005-02-15 2014-04-29 Microsoft Corporation System and method for browsing tabbed-heterogeneous windows
RU2517271C2 (ru) * 2008-09-10 2014-05-27 Майкрософт Корпорейшн Длина документа в качестве статического признака релевантности для ранжирования результатов поиска
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
RU2532703C2 (ru) * 2008-12-23 2014-11-10 Функе Диджитал Тв Гайд Гмбх Рекомендующая система со смещением
RU2534810C2 (ru) * 2008-12-17 2014-12-10 Майкрософт Комрпорейшн Технологии для управления постоянными массивами документов
RU2541900C2 (ru) * 2008-12-12 2015-02-20 Конинклейке Филипс Электроникс, Н.В. Сопоставление записей, основанное на утверждениях в распределенной и независимой медицинской среде
RU2547213C2 (ru) * 2010-04-14 2015-04-10 Дзе Дан Энд Брадстрит Корпорейшн Присвоение применимых на практике атрибутов данных, которые описывают идентичность личности
RU2581009C2 (ru) * 2007-07-19 2016-04-10 Марк С. ДеПАЛМА Система и способ накопления аккредитации
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
RU2656469C1 (ru) * 2017-02-20 2018-06-05 Дарья Игоревна Лапшина Способ структурирования результатов поиска по текстам, содержащим информацию о научной и исследовательской деятельности
RU2679960C2 (ru) * 2013-10-10 2019-02-14 Общество С Ограниченной Ответственностью "Яндекс" Способ и система базы данных для нахождения документов
RU2764391C1 (ru) * 2020-12-09 2022-01-17 Михаил Валерьевич Митрофанов Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8843486B2 (en) 2004-09-27 2014-09-23 Microsoft Corporation System and method for scoping searches using index keys
US9626079B2 (en) 2005-02-15 2017-04-18 Microsoft Technology Licensing, Llc System and method for browsing tabbed-heterogeneous windows
US8713444B2 (en) 2005-02-15 2014-04-29 Microsoft Corporation System and method for browsing tabbed-heterogeneous windows
RU2447483C2 (ru) * 2006-06-26 2012-04-10 Майкрософт Корпорейшн Пользовательский интерфейс с настраиваемым параметром
RU2443015C2 (ru) * 2006-07-31 2012-02-20 Майкрософт Корпорейшн Функции ранжирования, использующие модифицированный наивный байесовский классификатор запросов с инкрементным обновлением
RU2451999C2 (ru) * 2006-07-31 2012-05-27 Майкрософт Корпорейшн Оптимизация извлечения факта с использованием многоэтапного подхода
RU2456661C2 (ru) * 2006-09-15 2012-07-20 Майкрософт Корпорейшн Эффективная навигация результатов поиска
RU2487404C2 (ru) * 2006-12-19 2013-07-10 Молдтэк Онтверпен Б.В. Способ классификации веб-страниц и организации соответствующего информационного наполнения
RU2451329C2 (ru) * 2007-02-16 2012-05-20 Майкрософт Корпорейшн Контекстно-зависимые поиски и функциональные возможности для приложений немедленной передачи текстовых сообщений
RU2454712C2 (ru) * 2007-03-30 2012-06-27 Майкрософт Корпорейшн Генерация запроса с использованием конфигурации среды
RU2581009C2 (ru) * 2007-07-19 2016-04-10 Марк С. ДеПАЛМА Система и способ накопления аккредитации
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US8812493B2 (en) 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
RU2447506C2 (ru) * 2008-09-03 2012-04-10 Елена Валерьевна Папченко Способ повышения популярности творческих проектов и компьютерный сервер для его реализации
RU2517271C2 (ru) * 2008-09-10 2014-05-27 Майкрософт Корпорейшн Длина документа в качестве статического признака релевантности для ранжирования результатов поиска
RU2541900C2 (ru) * 2008-12-12 2015-02-20 Конинклейке Филипс Электроникс, Н.В. Сопоставление записей, основанное на утверждениях в распределенной и независимой медицинской среде
US9740693B2 (en) 2008-12-17 2017-08-22 Microsoft Technology Licensing, Llc Techniques for managing persistent document collections
RU2534810C2 (ru) * 2008-12-17 2014-12-10 Майкрософт Комрпорейшн Технологии для управления постоянными массивами документов
US10430470B2 (en) 2008-12-17 2019-10-01 Microsoft Technology Licensing, Llc Techniques for managing persistent document collections
US10296590B2 (en) 2008-12-17 2019-05-21 Microsoft Technology Licensing, Llc Techniques for managing persistent document collections
US9626362B2 (en) 2008-12-17 2017-04-18 Microsoft Technology Licensing, Llc Techniques for managing persistent document collections
RU2532703C2 (ru) * 2008-12-23 2014-11-10 Функе Диджитал Тв Гайд Гмбх Рекомендующая система со смещением
RU2473120C1 (ru) * 2009-05-25 2013-01-20 Ракутен, Инк. Устройство обработки информации, способ обработки информации и программа обработки информации
RU2547213C2 (ru) * 2010-04-14 2015-04-10 Дзе Дан Энд Брадстрит Корпорейшн Присвоение применимых на практике атрибутов данных, которые описывают идентичность личности
US9442991B2 (en) 2010-04-14 2016-09-13 The Dun & Bradstreet Corporation Ascribing actionable attributes to data that describes a personal identity
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
RU2444781C1 (ru) * 2010-07-30 2012-03-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Ульяновский государственный технический университет" Устройство поиска информации
RU2452001C1 (ru) * 2011-03-15 2012-05-27 Общество С Ограниченной Ответственностью "Виси Рус" Способ отображения рекламы на ресурсах интернет в зависимости от их комбинированного содержания
RU2473119C1 (ru) * 2011-08-05 2013-01-20 Учреждение Российской академии наук Институт Системного Анализа РАН (ИСА РАН) Способ и система семантического поиска электронных документов
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
RU2679960C2 (ru) * 2013-10-10 2019-02-14 Общество С Ограниченной Ответственностью "Яндекс" Способ и система базы данных для нахождения документов
RU2656469C1 (ru) * 2017-02-20 2018-06-05 Дарья Игоревна Лапшина Способ структурирования результатов поиска по текстам, содержащим информацию о научной и исследовательской деятельности
RU2764391C1 (ru) * 2020-12-09 2022-01-17 Михаил Валерьевич Митрофанов Способ формирования основных и дополнительных электронных ресурсов сети интернет для изучения заданной образовательной программы

Similar Documents

Publication Publication Date Title
RU2236699C1 (ru) Способ поиска и выборки информации с повышенной релевантностью
US9773055B2 (en) Query rewriting with entity detection
US7949648B2 (en) Compiling and accessing subject-specific information from a computer network
US7747617B1 (en) Searching documents using a dimensional database
US6701310B1 (en) Information search device and information search method using topic-centric query routing
US6418433B1 (en) System and method for focussed web crawling
US7415459B2 (en) Scoping queries in a search engine
US7783626B2 (en) Pipelined architecture for global analysis and index building
US6446066B1 (en) Method and apparatus using run length encoding to evaluate a database
US20080147631A1 (en) Method and system for collecting and retrieving information from web sites
US20060020583A1 (en) System and method for searching and retrieving documents by their descriptions
Winship World‐Wide Web searching tools: an evaluation
US20050080774A1 (en) Ranking of business objects for search engines
Ajayi et al. Performance evaluation of selected search engines
EP1505520A2 (en) Ranking of business objects for search engines
Murata Visualizing the structure of web communities based on data acquired from a search engine
Li et al. A new statistical method for performance evaluation of search engines
Mukhopadhyay et al. An approach to confidence based page ranking for user oriented web search
US7970752B2 (en) Data processing system and method
EP1672544A2 (en) Improving text search quality by exploiting organizational information
Wable Information Retrieval in Business
Biradar et al. Internet search engines: a comparative study and evaluation methodology
Henzinger Tutorial 1: Web Information Retrieval
Al‐Hawamdeh et al. Paragraph‐based access to full‐text documents using a hypertext system
Desai A Test of Internet Search Engines: once again, with new players!

Legal Events

Date Code Title Description
PC4A Invention patent assignment

Effective date: 20060505

MM4A The patent is invalid due to non-payment of fees

Effective date: 20140226