RU2435212C2 - Сбор данных о пользовательском поведении при веб-поиске для повышения релевантности веб-поиска - Google Patents

Сбор данных о пользовательском поведении при веб-поиске для повышения релевантности веб-поиска Download PDF

Info

Publication number
RU2435212C2
RU2435212C2 RU2008135459/08A RU2008135459A RU2435212C2 RU 2435212 C2 RU2435212 C2 RU 2435212C2 RU 2008135459/08 A RU2008135459/08 A RU 2008135459/08A RU 2008135459 A RU2008135459 A RU 2008135459A RU 2435212 C2 RU2435212 C2 RU 2435212C2
Authority
RU
Russia
Prior art keywords
user
computer
search results
search
behavior
Prior art date
Application number
RU2008135459/08A
Other languages
English (en)
Other versions
RU2008135459A (ru
Inventor
Евгений Е. АГИХТЕЙН (US)
Евгений Е. АГИХТЕЙН
Эрик Д. БРИЛЛ (US)
Эрик Д. БРИЛЛ
Сюзан Т. ДЮМЭ (US)
Сюзан Т. ДЮМЭ
Роберт Дж. РЭГНО (US)
Роберт Дж. РЭГНО
Original Assignee
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн
Publication of RU2008135459A publication Critical patent/RU2008135459A/ru
Application granted granted Critical
Publication of RU2435212C2 publication Critical patent/RU2435212C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Изобретение относится к системам и способам поиска информации в сети Интернет. Техническим результатом является расширение функциональных возможностей поиска в информационно-поисковой системе путем применения компонента пользовательского поведения. Компонент пользовательского поведения, связанный с поисковой машиной, может автоматически интерпретировать коллективное поведение пользователей (например, пользователей, производящих веб-поиск). Подобный компонент обратной связи может содержать поведенческие признаки пользователей и прогнозирующие модели (например, на основе компонента пользовательского поведения), которые устойчивы к шуму, который может присутствовать в наблюдаемых пользовательских взаимодействиях с результатами поиска (например, злонамеренные и/или иррациональные действия пользователя). 4 н. и 15 з.п. ф-лы, 10 ил.

Description

Уровень техники
При существующей распространенности «Всемирной паутины» и сети Internet пользователи могут получать информацию почти по любой теме из большого числа источников информации. Для поиска информации пользователи обычно применяют различные поисковые машины для решения информационно-поисковой задачи. Поисковые машины дают пользователям возможность нахождения веб-страниц, содержащих информацию или другой материал в сети Internet, который содержит конкретные слова или фразы.
В общем, поиск по ключевым словам может находить, в полную меру возможностей компьютера, все веб-сайты, которые содержат любую информацию, связанную с любыми ключевыми словами и фразами, которые заданы. Сайт поисковой машины будет содержать окно для ввода пользователями ключевых слов и кнопку для нажатия, чтобы начать поиск. Многие поисковые машины содержат рекомендации относительно того, как пользоваться ключевыми словами для эффективного поиска. Обычно упомянутые рекомендации помогают пользователям задавать узкие поисковые условия, чтобы не получать обратно постороннюю и нерелевантную информацию, и чтобы процесс поиска информации не становился беспорядочным. Подобное ручное сужение условий может подавить получение нескольких тысяч сайтов путем сортировки при просмотре определенной информации.
В некоторых случаях темы поиска предварительно организуют на тематические области и подтематические области. Например, поисковая машина «Yahoo» обеспечивает иерархически организованный заданный список возможных тем (например, бизнес, государственное управление, наука и т.п.), из которых пользователь будет выбирать в списке тему и затем дополнительно выбирать подтему. Другой пример заданных списков тем широко применяется в справочных утилитах настольных персональных компьютеров, в которых пользователю предлагается список справочных тем и относящихся к ним подтем. Хотя упомянутые заданные иерархические структуры могут быть полезны в некоторых контекстах, пользователи часто нуждаются в поиске/запросе информации, находящейся за пределами упомянутых заданных списков и/или не содержащейся в них. Следовательно, часто используют поисковые машины или другие поисковые системы для предоставления пользователям возможности прямых запросов, чтобы находить требуемую информацию. Тем не менее, во время производимого пользователями поиска получают много нерелевантных результатов, поскольку пользователи не могут быть уверены в том, как создать или построить конкретный запрос. Более того, упомянутые системы обычно требуют от пользователей неоднократного видоизменения запросов и уточнения найденных результатов поиска для получения разумного числа результатов для изучения.
Нередко случается, что в поле ввода запроса поисковой системы вводят слово или фразу и затем получают несколько миллионов результатов в качестве возможных подходящих вариантов. Чтобы разобраться с большим числом полученных подходящих вариантов, пользователю часто потребуется попробовать другие комбинации слов для дополнительного сужения списка.
В общем, поисковая система будет ранжировать результаты в соответствии с прогнозируемой релевантностью результатов относительно запроса. Ранжирование обычно основано на функции, которая объединяет много параметров, включая сходство веб-страницы с запросом, а также собственное качество документа, часто логически выводимое из информации о веб-топологии. Качество впечатлений пользователя от поиска прямо зависит от качества функции ранжирования, так как пользователь обычно не просматривает результаты низкого ранга.
В общем, поисковая система будет пробовать подбирать или находить все темы, связанные с введенным пользовательским запросом, независимо от того, имеют ли «искомые» темы какую-либо контекстную связь с тематической(ким) областью или классом, которые фактически интересуют пользователя. Например, если пользователь, который проявил интерес к астрономии, собрался ввести запрос «Сатурн» в обычную поисковую машину, то, вероятно, должны быть получены все типы нерелевантных результатов, включая результаты, относящиеся к автомобилям, автомобильным дилерам, компьютерным играм и другим сайтам, содержащим слово «Сатурн». Другая проблема реализаций обычного поиска состоит в том, что поисковые машины работают одинаковым образом для всех пользователей, независимо от различия потребностей и обстоятельств пользователей. Следовательно, если два пользователя вводят одинаковый поисковый запрос, они обычно получают одинаковые результаты, независимо от их интересов или характеристик, предыстории поиска, текущего контекста вычислений (например, открытых файлов) или контекста среды (например, местоположения, применяемой машины, времени суток, дня недели).
Настройка функций ранжирования поиска для получения релевантных результатов во главе обычно требует значительных усилий. Общий подход к современным поисковым машинам заключается в том, чтобы обучать функции ранжирования и настраивать параметры и весовые коэффициенты функций автоматически, на основе примеров результатов поиска, оцениваемых ручным способом. Ручные аннотаторы могут в явном виде оценивать набор страниц для запроса в соответствии с ощущаемой релевантностью и создавать «золотой стандарт», по которому можно настраивать и оценивать разные алгоритмы ранжирования. Однако явные ручные оценки являются дорогостоящими и сложными для получения, часто приводящими к недостаточно обученным и неоптимальным функциям ранжирования.
Сущность изобретения
Ниже представлена упрощенная сущность изобретения, чтобы обеспечить понимание основ некоторых аспектов заявленного предмета изобретения. Упомянутая сущность изобретения не дает всестороннего общего представления. Сущность изобретения не предназначена для обозначения ключевых/критических элементов или определения объема заявленного предмета изобретения. Единственной целью является представление некоторых концепций в упрощенной форме в качестве вводной части к более подробному описанию, которое приведено в дальнейшем.
Настоящее изобретение улучшает ранжирование поиска в информационно-поисковой системе путем применения компонента пользовательского поведения, который облегчает автоматическую интерпретацию коллективного пользовательского поведения, чтобы оценивать пользовательские предпочтения в отношении одной позиции по сравнению с другой позицией. Затем упомянутые предпочтения можно использовать для различных целей, например для совершенствования ранжирования результатов. Компонент пользовательского поведения может взаимодействовать с поисковой(выми) машиной(нами) и содержать возможности обратной связи, которые ослабляют шум, который обычно сопутствует пользовательскому поведению (например, злонамеренной и/или иррациональной деятельности пользователя). При использовании совокупного пользовательского поведения (например, без рассмотрения каждого пользователя как отдельного эксперта) настоящее изобретение может ослаблять шум и формировать релевантные оценки на основе обратной связи с пользователями. Компонент пользовательского поведения может использовать неявную или явную обратную связь с пользователями и их взаимодействие с результатами предшествующих запросов. Ключевые поведенческие признаки содержат презентационные признаки, которые могут помогать пользователю при определении того, является ли результат релевантным, путем просмотра заголовка и описания результата; признаки поиска и просмотра, например время, проводимое на странице, способ получения доступа к результатам поиска (например, посредством других ссылок), отклонение от среднего времени на домене и т.п.; признаки щелчка мышью, например число щелчков мышью на конкретном результате по запросу. Для данной пары запрос-результат изобретение обеспечивает несколько наблюдаемых и производных значений признаков для каждого типа признака.
Компонент пользовательского поведения может использовать управляемую данными модель пользовательского поведения. Например, компонент пользовательского поведения может моделировать пользовательское поведение при веб-поиске, как если бы оно формировалось двумя компонентами: «фоновым» компонентом (например, пользовательских беспорядочных щелчков мышью) и компонентом «релевантности», (например, поведением, обусловленным запросом, которое направляется релевантностью результата по отношению к запросу).
В соответствии с дополнительным аспектом настоящего изобретения, компонент пользовательского поведения может формировать и/или моделировать отклонения от ожидаемого пользовательского поведения. Следовательно, возможно вычисление производных признаков, при этом такие производные признаки в явном виде отражают отклонение наблюдаемого значения признака для данного результата поиска от ожидаемых значений для результата без информации, зависящей от запроса.
Кроме того, компонент пользовательского поведения в соответствии с настоящим изобретением может использовать модели, содержащие два типа признаков для описания пользовательского поведения, а именно прямой и девиационный, при этом первый тип относится к непосредственно измеренным значениям, и второй тип относится к отклонению от ожидаемых значений, оцениваемых на основе общих (не зависящих от запроса) распределений для соответствующих непосредственно наблюдаемых признаков. Соответственно, наблюдаемое значение o признака f для запроса q и результата r может быть выражено как сумма двух компонентов:
Figure 00000001
где C(r, f) означает предшествующее «фоновое» распределение для значений f, собранных по всем запросам, соответствующим r, и rel(q, r, f) означает компонент «релевантности» поведения, на который влияет релевантность результата по отношению к запросу. Например, оценка релевантности пользовательского поведения может быть получена с помощью признака щелчка мышью путем вычитания фонового распределения из наблюдаемой частоты щелчка мышью в данном положении. Для ослабления эффекта индивидуальных вариаций пользовательского поведения, в соответствии с настоящим изобретением, можно усреднять значения признаков по всем пользователям и поисковым сеансам для каждой пары запрос-результат. Такое объединение может обеспечить дополнительную надежность, при этом не полагаются на сопряженные «с шумом» индивидуальные пользовательские взаимодействия.
Соответственно, пользовательское поведение применительно к паре запрос-ответ можно представить вектором признаков, который содержит значения как непосредственно наблюдаемых признаков, так и производных, «скорректированных», признаков. Различные методы обучения машины можно также применять в сочетании с обучением алгоритмов ранжирования для информационно-поисковых систем. Например, сначала могут обеспечиваться явные ручные оценки релевантности для различных поисковых запросов и затем применяться для последующего обучения алгоритмов ранжирования.
В соответствии со связанным аспектом, коллективное поведение пользователей, взаимодействующих с поисковой машиной для веб-сайтов, можно автоматически интерпретировать для прогнозирования будущих пользовательских приоритетов; следовательно, система может адаптироваться к изменению характеров поведения пользователей и разным параметрам настройки поиска посредством автоматического переобучения системы с помощью самых последних данных о пользовательском поведении.
Для достижения вышеописанных и связанных целей некоторые наглядные аспекты заявленного предмета изобретения поясняются в настоящей заявке в связи с нижеследующим описанием и прилагаемыми чертежами. Упомянутые аспекты характеризуют различные способы, с помощью которых можно практически реализовать предмет настоящего изобретения и которые считаются находящимися в пределах объема заявленного изобретения. Другие преимущества и элементы новизны могут стать очевидными из нижеследующего подробного описания при его изучении в связи с чертежами.
Краткое описание чертежей
Фиг.1 - блок-схема компонента пользовательского поведения в соответствии с примерным аспектом настоящего изобретения.
Фиг.2 - блок-схема системы, которая включает в себя компонент пользовательского поведения и взаимодействует с моделью обучения поисковой машины, в соответствии с аспектом настоящего изобретения.
Фиг.3 - блок-схема системы, которая включает в себя компонент ранжирования, функционально соединенный с компонентом пользовательского поведения, и поисковую машину, в соответствии с примерным аспектом настоящего изобретения.
Фиг.4 - таблица признаков, которые отражают операции пользователя по поиску и просмотру, в соответствии с аспектом настоящего изобретения.
Фиг.5 - изображение автоматизированной информационно-поисковой системы, которая использует компонент обучения машины, в соответствии с аспектом настоящего изобретения.
Фиг.6 - изображение компонента пользовательского поведения, который взаимодействует с множеством системных признаков, которые отражают действия пользователя, в соответствии с конкретным аспектом настоящего изобретения.
Фиг.7 - примерная методология интерпретации пользовательского поведения для оценки пользовательских предпочтений в соответствии с аспектом настоящего изобретения.
Фиг.8 - методология реализации пользовательского поведения как части ранжирования значений в соответствии с аспектом настоящего изобретения.
Фиг.9 - примерная среда для реализации различных аспектов изобретения.
Фиг.10 - структурная схема дополнительной вычислительной среды, которую можно использовать для реализации различных аспектов изобретения.
Подробное описание
Различные аспекты изобретения описаны ниже со ссылкой на прилагаемые чертежи, на которых одинаковые позиции служат сквозными обозначениями сходных или соответствующих элементов. Однако следует понимать, что чертежи и подробное описание, относящееся к ним, не предназначены для ограничения заявленного предмета изобретения конкретным предложенным вариантом. Наоборот, изобретение должно охватывать все модификации, эквиваленты и альтернативные варианты, не выходящие за пределы сущности и объема заявленного предмета изобретения.
В целях настоящего описания, термины «компонент», «система», «признак» и т.п. предназначены также для обозначения объекта, имеющего отношение к компьютерам, либо аппаратного обеспечения, комбинации из аппаратного обеспечения и программного обеспечения, программного обеспечения или программного обеспечения в процессе исполнения. Например, компонент может быть, но не в качестве ограничения, процессом, выполняемым в процессоре, процессором, объектом, исполняемым файлом, потоком выполнения, программой и/или компьютером. В качестве иллюстрации, как приложение, выполняемое в компьютере, так и компьютер могут быть компонентом. По меньшей мере, один компонент может постоянно находиться в процессе и/или потоке выполнения, и компонент может быть локализован в одном компьютере и/или распределен между двумя или более компьютерами.
Термин «примерный» применяется в настоящей заявке для обозначения примера, отдельного случая или пояснения. Любой аспект или схему, описанные в настоящей заявке в качестве «примерных», не обязательно следует толковать как предпочтительные или выигрышные по сравнению с другими аспектами или схемами.
Кроме того, предлагаемый предмет изобретения можно реализовать в виде системы, способа, устройства или изделия, использующего стандартное программирование и/или технические методы для создания программного обеспечения, встроенных программ, аппаратного обеспечения или любой их комбинации для управления компьютером или процессорным устройством, чтобы реализовать аспекты, подробно описанные в настоящей заявке. Термин компьютерная программа, в целях настоящей заявки, предназначен для охвата компьютерной программы, которую можно выбрать из любого компьютерночитаемого устройства, носителя или среды. Например, машиночитаемые носители могут содержать, но не в качестве ограничения, магнитные запоминающие устройства (например, жесткий диск, гибкий диск, магнитные ленты…), оптические диски (например, компакт-диск (CD), цифровой универсальный диск (DVD) …), смарт-карты и устройства флэш-памяти (например, плату, карту). Кроме того, следует понимать, что можно использовать электромагнитный сигнал передачи модулированной информации для передачи машиночитаемых электронных данных, например данных, применяемых при передаче и приеме электронной почты или при доступе к сети, например сети Internet или локальной сети (LAN). Разумеется, специалисты в данной области техники смогут понять, что возможно создание множества модификаций представленной конфигурации без выхода за пределы объема или сущности заявленного предмета изобретения.
На фиг.1 представлена блок-схема системы 100, которая включает в себя компонент пользовательского поведения, который взаимодействует с поисковой машиной, в соответствии с примерным аспектом настоящего изобретения. Компонент 104 пользовательского поведения, связанный с поисковой машиной 102, может автоматически интерпретировать коллективное поведение пользователей 101, 103, 105 (1-N, где N является целым числом). Такой компонент 104 пользовательского поведения может содержать возможности обратной связи, которые ослабляют шум, который обычно сопутствует пользовательскому поведению (например, злонамеренные и/или иррациональные действия пользователя). При использовании совокупного пользовательского поведения пользователей 101, 103, 105 (например, без рассмотрения каждого пользователя как отдельного эксперта) система 100 может ослаблять шум и формировать релевантные оценки на основе обратной связи с пользователями.
Компонент 104 пользовательского поведения может взаимодействовать с компонентом ранжирования. Для данного запроса компонент 104 пользовательского поведения выбирает прогнозные данные, полученные на основе ранее обученной поведенческой модели для данного запроса, и изменяет порядок результатов для запроса так, что результаты, которые представляются релевантными для предшествующих пользователей, получают более высокий ранг. Например, для данного запроса q неявную оценку IS r можно вычислить для каждого результата r по имеющимся признакам пользовательского взаимодействия, что имеет следствием неявный ранг I r для каждого результата. Объединенную оценку SM(r) можно вычислить для r посредством объединения рангов, полученных на основе неявной обратной связи, Ir, с исходным рангом r, O r.
Figure 00000002
Весовой коэффициент
Figure 00000003
является эвристически настраиваемым масштабным коэффициентом, который отражает относительную «значимость» неявной обратной связи. Результаты запроса могут упорядочиваться по уменьшающимся значениям SM(r) для получения окончательного ранжирования. Один конкретный случай подобной модели возникает при установке очень большого значения
Figure 00000003
, фактически предписывающего присваивать результатам, на которых производился щелчок мышью, более высокий ранг, чем результатам, на которых не производился щелчок мышью, что является интуитивной и эффективной эвристической процедурой, которую можно применять в качестве базовой. В общем, вышеописанный подход предполагает, что не существует никаких взаимодействий между базовыми признаками, формирующими исходное ранжирование веб-поиска, и признаками неявной обратной связи. Другие аспекты настоящего изобретения смягчают упомянутое предположение путем включения признаков неявной обратной связи непосредственно в процесс ранжирования, как подробно поясняется ниже. Кроме того, следует понимать, что применимы более сложное пользовательское поведение и алгоритмы объединения средств ранжирования, и они не выходят за пределы настоящего изобретения.
На фиг.2 представлен дополнительный аспект настоящего изобретения, в котором поисковая машина 202 дополнительно содержит обучающую модель 204 в соответствии с аспектом настоящего изобретения. Обучающая модель 204 может дополнительно содержать модели дополнительных типов для описания пользовательского поведения, а именно наблюдаемый поведенческий признак 201 и производный поведенческий признак 203. Наблюдаемый поведенческий признак 201 представляет собой непосредственно измеряемые значения, и производный поведенческий признак 203 представляет собой отклонение от ожидаемых значений, оцениваемых на основе общих (не зависящих от запроса) распределений для соответствующих непосредственно наблюдаемых признаков. Соответственно, наблюдаемое значение o признака f для запроса q и результата r может быть выражено как сумма двух компонентов:
Figure 00000001
где C(r, f) означает предшествующее «фоновое» распределение для значений f, собранных по всем запросам, соответствующим r, и rel(q, r, f) означает компонент поведения, на которое влияет релевантность результатов. Например, оценку релевантности пользовательского поведения можно получить с помощью признака щелчка мышью путем вычитания фонового распределения (например, шума) из наблюдаемой частоты щелчка мышью в данном положении. Для ослабления эффекта индивидуальных вариаций пользовательского поведения, в соответствии с настоящим изобретением, возможно усреднение значений прямых признаков по всем пользователям и поисковым сеансам для каждой пары запрос-URL. Такое объединение может обеспечить дополнительную надежность, при этом не полагаются на сопряженные «с шумом» индивидуальные пользовательские взаимодействия. Соответственно, пользовательское поведение для пары запрос-URL можно отразить вектором признаков, который содержит значения как непосредственно наблюдаемых признаков, так и производных, «скорректированных», признаков.
На фиг.3 представлена блок-схема системы 300, которая включает в себя компонент 310 ранжирования, функционально соединенный с компонентом 315 пользовательского поведения, и поисковую машину 340, в соответствии с примерным аспектом настоящего изобретения. Обычно поисковая машина 340 может ранжировать результаты 350 поиска с учетом большого числа признаков, включая признаки на основе контента (например, насколько близко запрос соответствует тексту или заголовку, или тексту ссылки документа) и признаки качества страницы, не зависимые от запроса (например, PageRank (ранг страницы) документа или домена), как подробно описано ниже. Кроме того, поисковая машина 340 может применять автоматические (или полуавтоматические) способы для настройки конкретной функции ранжирования, которая объединяет значения таких признаков. Например, можно предположить, что пользователь, который подает запрос 360, будет выполнять конкретные действия. Такие действия могут содержать щелчки мышью, навигацию, введение уточнений запроса, пока не найден релевантный документ и т.п. После нахождения релевантного документа пользователь может решить, что его требование удовлетворено, и изменить поведение (например, читать документ). Настоящее изобретение позволяет разрабатывать достаточно богатый набор признаков, которые позволяли бы обнаруживать, когда пользователь удовлетворен найденным результатом. Упомянутые признаки зависят от представленных запросов и, следовательно, обусловлены запросом. Например, признаки/действия пользователя можно классифицировать на презентационные признаки, признаки поиска и просмотра и признаки щелчка мышью, что поясняется со ссылкой на фиг.4.
На фиг.4 приведена таблица признаков 400, которые представляют поисковые и просмотровые действия пользователя. Презентационные признаки 410 обычно предназначены для отражения квалификации пользователя, так как они влияют на некоторые или все аспекты поведения (например, пользователь может решиться на щелчок мышью на результате, исходя из презентационных признаков). Для моделирования такого аспекта квалификации пользователя настоящее изобретение может использовать такие признаки, как совпадение слов в заголовке и слов в запросе (TitleOverlap) и части слов, совместно используемых заголовком и резюме результата, так как упомянутые слова часто принимаются во внимание пользователями при принятии решения о том, щелкать ли мышью на резюме результата, чтобы просмотреть весь документ.
Аналогично, признак 420 поиска и просмотра может собирать и количественно выражать аспекты пользовательских взаимодействий с веб-страницей. Например, настоящее изобретение может вычислять отклонение времени выполнения операции от ожидаемого времени выполнения операции на страницу для запроса, что позволяет моделировать разброс поведения при поиске и просмотре страницы внутри запроса. Упомянутый признак может дополнительно содержать как прямые признаки, так и производные признаки, как подробно изложено выше. Аналогично, признаки 430 щелчка мышью являются примером пользовательского взаимодействия с результатами поисковой машины. Например, признаки щелчка мышью могут содержать число щелчков для пары запрос-результат или отклонение от ожидаемой вероятности щелчка.
Как показано на фиг.4, признак щелчка мышью поясняет один аспект пользовательских взаимодействий с поисковой машиной для веб-сайтов. Настоящее изобретение может использовать автоматически получаемые прогнозирующие модели пользовательского поведения. Соответственно, для данного запроса каждый результат можно представить с признаками, сведенными в таблицу на фиг.4. Затем относительные пользовательские предпочтения можно оценить с использованием обученной модели пользовательского поведения, как подробно изложено выше. Применение таких моделей пользовательского поведения позволяет поисковой машине выгодно использовать здравый смысл множества людей, взаимодействующих с результатами поиска, а также более сложные признаки, характеризующие поведение при поиске и просмотре за пределами страницы результатов поиска.
На фиг.5 представлена автоматизированная информационно-поисковая система 500, которая использует компонент 535 обучения машины, в соответствии с аспектом настоящего изобретения. Для автоматического обучения модели пользовательских приоритетов можно применить общую стратегию интерпретации с неявной обратной связью (например, вместо опоры на эвристическую процедуру или интуитивные решения). Система 500 содержит компонент 510 ранжирования, который можно обучать, например, на основе журнала 520 данных или взаимодействий с компонентом 515 пользовательского поведения. Данные в журнале 520 могут быть собраны из локальных или удаленных источников данных и содержать информацию, связанную с данными предшествующего поиска или действиями 530 множества пользователей. После обучения компонент 510 ранжирования может взаимодействовать с поисковой машиной 540 для облегчения или улучшения будущих результатов поиска, которые показаны как релевантные результаты 550. Например, один или более новый поисковый запрос 560 может быть обработан поисковой машиной 540, частично, на основе обучения по данным 530 предшествующего поиска и/или информации из компонента 515 пользовательского поведения. В общем, система 500 может использовать различные методы сбора данных для совершенствования релевантности поисковой машины. Упомянутые методы могут заключаться в использовании классификаторов релевантности в компоненте 510 ранжирования для формирования высококачественных обучающих данных для классификаторов времени выполнения, которые применяются с поисковой машиной 540 для генерации результатов 550 поиска. На фиг.6 представлен компонент 610 пользовательского поведения, который взаимодействует с множеством системных признаков, которые отражают действия пользователя. В соответствии с одним аспектом, настоящее изобретение рассматривает особенности поведения при веб-поиске как сочетание «фонового» компонента (например, шум, независимый от запроса и релевантности, в поведении пользователя и т.п.) и компонента «релевантности» (например, обусловленного запросом поведения, характеризующего релевантность результата запросу). Подобная схема может использовать преимущества совокупного пользовательского поведения, когда набор признаков состоит из непосредственно наблюдаемых признаков (вычисляемых непосредственно по наблюдениям для каждого запроса), а также зависимых от запроса, производных признаков, вычисленных как отклонение от общего, независимого от запроса распределения значений, для соответствующих значений непосредственно наблюдаемых признаков. Как показано на фиг.6, примерные системные признаки, например признак(и) 612 щелчка мышью, признак(и) 614 поиска и просмотра и презентационные признаки 616, которые можно использовать для представления пользовательских взаимодействий с результатами веб-поиска через посредство компонента 610 пользовательского поведения. Кроме того, могут также рассматриваться такие признаки, как отклонение наблюдаемого числа щелчков мышью для данной пары запрос-URL от ожидаемого числа щелчков на результате в данном положении. Кроме того, поведение при поиске и просмотре можно моделировать, например, после того, как сделан щелчок на результате, и затем среднее время выполнения операции на страницу для данной пары запрос-URL, а также его отклонение от ожидаемого (среднего) времени выполнения операции используют для такой модели. Кроме того, например, пользователи веб-поиска часто могут определять, является ли результат релевантным на основе просмотра заголовка результата, URL и резюме, при этом, во многих случаях, просмотр исходного документа обычно не обязателен. Для моделирования упомянутого аспекта квалификации пользователя можно также использовать такие признаки, как совпадение слов в заголовке и слов в запросе.
На фиг.7 представлена примерная методология 700 интерпретации пользовательского поведения для оценки пользовательских предпочтений в соответствии с аспектом настоящего изобретения. Хотя в настоящей заявке представлен и описан примерный способ в виде последовательности этапов, характеризующих различные события и/или операции, настоящее изобретение не ограничено представленным порядком упомянутых этапов. Например, некоторые операции или события могут происходить в различном порядке и/или параллельно с другими операциями или событиями, отдельно от порядка, изображенного в настоящей заявке, в соответствии с изобретением. Кроме того, не все изображенные этапы, события или операции могут потребоваться для реализации методологии в соответствии с настоящим изобретением. Кроме того, следует понимать, что примерный способ и другие способы в соответствии с изобретением могут быть реализованы в связи со способом, представленным и описанным в настоящей заявке, а также в связи с другими, не показанными и не описанными системами и устройствами. Сначала, на этапе 710, могут быть собраны данные, относящиеся к пользовательскому взаимодействию с поисковой машиной, например пользовательскому поведению после поиска. Затем, на этапе 720, пользовательское поведение может быть суммировано, например, с применением методов статистического анализа. Затем, на этапе 730, может применяться обучение машины для обучения модели пользовательских приоритетов. И затем, на этапе 740, прогнозы пользовательских предпочтений могут поставляться для результата будущих запросов.
На фиг.8 представлена методология 800 реализации пользовательского поведения как составной части ранжирования в соответствии с аспектом настоящего изобретения. Сначала, на этапе 810, могут быть собраны данные, относящиеся к пользовательскому поведению. Упомянутое пользовательское поведение можно затем использовать для обучения и/или автоматического формирования поведенческой модели на этапе 820. Затем подобную модель (например, прогнозирующую поведенческую модель) можно включать в состав поисковой машины для ранжирования результатов и/или формирования неявных оценок релевантности на основе обратной связи с пользователями, на этапе 830. Затем, на этапе 840, частично на основе сформированной и/или обученной поведенческой модели может быть ранжирована информация, найденная поисковой машиной.
Чтобы обеспечить контекст для различных аспектов предложенного предмета изобретения, фиг.9 и 10, а также нижеследующее пояснение предназначены для представления краткого общего описания подходящей среды, в которой могут быть реализованы различные аспекты предложенного предмета изобретения. Хотя предмет изобретения описан выше в общем контексте машиноисполняемых инструкций компьютерной программы, которая работает на компьютере и/или компьютерах, специалистам в данной области техники будет очевидно, что изобретение можно также реализовать в комбинации с другими программными модулями. В общем, программные модули содержат подпрограммы, программы, компоненты, структуры данных и т.п., которые выполняют конкретные задачи и/или реализуют определенные абстрактные типы данных. Кроме того, специалистам в данной области техники будет очевидно, что новые способы можно практически реализовать в компьютерных системах других конфигураций, включая однопроцессорные или многопроцессорные компьютерные системы, миникомпьютерные устройства, основные компьютеры, а также персональные компьютеры, ручные вычислительные устройства (например, персональный цифровой секретарь (PDA), телефон, часы …), микропроцессорные или программируемые бытовые или промышленные электронные устройства и т.п. Изложенные аспекты можно также практически реализовать в распределенных вычислительных средах, в которых задачи выполняются удаленными устройствами обработки, которые связаны по сетям связи. Однако некоторые, если не все, аспекты изобретения можно практически реализовать на отдельно установленных компьютерах. В распределенной вычислительной среде программные модули могут находиться как в локальных, так и в удаленных запоминающих устройствах.
Со ссылкой на фиг.9 описана примерная среда 910 для реализации различных аспектов настоящего изобретения, которая содержит компьютер 912. Компьютер 912 содержит блок 914 обработки, системную память 916 и системную шину 918. Системная шина 918 связывает системные компоненты, включая, но не в качестве ограничения, системную память 916 с блоком 914 обработки. Блок 914 обработки может быть любым из различных доступных процессоров. В качестве блока 914 обработки можно также применять сдвоенные микропроцессоры и другие мультипроцессорные архитектуры.
Системная шина 918 может относиться к любому из нескольких типов шинных структур, включая шину памяти или контроллер памяти, периферийную шину или внешнюю шину и/или локальную шину, использующих любое число разнообразных доступных шинных архитектур, включая, но не в качестве ограничения, 11-разрядную шину, архитектуру шины промышленного стандарта (ISA), микроканальную архитектуру (MSA), расширенную ISA (EISA), интеллектуальное электронное оборудование дисковых накопителей (IDE), локальную шину VESA (VLB), межсоединение периферийных компонентов (шину PCI), универсальную последовательную шину (USB), универсальный графический порт (AGP), шину по спецификации PCMCIA (Международной ассоциации производителей карт памяти для персональных компьютеров и интерфейс малых вычислительных систем (SCSI).
Системная память 916 содержит энергозависимую память 920 и энергонезависимую память 922. Базовая система ввода/вывода (BIOS), содержащая основные подпрограммы для передачи информации между элементами внутри компьютера 912, например, во время запуска, хранится в энергонезависимой памяти 922. К примеру, а не в качестве ограничения, энергонезависимая память 922 может содержать постоянную память (ROM), программируемую ROM (PROM), электрически программируемую ROM (EPROM), электрически стираемую ROM (EEPROM) или флэш-память. Энергозависимая память 920 содержит оперативную память (RAM), которая выполняет функцию внешней кэш-памяти. К примеру, а не в качестве ограничения, RAM выпускается в многочисленных формах, например синхронной RAM (SRAM), динамической RAM (DRAM), синхронной DRAM (SDRAM), SDRAM с двойной скоростью (DDR SDRAM), усовершенствованной SDRAM (ESDRAM), Synchlink DRAM (SLDRAM) и RAM с шиной прямого резидентного доступа (DRRAM).
Компьютер 912 содержит также съемные/несъемные, энергозависимые/энергонезависимые компьютерные носители данных. На фиг.9 представлено, например, дисковое запоминающее устройство 924. Дисковое запоминающее устройство 924 содержит, но не в качестве ограничения, устройства типа магнитного дискового накопителя, накопителя на гибких дисках, накопителя на магнитной ленте, Jaz-дисковода, Zip-дисковода, дисковода LS-60, карты флэш-памяти или карты памяти. Кроме того, дисковое запоминающее устройство 924 может содержать носители данных по отдельности или в комбинации с другими носителями данных, включая, но не в качестве ограничения, оптический диск, устройство ROM на компакт-диске (CD-ROM), накопитель на записываемом CD (накопитель CD-R), накопитель на CD многократной перезаписи (накопитель CD-RW) или накопитель ROM на универсальном цифровом диске (DVD-ROM). Для облегчения подключения дисковых запоминающих устройств 924 к системной шине 918 обычно применяется съемный или несъемный интерфейс, например интерфейс 926.
Следует понимать, что на фиг.9 показано программное обеспечение, которое выполняет функцию промежуточного звена между пользователями и основными компьютерными ресурсами, описанными в подходящей операционной среде 910. Упомянутое программное обеспечение содержит операционную систему 928. Операционная система 928, которая может храниться в дисковом запоминающем устройстве 924, служит для управления и распределения ресурсов компьютерной системы 912. Системные приложения 930 используют возможности управления ресурсами операционной системы 928 посредством программных модулей 932 и данных 934 по программе, хранящихся либо в системной памяти 916, либо в дисковом запоминающем устройстве 924. Следует понимать, что различные компоненты, описанные в настоящей заявке, могут быть реализованы в различных операционных системах или комбинациях операционных систем.
Пользователь вводит команды или информацию в компьютер 912 через устройство(а) 936 ввода. Устройства 936 ввода содержат, но не в качестве ограничения, координатно-указательное устройство, например мышь, трекбол, перо, сенсорную клавиатуру, клавиатуру, микрофон, джойстик, игровой пульт, спутниковую тарелку, сканер, плату телевизионного тюнера, цифровую камеру, цифровую видеокамеру, веб-камеру и т.п. Перечисленные и другие устройства ввода соединяются с блоком 914 обработки по системной шине 918 через порт(ы) 938 интерфейса. Порт(ы) 938 интерфейса содержат, например, последовательный порт, параллельный порт, игровой порт и универсальную последовательную шину (USB). Устройство(а) 940 вывода используют некоторые из портов такого же типа, что и устройство(а) 936 ввода. Следовательно, например, порт USB можно применять для обеспечения ввода в компьютер 912 и для вывода информации из компьютера 912 в устройство 940 вывода. Выходной адаптер 942 обеспечен для демонстрации, что, кроме других устройств 940 вывода, существуют некоторые устройства 940 вывода типа мониторов, громкоговорителей и принтеров, которые нуждаются в специальных адаптерах. Выходной адаптер 942 содержит, к примеру, и не в качестве ограничения, видео и аудиоплаты, которые обеспечивают средство связи между устройством 940 вывода и системной шиной 918. Следует отметить, что возможности как ввода, так и вывода обеспечиваются другими устройствами и/или системами устройств, например удаленным(и) компьютером(ами) 944.
Компьютер 912 может работать в сетевой среде с использованием логических соединений с, по меньшей мере, одним удаленным компьютером, например удаленным(и) компьютером(ами) 944. Удаленный(е) компьютер(ы) 944 может быть персональным компьютером, сервером, маршрутизатором, сетевым PC, рабочей станцией, микропроцессорным аппаратом, равноправным устройством или другим распространенным сетевым узлом и т.п. и обычно содержит многие или все элементы, описанные в связи с компьютером 912. Для краткости, с удаленным(и) компьютером(ами) 944 показано только запоминающее устройство 946. Удаленный(е) компьютер(ы) 944 логически соединяется с компьютером 912 посредством сетевого интерфейса 948 и затем физически соединяется посредством соединений 950 связи. Сетевой интерфейс 948 охватывает сети связи, например локальные сети (LAN) и глобальные сети (WAN). Технологии LAN содержат интерфейс для доступа к распределенным данным по оптоволокну (FDDI), распределенный интерфейс передачи данных по кабельным линиям (CDDI), сеть стандарта Ethernet/IEEE 802.3, кольцевую сеть с маркерным доступом Token Ring/IEEE 802.5 и т.п. Технологии WAN содержат, но не в качестве ограничения, линии прямой связи, сети с коммутацией каналов типа цифровых сетей с интеграцией служб (ISDN) и их вариантов, сети коммутации пакетов и цифровые абонентские линии (DSL).
Соединение(ия) 950 связи означает аппаратное/программное обеспечение, применяемое для подключения сетевого интерфейса 948 к шине 918. Хотя соединение связи 950 показано, для ясности, внутри компьютера 912, оно может быть также внешним относительно компьютера 912. Аппаратное/программное обеспечение, необходимое для подключения к сетевому интерфейсу 948, содержит, только для примера, внутренние и внешние технические средства, например модемы, содержащие обычные телефонные модемы, кабельные модемы и модемы DSL, адаптеры ISDN и сетевые карты Ethernet.
В целях настоящего описания, термины «компонент», «система» и т.п. предназначены для обозначения объекта, имеющего отношение к компьютерам, либо аппаратного обеспечения, комбинации из аппаратного обеспечения и программного обеспечения, программного обеспечения или программного обеспечения в процессе исполнения. Например, компонент может быть, но не в качестве ограничения, процессом, выполняемым в процессоре, процессором, объектом, исполняемым файлом, потоком выполнения, программой и/или компьютером. В качестве иллюстрации, как приложение, выполняемое в компьютере, так и компьютер могут быть компонентом. По меньшей мере, один компонент может постоянно находиться в процессе и/или потоке выполнения, и компонент может быть локализован в одном компьютере и/или распределен между двумя или более компьютерами. Термин «примерный» применяется в настоящей заявке для обозначения примера, отдельного случая или пояснения. Любой аспект или схему, описанные в настоящей заявке в качестве «примерных», не обязательно следует толковать как предпочтительные или выигрышные по сравнению с другими аспектами или схемами.
Кроме того, предлагаемый предмет изобретения можно реализовать в виде системы, способа, устройства или изделия, использующего стандартное программирование и/или технические методы для создания программного обеспечения, встроенных программ, аппаратного обеспечения или любой их комбинации для управления компьютером или процессорным устройством, чтобы реализовать аспекты, подробно описанные в настоящей заявке. Термин компьютерная программа, в целях настоящей заявки, предназначен для охвата компьютерной программы, которую можно выбрать из любого машиночитаемого устройства, носителя или среды. Например, машиночитаемые носители могут содержать, но не в качестве ограничения, магнитные запоминающие устройства (например, жесткий диск, гибкий диск, магнитные ленты…), оптические диски (например, компакт-диск (CD), цифровой универсальный диск (DVD) …), смарт-карты и устройства флэш-памяти (например, плату, карту). Кроме того, следует понимать, что можно использовать электромагнитный сигнал передачи модулированной информации для передачи машиночитаемых электронных данных, например данных, применяемых при передаче и приеме электронной почты или при доступе к сети, например сети Internet или локальной сети (LAN). Разумеется, специалисты в данной области техники смогут понять, что возможно создание множества модификаций представленной конфигурации без выхода за пределы объема или сущности заявленного предмета изобретения.
На фиг.10 представлена структурная схема примерной вычислительной среды 1000, которую можно использовать для оценки пользовательского приоритета при посредстве компонента пользовательского поведения в соответствии с аспектом настоящего изобретения. Система 1000 содержит, по меньшей мере, одного клиента 1010. Клиент 1010 может быть аппаратным и/или программным обеспечением (например, потоками, процессами, вычислительными устройствами). Система 1000 содержит также, по меньшей мере, один сервер 1030. Сервер 1030 может быть также аппаратным и/или программным обеспечением (например, потоками, процессами, вычислительными устройствами). Серверы 1030 могут содержать потоки для выполнения преобразований, например, с использованием компонентов, описанных в настоящей заявке. Одна возможная связь между клиентом 1010 и сервером 1030 может быть в форме пакета данных, предназначенного для передачи между, по меньшей мере, двумя компьютерными процессами. Система 1000 содержит инфраструктуру 1050 связи, которую можно использовать для облегчения связи между клиентом(ами) 1010 и сервером(ами) 1030. Клиент(ы) 1010 функционально подключены к, по меньшей мере, одному или более информационному хранилищу 1060 клиента, которое можно использовать для хранения информации, локальной для клиента(ов) 1010. Аналогично, сервер(ы) 1030 функционально подключены к одному или более информационному хранилищу 1040 сервера, которое можно использовать для хранения информации, локальной для серверов 1030.
Вышеприведенное описание содержит различные примерные аспекты. Разумеется, невозможно описать каждую возможную комбинацию компонентов или способов в целях описания упомянутых аспектов, но специалист со средним уровнем компетентности в данной области сможет понять, что возможны многочисленные дополнительные комбинации и перестановки. Соответственно, аспекты, описанные в настоящей заявке, предполагают охват всех изменений, модификаций и вариантов, которые находятся в пределах сущности и объема прилагаемой формулы изобретения.
Кроме того, в том смысле, в котором термин «содержит» применяется либо в подробном описании, либо в формуле изобретения, данный термин следует понимать как включающий, аналогично термину «содержащий», когда «содержащий» истолковывается при его использовании в качестве переходного слова в пункте формулы изобретения.

Claims (19)

1. Компьютерно-реализованная система для ранжирования результатов поиска, содержащая следующие машиноисполняемые компоненты:
компонент пользовательского поведения, который оценивает пользовательские предпочтения по отношению к результатам поиска на основе непосредственно наблюдаемых признаков пользователя и производных признаков, причем производные признаки основываются на отклонении непосредственно наблюдаемых признаков пользователя для результатов поиска от ожидаемого поведения, определенного из общего распределения множества дополнительных пользователей для результатов поиска, при этом компонент пользовательского поведения дополнительно ослабляет эффект, связанный со злонамеренными или иррациональными просмотровыми действиями, сопровождающими индивидуальное поведение при просмотре, посредством интерпретации коллективного поведения при просмотре, соответствующего упомянутому множеству дополнительных пользователей;
набор признаков, содержащий по меньшей мере одно из презентационных признаков, просмотровых признаков и признаков щелчка мышью, которыми собираются и количественно выражаются взаимодействия при просмотре Web со стороны упомянутого пользователя и упомянутого множества дополнительных пользователей, причем данный набор признаков включает в себя упомянутые непосредственно наблюдаемые признаки и производные признаки; и
поисковую машину, которая учитывает пользовательские предпочтения для определения релевантности и ранжирования полученных в ответ результатов поиска, при этом результаты поиска, связанные с ожидаемым поведением упомянутого множества дополнительных пользователей, располагаются выше при ранжировании по сравнению с результатами поиска, связанными с упомянутыми непосредственно наблюдаемыми признаками.
2. Компьютерно-реализованная система по п.1, в которой компонент пользовательского поведения дополнительно содержит фоновый компонент и компонент релевантности.
3. Компьютерно-реализованная система по п.1, дополнительно содержащая компонент обучения машины.
4. Компьютерно-реализованная система по п.1, в которой компонент пользовательского поведения дополнительно содержит управляемую данными модель пользовательского поведения.
5. Компьютерно-реализованная система по п.4, дополнительно содержащая журнал данных, который содержит данные о предшествующих поисках.
6. Компьютерно-реализованная система по п.1, в которой поисковая машина дополнительно содержит компонент ранжирования, который ранжирует результаты поиска.
7. Компьютерно-реализованная система по п.4, дополнительно содержащая компонент обучения машины, который обучает модель пользовательского поведения.
8. Компьютерно-реализуемый способ ранжирования результатов поиска, согласно которому процессор исполняет машиноисполняемые инструкции, хранящиеся на машиночитаемом носителе, для выполнения этапов способа, на которых
получают пользовательское поведение пользователя во время взаимодействия с поисковой машиной, где пользователь представляет запрос в поисковую машину;
объединяют пользовательское поведение для его анализа, при этом пользовательское поведение включает в себя непосредственно наблюдаемые признаки пользовательского поведения и производные признаки пользовательского поведения, причем производные признаки основываются на отклонении явных результатов поиска, связанных с непосредственно наблюдаемыми признаками пользовательского поведения для результата поиска, от неявных результатов поиска, связанных с ожидаемым поведением, определенным из общего распределения множества дополнительных предшествующих пользователей для этого результата поиска;
ослабляют шум, связанный с пользовательским поведением, посредством интерпретации объединенного пользовательского поведения и посредством усреднения наблюдаемых признаков взаимодействия, причем этот шум соответствует злонамеренным или иррациональным просмотровым действиям;
оценивают пользовательские предпочтения в отношении найденных результатов на основе упомянутых объединения и ослабления;
определяют ранжирование результатов на основе пользовательских предпочтений, так что при имеющихся неявных результатах поиска ранжирование представляет комбинацию явных и неявных результатов поиска, в противном случае, ранжирование представляет явные результаты поиска.
9. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап обучения модели для ранжирования найденных результатов.
10. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап автоматического формирования модели на основе пользовательского поведения.
11. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап разработки набора признаков, относящихся к пользовательскому взаимодействию с найденными результатами.
12. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап использования обучения машины для учета пользовательского поведения.
13. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап прогнозирования пользовательского поведения.
14. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап сбора данных об объединенном пользовательском поведении для ранжирования найденных результатов.
15. Компьютерно-реализуемый способ по п.8, дополнительно содержащий этап применения непосредственно наблюдаемых признаков из взаимодействий с найденными результатами для оценки пользовательских предпочтений.
16. Компьютерно-реализованная система для ранжирования результатов поиска, содержащая следующие машиноисполняемые компоненты:
средство для сбора неявной обратной связи от множества пользователей;
средство для построения набора признаков на основе этой неявной обратной связи, при этом набор признаков включает в себя наблюдаемые пользовательские поведения при просмотре и производные признаки, причем производные признаки основываются на отклонении явных результатов поиска, связанных с этими наблюдаемыми пользовательскими поведениями при просмотре для результата поиска, от неявных результатов поиска, связанных с ожидаемыми пользовательскими поведениями при просмотре, определенными из общего распределения множества дополнительных пользователей для этого результата поиска;
средство для ослабления шума, сопровождающего индивидуальное поведение при просмотре, причем данный шум соответствует злонамеренным или иррациональным просмотровым действиям; и
средство для оценки пользовательских предпочтений на основе набора признаков; и
средство для определения ранжирования результатов на основе пользовательских предпочтений, так что при имеющихся неявных результатах поиска ранжирование представляет комбинацию явных и неявных результатов поиска, к которым применены весовые коэффициенты, в противном случае, ранжирование представляет явные результаты поиска, при этом весовыми коэффициентами устанавливается то, что те результаты из неявных результатов поиска, по которым был выполнен щелчок мышью, имеют более высокий ранг, чем те результаты из неявных результатов поиска, по которым щелчок мышью выполнен не был.
17. Автоматизированный способ обеспечения улучшенного поиска и просмотра Web, согласно которому один или более процессоров исполняют машиноисполняемые инструкции, хранящиеся на машиночитаемом носителе, для выполнения этапов способа, на которых:
получают данные касаемо поведения при просмотре Web со стороны множества пользователей;
формируют модель для прогнозирования пользовательских предпочтений на основе этих данных, причем модель использует набор признаков, включающий в себя наблюдаемые признаки и производные признаки, при этом наблюдаемые признаки формируются из наблюдаемых пользовательских поведений при просмотре, а производные признаки выводятся из отклонения этих наблюдаемых признаков для результата поиска от ожидаемого поведения, определенного из общего распределения упомянутого множества пользователей для этого результата поиска, причем набор признаков содержит по меньшей мере одно из презентационных признаков, просмотровых признаков и признаков щелчка мышью, которыми собираются и количественно выражаются взаимодействия при просмотре Web со стороны пользователей, при этом при прогнозировании выполняют усреднение по признакам набора признаков для ослабления эффектов, обусловленных вариациями в поведении среди отдельных пользователей, причем презентационные признаки включают в себя долю слов, общих между запросом и по меньшей мере одним из заголовка, резюме, универсального указателя информационного ресурса (URL) и домена; и
взаимодействуют с моделью, чтобы на основе пользовательских предпочтений задать ранжирование для результатов поиска по Web, при этом результаты поиска, связанные с ожидаемым поведением упомянутого множества пользователей, располагаются выше при ранжировании по сравнению с результатами поиска, связанными с наблюдаемыми признаками.
18. Способ по п.17, дополнительно содержащий этап моделирования пользовательского поведения, соответствующего паре поисковый запрос-результат поиска, используя как наблюдаемый признак, так и производный признак.
19. Способ по п.17, дополнительно содержащий этап ранжирования результатов поиска как на основе зависящих от запроса признаков, включая то, насколько близко запрос соответствует тексту Web-документа, так и не зависящих от запроса признаков, включая ранг страницы Web-документа.
RU2008135459/08A 2006-03-02 2007-02-08 Сбор данных о пользовательском поведении при веб-поиске для повышения релевантности веб-поиска RU2435212C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US77865006P 2006-03-02 2006-03-02
US60/778,650 2006-03-02
US60/788,650 2006-04-03
US11/457,733 2006-07-14
US11/457,733 US20070208730A1 (en) 2006-03-02 2006-07-14 Mining web search user behavior to enhance web search relevance

Publications (2)

Publication Number Publication Date
RU2008135459A RU2008135459A (ru) 2010-03-10
RU2435212C2 true RU2435212C2 (ru) 2011-11-27

Family

ID=38472589

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008135459/08A RU2435212C2 (ru) 2006-03-02 2007-02-08 Сбор данных о пользовательском поведении при веб-поиске для повышения релевантности веб-поиска

Country Status (9)

Country Link
US (1) US20070208730A1 (ru)
EP (1) EP1997065A4 (ru)
JP (1) JP5247475B2 (ru)
KR (1) KR101366408B1 (ru)
BR (1) BRPI0708397A2 (ru)
CA (1) CA2644440A1 (ru)
MX (1) MX2008011223A (ru)
RU (1) RU2435212C2 (ru)
WO (1) WO2007106269A1 (ru)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013090946A1 (en) * 2011-12-15 2013-06-20 Qwiki, Inc. Systems and methods involving features of seach and/or search integration
WO2013149220A1 (en) * 2012-03-30 2013-10-03 Xen, Inc. Centralized tracking of user interest information from distributed information sources
WO2015038881A1 (en) * 2013-09-13 2015-03-19 ClickTale, Ltd. A method and system for generating comparable visual maps for browsing activity analysis
RU2601138C2 (ru) * 2012-07-10 2016-10-27 Тенсент Текнолоджи (Шэньчжэнь) Компани Лимитед Способ предоставления рекомендуемой информации для браузера мобильного терминала и система, применяющая данный способ
RU2608886C2 (ru) * 2014-06-30 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Ранжиратор результатов поиска
RU2621962C1 (ru) * 2016-08-16 2017-06-08 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2630741C1 (ru) * 2016-12-20 2017-09-12 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2632133C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
RU2632138C2 (ru) * 2015-09-14 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
RU2632423C2 (ru) * 2015-09-30 2017-10-04 Общество С Ограниченной Ответственностью "Яндекс" Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств
RU2639953C2 (ru) * 2014-12-09 2017-12-25 Сяоми Инк. Способ и устройство для предоставления контактных данных
RU2654145C2 (ru) * 2012-12-14 2018-05-16 Самсунг Электроникс Ко., Лтд Способ и устройство поиска информации и компьютерно-читаемый носитель записи для этого
RU2663706C1 (ru) * 2017-07-20 2018-08-08 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных оценки доверия контенту
US10275418B2 (en) 2013-03-22 2019-04-30 National Research University Higher School of Economics (HSE) Method for selecting valid variants in search and recommendation systems (variants)
RU2689812C2 (ru) * 2017-07-25 2019-05-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения ранжированных позиций ненативных элементов с помощью системы ранжирования
US10552505B2 (en) 2017-07-25 2020-02-04 Yandex Europe Ag Method and system for generating a user-personalization interest parameter for identifying personalized targeted content item
US11256991B2 (en) 2017-11-24 2022-02-22 Yandex Europe Ag Method of and server for converting a categorical feature value into a numeric representation thereof
US11995519B2 (en) 2017-11-24 2024-05-28 Direct Cursus Technology L.L.C Method of and server for converting categorical feature value into a numeric representation thereof and for generating a split value for the categorical feature

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US7860886B2 (en) * 2006-09-29 2010-12-28 A9.Com, Inc. Strategy for providing query results based on analysis of user intent
US9747349B2 (en) * 2006-10-30 2017-08-29 Execue, Inc. System and method for distributing queries to a group of databases and expediting data access
US9110975B1 (en) * 2006-11-02 2015-08-18 Google Inc. Search result inputs using variant generalized queries
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9305088B1 (en) * 2006-11-30 2016-04-05 Google Inc. Personalized search results
KR100898456B1 (ko) * 2007-01-12 2009-05-21 엔에이치엔(주) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US8005643B2 (en) * 2007-06-26 2011-08-23 Endeca Technologies, Inc. System and method for measuring the quality of document sets
US8935249B2 (en) 2007-06-26 2015-01-13 Oracle Otc Subsidiary Llc Visualization of concepts within a collection of information
US8458165B2 (en) * 2007-06-28 2013-06-04 Oracle International Corporation System and method for applying ranking SVM in query relaxation
US7783630B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Tuning of relevancy ranking for federated search
US7783620B1 (en) * 2007-06-29 2010-08-24 Emc Corporation Relevancy scoring using query structure and data structure for federated search
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US20090089311A1 (en) * 2007-09-28 2009-04-02 Yahoo! Inc. System and method for inclusion of history in a search results page
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
US7984000B2 (en) 2007-10-31 2011-07-19 Microsoft Corporation Predicting and using search engine switching behavior
US9152699B2 (en) * 2007-11-02 2015-10-06 Ebay Inc. Search based on diversity
US20090119254A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Storing Accessible Histories of Search Results Reordered to Reflect User Interest in the Search Results
US20090119278A1 (en) * 2007-11-07 2009-05-07 Cross Tiffany B Continual Reorganization of Ordered Search Results Based on Current User Interaction
US7797260B2 (en) * 2008-02-11 2010-09-14 Yahoo! Inc. Automated document classifier tuning including training set adaptive to user browsing behavior
US7836058B2 (en) 2008-03-27 2010-11-16 Microsoft Corporation Web searching
US8069179B2 (en) * 2008-04-24 2011-11-29 Microsoft Corporation Preference judgements for relevance
US20090299964A1 (en) * 2008-05-30 2009-12-03 Microsoft Corporation Presenting search queries related to navigational search queries
US8543592B2 (en) * 2008-05-30 2013-09-24 Microsoft Corporation Related URLs for task-oriented query results
US8639636B2 (en) * 2008-08-15 2014-01-28 At&T Intellectual Property I, L.P. System and method for user behavior modeling
US7979415B2 (en) * 2008-09-04 2011-07-12 Microsoft Corporation Predicting future queries from log data
US8037043B2 (en) 2008-09-09 2011-10-11 Microsoft Corporation Information retrieval system
US8515950B2 (en) * 2008-10-01 2013-08-20 Microsoft Corporation Combining log-based rankers and document-based rankers for searching
US8060456B2 (en) * 2008-10-01 2011-11-15 Microsoft Corporation Training a search result ranker with automatically-generated samples
US9449078B2 (en) * 2008-10-01 2016-09-20 Microsoft Technology Licensing, Llc Evaluating the ranking quality of a ranked list
US8122021B2 (en) * 2008-10-06 2012-02-21 Microsoft Corporation Domain expertise determination
US8126894B2 (en) * 2008-12-03 2012-02-28 Microsoft Corporation Click chain model
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8341167B1 (en) 2009-01-30 2012-12-25 Intuit Inc. Context based interactive search
US8577875B2 (en) * 2009-03-20 2013-11-05 Microsoft Corporation Presenting search results ordered using user preferences
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8073832B2 (en) 2009-05-04 2011-12-06 Microsoft Corporation Estimating rank on graph streams
US9495460B2 (en) * 2009-05-27 2016-11-15 Microsoft Technology Licensing, Llc Merging search results
US20100306224A1 (en) * 2009-06-02 2010-12-02 Yahoo! Inc. Online Measurement of User Satisfaction Using Long Duration Clicks
US20100332531A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Batched Transfer of Arbitrarily Distributed Data
US20100332550A1 (en) * 2009-06-26 2010-12-30 Microsoft Corporation Platform For Configurable Logging Instrumentation
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8082247B2 (en) * 2009-07-30 2011-12-20 Microsoft Corporation Best-bet recommendations
US8135753B2 (en) * 2009-07-30 2012-03-13 Microsoft Corporation Dynamic information hierarchies
US20110029516A1 (en) * 2009-07-30 2011-02-03 Microsoft Corporation Web-Used Pattern Insight Platform
US8392380B2 (en) * 2009-07-30 2013-03-05 Microsoft Corporation Load-balancing and scaling for analytics data
US9020936B2 (en) * 2009-08-14 2015-04-28 Microsoft Technology Licensing, Llc Using categorical metadata to rank search results
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US9576251B2 (en) * 2009-11-13 2017-02-21 Hewlett Packard Enterprise Development Lp Method and system for processing web activity data
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US9009134B2 (en) * 2010-03-16 2015-04-14 Microsoft Technology Licensing, Llc Named entity recognition in query
US9665648B2 (en) * 2010-03-29 2017-05-30 Nokia Technologies Oy Method and apparatus for a user interest topology based on seeded user interest modeling
KR101098871B1 (ko) 2010-04-13 2011-12-26 건국대학교 산학협력단 랭크된 사용자의 피드백 정보에 기반한 컨텐츠 유사도 측정 장치, 방법 및 그 방법을 실행하는 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
US20110258032A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Search advertisement selection based on user actions
US10204163B2 (en) 2010-04-19 2019-02-12 Microsoft Technology Licensing, Llc Active prediction of diverse search intent based upon user browsing behavior
US8799280B2 (en) 2010-05-21 2014-08-05 Microsoft Corporation Personalized navigation using a search engine
US20110295897A1 (en) * 2010-06-01 2011-12-01 Microsoft Corporation Query correction probability based on query-correction pairs
US8612432B2 (en) 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US8825649B2 (en) 2010-07-21 2014-09-02 Microsoft Corporation Smart defaults for data visualizations
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
WO2012034069A1 (en) * 2010-09-10 2012-03-15 Veveo, Inc. Method of and system for conducting personalized federated search and presentation of results therefrom
US8560484B2 (en) * 2010-12-17 2013-10-15 Intel Corporation User model creation
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US9449093B2 (en) * 2011-02-10 2016-09-20 Sri International System and method for improved search experience through implicit user interaction
US9053208B2 (en) 2011-03-02 2015-06-09 Microsoft Technology Licensing, Llc Fulfilling queries using specified and unspecified attributes
US9507861B2 (en) * 2011-04-01 2016-11-29 Microsoft Technolgy Licensing, LLC Enhanced query rewriting through click log analysis
US8732151B2 (en) 2011-04-01 2014-05-20 Microsoft Corporation Enhanced query rewriting through statistical machine translation
JP2013037624A (ja) * 2011-08-10 2013-02-21 Sony Computer Entertainment Inc 情報処理システム、情報処理方法、プログラム及び情報記憶媒体
US9355095B2 (en) 2011-12-30 2016-05-31 Microsoft Technology Licensing, Llc Click noise characterization model
US9460237B2 (en) 2012-05-08 2016-10-04 24/7 Customer, Inc. Predictive 411
US8996513B2 (en) * 2012-07-24 2015-03-31 Microsoft Technology Licensing, Llc Providing an interface to access website actions
CN103631794B (zh) * 2012-08-22 2019-05-07 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行排序的方法、装置与设备
US10108720B2 (en) * 2012-11-28 2018-10-23 International Business Machines Corporation Automatically providing relevant search results based on user behavior
US9589149B2 (en) 2012-11-30 2017-03-07 Microsoft Technology Licensing, Llc Combining personalization and privacy locally on devices
US9824151B2 (en) * 2012-12-27 2017-11-21 Google Inc. Providing a portion of requested data based upon historical user interaction with the data
US20140188889A1 (en) * 2012-12-31 2014-07-03 Motorola Mobility Llc Predictive Selection and Parallel Execution of Applications and Services
US9594837B2 (en) 2013-02-26 2017-03-14 Microsoft Technology Licensing, Llc Prediction and information retrieval for intrinsically diverse sessions
CN104679771B (zh) * 2013-11-29 2018-09-18 阿里巴巴集团控股有限公司 一种个性化数据搜索方法和装置
US10042936B1 (en) * 2014-07-11 2018-08-07 Google Llc Frequency-based content analysis
CN104268212A (zh) * 2014-09-23 2015-01-07 北京奇虎科技有限公司 一种互联网产品的发放方法和装置
US10430473B2 (en) 2015-03-09 2019-10-01 Microsoft Technology Licensing, Llc Deep mining of network resource references
US9697286B2 (en) * 2015-03-16 2017-07-04 International Business Machines Corporation Shared URL content update to improve search engine optimization
CN105095357A (zh) * 2015-06-24 2015-11-25 百度在线网络技术(北京)有限公司 一种用于咨询数据处理的方法和装置
RU2637899C2 (ru) 2015-07-16 2017-12-07 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер определения изменений в пользовательском интерактивном взаимодействии со страницей результатов поиска
CN109074292B (zh) * 2016-04-18 2021-12-14 谷歌有限责任公司 适当的代理的自动化助理调用
US10055481B2 (en) * 2016-07-20 2018-08-21 LogsHero Ltd. Method and system for automatic event classification
US10803070B2 (en) * 2016-07-29 2020-10-13 International Business Machines Corporation Selecting a content summary based on relevancy
CN107133290B (zh) * 2017-04-19 2019-10-29 中国人民解放军国防科学技术大学 一种个性化信息检索方法与装置
US11842533B2 (en) * 2017-04-26 2023-12-12 Chia-Lin Simmons Predictive search techniques based on image analysis and group feedback
EP3729248A4 (en) * 2017-12-21 2021-12-15 Commonwealth Scientific and Industrial Research Organisation CREATION OF A USER-SPECIFIC USER INTERFACE
JP6560843B1 (ja) * 2018-03-16 2019-08-14 楽天株式会社 検索システム、検索方法、及びプログラム
CN110971659A (zh) * 2019-10-11 2020-04-07 贝壳技术有限公司 推荐消息的推送方法、装置及存储介质
KR102144370B1 (ko) * 2019-11-18 2020-08-13 주식회사 오투오 대화형 정보 검색장치
CN113127614A (zh) * 2020-01-16 2021-07-16 微软技术许可有限责任公司 基于隐式相关性反馈来提供qa训练数据以及训练qa模型

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
US6321228B1 (en) * 1999-08-31 2001-11-20 Powercast Media, Inc. Internet search system for retrieving selected results from a previous search
US6546388B1 (en) * 2000-01-14 2003-04-08 International Business Machines Corporation Metadata search results ranking system
US6701362B1 (en) * 2000-02-23 2004-03-02 Purpleyogi.Com Inc. Method for creating user profiles
JP2002032401A (ja) * 2000-07-18 2002-01-31 Mitsubishi Electric Corp 文書検索方法及び文書検索装置及び文書検索方法をコンピュータに実現させるためのプログラムを記録したコンピュータで読取可能な記録媒体
US6792434B2 (en) * 2001-04-20 2004-09-14 Mitsubishi Electric Research Laboratories, Inc. Content-based visualization and user-modeling for interactive browsing and retrieval in multimedia databases
US20030018621A1 (en) * 2001-06-29 2003-01-23 Donald Steiner Distributed information search in a networked environment
KR100438857B1 (ko) * 2001-09-26 2004-07-05 엘지전자 주식회사 사용자 선호도 기반 멀티미디어 검색 시스템
US8117072B2 (en) * 2001-11-13 2012-02-14 International Business Machines Corporation Promoting strategic documents by bias ranking of search results on a web browser
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US7024404B1 (en) * 2002-05-28 2006-04-04 The State University Rutgers Retrieval and display of data objects using a cross-group ranking metric
CA2397424A1 (en) * 2002-08-09 2004-02-09 Mohammed Lamine Kherfi Content-based image retrieval using positive and negative examples
EP1586058A1 (en) * 2003-01-24 2005-10-19 BRITISH TELECOMMUNICATIONS public limited company Searching apparatus and methods
US20050071328A1 (en) * 2003-09-30 2005-03-31 Lawrence Stephen R. Personalization of web search
US20050120003A1 (en) * 2003-10-08 2005-06-02 Drury William J. Method for maintaining a record of searches and results
JP2005208943A (ja) * 2004-01-22 2005-08-04 Denso It Laboratory Inc サービス候補提供システム及びユーザ側通信装置並びにサービス候補提供サーバ
US7457823B2 (en) * 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US7257577B2 (en) * 2004-05-07 2007-08-14 International Business Machines Corporation System, method and service for ranking search results using a modular scoring system
WO2006023765A2 (en) * 2004-08-19 2006-03-02 Claria, Corporation Method and apparatus for responding to end-user request for information
WO2006036781A2 (en) * 2004-09-22 2006-04-06 Perfect Market Technologies, Inc. Search engine using user intent
WO2006042265A2 (en) * 2004-10-11 2006-04-20 Nextumi, Inc. System and method for facilitating network connectivity based on user characteristics

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013090946A1 (en) * 2011-12-15 2013-06-20 Qwiki, Inc. Systems and methods involving features of seach and/or search integration
WO2013149220A1 (en) * 2012-03-30 2013-10-03 Xen, Inc. Centralized tracking of user interest information from distributed information sources
RU2601138C2 (ru) * 2012-07-10 2016-10-27 Тенсент Текнолоджи (Шэньчжэнь) Компани Лимитед Способ предоставления рекомендуемой информации для браузера мобильного терминала и система, применяющая данный способ
US10614120B2 (en) 2012-12-14 2020-04-07 Samsung Electronics Co., Ltd. Information search method and device and computer readable recording medium thereof
US11314804B2 (en) 2012-12-14 2022-04-26 Samsung Electronics Co., Ltd. Information search method and device and computer readable recording medium thereof
RU2654145C2 (ru) * 2012-12-14 2018-05-16 Самсунг Электроникс Ко., Лтд Способ и устройство поиска информации и компьютерно-читаемый носитель записи для этого
US10275418B2 (en) 2013-03-22 2019-04-30 National Research University Higher School of Economics (HSE) Method for selecting valid variants in search and recommendation systems (variants)
WO2015038881A1 (en) * 2013-09-13 2015-03-19 ClickTale, Ltd. A method and system for generating comparable visual maps for browsing activity analysis
US10079737B2 (en) 2013-09-13 2018-09-18 Clicktale Ltd. Method and system for generating comparable visual maps for browsing activity analysis
RU2608886C2 (ru) * 2014-06-30 2017-01-25 Общество С Ограниченной Ответственностью "Яндекс" Ранжиратор результатов поиска
RU2639953C2 (ru) * 2014-12-09 2017-12-25 Сяоми Инк. Способ и устройство для предоставления контактных данных
RU2632138C2 (ru) * 2015-09-14 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и сервер ранжирования поисковых результатов на основе параметра полезности
US10275406B2 (en) 2015-09-14 2019-04-30 Yandex Europe Ag System and method for ranking search results based on usefulness parameter
RU2632133C2 (ru) * 2015-09-29 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ (варианты) и система (варианты) создания модели прогнозирования и определения точности модели прогнозирования
US11341419B2 (en) 2015-09-29 2022-05-24 Yandex Europe Ag Method of and system for generating a prediction model and determining an accuracy of a prediction model
US10387801B2 (en) 2015-09-29 2019-08-20 Yandex Europe Ag Method of and system for generating a prediction model and determining an accuracy of a prediction model
RU2632423C2 (ru) * 2015-09-30 2017-10-04 Общество С Ограниченной Ответственностью "Яндекс" Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств
US10282358B2 (en) 2015-09-30 2019-05-07 Yandex Europe Ag Methods of furnishing search results to a plurality of client devices via a search engine system
RU2621962C1 (ru) * 2016-08-16 2017-06-08 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2630741C1 (ru) * 2016-12-20 2017-09-12 Игорь Юрьевич Скворцов Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных обмена комментариями между пользователями
RU2663706C1 (ru) * 2017-07-20 2018-08-08 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Самонастраивающаяся интерактивная система, способ и считываемый компьютером носитель данных оценки доверия контенту
WO2019017820A1 (ru) * 2017-07-20 2019-01-24 Общество С Ограниченной Ответственностью "Центр Разработки И Внедрения Инновационных Технологий" Самонастраивающаяся интерактивная система оценки доверия контенту
US10552505B2 (en) 2017-07-25 2020-02-04 Yandex Europe Ag Method and system for generating a user-personalization interest parameter for identifying personalized targeted content item
RU2757546C2 (ru) * 2017-07-25 2021-10-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания персонализированного пользовательского параметра интереса для идентификации персонализированного целевого элемента содержимого
RU2689812C2 (ru) * 2017-07-25 2019-05-29 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения ранжированных позиций ненативных элементов с помощью системы ранжирования
US11256991B2 (en) 2017-11-24 2022-02-22 Yandex Europe Ag Method of and server for converting a categorical feature value into a numeric representation thereof
US11995519B2 (en) 2017-11-24 2024-05-28 Direct Cursus Technology L.L.C Method of and server for converting categorical feature value into a numeric representation thereof and for generating a split value for the categorical feature

Also Published As

Publication number Publication date
BRPI0708397A2 (pt) 2011-05-31
KR20080114708A (ko) 2008-12-31
US20070208730A1 (en) 2007-09-06
EP1997065A1 (en) 2008-12-03
RU2008135459A (ru) 2010-03-10
KR101366408B1 (ko) 2014-03-03
CA2644440A1 (en) 2007-09-20
JP5247475B2 (ja) 2013-07-24
EP1997065A4 (en) 2011-04-13
JP2009528619A (ja) 2009-08-06
WO2007106269A1 (en) 2007-09-20
MX2008011223A (es) 2008-11-04

Similar Documents

Publication Publication Date Title
RU2435212C2 (ru) Сбор данных о пользовательском поведении при веб-поиске для повышения релевантности веб-поиска
US10942905B2 (en) Systems and methods for cleansing automated robotic traffic
Middleton et al. Capturing knowledge of user preferences: ontologies in recommender systems
RU2701110C2 (ru) Изучение и использование контекстных правил извлечения контента для устранения неоднозначности запросов
US7152057B2 (en) Utilizing information redundancy to improve text searches
US8886623B2 (en) Large scale concept discovery for webpage augmentation using search engine indexers
Teevan et al. Slow search: Information retrieval without time constraints
US11113291B2 (en) Method of and system for enriching search queries for ranking search results
RU2419858C2 (ru) Система, способ и интерфейс для обеспечения персонализированного поиска и доступа к информации
RU2677380C2 (ru) Способ и система ранжирования множества документов на странице результатов поиска
RU2744029C1 (ru) Система и способ формирования обучающего набора для алгоритма машинного обучения
US20160335603A1 (en) Evaluating service providers using a social network
Bedi et al. A framework for personalizing atypical web search sessions with concept-based user profiles using selective machine learning techniques
US20060224579A1 (en) Data mining techniques for improving search engine relevance
WO2008140943A1 (en) Accounting for behavioral variability in web search
US10740420B2 (en) Computer-implemented platform for generating query-answer pairs
RU2733481C2 (ru) Способ и система генерирования признака для ранжирования документа
US20170199939A1 (en) Method of and a system for website ranking using an appeal factor
US20210075809A1 (en) Method of and system for identifying abnormal site visits
US11334559B2 (en) Method of and system for identifying abnormal rating activity
Dorn Web Information Retrieval and Search
Broccolo Query log based techniques to improve the performance of a web search engine
Gupta et al. Disambiguation of User Search Query
Bhojawala et al. Search Logs Mining: Survey
Lieberam-Schmidt et al. Web Search

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20130209