RU2017146276A - Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса - Google Patents

Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса Download PDF

Info

Publication number
RU2017146276A
RU2017146276A RU2017146276A RU2017146276A RU2017146276A RU 2017146276 A RU2017146276 A RU 2017146276A RU 2017146276 A RU2017146276 A RU 2017146276A RU 2017146276 A RU2017146276 A RU 2017146276A RU 2017146276 A RU2017146276 A RU 2017146276A
Authority
RU
Russia
Prior art keywords
gram
grams
server
past user
given
Prior art date
Application number
RU2017146276A
Other languages
English (en)
Other versions
RU2711103C2 (ru
RU2017146276A3 (ru
Inventor
Алексей Галимович Шаграев
Original Assignee
Общество С Ограниченной Ответственностью "Яндекс"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество С Ограниченной Ответственностью "Яндекс" filed Critical Общество С Ограниченной Ответственностью "Яндекс"
Priority to RU2017146276A priority Critical patent/RU2711103C2/ru
Priority to US16/022,811 priority patent/US10846340B2/en
Publication of RU2017146276A publication Critical patent/RU2017146276A/ru
Publication of RU2017146276A3 publication Critical patent/RU2017146276A3/ru
Application granted granted Critical
Publication of RU2711103C2 publication Critical patent/RU2711103C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24575Query processing with adaptation to user needs using context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/274Converting codes to words; Guess-ahead of partial word inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Claims (52)

1. Способ обучения алгоритма машинного обучения (MLA) для определения предлагаемого варианта расширения частично введенного пользователем запроса, представляющего собой часть предполагаемого пользовательского запроса, выполняемый сервером и включающий в себя:
прием сервером множества прошлых пользовательских запросов;
разделение сервером множества прошлых пользовательских запросов на множество n-грамм, причем каждая из множества n-грамм связана с по меньшей мере одним соответствующим прошлым пользовательским запросом и соответствующими признаками n-граммы, указывающими на попарное совместное появление n-грамм из каждой возможной пары n-грамм из множества n-грамм во множестве прошлых пользовательских запросов; и
для данной n-граммы из данного прошлого пользовательского запроса:
выбор сервером по меньшей мере одной возможной n-граммы из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов;
формирование сервером соответствующих векторов признаков для данной n-граммы и по меньшей мере одной возможной n-граммы в зависимости от соответствующих признаков n-грамм;
формирование сервером для данной n-граммы обучающего набора, содержащего входной сегмент и сегмент метки, при этом входной сегмент основан на данной n-грамме, по меньшей мере одной возможной n-грамме и соответствующих векторах признаков, а сегмент метки основан на данном прошлом пользовательском запросе и по меньшей мере одной возможной n-грамме и указывает на групповое совместное появление группы n-грамм в данном прошлом пользовательском запросе, причем группа n-грамм включает в себя (а) по меньшей мере одну n-грамму из по меньшей мере одной возможной n-граммы и (б) данную n-грамму, и
обучение сервером алгоритма MLA на основе обучающего набора для определения на этапе его использования предсказанного группового совместного появления по меньшей мере одной используемой возможной n-граммы и по меньшей мере одной используемой n-граммы в предполагаемом пользовательском запросе, причем по меньшей мере одна используемая n-грамма представляет собой частично введенный пользователем запрос, а предсказанное групповое совместное появление предназначено для определения того, какая из по меньшей мере одной используемой возможной n-граммы должна использоваться в качестве соответствующего предлагаемого варианта расширения запроса.
2. Способ по п. 1, отличающийся тем, что содержит определение сервером признаков n-граммы, которые должны быть связаны с каждой n-граммой из множества n-грамм, в зависимости от множества n-грамм и множества прошлых пользовательских запросов.
3. Способ по п. 1, отличающийся тем, что выбор по меньшей мере одной возможной n-граммы из множества n-грамм включает в себя выбор сервером только тех n-грамм из множества n-грамм, которые появлялись совместно с данной n-граммой во множестве прошлых пользовательских запросов.
4. Способ по п. 1, отличающийся тем, что выбор по меньшей мере одной возможной n-граммы из множества n-грамм включает в себя
ранжирование сервером по меньшей мере некоторых n-грамм из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов; и
выбор сервером по меньшей мере одной n-граммы с наибольшим рангом из по меньшей мере некоторых n-грамм из множества n-грамм в качестве по меньшей мере одной возможной n-граммы.
5. Способ по п. 1, отличающийся тем, что n-грамма из множества n-грамм, появлявшаяся совместно с данной n-граммой в одном из множества прошлых пользовательских запросов, является предшествующей n-граммой для данной n-граммы в одном из множества прошлых пользовательских запросов или последующей n-граммой для данной n-граммы в одном из множества прошлых пользовательских запросов.
6. Способ по п. 5, отличающийся тем, что предшествующая n-грамма является непосредственно предшествующей n-граммой, а последующая n-грамма является непосредственно последующей n-граммой.
7. Способ по п. 1, отличающийся тем, что признаки данной n-граммы указывают на попарное совместное появление каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов.
8. Способ по п. 1, отличающийся тем, что дополнительно включает в себя:
прием сервером частично введенного пользователем запроса;
разделение сервером частично введенного пользователем запроса на по меньшей мере одну используемую n-грамму, связанную с соответствующими признаками n-граммы;
выбор сервером по меньшей мере одной используемой возможной n-граммы из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и по меньшей мере одной используемой n-граммы во множестве прошлых пользовательских запросов;
формирование сервером соответствующих векторов признаков для по меньшей мере одной используемой n-граммы и по меньшей мере одной используемой возможной n-граммы в зависимости от соответствующих признаков n-грамм;
определение сервером, выполняющим алгоритм MLA, предсказанного группового совместного появления по меньшей мере одной используемой возможной n-граммы и по меньшей мере одной используемой n-граммы, причем определение предсказанного группового совместного появления основано на по меньшей мере одной используемой n-грамме, по меньшей мере одной используемой возможной n-грамме и соответствующих векторах признаков.
9. Способ по п. 8, отличающийся тем, что по меньшей мере одна используемая возможная n-грамма представляет собой по меньшей мере две используемые возможные n-граммы, причем способ дополнительно включает в себя ранжирование сервером по меньшей мере двух используемых возможных n-грамм в зависимости от предсказанного группового совместного появления.
10. Способ по п. 9, отличающийся тем, что дополнительно включает в себя определение сервером на основе предсказанного группового совместного появления того, какая из по меньшей мере одной используемой возможной n-граммы должна использоваться в качестве соответствующего предлагаемого варианта расширения запроса.
11. Способ по п. 1, отличающийся тем, что данная n-грамма может являться по меньшей мере одной из следующих n-грамм:
основанная на буквах n-грамма;
основанная на фонемах n-грамма;
основанная на слогах n-грамма;
основанная на словах n-грамма.
12. Сервер для обучения алгоритма машинного обучения (MLA) для определения предлагаемого варианта расширения частично введенного пользователем запроса, представляющего собой часть предполагаемого пользовательского запроса, выполненный с возможностью:
принимать множество прошлых пользовательских запросов;
разделять множество прошлых пользовательских запросов на множество n-грамм, причем каждая из множества n-грамм связана с по меньшей мере одним соответствующим прошлым пользовательским запросом и соответствующими признаками n-граммы, указывающими на попарное совместное появление n-грамм из каждой возможной пары n-грамм из множества n-грамм во множестве прошлых пользовательских запросов; и
для данной n-граммы из данного прошлого пользовательского запроса:
выбирать по меньшей мере одну возможную n-грамму из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов;
формировать соответствующие векторы признаков для данной n-граммы и по меньшей мере одной возможной n-граммы в зависимости от соответствующих признаков n-грамм;
формировать для данной n-граммы обучающий набор, содержащий входной сегмент и сегмент метки, при этом входной сегмент основан на данной n-грамме, по меньшей мере одной возможной n-грамме и соответствующих векторах признаков, а сегмент метки основан на данном прошлом пользовательском запросе и по меньшей мере одной возможной n-грамме и указывает на групповое совместное появление группы n-грамм в данном прошлом пользовательском запросе, причем группа n-грамм включает в себя (а) по меньшей мере одну n-грамму из по меньшей мере одной возможной n-граммы и (б) данную n-грамму, и
обучать алгоритм MLA на основе обучающего набора для определения на этапе его использования предсказанного группового совместного появления по меньшей мере одной используемой возможной n-граммы и по меньшей мере одной используемой n-граммы в предполагаемом пользовательском запросе, причем по меньшей мере одна используемая n-грамма представляет собой частично введенный пользователем запрос, а предсказанное групповое совместное появление предназначено для определения того, какая из по меньшей мере одной используемой возможной n-граммы должна использоваться в качестве соответствующего предлагаемого варианта расширения запроса.
13. Сервер по п. 12, отличающийся тем, что сервер дополнительно выполнен с возможностью определять признаки n-граммы, которые должны быть связаны с каждой n-граммой из множества n-грамм, в зависимости от множества n-грамм и множества прошлых пользовательских запросов.
14. Сервер по п. 12, отличающийся тем, что возможность сервера выбирать по меньшей мере одну возможную n-грамму из множества n-грамм включает в себя возможность выбирать только те n-граммы из множества n-грамм, которые появлялись совместно с данной n-граммой во множестве прошлых пользовательских запросов.
15. Сервер по п. 12, отличающийся тем, что возможность сервера выбирать по меньшей мере одну возможную n-грамму из множества n-грамм включает в себя возможность:
ранжировать по меньшей мере некоторые n-граммы из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов; и
выбирать по меньшей мере одну n-грамму с наибольшим рангом из по меньшей мере некоторых n-грамм из множества n-грамм в качестве по меньшей мере одной возможной n-граммы.
16. Сервер по п. 12, отличающийся тем, что n-грамма из множества n-грамм, появлявшаяся совместно с данной n-граммой в одном из множества прошлых пользовательских запросов, является предшествующей n-граммой для данной n-граммы в одном из множества прошлых пользовательских запросов или последующей n-граммой для данной n-граммы в одном из множества прошлых пользовательских запросов.
17. Сервер по п. 16, отличающийся тем, что предшествующая n-грамма является непосредственно предшествующей n-граммой, а последующая n-грамма является непосредственно последующей n-граммой.
18. Сервер по п. 12, отличающийся тем, что признаки данной n-граммы указывают на попарное совместное появление каждой n-граммы из множества n-грамм и данной n-граммы во множестве прошлых пользовательских запросов.
19. Сервер по п. 12, отличающийся тем, что сервер дополнительно выполнен с возможностью:
принимать частично введенный пользователем запрос;
разделять частично введенный пользователем запрос на по меньшей мере одну используемую n-грамму, связанную с соответствующими признаками n-граммы;
выбирать по меньшей мере одну используемую возможную n-грамму из множества n-грамм в зависимости от попарного совместного появления каждой n-граммы из множества n-грамм и по меньшей мере одной используемой n-граммы во множестве прошлых пользовательских запросов;
формировать соответствующие векторы признаков для по меньшей мере одной используемой n-граммы и по меньшей мере одной используемой возможной n-граммы в зависимости от соответствующих признаков n-грамм; и
определять путем выполнения алгоритма MLA предсказанное групповое совместное появление по меньшей мере одной используемой возможной n-граммы и по меньшей мере одной используемой n-граммы, причем определение предсказанного группового совместного появления основано на по меньшей мере одной используемой n-грамме, по меньшей мере одной используемой возможной n-грамме и соответствующих векторах признаков.
20. Сервер по п. 19, отличающийся тем, что по меньшей мере одна используемая возможная n-грамма представляет собой по меньшей мере две используемые возможные n-граммы, причем сервер дополнительно выполнен с возможностью ранжировать по меньшей мере две используемые возможные n-граммы в зависимости от предсказанного группового совместного появления.
RU2017146276A 2017-12-27 2017-12-27 Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса RU2711103C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2017146276A RU2711103C2 (ru) 2017-12-27 2017-12-27 Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
US16/022,811 US10846340B2 (en) 2017-12-27 2018-06-29 Method and server for predicting a query-completion suggestion for a partial user-entered query

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2017146276A RU2711103C2 (ru) 2017-12-27 2017-12-27 Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса

Publications (3)

Publication Number Publication Date
RU2017146276A true RU2017146276A (ru) 2019-06-27
RU2017146276A3 RU2017146276A3 (ru) 2019-10-30
RU2711103C2 RU2711103C2 (ru) 2020-01-15

Family

ID=66950331

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017146276A RU2711103C2 (ru) 2017-12-27 2017-12-27 Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса

Country Status (2)

Country Link
US (1) US10846340B2 (ru)
RU (1) RU2711103C2 (ru)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11244015B1 (en) * 2020-05-13 2022-02-08 Pinterest, Inc. Projecting queries into a content item embedding space

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7487145B1 (en) 2004-06-22 2009-02-03 Google Inc. Method and system for autocompletion using ranked results
US7461059B2 (en) 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US20090171929A1 (en) 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US8010547B2 (en) 2008-04-15 2011-08-30 Yahoo! Inc. Normalizing query words in web search
US20100205198A1 (en) * 2009-02-06 2010-08-12 Gilad Mishne Search query disambiguation
US8688727B1 (en) * 2010-04-26 2014-04-01 Google Inc. Generating query refinements
US20120179705A1 (en) 2011-01-11 2012-07-12 Microsoft Corporation Query reformulation in association with a search box
US20120191745A1 (en) 2011-01-24 2012-07-26 Yahoo!, Inc. Synthesized Suggestions for Web-Search Queries
US9031970B1 (en) 2011-01-26 2015-05-12 Google Inc. Query autocompletions
US8577913B1 (en) 2011-05-27 2013-11-05 Google Inc. Generating midstring query refinements
US8515985B1 (en) 2011-06-24 2013-08-20 Google Inc. Search query suggestions
US8417718B1 (en) 2011-07-11 2013-04-09 Google Inc. Generating word completions based on shared suffix analysis
US20130041878A1 (en) 2011-08-11 2013-02-14 Microsoft Corporation Autosuggesting an equivalent query
US20130198217A1 (en) 2012-01-27 2013-08-01 Microsoft Corporation Techniques for testing rule-based query transformation and generation
US9235654B1 (en) 2012-02-06 2016-01-12 Google Inc. Query rewrites for generating auto-complete suggestions
US9594851B1 (en) * 2012-02-07 2017-03-14 Google Inc. Determining query suggestions
US10984337B2 (en) * 2012-02-29 2021-04-20 Microsoft Technology Licensing, Llc Context-based search query formation
US10108699B2 (en) * 2013-01-22 2018-10-23 Microsoft Technology Licensing, Llc Adaptive query suggestion
US9336277B2 (en) * 2013-05-31 2016-05-10 Google Inc. Query suggestions based on search data
US9116952B1 (en) * 2013-05-31 2015-08-25 Google Inc. Query refinements using search data
US10936632B2 (en) 2014-09-11 2021-03-02 Ebay Inc. Enhanced search query suggestions
US9767183B2 (en) 2014-12-30 2017-09-19 Excalibur Ip, Llc Method and system for enhanced query term suggestion
RU2626663C2 (ru) * 2015-06-30 2017-07-31 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для создания предложений по завершению поисковых запросов

Also Published As

Publication number Publication date
RU2711103C2 (ru) 2020-01-15
RU2017146276A3 (ru) 2019-10-30
US20190197131A1 (en) 2019-06-27
US10846340B2 (en) 2020-11-24

Similar Documents

Publication Publication Date Title
RU2016138553A (ru) Корректировка представления страницы результатов системы поиска (serp) на основе цели запроса
RU2638728C2 (ru) Предложения запроса на основе данных поиска
JP5432243B2 (ja) メディアオブジェクト照会の送信および反応
RU2014135211A (ru) Формирование поискового запроса на основе контекста
JP2016224994A5 (ru)
RU2017122991A (ru) Различение неоднозначных выражений для улучшения взаимодействия с пользователем
WO2017196419A8 (en) Searching structured and unstructured data sets
RU2017142112A (ru) Устройство и способ персонализированного поиска на основе признаков изображения продукта
BR112017019015A2 (pt) sistema que facilita o uso de palavras-chave inseridas pelo usuário para buscar conceitos clínicos relacionados, e método para facilitar o uso de palavras-chave inseridas pelo usuário para buscar conceitos clínicos relacionados
RU2015141341A (ru) Способ и устройство для кластеризации предложений для поисковых запросов
RU2013122474A (ru) Регистрация для поискового интерфейса пользователя системного уровня
JP2014533407A5 (ru)
MX2022002559A (es) Recomendaciones de articulos complementarios basadas en inserciones multimodales.
US20160055533A1 (en) Response generation device, response generation method, and non-transitory computer readable storage medium
RU2014126774A (ru) Ранжиратор результатов поиска
RU2015141517A (ru) Способ и поисковая система предоставления поисковых результатов на множество клиентских устройств
EP4073679A1 (en) Sentence similarity scoring using neural network distillation
JP2010503051A5 (ru)
AU2017316544A8 (en) Broker chat bot
CN112612875B (zh) 一种查询词自动扩展方法、装置、设备及存储介质
JP2014215826A (ja) 検索システム
RU2017146276A (ru) Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
RU2015111167A (ru) Устройство и способ поиска объектов контента, использующий это устройство
CN104978553B (zh) 图像分析的方法及装置
JPH0454564A (ja) 重み学習型テキストベース検索装置