RU2015156488A - Предложения запроса на основе данных поиска - Google Patents

Предложения запроса на основе данных поиска Download PDF

Info

Publication number
RU2015156488A
RU2015156488A RU2015156488A RU2015156488A RU2015156488A RU 2015156488 A RU2015156488 A RU 2015156488A RU 2015156488 A RU2015156488 A RU 2015156488A RU 2015156488 A RU2015156488 A RU 2015156488A RU 2015156488 A RU2015156488 A RU 2015156488A
Authority
RU
Russia
Prior art keywords
refinement
query
cluster
topic
request
Prior art date
Application number
RU2015156488A
Other languages
English (en)
Other versions
RU2638728C2 (ru
Inventor
Бехсхад БЕХЗАДИ
Евгений А. ЧЕРЕПАНОВ
Нильс ГРИМСМО
Орельен БОФФИ
Алессандро АГОСТИНИ
Карой ЧАЛОГАНЬ
Фредрик БЕРГЕНЛИД
Маттиас ХЕЙЛЕР
Марцин М. НОВАК-ПЖИГОДЗКИ
Original Assignee
Гугл Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Гугл Инк. filed Critical Гугл Инк.
Publication of RU2015156488A publication Critical patent/RU2015156488A/ru
Application granted granted Critical
Publication of RU2638728C2 publication Critical patent/RU2638728C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (91)

1. Способ, содержащий этапы, на которых
принимают посредством одного или более компьютеров первый запрос;
определяют уточнения запроса на основе первого запроса;
генерируют исходя из уточнений запроса кластеры уточнений, причем каждый кластер уточнения соответствует конкретной теме и каждый кластер уточнения включает в себя уточнения запроса, которые определены как принадлежащие конкретной теме, которой соответствует данный кластер уточнения;
ранжируют кластеры уточнений;
выбирают кластер уточнения, который является самым высоким по рангу относительно других кластеров уточнений при упомянутом ранжировании, в качестве первого кластера уточнения поиска для первого запроса; и
генерируют первые данные тематической подсказки на основе темы, связанной с первым кластером уточнения поиска, причем первые данные тематической подсказки описывают запрос первого пользовательского ввода n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска.
2. Способ по п.1, дополнительно содержащий этапы, на которых
определяют посредством одного или более компьютеров вторые запросы на основе первого запроса, где каждый из вторых запросов является запросом, который соответствует пороговому уровню сходства с первым запросом, причем первый запрос является одним из этих вторых запросов; и
для каждого из вторых запросов, определяют уточнения запроса на основе данного второго запроса.
3. Способ по п.1, дополнительно содержащий выполнение операции поиска с использованием первого кластера уточнения поиска и на основе первого запроса.
4. Способ по п.3, в котором выполнение операции поиска содержит этапы, на которых:
принимают для сеанса пользователя третий запрос, который соответствует первому запросу;
предоставляют для сеанса пользователя первые данные тематической подсказки;
принимают для сеанса пользователя выбор n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска, причем упомянутый выбор следует за третьим запросом без другого промежуточного пользовательского ввода для сеанса пользователя; и
предоставляют для сеанса пользователя результаты поиска, отвечающие первому запросу и упомянутому выбору.
5. Способ по п.3, в котором выполнение операции поиска содержит этапы, на которых
принимают для сеанса пользователя третий запрос, который соответствует первому запросу;
принимают цифровое представление речи на основе первых данных тематической подсказки; и
предоставляют для сеанса пользователя цифровое представление речи в ответ на третий запрос.
6. Способ по п.1, в котором конкретная тема, связанная с кластером уточнения, является темой, включенной в запросы в кластере уточнения и не включенной в первый запрос.
7. Способ по п.1, в котором упомянутое ранжирование содержит этапы, на которых
оценивают каждый из кластеров уточнений на основе количества раз, которое n-грамма, связанная с конкретной темой кластера уточнения, встречается в запросах, включенных в кластер уточнения; и
ранжируют кластеры уточнений на основе оценок, связанных с кластерами уточнений, где кластер уточнения, ранг которого является самым высоким при ранжировании относительно других кластеров уточнений, имеет наиболее высокую оценку из кластеров уточнений.
8. Способ по п.7, в котором упомянутый выбор содержит этапы, на которых:
определяют, превышает ли наиболее высокая оценка пороговое значение; и
выбирают на основе определения того, что наиболее высокая оценка превышает пороговое значение, кластер уточнения, ранг которого является самым высоким при ранжировании относительно других кластеров уточнений, в качестве первого кластера уточнения поиска для первого запроса.
9. Способ по п.7, дополнительно содержащий этапы, на которых
принимают для сеанса пользователя третий запрос, который соответствует первому запросу;
предоставляют для сеанса пользователя первые данные тематической подсказки;
принимают для сеанса пользователя первый выбор n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска;
предоставляют для сеанса пользователя вторые данные тематической подсказки на основе темы, связанной со вторым кластером уточнения поиска, который имеет вторую по величине оценку из кластеров уточнений, или с кластером уточнения, имеющим наиболее высокую комбинированную оценку для сочетания первого запроса и первого выбора, где вторые данные тематической подсказки описывают запрос второго пользовательского ввода n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска;
принимают для сеанса пользователя второй выбор n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска; и
предоставляют для сеанса пользователя результаты поиска, отвечающие первому запросу, первому выбору и второму выбору.
10. Способ по п.9, в котором наиболее высокая оценка и вторая по величине оценка выше порогового значения.
11. Долговременный машиночитаемый носитель данных, на котором сохранены инструкции, исполняемые устройством обработки данных и при их исполнении предписывающие устройству обработки данных выполнять операции, содержащие:
прием первого запроса;
определение уточнений запроса на основе первого запроса;
генерирование, исходя из уточнений запроса, кластеров уточнений, где каждый кластер уточнения соответствует конкретной теме и каждый кластер уточнения включает в себя уточнения запроса, которые определены как принадлежащие конкретной теме, которой соответствует данный кластер уточнения;
ранжирование кластеров уточнений;
выбор кластера уточнения, который является самым высоким по рангу относительно других кластеров уточнений при упомянутом ранжировании, в качестве первого кластера уточнения поиска для первого запроса; и
генерирование первых данных тематической подсказки на основе темы, связанной с первым кластером уточнения поиска, причем первые данные тематической подсказки описывают запрос первого пользовательского ввода n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска.
12. Долговременный машиночитаемый носитель данных по п.11, при этом упомянутые операции дополнительно содержат
определение вторых запросов на основе первого запроса, где каждый из вторых запросов является запросом, который соответствует пороговому уровню сходства с первым запросом, причем первый запрос является одним из этих вторых запросов; и
для каждого из вторых запросов, определение уточнений запроса на основе этого второго запроса.
13. Долговременный машиночитаемый носитель данных по п.11, при этом упомянутые операции дополнительно содержат выполнение операции поиска с использованием первого кластера уточнения поиска и на основе первого запроса.
14. Долговременный машиночитаемый носитель данных по п.13, при этом выполнение операции поиска содержит
прием для сеанса пользователя, третьего запроса, который соответствует первому запросу;
предоставление для сеанса пользователя, первых данных тематической подсказки;
прием для сеанса пользователя, выбора n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска, причем упомянутый выбор следует за третьим запросом без другого промежуточного пользовательского ввода для сеанса пользователя; и
предоставление для сеанса пользователя, результатов поиска, отвечающих первому запросу и упомянутому выбору.
15. Долговременный машиночитаемый носитель данных по п.11, при этом конкретная тема, связанная с кластером уточнения, является темой, включенной в запросы в кластере уточнения и не включенной в первый запрос.
16. Долговременный машиночитаемый носитель данных по п.11, при этом упомянутое ранжирование содержит:
оценивание каждого из кластеров уточнений на основе количества раз, которое n-грамма, связанная с конкретной темой кластера уточнения, встречается в запросах, включенных в кластер уточнения; и
ранжирование кластеров уточнений на основе оценок, связанных с кластерами уточнений, где кластер уточнения, ранг которого является самым высоким при ранжировании относительно других кластеров уточнений, имеет наиболее высокую оценку из кластеров уточнений.
17. Долговременный машиночитаемый носитель данных по п.16, при этом упомянутые операции дополнительно содержат
прием, для сеанса пользователя, третьего запроса, который соответствует первому запросу;
предоставление для сеанса пользователя, первых данных тематической подсказки;
прием для сеанса пользователя первого выбора n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска;
предоставление для сеанса пользователя вторых данных тематической подсказки на основе темы, связанной со вторым кластером уточнения поиска, который имеет вторую по величине оценку из кластеров уточнений, или с кластером уточнения, имеющим наиболее высокую комбинированную оценку для сочетания первого запроса и первого выбора, при этом вторые данные тематической подсказки описывают запрос второго пользовательского ввода n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска;
прием для сеанса пользователя второго выбора n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска; и
предоставление для сеанса пользователя результатов поиска, отвечающих первому запросу, первому выбору и второму выбору.
18. Система, содержащая
устройство обработки данных; и
долговременный машиночитаемый носитель данных, выполненный с возможностью обмена данными с устройством обработки данных и хранящий инструкции, исполняемые устройством обработки данных, которые при их исполнении предписывают устройству обработки данных выполнять операции, содержащие:
прием первого запроса;
определение уточнений запроса на основе первого запроса;
генерирование, исходя из уточнений запроса, кластеров уточнений, где каждый кластер уточнения соответствует конкретной теме и каждый кластер уточнения включает в себя уточнения запроса, которые определены как принадлежащие конкретной теме, которой соответствует этот кластер уточнения;
ранжирование кластеров уточнений;
выбор кластера уточнения, который является самым высоким по рангу относительно других кластеров уточнений при упомянутом ранжировании, в качестве первого кластера уточнения поиска для первого запроса и
генерирование первых данных тематической подсказки на основе темы, связанной с первым кластером уточнения поиска, причем первые данные тематической подсказки описывают запрос первого пользовательского ввода n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска.
19. Система по п.18, при этом упомянутые операции дополнительно содержат:
определение вторых запросов на основе первого запроса, где каждый из вторых запросов является запросом, который соответствует пороговому уровню сходства с первым запросом, причем первый запрос является одним из этих вторых запросов; и
для каждого из вторых запросов, определение уточнения запроса на основе этого второго запроса.
20. Система по п.18, при этом упомянутые операции дополнительно содержат выполнение операции поиска с использованием первого кластера уточнения поиска и на основе первого запроса.
21. Система по п.20, в которой выполнение операции поиска содержит
прием для сеанса пользователя третьего запроса, который соответствует первому запросу;
предоставление для сеанса пользователя первых данных тематической подсказки;
прием для сеанса пользователя выбора n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска, при этом упомянутый выбор следует за третьим запросом без другого промежуточного пользовательского ввода для сеанса пользователя; и
предоставление для сеанса пользователя результатов поиска, отвечающих первому запросу и упомянутому выбору.
22. Система по п.18, в которой конкретная тема, связанная с кластером уточнения, является темой, включенной в запросы в кластере уточнения и не включенной в первый запрос.
23. Система по п.18, в которой упомянутое ранжирование содержит
оценивание каждого из кластеров уточнений на основе количества раз, которое n-грамма, связанная с конкретной темой кластера уточнения, встречается в запросах, включенных в кластер уточнения; и
ранжирование кластеров уточнений на основе оценок, связанных с кластерами уточнений, причем кластер уточнения, ранг которого является самым высоким при ранжировании относительно других кластеров уточнений, имеет наиболее высокую оценку из кластеров уточнений.
24. Система по п.23, при этом упомянутые операции дополнительно содержат:
прием для сеанса пользователя третьего запроса, который соответствует первому запросу;
предоставление для сеанса пользователя первых данных тематической подсказки;
прием для сеанса пользователя первого выбора n-граммы, которая относится к теме, связанной с первым кластером уточнения поиска;
предоставление для сеанса пользователя вторых данных тематической подсказки на основе темы, связанной со вторым кластером уточнения поиска, который имеет вторую по величине оценку из кластеров уточнений, или с кластером уточнения, имеющим наиболее высокую комбинированную оценку для сочетания первого запроса и первого выбора, при этом вторые данные тематической подсказки описывают запрос второго пользовательского ввода n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска;
прием для сеанса пользователя второго выбора n-граммы, которая относится к теме, связанной со вторым кластером уточнения поиска; и
предоставление для сеанса пользователя результатов поиска, отвечающих первому запросу, первому выбору и второму выбору.
RU2015156488A 2013-05-31 2014-05-20 Предложения запроса на основе данных поиска RU2638728C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/906,669 2013-05-31
US13/906,669 US9336277B2 (en) 2013-05-31 2013-05-31 Query suggestions based on search data
PCT/US2014/038743 WO2014193698A1 (en) 2013-05-31 2014-05-20 Query suggestions based on search data

Publications (2)

Publication Number Publication Date
RU2015156488A true RU2015156488A (ru) 2017-07-05
RU2638728C2 RU2638728C2 (ru) 2017-12-15

Family

ID=51059549

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015156488A RU2638728C2 (ru) 2013-05-31 2014-05-20 Предложения запроса на основе данных поиска

Country Status (5)

Country Link
US (1) US9336277B2 (ru)
EP (1) EP3005167A1 (ru)
CN (1) CN105247516B (ru)
RU (1) RU2638728C2 (ru)
WO (1) WO2014193698A1 (ru)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9116952B1 (en) 2013-05-31 2015-08-25 Google Inc. Query refinements using search data
US9864781B1 (en) * 2013-11-05 2018-01-09 Western Digital Technologies, Inc. Search of NAS data through association of errors
US9721024B2 (en) * 2014-12-19 2017-08-01 Facebook, Inc. Searching for ideograms in an online social network
US9792335B2 (en) 2014-12-19 2017-10-17 International Business Machines Corporation Creating and discovering learning content in a social learning system
US10817519B2 (en) * 2016-06-06 2020-10-27 Baidu Usa Llc Automatic conversion stage discovery
US20180052885A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Generating next user prompts in an intelligent online personal assistant multi-turn dialog
US10803245B2 (en) * 2016-09-06 2020-10-13 Microsoft Technology Licensing, Llc Compiling documents into a timeline per event
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US11004131B2 (en) 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US10860898B2 (en) 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
CN106528813B (zh) * 2016-11-18 2018-12-11 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
US10878479B2 (en) 2017-01-05 2020-12-29 Microsoft Technology Licensing, Llc Recommendation through conversational AI
RU2711103C2 (ru) * 2017-12-27 2020-01-15 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер для прогнозирования предлагаемого варианта расширения частично введенного пользователем запроса
US11854040B1 (en) 2018-03-23 2023-12-26 Amazon Technologies, Inc. Responding with unresponsive content
US11544303B1 (en) * 2018-03-23 2023-01-03 Amazon Technologies, Inc. Responding with unresponsive content
US11315552B1 (en) 2018-03-23 2022-04-26 Amazon Technologies, Inc. Responding with unresponsive content
CN112989153A (zh) * 2019-12-13 2021-06-18 阿里巴巴集团控股有限公司 数据处理方法、装置及计算机设备
US11442986B2 (en) * 2020-02-15 2022-09-13 International Business Machines Corporation Graph convolutional networks for video grounding
US11768837B1 (en) * 2021-12-28 2023-09-26 Wells Fargo Bank, N.A. Semantic entity search using vector space
US11880379B1 (en) 2022-04-28 2024-01-23 Wells Fargo Bank, N.A. Identity resolution in knowledge graph databases

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6163782A (en) 1997-11-19 2000-12-19 At&T Corp. Efficient and effective distributed information management
US6144958A (en) 1998-07-15 2000-11-07 Amazon.Com, Inc. System and method for correcting spelling errors in search queries
US7890526B1 (en) * 2003-12-30 2011-02-15 Microsoft Corporation Incremental query refinement
US8065316B1 (en) 2004-09-30 2011-11-22 Google Inc. Systems and methods for providing search query refinements
US7577643B2 (en) * 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
US20090089251A1 (en) * 2007-10-02 2009-04-02 Michael James Johnston Multimodal interface for searching multimedia content
US8108416B2 (en) 2007-10-31 2012-01-31 Yahoo! Inc. System and method for updating a search results page in response to a user map interaction
US8024332B2 (en) * 2008-08-04 2011-09-20 Microsoft Corporation Clustering question search results based on topic and focus
US9978365B2 (en) * 2008-10-31 2018-05-22 Nokia Technologies Oy Method and system for providing a voice interface
US20100146012A1 (en) * 2008-12-04 2010-06-10 Microsoft Corporation Previewing search results for suggested refinement terms and vertical searches
US8145623B1 (en) 2009-05-01 2012-03-27 Google Inc. Query ranking based on query clustering and categorization
US8190601B2 (en) * 2009-05-22 2012-05-29 Microsoft Corporation Identifying task groups for organizing search results
US8423538B1 (en) * 2009-11-02 2013-04-16 Google Inc. Clustering query refinements by inferred user intent
WO2011079415A1 (en) 2009-12-30 2011-07-07 Google Inc. Generating related input suggestions
US8880548B2 (en) 2010-02-17 2014-11-04 Microsoft Corporation Dynamic search interaction
US8392435B1 (en) 2010-04-14 2013-03-05 Google Inc. Query suggestions for a document based on user history
US8688727B1 (en) * 2010-04-26 2014-04-01 Google Inc. Generating query refinements
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9189550B2 (en) * 2011-11-17 2015-11-17 Microsoft Technology Licensing, Llc Query refinement in a browser toolbar
US9767144B2 (en) * 2012-04-20 2017-09-19 Microsoft Technology Licensing, Llc Search system with query refinement
US9684395B2 (en) * 2012-06-02 2017-06-20 Tara Chand Singhal System and method for context driven voice interface in handheld wireless mobile devices
US9547647B2 (en) * 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching

Also Published As

Publication number Publication date
RU2638728C2 (ru) 2017-12-15
WO2014193698A1 (en) 2014-12-04
US9336277B2 (en) 2016-05-10
CN105247516A (zh) 2016-01-13
EP3005167A1 (en) 2016-04-13
CN105247516B (zh) 2019-08-27
US20140358906A1 (en) 2014-12-04

Similar Documents

Publication Publication Date Title
RU2015156488A (ru) Предложения запроса на основе данных поиска
KR102150509B1 (ko) 음성 인식 시스템
US11514035B1 (en) Query refinements using search data
US10423677B2 (en) Time-box constrained searching in a distributed search system
US8321403B1 (en) Web search refinement
US10698654B2 (en) Ranking and boosting relevant distributable digital assistant operations
RU2015117787A (ru) Представление результатов поиска на основе намерения
US10380192B2 (en) Method and system for providing context based query suggestions
JP2014505945A5 (ru)
JP2015535114A5 (ru)
RU2016103814A (ru) Исполняемый на компьютере способ и система для поиска в инвертированном индексе, обладающем множеством списков словопозиций
JP2013537332A5 (ru)
NZ601132A (en) Systems and methods for ranking documents
RU2014110965A (ru) Обеспечение руководства тематическим поиском
RU2016130328A (ru) Выявление навигационных результатов поиска
US20180089325A1 (en) Method, Apparatus and Client of Processing Information Recommendation
US10394838B2 (en) App store searching
CN108304421B (zh) 一种信息搜索方法及装置
WO2014053825A3 (en) Search
RU2015153010A (ru) Способ поиска в базе данных
JP2015148758A (ja) 音声対話システム及び音声対話方法
US9449095B1 (en) Revising search queries
JP2020071678A5 (ru)
Wang et al. Understanding the Query: THCIB and THUIS at NTCIR-10 Intent Task.
US10055463B1 (en) Feature based ranking adjustment