RU2008110731A - Функции ранжирования, использующие статистические данные используемости документа - Google Patents

Функции ранжирования, использующие статистические данные используемости документа Download PDF

Info

Publication number
RU2008110731A
RU2008110731A RU2008110731/09A RU2008110731A RU2008110731A RU 2008110731 A RU2008110731 A RU 2008110731A RU 2008110731/09 A RU2008110731/09 A RU 2008110731/09A RU 2008110731 A RU2008110731 A RU 2008110731A RU 2008110731 A RU2008110731 A RU 2008110731A
Authority
RU
Russia
Prior art keywords
document
usability
documents
value
actual
Prior art date
Application number
RU2008110731/09A
Other languages
English (en)
Other versions
RU2419861C2 (ru
Inventor
Дмитрий МЕЙЕРЗОН (US)
Дмитрий МЕЙЕРЗОН
Хьюго САРАГОЗА (US)
Хьюго САРАГОЗА
Кайл ПЕЛТОНЕН (US)
Кайл ПЕЛТОНЕН
Эндрю ДЕБРЮИН (US)
Эндрю ДЕБРЮИН
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Publication of RU2008110731A publication Critical patent/RU2008110731A/ru
Application granted granted Critical
Publication of RU2419861C2 publication Critical patent/RU2419861C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99938Concurrency, e.g. lock management in shared database

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

1. Машиночитаемый носитель, имеющий сохраненные на нем исполняемые компьютером инструкции для ранжирования документов в сети, при этом упомянутые исполняемые компьютером инструкции используют функцию ранжирования, которая содержит один или более независимых от запроса компонентов, причем, по меньшей мере, один независимый от запроса компонент включает в себя параметр используемости, которым учитываются сформированные сервером и сохраненные на сервере данные используемости для одного или более документов в сети. ! 2. Машиночитаемый носитель по п.1, в котором значение используемости включает в себя (i) фактическое значение используемости, основанное на данных фактической используемости, поддерживаемых сервером, или (ii) используемое по умолчанию значение используемости, которое не основано на данных фактической используемости. ! 3. Машиночитаемый носитель по п.2, в котором фактическое значение используемости зависит от одного или более связанных с используемостью свойств документа или папки, содержащей набор документов, причем упомянутые одно или более связанных с используемостью свойств включают в себя общее количество просмотров пользователями документа или папки в пределах заданного промежутка времени, среднее количество просмотров документа или папки в расчете на пользователя в пределах заданного промежутка времени, полное время использования конкретного документа или папки в пределах заданного промежутка времени, среднее время использования конкретного документа или папки в пределах заданного промежутка времени, при этом упомянутый заданный промежуток времени включает в себя прошлую неделю, �

Claims (20)

1. Машиночитаемый носитель, имеющий сохраненные на нем исполняемые компьютером инструкции для ранжирования документов в сети, при этом упомянутые исполняемые компьютером инструкции используют функцию ранжирования, которая содержит один или более независимых от запроса компонентов, причем, по меньшей мере, один независимый от запроса компонент включает в себя параметр используемости, которым учитываются сформированные сервером и сохраненные на сервере данные используемости для одного или более документов в сети.
2. Машиночитаемый носитель по п.1, в котором значение используемости включает в себя (i) фактическое значение используемости, основанное на данных фактической используемости, поддерживаемых сервером, или (ii) используемое по умолчанию значение используемости, которое не основано на данных фактической используемости.
3. Машиночитаемый носитель по п.2, в котором фактическое значение используемости зависит от одного или более связанных с используемостью свойств документа или папки, содержащей набор документов, причем упомянутые одно или более связанных с используемостью свойств включают в себя общее количество просмотров пользователями документа или папки в пределах заданного промежутка времени, среднее количество просмотров документа или папки в расчете на пользователя в пределах заданного промежутка времени, полное время использования конкретного документа или папки в пределах заданного промежутка времени, среднее время использования конкретного документа или папки в пределах заданного промежутка времени, при этом упомянутый заданный промежуток времени включает в себя прошлую неделю, прошлый месяц, прошлый год, время существования документа или папки, либо любой другой промежуток времени.
4. Машиночитаемый носитель по п.1, в котором упомянутый, по меньшей мере, один независимый от запроса компонент представлен формулой:
Figure 00000001
в которой: U - фактическое значение используемости или используемое по умолчанию значение используемости; и
Figure 00000002
и
Figure 00000003
- параметры, корректирующие значение используемости.
5. Машиночитаемый носитель по п.1, в котором упомянутый, по меньшей мере, один независимый от запроса компонент включает в себя и (i) параметр используемости и (ii) параметр дистанции в кликах (количества щелчков, например, мышью («кликов») от документа до страницы верхнего уровня) или смещенной дистанции в кликах.
6. Машиночитаемый носитель по п.1, в котором упомянутый, по меньшей мере, один независимый от запроса компонент включает в себя и параметр используемости, и параметр глубины URL.
7. Машиночитаемый носитель по п.1, дополнительно содержащий исполняемые компьютером инструкции для назначения показателя, сформированного функцией ранжирования, каждому документу в сети, причем упомянутый показатель используется для ранжирования документов по порядку.
8. Машиночитаемый носитель по п.7, в котором показатель каждого документа формируется, используя формулу:
Figure 00000004
в которой:
Figure 00000005
- взвешенная повторяемость терма,
N - количество документов в сети,
n - количество документов, содержащих поисковый терм,
w cd - вес независимого от запроса компонента,
b cd - вес дистанции в кликах,
b ud - вес глубины URL,
CD - вычисленная дистанция в кликах или назначенная смещенная дистанция в кликах для документа,
k ew - корректирующая константа, соответствующая весам ребер,
UD - глубина URL,
U - фактическое значение используемости или используемое по умолчанию значение используемости,
w u и k u - параметры, корректирующие значение используемости, и
k cd и k l - константы.
9. Машиночитаемый носитель по п.1, дополнительно содержащий исполняемые компьютером инструкции для принятия введенного пользователем поискового запроса, проведения поиска документов в сети, чтобы сформировать результаты поиска, содержащие многочисленные документы, ранжирования для многочисленных документов, соответствующих результатам поиска, используя функцию ранжирования, чтобы сформировать ранжированные результаты поиска, и отображения ранжированных результатов поиска пользователю.
10. Машиночитаемый носитель по п.1, дополнительно содержащий исполняемые компьютером инструкции для предоставления возможности администратору вручную настраивать результаты ранжирования, сформированные посредством функции ранжирования.
11. Вычислительная система, содержащая, по меньшей мере, один модуль приложения, используемый в вычислительной системе, причем этот, по меньшей мере, один модуль приложения содержит прикладной код, загружаемый в вычислительную систему с машиночитаемого носителя по п.1.
12. Способ определения показателя релевантности документа для документа в сети, содержащий этапы, на которых
назначают фактическое значение (U А ) используемости одному или более документам в сети, содержащей N документов, при этом фактическое значение (U А ) используемости основывается на данных фактической используемости, обслуживаемых и сохраненных на сервере;
назначают документам, которые не имеют ассоциированных с ними данных фактической используемости, используемое по умолчанию значение (U D ) используемости, если меньше чем N документам назначено фактическое значение (U А ) используемости;
используют значение используемости для каждого документа для определения показателя релевантности документа заданного документа в сети.
13. Способ по п.12, дополнительно содержащий этап, на котором извлекают данные фактической используемости или фактическое значение (U А ) используемости для документа из файла хранения данных на сервере.
14. Способ по п.12, дополнительно содержащий этап, на котором сохраняют данные фактической используемости или фактическое значение (U А ) используемости для документа в файле хранения данных.
15. Способ по п.12, в котором показатель релевантности документа для каждого документа в сети формируется, используя формулу:
Figure 00000004
в которой:
Figure 00000005
- взвешенная повторяемость терма,
N - количество документов в сети,
n - количество документов, содержащих поисковый терм,
w cd - вес независимого от запроса компонента,
b cd - вес дистанции в кликах,
b ud - вес глубины URL,
CD - вычисленная дистанция в кликах или назначенная смещенная дистанция в кликах для документа,
k ew - корректируется константа, соответствующая весам ребер,
UD - глубина URL,
U - фактическое значение используемости или используемое по умолчанию значение используемости,
w u и k u - параметры, корректирующие значение используемости, и
k cd и k l - константы.
16. Способ ранжирования документов в сети, содержащий этапы, на которых
определяют показатель релевантности документа для каждого документа в сети, используя способ по п.12; и
ранжируют документы в убывающем порядке, исходя из показателя релевантности документа каждого документа.
17. Способ ранжирования результатов поиска по поисковому запросу, содержащий этапы, на которых
определяют показатель релевантности документа для каждого документа в сети, используя способ по п.12; и
ранжируют документы в убывающем порядке, исходя из показателя релевантности документа каждого документа.
18. Машиночитаемый носитель информации, имеющий сохраненные на нем исполняемые компьютером инструкции для выполнения способа по п.12.
19. Вычислительная система, содержащая, по меньшей мере, один модуль приложения, используемый в вычислительной системе, причем этот, по меньшей мере, один модуль приложения содержит прикладной код для выполнения способа определения показателя релевантности документа для документа в сети, содержащего этапы, на которых
назначают фактическое значение (U А ) используемости одному или более документам в сети, содержащей N документов, при этом фактическое значение (U А ) используемости основывается на данных фактической используемости, обслуживаемых и сохраненных на сервере;
назначают документам, которые не имеют ассоциированных с ними данных фактической используемости, используемое по умолчанию значение (U D ) используемости, если меньше чем N документам назначено фактическое значение (U А ) используемости;
используют значение используемости для каждого документа для определения показателя релевантности документа заданного документа в сети.
20. Вычислительная система по п.19, в которой фактическое значение используемости зависит от одного или более относящихся к используемости свойств документа или содержащей набор документов папки, причем упомянутое одно или более относящихся к используемости свойств включают в себя общее количество просмотров пользователями документа или папки в пределах заданного периода времени, среднее количество просмотров документа или папки в расчете на пользователя в пределах заданного периода времени, общее время использования конкретного документа или папки в пределах заданного периода времени, среднее время использования конкретного документа или папки в пределах заданного периода времени, при этом упомянутый заданный период времени включает в себя прошлую неделю, прошлый месяц, прошлый год, время существования документа или папки, либо любой другой период времени.
RU2008110731/08A 2005-09-21 2006-09-20 Функции ранжирования, использующие статистические данные используемости документа RU2419861C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/231,955 US7499919B2 (en) 2005-09-21 2005-09-21 Ranking functions using document usage statistics
US11/231,955 2005-09-21

Publications (2)

Publication Number Publication Date
RU2008110731A true RU2008110731A (ru) 2009-09-27
RU2419861C2 RU2419861C2 (ru) 2011-05-27

Family

ID=37885403

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008110731/08A RU2419861C2 (ru) 2005-09-21 2006-09-20 Функции ранжирования, использующие статистические данные используемости документа

Country Status (15)

Country Link
US (2) US7499919B2 (ru)
EP (1) EP1952277B1 (ru)
JP (2) JP4698737B2 (ru)
KR (1) KR101311050B1 (ru)
CN (1) CN101268464B (ru)
AU (1) AU2006292103A1 (ru)
BR (1) BRPI0616233A2 (ru)
CA (1) CA2620045A1 (ru)
IL (1) IL189495A (ru)
MY (1) MY149197A (ru)
NO (1) NO20080934L (ru)
NZ (1) NZ566532A (ru)
RU (1) RU2419861C2 (ru)
WO (1) WO2007035919A1 (ru)
ZA (1) ZA200802250B (ru)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060064411A1 (en) * 2004-09-22 2006-03-23 William Gross Search engine using user intent
US7606793B2 (en) * 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
US7499919B2 (en) * 2005-09-21 2009-03-03 Microsoft Corporation Ranking functions using document usage statistics
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
JP2008299655A (ja) * 2007-05-31 2008-12-11 Ntt Resonant Inc 情報検索装置
US9348912B2 (en) * 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
US20090106221A1 (en) * 2007-10-18 2009-04-23 Microsoft Corporation Ranking and Providing Search Results Based In Part On A Number Of Click-Through Features
US8510299B2 (en) * 2007-10-23 2013-08-13 At&T Intellectual Property I, L.P. Method and apparatus for providing a user traffic weighted search
US7958136B1 (en) * 2008-03-18 2011-06-07 Google Inc. Systems and methods for identifying similar documents
US8812493B2 (en) * 2008-04-11 2014-08-19 Microsoft Corporation Search results ranking using editing distance and document information
JP5384884B2 (ja) * 2008-09-03 2014-01-08 日本電信電話株式会社 情報検索装置および情報検索プログラム
KR101065091B1 (ko) * 2009-02-17 2011-09-16 엔에이치엔(주) 기여 점수에 기초한 문서 순위 결정 시스템 및 방법
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US8447760B1 (en) * 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
JP2011091522A (ja) * 2009-10-21 2011-05-06 Fujifilm Corp ドキュメント画像生成サーバ及びプログラム、並びにドキュメント閲覧システム
US20110282869A1 (en) * 2010-05-11 2011-11-17 Maxim Zhilyaev Access to information by quantitative analysis of enterprise web access traffic
US8434134B2 (en) 2010-05-26 2013-04-30 Google Inc. Providing an electronic document collection
US8738635B2 (en) 2010-06-01 2014-05-27 Microsoft Corporation Detection of junk in search result ranking
US8375061B2 (en) * 2010-06-08 2013-02-12 International Business Machines Corporation Graphical models for representing text documents for computer analysis
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
US8452797B1 (en) * 2011-03-09 2013-05-28 Amazon Technologies, Inc. Personalized recommendations based on item usage
US8468164B1 (en) 2011-03-09 2013-06-18 Amazon Technologies, Inc. Personalized recommendations based on related users
US9110992B2 (en) 2011-06-03 2015-08-18 Facebook, Inc. Context-based selection of calls-to-action associated with search results
US8909637B2 (en) * 2011-06-03 2014-12-09 Facebook, Inc. Context-based ranking of search results
US9268857B2 (en) 2011-06-03 2016-02-23 Facebook, Inc. Suggesting search results to users before receiving any search query from the users
US8856640B1 (en) 2012-01-20 2014-10-07 Google Inc. Method and apparatus for applying revision specific electronic signatures to an electronically stored document
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results
CN103577413B (zh) * 2012-07-20 2017-11-17 阿里巴巴集团控股有限公司 搜索结果排序方法及系统、搜索结果排序优化方法及系统
US9529916B1 (en) 2012-10-30 2016-12-27 Google Inc. Managing documents based on access context
US11308037B2 (en) 2012-10-30 2022-04-19 Google Llc Automatic collaboration
US9779140B2 (en) * 2012-11-16 2017-10-03 Google Inc. Ranking signals for sparse corpora
US9495341B1 (en) 2012-12-18 2016-11-15 Google Inc. Fact correction and completion during document drafting
US9384285B1 (en) 2012-12-18 2016-07-05 Google Inc. Methods for identifying related documents
US9514113B1 (en) 2013-07-29 2016-12-06 Google Inc. Methods for automatic footnote generation
US9201929B1 (en) * 2013-08-09 2015-12-01 Google, Inc. Ranking a search result document based on data usage to load the search result document
US9842113B1 (en) 2013-08-27 2017-12-12 Google Inc. Context-based file selection
PL406196A1 (pl) * 2013-11-22 2015-05-25 Eo Networks Spółka Akcyjna Sposób dostarczania użytkownikowi wyników wyszukiwania dokumentów w postaci strony internetowej
US9529791B1 (en) 2013-12-12 2016-12-27 Google Inc. Template and content aware document and template editing
US9830392B1 (en) * 2013-12-18 2017-11-28 BloomReach Inc. Query-dependent and content-class based ranking
US9703763B1 (en) 2014-08-14 2017-07-11 Google Inc. Automatic document citations by utilizing copied content for candidate sources
US10127240B2 (en) * 2014-10-17 2018-11-13 Zestfinance, Inc. API for implementing scoring functions
US9720953B2 (en) 2015-07-01 2017-08-01 Zestfinance, Inc. Systems and methods for type coercion
US10061817B1 (en) 2015-07-29 2018-08-28 Google Llc Social ranking for apps
US11106705B2 (en) 2016-04-20 2021-08-31 Zestfinance, Inc. Systems and methods for parsing opaque data
WO2019028179A1 (en) 2017-08-02 2019-02-07 Zestfinance, Inc. SYSTEMS AND METHODS FOR PROVIDING DISAPPEARED IMPACT INFORMATION OF AUTOMATIC LEARNING MODEL
EP3762869A4 (en) 2018-03-09 2022-07-27 Zestfinance, Inc. SYSTEMS AND METHODS FOR PROVIDING ASSESSMENT OF A MACHINE LEARNING MODEL THROUGH DECOMPOSITION
WO2019212857A1 (en) 2018-05-04 2019-11-07 Zestfinance, Inc. Systems and methods for enriching modeling tools and infrastructure with semantics
US11816541B2 (en) 2019-02-15 2023-11-14 Zestfinance, Inc. Systems and methods for decomposition of differentiable and non-differentiable models
EP3942384A4 (en) 2019-03-18 2022-05-04 Zestfinance, Inc. SYSTEMS AND PROCEDURES FOR MODEL FAIRNESS
KR102245386B1 (ko) 2019-07-16 2021-04-27 서울과학기술대학교 산학협력단 사회연결망과 자료포락을 이용한 소프트웨어 함수 분석 시스템 및 그 방법
US11720962B2 (en) 2020-11-24 2023-08-08 Zestfinance, Inc. Systems and methods for generating gradient-boosted models with improved fairness

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025379B2 (ja) * 1996-09-17 2007-12-19 株式会社ニューズウオッチ 検索システム
US6272507B1 (en) * 1997-04-09 2001-08-07 Xerox Corporation System for ranking search results from a collection of documents using spreading activation techniques
AUPO710597A0 (en) * 1997-06-02 1997-06-26 Knowledge Horizons Pty. Ltd. Methods and systems for knowledge management
US7072847B2 (en) * 2000-08-25 2006-07-04 Jonas Ulenas Method and apparatus for obtaining consumer product preferences through product selection and evaluation
NO313399B1 (no) * 2000-09-14 2002-09-23 Fast Search & Transfer Asa Fremgangsmate til soking og analyse av informasjon i datanettverk
JP2002157271A (ja) * 2000-11-20 2002-05-31 Yozan Inc ブラウザ装置、サーバ装置、記録媒体、検索システムおよび検索方法
JP2002202992A (ja) * 2000-12-28 2002-07-19 Speed System:Kk ホームページ検索システム
US8001118B2 (en) 2001-03-02 2011-08-16 Google Inc. Methods and apparatus for employing usage statistics in document retrieval
US6947920B2 (en) * 2001-06-20 2005-09-20 Oracle International Corporation Method and system for response time optimization of data query rankings and retrieval
KR100509276B1 (ko) * 2001-08-20 2005-08-22 엔에이치엔(주) 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치
US20030046389A1 (en) * 2001-09-04 2003-03-06 Thieme Laura M. Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility
US7565367B2 (en) 2002-01-15 2009-07-21 Iac Search & Media, Inc. Enhanced popularity ranking
US7340466B2 (en) * 2002-02-26 2008-03-04 Kang Jo Mgmt. Limited Liability Company Topic identification and use thereof in information retrieval systems
JP3922693B2 (ja) * 2002-06-17 2007-05-30 Necシステムテクノロジー株式会社 インターネット情報検索システム
US8239380B2 (en) * 2003-06-20 2012-08-07 Microsoft Corporation Systems and methods to tune a general-purpose search engine for a search entry point
US7346839B2 (en) * 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US7293005B2 (en) * 2004-01-26 2007-11-06 International Business Machines Corporation Pipelined architecture for global analysis and index building
US9104689B2 (en) * 2004-03-17 2015-08-11 International Business Machines Corporation Method for synchronizing documents for disconnected operation
US7260573B1 (en) * 2004-05-17 2007-08-21 Google Inc. Personalizing anchor text scores in a search engine
CN100472522C (zh) * 2004-09-16 2009-03-25 特里诺尔公司 用于搜索、导航和排名个人网中的文档的方法、系统和计算机程序产品
US7499919B2 (en) * 2005-09-21 2009-03-03 Microsoft Corporation Ranking functions using document usage statistics
US7716226B2 (en) * 2005-09-27 2010-05-11 Patentratings, Llc Method and system for probabilistically quantifying and visualizing relevance between two or more citationally or contextually related data objects

Also Published As

Publication number Publication date
JP5174931B2 (ja) 2013-04-03
ZA200802250B (en) 2009-10-28
CN101268464B (zh) 2011-03-09
KR101311050B1 (ko) 2013-09-24
EP1952277A4 (en) 2012-01-18
NZ566532A (en) 2010-03-26
US20070067284A1 (en) 2007-03-22
JP4698737B2 (ja) 2011-06-08
IL189495A (en) 2012-05-31
IL189495A0 (en) 2008-06-05
RU2419861C2 (ru) 2011-05-27
WO2007035919A1 (en) 2007-03-29
NO20080934L (no) 2008-03-14
BRPI0616233A2 (pt) 2011-06-14
CN101268464A (zh) 2008-09-17
MY149197A (en) 2013-07-31
CA2620045A1 (en) 2007-03-29
EP1952277B1 (en) 2018-05-16
US7499919B2 (en) 2009-03-03
EP1952277A1 (en) 2008-08-06
JP2011108268A (ja) 2011-06-02
KR20080046670A (ko) 2008-05-27
AU2006292103A1 (en) 2007-03-29
JP2009509275A (ja) 2009-03-05
US20100191744A1 (en) 2010-07-29
US20120041960A9 (en) 2012-02-16

Similar Documents

Publication Publication Date Title
RU2008110731A (ru) Функции ранжирования, использующие статистические данные используемости документа
RU2421802C2 (ru) Функции ранжирования, использующие смещенное расстояние, измеряемое количеством последовательных переходов, до документа в сети
JP2009509275A5 (ru)
US10146811B2 (en) Method and device for presenting application programs
US8996550B2 (en) Autocompletion for partially entered query
US9235654B1 (en) Query rewrites for generating auto-complete suggestions
US8407215B2 (en) Text analysis to identify relevant entities
US8782029B1 (en) Customizing image search for user attributes
RU2009103140A (ru) Функции ранжирования, использующие модифицированный наивный байесовский классификатор запросов с инкрементным обновлением
US8326600B2 (en) Evaluating and modifying transliteration rules
EP2558965A2 (en) Automatic query suggestion generation using sub-queries
WO2017117201A1 (en) Entity resolution techniques and systems
WO2014007970A2 (en) Providing query suggestions
JP2009145953A (ja) データ検索装置、データ検索方法、コンピュータプログラム、及び記録媒体
KR20180088153A (ko) 관심도 높은 단어를 검색어로 추천하는 문장완성형 검색시스템 및 방법
CN111737397A (zh) 信息处理装置、文档管理系统、记录媒体及信息处理方法
US9934311B2 (en) Generating unweighted samples from weighted features
US9116996B1 (en) Reverse question answering
JP5094891B2 (ja) 検索スコア算出装置
US20180330015A1 (en) Scalable approach to information-theoretic string similarity using a guaranteed rank threshold
JP6267252B2 (ja) 検索装置、検索方法及び検索プログラム
JP6042162B2 (ja) ウェブ検索装置、ウェブ検索方法及びプログラム
JP2010231344A (ja) 検索用参照データ作成装置、情報検索装置、検索用参照データ作成方法及び情報検索方法
KR101623523B1 (ko) 이미지 단어 해석에 기반한 사용자 니즈 파악 방법
JP2009277154A (ja) 情報検索装置及び情報検索方法

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20150526

MM4A The patent is invalid due to non-payment of fees

Effective date: 20190921