RU2005111000A - Предложение родственных терминов для многосмыслового запроса - Google Patents

Предложение родственных терминов для многосмыслового запроса Download PDF

Info

Publication number
RU2005111000A
RU2005111000A RU2005111000/09A RU2005111000A RU2005111000A RU 2005111000 A RU2005111000 A RU 2005111000A RU 2005111000/09 A RU2005111000/09 A RU 2005111000/09A RU 2005111000 A RU2005111000 A RU 2005111000A RU 2005111000 A RU2005111000 A RU 2005111000A
Authority
RU
Russia
Prior art keywords
term
terms
phrase
clusters
previous
Prior art date
Application number
RU2005111000/09A
Other languages
English (en)
Other versions
RU2393533C2 (ru
Inventor
Бэньюй ЧЖАН (US)
Бэньюй ЧЖАН
Хуа-Цзюнь ЦЗЭН (US)
Хуа-Цзюнь ЦЗЭН
Ли ЛИ (US)
Ли Ли
Тарек НАДЖМ (US)
Тарек НАДЖМ
Вэй-Ин МА (US)
Вэй-Ин МА
Ин ЛИ (US)
Ин ЛИ
Чжэн ЧЭНЬ (US)
Чжэн ЧЭНЬ
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Publication of RU2005111000A publication Critical patent/RU2005111000A/ru
Application granted granted Critical
Publication of RU2393533C2 publication Critical patent/RU2393533C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D25/00Information-bearing cards or sheet-like structures characterised by identification or security features; Manufacture thereof
    • B42D25/20Information-bearing cards or sheet-like structures characterised by identification or security features; Manufacture thereof characterised by a particular use or purpose
    • B42D25/29Securities; Bank notes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D15/00Printed matter of special format or style not otherwise provided for
    • B42D15/0053Forms specially designed for commercial use, e.g. bills, receipts, offer or order sheets, coupons
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B42BOOKBINDING; ALBUMS; FILES; SPECIAL PRINTED MATTER
    • B42DBOOKS; BOOK COVERS; LOOSE LEAVES; PRINTED MATTER CHARACTERISED BY IDENTIFICATION OR SECURITY FEATURES; PRINTED MATTER OF SPECIAL FORMAT OR STYLE NOT OTHERWISE PROVIDED FOR; DEVICES FOR USE THEREWITH AND NOT OTHERWISE PROVIDED FOR; MOVABLE-STRIP WRITING OR READING APPARATUS
    • B42D15/00Printed matter of special format or style not otherwise provided for
    • B42D15/0073Printed matter of special format or style not otherwise provided for characterised by shape or material of the sheets
    • B42D15/0086Sheets combined with other articles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Claims (50)

1. Способ предложения родственных терминов, заключающийся в том, что создают кластеры терминов в зависимости от вычисленного подобия векторов терминов, причем каждый вектор термина создают из результатов поиска, связанных с группой предыдущих запросов с высокой частотой появления (ЧП), поданных ранее в поисковую машину, и в ответ на получение термина/фразы от объекта оценивают этот термин/фразу, принимая во внимание термины/фразы в кластерах терминов, для идентификации одного или более предложений родственных терминов.
2. Способ по п.1, по которому данный термин/фраза содержится в многосмысловом запросе.
3. Способ по п.1, по которому объектом является компьютерное программное приложение и/или конечный пользователь.
4. Способ по п.1, по которому также определяют вычисленное подобие как
Figure 00000001
где весовой коэффициент
Figure 00000002
для
Figure 00000003
-го вектора
Figure 00000004
-го термина вычисляют как
Figure 00000005
где
Figure 00000006
- частота термина;
Figure 00000007
- общее количество терминов запроса; и
Figure 00000008
- количество записей извлеченных признаков, которые содержат термин
Figure 00000009
.
5. Способ по п.1, по которому также собирают термины предыдущих запросов из журнала запросов и определяют термины предыдущих запросов, имеющие высокую ЧП.
6. Способ по п.1, по которому перед созданием кластеров терминов также уменьшают размерность векторов терминов и нормируют векторы терминов.
7. Способ по п.1, по которому при оценивании также определяют совпадение между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров терминов, и в ответ на определение формируют предложение (предложения) родственных терминов, содержащее данный термин (термины)/фразу (фразы).
8. Способ по п.7, по которому предложение (предложения) родственных терминов также содержит для каждого термина/фразы из термина (терминов)/фразы (фраз) значение частоты появления, указывающее, сколько раз данный термин/фраза появлялся в группе извлеченных предыдущих запросов.
9. Способ по п.1, по которому при создании кластеров терминов также посылают соответствующие из предыдущих запросов с высокой ЧП в поисковую машину для получения результатов поиска и извлекают векторы терминов из, по меньшей мере, подгруппы признаков, соответствующих соответствующим запросам, и создают векторы терминов из признаков как функции частоты термина и обратной частоты термина.
10. Способ по п.9, по которому признаки содержат заголовок, описание и/или контекст для соответствующих предыдущих терминов запроса с высокой ЧП.
11. Способ по п.9, по которому соответствующие результаты содержат результаты поиска высшего ранга.
12. Способ по п.1, по которому кластеры терминов являются первой группой кластеров терминов, при этом также определяют, что отсутствует совпадение между термином/фразой и терминами/фразами, и в ответ на это определение создают вторую группу кластеров терминов из вычисленного подобия векторов терминов, причем каждый вектор термина создают из результатов поиска, связанных с группой предыдущих запросов с низкой ЧП, поданных ранее в поисковую машину, и оценивают термин/фразу, принимая во внимание термины/фразы второй группы кластеров терминов, для определения одного или более предложений родственных терминов.
13. Способ по п.12, по которому при создании также идентифицируют предыдущие запросы с низкой ЧП из предыдущих запросов, извлеченных из журнала запросов, посылают соответствующие запросы из, по меньшей мере, подгруппы предыдущих запросов с низкой ЧП в поисковую машину для получения результатов поиска, извлекают признаки из, по меньшей мере, подгруппы результатов поиска и создают векторы терминов из признаков как функции частоты термина и обратной частоты термина.
14. Способ по п.13, по которому после кластеризации также определяют, что отсутствует совпадение между термином/фразой и термином (терминами)/фразой (фразами) из первой группы кластеров терминов, основанной на предыдущих запросах с высокой ЧП, и в ответ на определение идентифицируют совпадение между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров из второй группы кластеров терминов, причем вторая группа основана на предыдущих запросах с низкой ЧП, и в ответ для идентификации формируют предложение (предложения) родственных терминов, содержащее данный термин (термины)/фразу (фразы).
15. Машиночитаемый носитель, содержащий исполняемые машиной команды для создания кластеров терминов в зависимости от вычисленного подобия векторов терминов, причем каждый вектор термина сформирован из результатов поиска, связанных с группой предыдущих запросов с высокой частотой появления (ЧП), поданных ранее в поисковую машину, и в ответ на получение термина/фразы от объекта оценки термина/фразы, принимая во внимание термины/фразы в кластерах терминов, для идентификации одного или более предложений родственных терминов.
16. Машиночитаемый носитель по п.15, в котором данный термин/фраза содержится в многосмысловом запросе.
17. Машиночитаемый носитель по п.15, в котором объектом является компьютерное программное приложение и/или конечный пользователь.
18. Машиночитаемый носитель по п.15, который также содержит исполняемые машиной команды для определения вычисленного подобия как
Figure 00000001
где весовой коэффициент
Figure 00000010
для
Figure 00000011
-го вектора
Figure 00000004
-го термина вычисляют как
Figure 00000012
и где
Figure 00000013
- частота термина,
Figure 00000014
- общее количество терминов запроса, и
Figure 00000015
- количество записей извлеченных признаков, которые содержат термин
Figure 00000016
.
19. Машиночитаемый носитель по п.15, который также содержит исполняемые машиной команды для сбора терминов предыдущих запросов из журнала запросов и определения предыдущих терминов запроса, имеющих высокую ЧП.
20. Машиночитаемый носитель по п.15, который также содержит перед созданием кластеров терминов, исполняемые машиной команды для уменьшения размерности векторов термина и нормирования векторов терминов.
21. Машиночитаемый носитель по п.15, который также содержит при оценивании исполняемые машиной команды для определения совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров терминов, и в ответ на идентификацию формирования предложения (предложений) родственных терминов, содержащего данный термин (термины)/фразу (фразы).
22. Машиночитаемый носитель по п.21, в котором предложение (предложения) родственных терминов также содержит для каждого термина/фразы из терминов/фраз значение частоты появления, показывающее, сколько раз данный термин/фраза появлялся в группе извлеченных предыдущих запросов.
23. Машиночитаемый носитель по п.15, который также содержит при создании кластеров терминов исполняемые машиной команды для посылки соответствующих запросов из предыдущих запросов с высокой ЧП в поисковую машину для получения результатов поиска, извлечения признаков, по меньшей мере, из подгруппы результатов поиска, соответствующих упомянутым соответствующим запросам, и создания векторов терминов из признаков как функции частоты терминов и обратной частоты терминов.
24. Машиночитаемый носитель по п.23, в котором признаки включают в себя заголовок, описание и/или контекст для терминов соответствующих запросов из предыдущих запросов с высокой ЧП.
25. Машиночитаемый носитель по п.23, в котором соответствующие запросы содержат результаты поиска высшего ранга.
26. Машиночитаемый носитель по п.15, в котором кластеры терминов являются первой группой кластеров терминов, при этом исполняемые машиной команды также содержат команды для определения, что отсутствует совпадение между термином/фразой и терминами/фразами, и в ответ на это определение создания второй группы кластеров терминов из вычисленного подобия векторов терминов, причем каждый вектор терминов создан из результатов поиска, связанных с группой предыдущих запросов с низкой ЧП, поданных ранее в поисковую машину, и оценки термина/фразы, принимая во внимание термины/фразы второй группы кластеров терминов, для идентификации одного или более предложений родственных терминов.
27. Машиночитаемый носитель по п.26, который также содержит при создании исполняемые машиной команды для идентификации предыдущих запросов с низкой ЧП из предыдущих запросов, извлеченных из журнала запросов, посылки соответствующих запросов, по меньшей мере, из подгруппы предыдущих запросов с низкой ЧП в поисковую машину для получения результатов поиска, извлечения признаков, по меньшей мере, из подгруппы результатов поиска и создания векторов терминов из признаков как функции частоты термина и обратной частоты термина.
28. Машиночитаемый носитель по п.27, который также содержит исполняемые машиной команды после кластеризации для определения, что отсутствует совпадение между термином/фразой и термином (терминами)/фразой (фразами) из первой группы кластеров терминов, основанной на предыдущих запросах с высокой ЧП, и в ответ на данное определение идентификации совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров из второй группы кластеров терминов, основанной на предыдущих запросах с низкой ЧП, и в ответ для идентификации формирования предложения (предложений) родственных терминов, содержащего данный термин (термины)/фразу (фразы).
29. Вычислительное устройство, содержащее процессор и память, подсоединенную к процессору, содержащую машинные команды, исполняемые процессором, для создания кластеров терминов в зависимости от вычисленного подобия векторов терминов, причем каждый вектор терминов создан из результатов поиска, связанных с группой предыдущих запросов с высокой частотой появления (ЧП), поданных ранее в поисковую машину, и в ответ на получение термина/фразы от объекта оценки термина/фразы, принимая во внимание термины/фразы в кластерах терминов, для идентификации одного или более предложений родственных терминов.
30. Вычислительное устройство по п.29, в котором данный термин/фраза содержится в многосмысловом запросе.
31. Вычислительное устройство по п.29, в котором объектом является машинное программное приложение и/или конечный пользователь.
32. Вычислительное устройство по п.29, которое также содержит исполняемые машиной команды для определения вычисленного подобия как
Figure 00000001
где весовой коэффициент
Figure 00000010
для
Figure 00000017
-го вектора
Figure 00000018
-го термина вычисляют как
Figure 00000012
и где
Figure 00000019
- частота термина;
Figure 00000020
- общее количество терминов запроса; и
Figure 00000021
- количество записей извлеченных признаков, которые содержат термин
Figure 00000018
.
33. Вычислительное устройство по п.29, которое также содержит исполняемые машиной команды для сбора терминов предыдущих запросов из журнала запросов и определения терминов предыдущих запросов, имеющих высокую ЧП.
34. Вычислительное устройство по п.29, которое также содержит перед созданием кластеров терминов исполняемые машиной команды для уменьшения размерности векторов терминов и нормирования векторов терминов.
35. Вычислительное устройство по п.29, которое также содержит при оценивании исполняемые машиной команды для идентификации совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров терминов, и в ответ на идентификацию создания предложения (предложений) родственных терминов, содержащего данный термин (термины)/фразу (фразы).
36. Вычислительное устройство по п.35, в котором предложение (предложения) родственных терминов также содержит для каждого термина/фразы из термина (терминов)/фразы (фраз) значение частоты появления, показывающее, сколько раз данный термин/фраза появлялся в группе извлеченных предыдущих запросов.
37. Вычислительное устройство по п.29, которое также содержит при создании кластеров терминов исполняемые машиной команды для посылки соответствующих из предыдущих запросов с высокой ЧП в поисковую машину для получения результатов поиска, извлечения признаков, по меньшей мере, из подгруппы результатов поиска, соответствующих упомянутым соответствующим запросам, и создания векторов терминов из признаков как функции частоты термина и обратной частоты термина.
38. Вычислительное устройство по п.37, в котором признаки включают в себя заголовок, описание и/или контекст для соответствующих терминов из предыдущих запросов с высокой ЧП.
39. Вычислительное устройство по п.37, в котором соответствующие запросы содержат результаты поиска высшего ранга.
40. Вычислительное устройство по п.29, в котором кластеры терминов являются первой группой кластеров терминов, при этом исполняемые машиной команды также содержат команды для определения, что отсутствует совпадение между термином/фразой и терминами/фразами, и в ответ на это определение создания второй группы кластеров терминов из вычисленного подобия векторов терминов, причем каждый вектор терминов создан из результатов поиска, связанных с группой предыдущих запросов с низкой ЧП, поданных ранее в поисковую машину, и оценки термина/фразы, принимая во внимание термины/фразы второй группы кластеров терминов, для идентификации одного или более предложений родственных терминов.
41. Вычислительное устройство по п.40, которое также содержит при создании исполняемые машиной команды для идентификации предыдущих запросов с низкой ЧП из предыдущих запросов, извлеченных их журнала запросов, посылки соответствующих запросов, по меньшей мере, из подгруппы предыдущих запросов с низкой ЧП в поисковую машину для получения результатов поиска, извлечения признаков, по меньшей мере, из подгруппы результатов поиска и создания векторов терминов из признаков как функции частоты термина и обратной частоты термина.
42. Вычислительное устройство по п.41, которое также содержит после кластеризации исполняемые машиной команды для определения, что отсутствует совпадение между термином/фразой и термином (терминами)/фразой (фразами) из первой группы кластеров терминов, основанной на предыдущих запросах с высокой ЧП, и в ответ на упомянутое определение идентификации совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров из второй группы кластеров терминов, основанной на предыдущих запросах с низкой ЧП, и в ответ на идентификацию формирования предложения (предложений) родственных терминов, содержащего данный термин (термины)/фразу (фразы).
43. Вычислительное устройство, содержащее средство для создания кластеров терминов как функции вычисленного подобия векторов терминов, причем каждый вектор терминов создан из результатов поиска, связанных с группой предыдущих запросов с высокой частотой появления (ЧП), поданных ранее в поисковую машину, и средство для оценки, в ответ на получение термина/фразы от объекта, термина/фразы, принимая во внимание термины/фразы в кластерах терминов, для идентификации одного или более предложений родственных терминов.
44. Вычислительное устройство по п.43, в котором данный термин/фраза содержится в многосмысловом запросе.
45. Вычислительное устройство по п.43, в котором объектом является машинное программное приложение и/или конечный пользователь.
46. Вычислительное устройство по п.43, которое также содержит средство для сбора терминов предыдущих запросов из журнала запросов и средство для определения терминов предыдущих запросов с высокой ЧП.
47. Вычислительное устройство по п.43, в котором средство для оценки также содержит средство для определения совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров терминов, и средство для создания в ответ на определение предложения (предложений) родственных терминов, содержащего термин (термины)/фразу (фразы).
48. Вычислительное устройство по п.43, в котором средство для создания кластеров терминов также содержит средство для посылки соответствующих запросов из предыдущих запросов с высокой ЧП в поисковую машину для получения результатов поиска, средство для извлечения признаков, по меньшей мере, из подгруппы результатов поиска, соответствующих упомянутым соответствующим запросам, и средство для создания векторов терминов из признаков.
49. Вычислительное устройство по п.43, в котором кластеры терминов являются первой группой кластеров терминов, при этом вычислительное устройство также содержит средство для определения, что отсутствует совпадение между термином/фразой и терминами/фразами, и в ответ на это определение средство для создания второй группы кластеров терминов из вычисленного подобия векторов терминов, причем каждый вектор терминов создан из результатов поиска, связанных с группой предыдущих запросов с низкой ЧП, поданных ранее в поисковую машину, и средство для оценки термина/фразы, принимая во внимание термины/фразы второй группы кластеров терминов, для идентификации одного или более предложений родственных терминов.
50. Вычислительное устройство по п.49, которое также содержит средство для вычисления, что отсутствует совпадение между данным термином/фразой и термином (терминами)/фразой (фразами) из первой группы кластеров терминов, основанной на предыдущих запросах с высокой ЧП, и средство для идентификации в ответ на упомянутое вычисление совпадения между термином/фразой и термином (терминами)/фразой (фразами) из одного или более кластеров из второй группы кластеров терминов, основанной на предыдущих запросах с низкой ЧП, и средство для формирования в ответ на упомянутую идентификацию предложения (предложений) родственных терминов, содержащего термин (термины)/фразу (фразы).
RU2005111000/09A 2004-04-15 2005-04-14 Предложение родственных терминов для многосмыслового запроса RU2393533C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/825,894 2004-04-15
US10/825,894 US7428529B2 (en) 2004-04-15 2004-04-15 Term suggestion for multi-sense query

Publications (2)

Publication Number Publication Date
RU2005111000A true RU2005111000A (ru) 2006-10-20
RU2393533C2 RU2393533C2 (ru) 2010-06-27

Family

ID=34939289

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005111000/09A RU2393533C2 (ru) 2004-04-15 2005-04-14 Предложение родственных терминов для многосмыслового запроса

Country Status (10)

Country Link
US (1) US7428529B2 (ru)
EP (1) EP1587011A1 (ru)
JP (1) JP4726528B2 (ru)
KR (1) KR101109236B1 (ru)
CN (1) CN100517311C (ru)
AU (1) AU2005201682A1 (ru)
BR (1) BRPI0501320A (ru)
CA (1) CA2504106C (ru)
MX (1) MXPA05004099A (ru)
RU (1) RU2393533C2 (ru)

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7194483B1 (en) 2001-05-07 2007-03-20 Intelligenxia, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
USRE46973E1 (en) 2001-05-07 2018-07-31 Ureveal, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
US8589413B1 (en) 2002-03-01 2013-11-19 Ixreveal, Inc. Concept-based method and system for dynamically analyzing results from search engines
US10032452B1 (en) 2016-12-30 2018-07-24 Google Llc Multimodal transmission of packetized data
US7836076B2 (en) * 2004-08-20 2010-11-16 Hewlett-Packard Development Company, L.P. Distributing content indices
US7801899B1 (en) * 2004-10-01 2010-09-21 Google Inc. Mixing items, such as ad targeting keyword suggestions, from heterogeneous sources
KR100669971B1 (ko) * 2004-11-24 2007-01-16 엔에이치엔(주) 검색 서비스 제공 방법 및 상기 방법을 수행하는 검색시스템
US7428533B2 (en) * 2004-12-06 2008-09-23 Yahoo! Inc. Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies
US7620628B2 (en) * 2004-12-06 2009-11-17 Yahoo! Inc. Search processing with automatic categorization of queries
US8375017B1 (en) * 2005-01-28 2013-02-12 Manta Media, Inc. Automated keyword analysis system and method
US7668808B2 (en) * 2005-03-10 2010-02-23 Yahoo! Inc. System for modifying queries before presentation to a sponsored search generator or other matching system where modifications improve coverage without a corresponding reduction in relevance
US8438142B2 (en) * 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7725485B1 (en) 2005-08-01 2010-05-25 Google Inc. Generating query suggestions using contextual information
WO2007047252A2 (en) 2005-10-11 2007-04-26 Intelligenxia Inc. System, method & computer program product for concept based searching & analysis
US8015065B2 (en) * 2005-10-28 2011-09-06 Yahoo! Inc. Systems and methods for assigning monetary values to search terms
CA2669236C (en) * 2005-11-16 2016-05-24 Evri Inc. Extending keyword searching to syntactically and semantically annotated data
US8010523B2 (en) * 2005-12-30 2011-08-30 Google Inc. Dynamic search box for web browser
US7676485B2 (en) 2006-01-20 2010-03-09 Ixreveal, Inc. Method and computer program product for converting ontologies into concept semantic networks
US7747083B2 (en) * 2006-03-27 2010-06-29 Yahoo! Inc. System and method for good nearest neighbor clustering of text
US20070244862A1 (en) * 2006-04-13 2007-10-18 Randy Adams Systems and methods for ranking vertical domains
US9330170B2 (en) * 2006-05-16 2016-05-03 Sony Corporation Relating objects in different mediums
US20070271255A1 (en) * 2006-05-17 2007-11-22 Nicky Pappo Reverse search-engine
US7937397B2 (en) * 2006-08-22 2011-05-03 Fuji Xerox Co., Ltd. Apparatus and method for term context modeling for information retrieval
US7685201B2 (en) * 2006-09-08 2010-03-23 Microsoft Corporation Person disambiguation using name entity extraction-based clustering
US7689548B2 (en) * 2006-09-22 2010-03-30 Microsoft Corporation Recommending keywords based on bidding patterns
US7577643B2 (en) * 2006-09-29 2009-08-18 Microsoft Corporation Key phrase extraction from query logs
US20080113801A1 (en) * 2006-11-13 2008-05-15 Roland Moreno Game based on combinations of words and implemented by computer means
US7603348B2 (en) * 2007-01-26 2009-10-13 Yahoo! Inc. System for classifying a search query
US7685084B2 (en) * 2007-02-09 2010-03-23 Yahoo! Inc. Term expansion using associative matching of labeled term pairs
US20100325109A1 (en) * 2007-02-09 2010-12-23 Agency For Science, Technology And Rearch Keyword classification and determination in language modelling
WO2008113045A1 (en) * 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
CN101276361B (zh) 2007-03-28 2010-09-15 阿里巴巴集团控股有限公司 一种显示相关关键词的方法及系统
US7693813B1 (en) 2007-03-30 2010-04-06 Google Inc. Index server architecture using tiered and sharded phrase posting lists
US7702614B1 (en) 2007-03-30 2010-04-20 Google Inc. Index updating using segment swapping
US7925655B1 (en) 2007-03-30 2011-04-12 Google Inc. Query scheduling using hierarchical tiers of index servers
US8166045B1 (en) 2007-03-30 2012-04-24 Google Inc. Phrase extraction using subphrase scoring
US8166021B1 (en) 2007-03-30 2012-04-24 Google Inc. Query phrasification
US8086594B1 (en) 2007-03-30 2011-12-27 Google Inc. Bifurcated document relevance scoring
US7698344B2 (en) * 2007-04-02 2010-04-13 Microsoft Corporation Search macro suggestions relevant to search queries
KR101254362B1 (ko) 2007-05-18 2013-04-12 엔에이치엔(주) 공통 접사를 이용한 키워드 순위를 제공하는 방법 및시스템
US7822774B2 (en) * 2007-06-11 2010-10-26 Microsoft Corporation Using link structure for suggesting related queries
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
US9195743B2 (en) * 2007-10-04 2015-11-24 Yahoo! Inc. System and method for creating and applying predictive user click models to predict a target page associated with a search query
US8583670B2 (en) * 2007-10-04 2013-11-12 Microsoft Corporation Query suggestions for no result web searches
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
WO2009052308A1 (en) 2007-10-17 2009-04-23 Roseman Neil S Nlp-based content recommender
JP4724701B2 (ja) * 2007-10-30 2011-07-13 日本電信電話株式会社 文章検索サーバコンピュータ,文章検索方法,文章検索プログラム,そのプログラムを記録した記録媒体
US8019748B1 (en) 2007-11-14 2011-09-13 Google Inc. Web search refinement
US8458179B2 (en) * 2007-11-29 2013-06-04 Palo Alto Research Center Incorporated Augmenting privacy policies with inference detection
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US7984004B2 (en) * 2008-01-17 2011-07-19 Microsoft Corporation Query suggestion generation
US10269024B2 (en) * 2008-02-08 2019-04-23 Outbrain Inc. Systems and methods for identifying and measuring trends in consumer content demand within vertically associated websites and related content
US20120053990A1 (en) * 2008-05-07 2012-03-01 Nice Systems Ltd. System and method for predicting customer churn
US8386476B2 (en) * 2008-05-20 2013-02-26 Gary Stephen Shuster Computer-implemented search using result matching
US7890516B2 (en) * 2008-05-30 2011-02-15 Microsoft Corporation Recommending queries when searching against keywords
US20090327223A1 (en) * 2008-06-26 2009-12-31 Microsoft Corporation Query-driven web portals
US20100070339A1 (en) * 2008-09-15 2010-03-18 Google Inc. Associating an Entity with a Category
AU2009304581A1 (en) * 2008-10-14 2010-04-22 Remarqueble Pty Ltd Search, analysis and categorization
US8171043B2 (en) * 2008-10-24 2012-05-01 Yahoo! Inc. Methods for improving the diversity of image search results
US8386489B2 (en) * 2008-11-07 2013-02-26 Raytheon Company Applying formal concept analysis to validate expanded concept types
US8463808B2 (en) * 2008-11-07 2013-06-11 Raytheon Company Expanding concept types in conceptual graphs
US9305051B2 (en) * 2008-12-10 2016-04-05 Yahoo! Inc. Mining broad hidden query aspects from user search sessions
US8577924B2 (en) * 2008-12-15 2013-11-05 Raytheon Company Determining base attributes for terms
US9158838B2 (en) * 2008-12-15 2015-10-13 Raytheon Company Determining query return referents for concept types in conceptual graphs
US9087293B2 (en) * 2008-12-23 2015-07-21 Raytheon Company Categorizing concept types of a conceptual graph
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
US9245243B2 (en) 2009-04-14 2016-01-26 Ureveal, Inc. Concept-based analysis of structured and unstructured data using concept inheritance
CA2796408A1 (en) * 2009-04-16 2010-10-21 Evri Inc. Enhanced advertisement targeting
US9098568B2 (en) 2009-08-04 2015-08-04 Google Inc. Query suggestions from documents
US20110040604A1 (en) * 2009-08-13 2011-02-17 Vertical Acuity, Inc. Systems and Methods for Providing Targeted Content
US20110040774A1 (en) * 2009-08-14 2011-02-17 Raytheon Company Searching Spoken Media According to Phonemes Derived From Expanded Concepts Expressed As Text
CN102056335B (zh) * 2009-11-06 2014-02-19 华为技术有限公司 移动搜索方法、装置和系统
US20110145226A1 (en) * 2009-12-10 2011-06-16 Microsoft Corporation Product similarity measure
US20110161091A1 (en) * 2009-12-24 2011-06-30 Vertical Acuity, Inc. Systems and Methods for Connecting Entities Through Content
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
US8150841B2 (en) * 2010-01-20 2012-04-03 Microsoft Corporation Detecting spiking queries
US8645125B2 (en) 2010-03-30 2014-02-04 Evri, Inc. NLP-based systems and methods for providing quotations
JP5165719B2 (ja) * 2010-03-30 2013-03-21 ヤフー株式会社 情報処理装置、データ抽出方法及びプログラム
WO2011125793A1 (ja) * 2010-03-31 2011-10-13 楽天株式会社 検索システム、検索方法、検索プログラム及び記録媒体
US8161073B2 (en) 2010-05-05 2012-04-17 Holovisions, LLC Context-driven search
US20110314001A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Performing query expansion based upon statistical analysis of structured data
US8725739B2 (en) 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
EP2635965A4 (en) * 2010-11-05 2016-08-10 Rakuten Inc SYSTEMS AND METHODS RELATING TO KEYWORD EXTRACTION
US10346479B2 (en) 2010-11-16 2019-07-09 Microsoft Technology Licensing, Llc Facilitating interaction with system level search user interface
US20120124072A1 (en) 2010-11-16 2012-05-17 Microsoft Corporation System level search user interface
US8515984B2 (en) 2010-11-16 2013-08-20 Microsoft Corporation Extensible search term suggestion engine
US10073927B2 (en) 2010-11-16 2018-09-11 Microsoft Technology Licensing, Llc Registration for system level search user interface
CN103329140B (zh) * 2010-12-22 2017-03-29 皇家飞利浦电子股份有限公司 基于用户隐私偏好创建访问控制策略
CN102567408B (zh) 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
CN102646103B (zh) * 2011-02-18 2016-03-16 腾讯科技(深圳)有限公司 检索词的聚类方法和装置
US8732151B2 (en) 2011-04-01 2014-05-20 Microsoft Corporation Enhanced query rewriting through statistical machine translation
US20120310690A1 (en) * 2011-06-06 2012-12-06 Winshuttle, Llc Erp transaction recording to tables system and method
US20120323627A1 (en) * 2011-06-14 2012-12-20 Microsoft Corporation Real-time Monitoring of Public Sentiment
US9652556B2 (en) 2011-10-05 2017-05-16 Google Inc. Search suggestions based on viewport content
US10013152B2 (en) 2011-10-05 2018-07-03 Google Llc Content selection disambiguation
US8724904B2 (en) * 2011-10-25 2014-05-13 International Business Machines Corporation Anomaly detection in images and videos
US9330083B2 (en) 2012-02-14 2016-05-03 Facebook, Inc. Creating customized user dictionary
US20130211915A1 (en) * 2012-02-14 2013-08-15 Erick Tseng Advertising Based on Customized User Dictionary
US9235565B2 (en) 2012-02-14 2016-01-12 Facebook, Inc. Blending customized user dictionaries
US9330082B2 (en) 2012-02-14 2016-05-03 Facebook, Inc. User experience with customized user dictionary
CN103365839B (zh) * 2012-03-26 2017-12-12 深圳市世纪光速信息技术有限公司 一种搜索引擎的推荐搜索方法和装置
US9922334B1 (en) 2012-04-06 2018-03-20 Google Llc Providing an advertisement based on a minimum number of exposures
US10776830B2 (en) 2012-05-23 2020-09-15 Google Llc Methods and systems for identifying new computers and providing matching services
US10152723B2 (en) 2012-05-23 2018-12-11 Google Llc Methods and systems for identifying new computers and providing matching services
US9465875B2 (en) * 2012-05-31 2016-10-11 Hewlett Packard Enterprise Development Lp Searching based on an identifier of a searcher
US9442909B2 (en) 2012-10-11 2016-09-13 International Business Machines Corporation Real time term suggestion using text analytics
US20140188894A1 (en) * 2012-12-27 2014-07-03 Google Inc. Touch to search
US10650066B2 (en) 2013-01-31 2020-05-12 Google Llc Enhancing sitelinks with creative content
US10735552B2 (en) 2013-01-31 2020-08-04 Google Llc Secondary transmissions of packetized data
US9501506B1 (en) 2013-03-15 2016-11-22 Google Inc. Indexing system
US10152538B2 (en) * 2013-05-06 2018-12-11 Dropbox, Inc. Suggested search based on a content item
US9483568B1 (en) 2013-06-05 2016-11-01 Google Inc. Indexing system
US20150026153A1 (en) * 2013-07-17 2015-01-22 Thoughtspot, Inc. Search engine for information retrieval system
US9405794B2 (en) 2013-07-17 2016-08-02 Thoughtspot, Inc. Information retrieval system
WO2015161515A1 (en) * 2014-04-25 2015-10-29 Yahoo! Inc. Systems and methods for commercial query suggestion
CN105183733A (zh) * 2014-06-05 2015-12-23 阿里巴巴集团控股有限公司 一种文本信息的匹配、业务对象的推送方法和装置
CN105446984A (zh) * 2014-06-30 2016-03-30 阿里巴巴集团控股有限公司 一种扩展词对的筛选方法及装置
JP6325502B2 (ja) * 2015-10-08 2018-05-16 Necパーソナルコンピュータ株式会社 情報処理装置、情報処理システムおよび情報処理方法
US11436610B2 (en) * 2016-03-31 2022-09-06 ZenDesk, Inc. Automatically clustering customer-support requests to form customer-support topics
US10699183B2 (en) * 2016-03-31 2020-06-30 ZenDesk, Inc. Automated system for proposing help center articles to be written to facilitate resolving customer-service requests
JP6555174B2 (ja) * 2016-04-01 2019-08-07 京セラドキュメントソリューションズ株式会社 情報処理装置及びプログラム
CN107784029B (zh) * 2016-08-31 2022-02-08 阿里巴巴集团控股有限公司 生成提示关键词、建立索引关系的方法、服务器和客户端
US10242113B2 (en) * 2016-10-13 2019-03-26 International Business Machines Corporation Modifying messages to be more discoverable on a social network
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US10298837B2 (en) 2016-12-28 2019-05-21 Facebook, Inc. Systems and methods for presenting content based on unstructured visual data
US20180181844A1 (en) * 2016-12-28 2018-06-28 Facebook, Inc. Systems and methods for presenting content based on unstructured visual data
US10708313B2 (en) 2016-12-30 2020-07-07 Google Llc Multimodal transmission of packetized data
US10593329B2 (en) 2016-12-30 2020-03-17 Google Llc Multimodal transmission of packetized data
JP6790942B2 (ja) * 2017-03-16 2020-11-25 富士通株式会社 検索支援プログラム、検索支援装置および検索支援方法
US11734286B2 (en) 2017-10-10 2023-08-22 Thoughtspot, Inc. Automatic database insight analysis
US20190129995A1 (en) * 2017-10-27 2019-05-02 Microsoft Technology Licensing, Llc Expanding search queries
US10747793B2 (en) 2017-10-27 2020-08-18 Microsoft Technology Licensing, Llc Expanding search queries
US11276089B1 (en) * 2017-12-20 2022-03-15 Groupon, Inc. Method, apparatus, and computer program product for adaptive tail digital content object bid value generation
US11593844B1 (en) 2017-12-20 2023-02-28 Groupon, Inc. Method, apparatus, and computer program product for predictive initial electronic bid value generation for new digital content objects
US11157564B2 (en) 2018-03-02 2021-10-26 Thoughtspot, Inc. Natural language question answering systems
US11042896B1 (en) * 2018-03-12 2021-06-22 Inmar Clearing, Inc. Content influencer scoring system and related methods
EP3550444B1 (en) 2018-04-02 2023-12-27 Thoughtspot Inc. Query generation based on a logical data model
US11409910B2 (en) 2018-05-31 2022-08-09 Microsoft Technology Licensing, Llc Predicting confidential data value insights at organization level using peer organization group
US10872303B2 (en) 2018-05-31 2020-12-22 Microsoft Technology Licensing, Llc Generating semantic representations for organizations and computing peer organization groups
EP3588303B1 (en) * 2018-06-12 2021-02-17 Syntel, Inc. System and method for identifying test cases for software development
US11023486B2 (en) 2018-11-13 2021-06-01 Thoughtspot, Inc. Low-latency predictive database analysis
US11544239B2 (en) 2018-11-13 2023-01-03 Thoughtspot, Inc. Low-latency database analysis using external data sources
US11580147B2 (en) 2018-11-13 2023-02-14 Thoughtspot, Inc. Conversational database analysis
US11416477B2 (en) 2018-11-14 2022-08-16 Thoughtspot, Inc. Systems and methods for database analysis
US11334548B2 (en) 2019-01-31 2022-05-17 Thoughtspot, Inc. Index sharding
CN109947924B (zh) * 2019-03-21 2021-08-31 百度在线网络技术(北京)有限公司 对话系统训练数据构建方法、装置、电子设备及存储介质
US11288453B1 (en) * 2019-03-22 2022-03-29 Pinterest, Inc. Key-word identification
US11928114B2 (en) 2019-04-23 2024-03-12 Thoughtspot, Inc. Query generation based on a logical data model with one-to-one joins
US11442932B2 (en) 2019-07-16 2022-09-13 Thoughtspot, Inc. Mapping natural language to queries using a query grammar
US11354326B2 (en) 2019-07-29 2022-06-07 Thoughtspot, Inc. Object indexing
US10970319B2 (en) 2019-07-29 2021-04-06 Thoughtspot, Inc. Phrase indexing
US11200227B1 (en) 2019-07-31 2021-12-14 Thoughtspot, Inc. Lossless switching between search grammars
US11409744B2 (en) 2019-08-01 2022-08-09 Thoughtspot, Inc. Query generation based on merger of subqueries
US11100170B2 (en) * 2019-11-15 2021-08-24 Microsoft Technology Licensing, Llc Domain-agnostic structured search query exploration
JP2021149613A (ja) * 2020-03-19 2021-09-27 株式会社野村総合研究所 自然言語処理装置およびプログラム
US11544272B2 (en) 2020-04-09 2023-01-03 Thoughtspot, Inc. Phrase translation for a low-latency database analysis system
US11580111B2 (en) 2021-04-06 2023-02-14 Thoughtspot, Inc. Distributed pseudo-random subset generation
CN113505281B (zh) * 2021-06-15 2022-11-08 北京三快在线科技有限公司 搜索建议词生成方法、装置、电子设备及可读存储介质
CN116628201B (zh) * 2023-05-18 2023-10-20 浙江数洋科技有限公司 一种文本资料库的智能化分群和推送方法

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03122770A (ja) * 1989-10-05 1991-05-24 Ricoh Co Ltd キーワード連想文書検索方法
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5442778A (en) 1991-11-12 1995-08-15 Xerox Corporation Scatter-gather: a cluster-based method and apparatus for browsing large document collections
US7251637B1 (en) * 1993-09-20 2007-07-31 Fair Isaac Corporation Context vector generation and retrieval
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
US5812134A (en) * 1996-03-28 1998-09-22 Critical Thought, Inc. User interface navigational system & method for interactive representation of information contained within a database
US6188776B1 (en) 1996-05-21 2001-02-13 Interval Research Corporation Principle component analysis of images for the automatic location of control points
JP3108015B2 (ja) 1996-05-22 2000-11-13 松下電器産業株式会社 ハイパーテキスト検索装置
US5987460A (en) * 1996-07-05 1999-11-16 Hitachi, Ltd. Document retrieval-assisting method and system for the same and document retrieval service using the same with document frequency and term frequency
US6457004B1 (en) * 1997-07-03 2002-09-24 Hitachi, Ltd. Document retrieval assisting method, system and service using closely displayed areas for titles and topics
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
US5819258A (en) * 1997-03-07 1998-10-06 Digital Equipment Corporation Method and apparatus for automatically generating hierarchical categories from large document collections
US6298351B1 (en) 1997-04-11 2001-10-02 International Business Machines Corporation Modifying an unreliable training set for supervised classification
US6470307B1 (en) * 1997-06-23 2002-10-22 National Research Council Of Canada Method and apparatus for automatically identifying keywords within a document
US5927042A (en) * 1997-07-24 1999-07-27 Last; Harry J. Composite beam enclosure structure
US5845278A (en) 1997-09-12 1998-12-01 Inioseek Corporation Method for automatically selecting collections to search in full text searches
US6003027A (en) * 1997-11-21 1999-12-14 International Business Machines Corporation System and method for determining confidence levels for the results of a categorization system
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US6598054B2 (en) * 1999-01-26 2003-07-22 Xerox Corporation System and method for clustering data objects in a collection
US6226408B1 (en) 1999-01-29 2001-05-01 Hnc Software, Inc. Unsupervised identification of nonlinear data cluster in multidimensional data
US7835943B2 (en) * 1999-05-28 2010-11-16 Yahoo! Inc. System and method for providing place and price protection in a search result list generated by a computer network search engine
US7225182B2 (en) 1999-05-28 2007-05-29 Overture Services, Inc. Recommending search terms using collaborative filtering and web spidering
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US7725307B2 (en) * 1999-11-12 2010-05-25 Phoenix Solutions, Inc. Query engine for processing voice based queries including semantic decoding
US7392185B2 (en) * 1999-11-12 2008-06-24 Phoenix Solutions, Inc. Speech based learning/training system using semantic decoding
US6556983B1 (en) 2000-01-12 2003-04-29 Microsoft Corporation Methods and apparatus for finding semantic information, such as usage logs, similar to a query using a pattern lattice data space
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
WO2001067225A2 (en) * 2000-03-06 2001-09-13 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
US6697998B1 (en) 2000-06-12 2004-02-24 International Business Machines Corporation Automatic labeling of unlabeled text data
US6578032B1 (en) * 2000-06-28 2003-06-10 Microsoft Corporation Method and system for performing phrase/word clustering and cluster merging
US7490092B2 (en) 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US7587428B2 (en) * 2000-10-13 2009-09-08 Microsoft Corporation Maintaining a relationship between two different items of data
US6772120B1 (en) 2000-11-21 2004-08-03 Hewlett-Packard Development Company, L.P. Computer method and apparatus for segmenting text streams
US7356530B2 (en) * 2001-01-10 2008-04-08 Looksmart, Ltd. Systems and methods of retrieving relevant information
WO2002071243A1 (en) 2001-03-01 2002-09-12 Biowulf Technologies, Llc Spectral kernels for learning machines
US6892193B2 (en) 2001-05-10 2005-05-10 International Business Machines Corporation Method and apparatus for inducing classifiers for multimedia based on unified representation of features reflecting disparate modalities
US20030065632A1 (en) * 2001-05-30 2003-04-03 Haci-Murat Hubey Scalable, parallelizable, fuzzy logic, boolean algebra, and multiplicative neural network based classifier, datamining, association rule finder and visualization software tool
US20030046389A1 (en) 2001-09-04 2003-03-06 Thieme Laura M. Method for monitoring a web site's keyword visibility in search engines and directories and resulting traffic from such keyword visibility
JP3918664B2 (ja) 2002-07-10 2007-05-23 ヤマハ株式会社 音響信号処理装置
US7136876B1 (en) * 2003-03-03 2006-11-14 Hewlett-Packard Development Company, L.P. Method and system for building an abbreviation dictionary
US20040249808A1 (en) * 2003-06-06 2004-12-09 Microsoft Corporation Query expansion using query logs
US7225184B2 (en) * 2003-07-18 2007-05-29 Overture Services, Inc. Disambiguation of search phrases using interpretation clusters
US7165119B2 (en) * 2003-10-14 2007-01-16 America Online, Inc. Search enhancement system and method having rankings, explicitly specified by the user, based upon applicability and validity of search parameters in regard to a subject matter
US7188762B2 (en) * 2004-05-07 2007-03-13 Advanced Card Technologies Llc Secure card package for transaction cards and method of activating the same

Also Published As

Publication number Publication date
CN1684072A (zh) 2005-10-19
KR20060045770A (ko) 2006-05-17
CA2504106A1 (en) 2005-10-15
BRPI0501320A (pt) 2005-12-06
JP2005302042A (ja) 2005-10-27
MXPA05004099A (es) 2005-10-19
US20050234879A1 (en) 2005-10-20
US7428529B2 (en) 2008-09-23
CA2504106C (en) 2014-06-17
KR101109236B1 (ko) 2012-01-30
CN100517311C (zh) 2009-07-22
AU2005201682A1 (en) 2005-10-27
EP1587011A1 (en) 2005-10-19
RU2393533C2 (ru) 2010-06-27
JP4726528B2 (ja) 2011-07-20

Similar Documents

Publication Publication Date Title
RU2005111000A (ru) Предложение родственных терминов для многосмыслового запроса
JP4494632B2 (ja) 言語モデルに基づく情報検索および音声認識
JP4741657B2 (ja) 検索クエリ連関性判断方法及びシステム
US9449075B2 (en) Guided search based on query model
JP2005302041A5 (ru)
JP3040945B2 (ja) 文書検索装置
JP3918531B2 (ja) 類似文書検索方法およびシステム
US6654740B2 (en) Probabilistic information retrieval based on differential latent semantic space
US20090083262A1 (en) System for entity search and a method for entity scoring in a linked document database
Pérez-Iglesias et al. Standard deviation as a query hardness estimator
JP2013506189A5 (ru)
RU2005111001A (ru) Проверка релевантности между ключевыми словами и содержанием веб-сайта
CN113821646A (zh) 基于语义检索的智能化专利相似度搜索方法及装置
JP2009193219A (ja) インデックス作成装置、その方法、プログラム及び記録媒体
JP4238616B2 (ja) 類似文書検索方法および類似文書検索装置
Sriram et al. A session-based search engine
Macdonald et al. Efficient & effective selective query rewriting with efficiency predictions
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
CN111737413A (zh) 基于概念网语义的反馈模型信息检索方法、系统及介质
JP3249743B2 (ja) 文書検索システム
JP2005025465A (ja) 文書検索方法及び文書検索装置
JP4360181B2 (ja) ドメイン別概念辞書構築装置及びプログラム
KR20120075553A (ko) 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법
JP3333186B2 (ja) 文書検索システム
Ellman et al. UNN-WePS: web person search using co-present names and lexical Chains

Legal Events

Date Code Title Description
PC41 Official registration of the transfer of exclusive right

Effective date: 20150306

MM4A The patent is invalid due to non-payment of fees

Effective date: 20200415