RU2005101735A - Автоматическая кластеризация запросов - Google Patents
Автоматическая кластеризация запросов Download PDFInfo
- Publication number
- RU2005101735A RU2005101735A RU2005101735/09A RU2005101735A RU2005101735A RU 2005101735 A RU2005101735 A RU 2005101735A RU 2005101735/09 A RU2005101735/09 A RU 2005101735/09A RU 2005101735 A RU2005101735 A RU 2005101735A RU 2005101735 A RU2005101735 A RU 2005101735A
- Authority
- RU
- Russia
- Prior art keywords
- properties
- elements
- cluster
- interface
- property
- Prior art date
Links
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B62—LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
- B62B—HAND-PROPELLED VEHICLES, e.g. HAND CARTS OR PERAMBULATORS; SLEDGES
- B62B5/00—Accessories or details specially adapted for hand carts
- B62B5/04—Braking mechanisms; Locking devices against movement
- B62B5/0485—Braking mechanisms; Locking devices against movement by braking on the running surface, e.g. the tyre
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
- G06F16/148—File search processing
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60B—VEHICLE WHEELS; CASTORS; AXLES FOR WHEELS OR CASTORS; INCREASING WHEEL ADHESION
- B60B33/00—Castors in general; Anti-clogging castors
- B60B33/04—Castors in general; Anti-clogging castors adjustable, e.g. in height; linearly shifting castors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
Claims (28)
1. Компьютеризированный интерфейс для представления данных, содержащий анализатор свойств, чтобы определять распределение элементов по меньшей мере для двух свойств кластеров, и организатор, который образует новые кластеры, частично основанные на распределении элементов.
2. Система по п.1, в которой свойства кластеров связаны с одним или более элементов данных, элементы данных хранятся по меньшей мере в одной из локальной и удаленной ячеек запоминающего устройства.
3. Система по п.2, в которой элементы данных включают документы, файлы, папки, изображения, аудио файлы, видео файлы, код, сообщения и компьютерное представление внешних объектов, включающих людей или местоположения.
4. Система по п.2, в которой свойства кластеров связаны по меньшей мере с одним из: тип элемента, дата или время создания, люди, связанные с элементом данных, месторасположение, категория и свойство, определяемое системой, приложением, администратором или пользователем.
5. Система по п.1, в которой анализатор свойств определяет кластер по типу элемента и затем определяет следующий кластер, основанный на другом свойстве.
6. Система по п.1, в которой анализатор свойств задает оценку кластеризации для различных свойств элементов и выбирает свойство с наивысшей оценкой.
7. Система по п.6, в которой оценка кластеризации вычисляется умножением в следующем уравнении: оценка = n_элементов в кластере 1* n_элементов в кластере 2*...
8. Система по п.6, в которой оценка кластеризации основывается на биномиальном распределении следующим образом: оценка = (N_суммарное)!/((n_элементов в кластере 1)!* (n_элементов в кластере 2)!*...).
9. Система по п.1, которая также содержит интерфейс пользователя, чтобы по меньшей мере отображать результаты кластеров, получать выборку запросов и получать информацию о свойствах, отображать информацию, относящуюся к элементу данных в кластере.
10. Считываемая компьютером среда, имеющая хранящиеся на ней считываемые компьютером инструкции для реализации анализатора свойств и организатора кластеров по п.1.
11. Система для результатов автоматической кластеризации запроса, содержащая средство для извлечения свойств множества элементов, средство для определения оценки для множества элементов, основанной на свойствах, и средство для связанных с элементами данных автоматической кластеризации, основанной на определенной оценке.
12. Способ автоматической кластеризации запроса, содержащий этапы на которых связывают одно или более свойств с множеством элементов данных, определяют распределение элементов данных, основанное на свойствах, и автоматически объединяют в кластеры элементы данных, основываясь на определенном распределении.
13. Способ по п.12, по которому распределение определяется по меньшей мере из одного из следующих уравнений:
оценка = n_элементов в кластере 1* n_элементов в кластере 2*...
оценка = (N_суммарное)!/((n_элементов в кластере 1)!* (n_элементов в кластере 2)!*...).
14. Способ по п.12, который также содержит этап обработки N элементов и M свойств.
15. Способ по п.14, который также содержит по меньшей мере один из этапов: инициализация M хэш-таблиц, итерация по N элементам и, для каждого элемента, итерация по M свойствам.
16. Способ по п.15, который также содержит этап вычисления значения хеш-функции для каждого свойства.
17. Способ по п.16, который также содержит этап вычисления оценки кластеризации для каждого свойства, используя данные из соответствующей хэш-таблицы.
18. Способ по п.12, который также содержит этап автоматического упорядочивания кластеров, основанный на предопределенной пороговой величине.
19. Способ по п.18, который также содержит этап предложения альтернативного группирования кластеров.
20. Способ по п.18, который также содержит этап упорядочивания кластеров, основанный на определенных пользователем свойствах.
21. Графический интерфейс пользователя, содержащий один или более элементов данных и соответствующих свойств, хранящихся в базе данных, один или более объектов отображения, созданных для элементов данных, компоненту ввода для выбора элементов данных и соответствующих свойств, и компоненту отображения, чтобы представлять объекты отображения, частично основываясь на автоматизированном анализе свойств.
22. Интерфейс по п.21, который также содержит управляющие элементы для взаимодействия со свойствами.
23. Интерфейс по п.22, в котором свойства применяются для вложенного запроса результатов.
24. Интерфейс по п.22, в котором свойства включают по меньшей мере одно из: тип, месторасположение, категория, личность, дата, время и параметр, определяемый пользователем.
25. Интерфейс по п.22, который также содержит компоненту, чтобы косвенным образом учиться на действиях пользователя.
26. Интерфейс по п.22, который также содержит по меньшей мере один полусвернутый список или группу.
27. Интерфейс по п. 26, который также содержит управляющие элементы для расширения списка или группы.
28. Интерфейс по п.27, в котором по меньшей мере один большой кластер свойств представлен в сжатом виде, использующим полусвернутый список.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/764,738 US7257571B2 (en) | 2004-01-26 | 2004-01-26 | Automatic query clustering |
US10/764,738 | 2004-01-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2005101735A true RU2005101735A (ru) | 2006-07-10 |
RU2368948C2 RU2368948C2 (ru) | 2009-09-27 |
Family
ID=34634626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2005101735/09A RU2368948C2 (ru) | 2004-01-26 | 2005-01-25 | Автоматическая кластеризация запросов |
Country Status (14)
Country | Link |
---|---|
US (2) | US7257571B2 (ru) |
EP (1) | EP1557774A3 (ru) |
JP (1) | JP4101239B2 (ru) |
KR (1) | KR101029403B1 (ru) |
CN (1) | CN1648903A (ru) |
AU (1) | AU2005200286A1 (ru) |
BR (1) | BRPI0500784A (ru) |
CA (1) | CA2494410A1 (ru) |
HK (1) | HK1080164A1 (ru) |
MX (1) | MXPA05001072A (ru) |
MY (1) | MY145961A (ru) |
RU (1) | RU2368948C2 (ru) |
TW (1) | TW200529063A (ru) |
ZA (1) | ZA200500736B (ru) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8448069B2 (en) * | 2004-04-23 | 2013-05-21 | International Business Machines Corporation | Object set property viewer |
US8090698B2 (en) | 2004-05-07 | 2012-01-03 | Ebay Inc. | Method and system to facilitate a search of an information resource |
JP4533007B2 (ja) * | 2004-06-09 | 2010-08-25 | キヤノン株式会社 | 画像管理装置、画像管理方法、及びプログラム |
US9552141B2 (en) | 2004-06-21 | 2017-01-24 | Apple Inc. | Methods and apparatuses for operating a data processing system |
US7693860B2 (en) * | 2005-03-18 | 2010-04-06 | Microsoft Corporation | Method and system to associate cell and item metadata |
CN101208667B (zh) * | 2005-06-22 | 2012-01-11 | 日本电气株式会社 | 调试系统及方法 |
US7739314B2 (en) * | 2005-08-15 | 2010-06-15 | Google Inc. | Scalable user clustering based on set similarity |
US8234293B2 (en) * | 2005-09-08 | 2012-07-31 | Microsoft Corporation | Autocompleting with queries to a database |
KR100713534B1 (ko) * | 2005-09-08 | 2007-04-30 | 삼성전자주식회사 | 이동 통신 단말의 사용자 데이터 검색 방법 |
US7792847B2 (en) * | 2005-09-09 | 2010-09-07 | Microsoft Corporation | Converting structured reports to formulas |
US8843481B1 (en) * | 2005-09-30 | 2014-09-23 | Yongyong Xu | System and method of forming action based virtual communities and related search mechanisms |
US7805433B2 (en) * | 2005-10-14 | 2010-09-28 | Microsoft Corporation | Multidimensional cube functions |
US20070168323A1 (en) * | 2006-01-03 | 2007-07-19 | Microsoft Corporation | Query aggregation |
WO2007088893A1 (ja) * | 2006-02-01 | 2007-08-09 | Matsushita Electric Industrial Co., Ltd. | 情報分類装置および情報検索装置 |
KR100725411B1 (ko) * | 2006-02-06 | 2007-06-07 | 삼성전자주식회사 | 컨텐츠 검색을 위한 사용자 인터페이스, 사용자 인터페이스제공 방법, 및 컨텐츠 검색 장치 |
US20070239682A1 (en) * | 2006-04-06 | 2007-10-11 | Arellanes Paul T | System and method for browser context based search disambiguation using a viewed content history |
US8214360B2 (en) * | 2006-04-06 | 2012-07-03 | International Business Machines Corporation | Browser context based search disambiguation using existing category taxonomy |
KR100806115B1 (ko) | 2006-05-02 | 2008-02-21 | 인하대학교 산학협력단 | 다중레벨 dbms에서 질의 분류 컴포넌트의 설계 방법 |
US20070260600A1 (en) * | 2006-05-08 | 2007-11-08 | Mita Group | Information discovery and group association |
CN101122910A (zh) * | 2006-08-07 | 2008-02-13 | 鸿富锦精密工业(深圳)有限公司 | 存储装置及打开其所存储文件的方法 |
WO2008034213A1 (en) * | 2006-09-18 | 2008-03-27 | Infobright Inc. | A method and system for data compression in a relational database |
US8266147B2 (en) * | 2006-09-18 | 2012-09-11 | Infobright, Inc. | Methods and systems for database organization |
US9817436B2 (en) * | 2007-01-07 | 2017-11-14 | Apple Inc. | Portable multifunction device, method, and graphical user interface for displaying user interface objects adaptively |
JP4412342B2 (ja) * | 2007-03-30 | 2010-02-10 | ソニー株式会社 | コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム |
US20090228826A1 (en) * | 2008-03-04 | 2009-09-10 | Microsoft Corporation | Group filtering of items in a view |
US7860866B2 (en) * | 2008-03-26 | 2010-12-28 | Microsoft Corporation | Heuristic event clustering of media using metadata |
WO2010060179A1 (en) * | 2008-11-28 | 2010-06-03 | Infobright Inc. | Methods for organizing a relational database by using clustering operations |
US20100299603A1 (en) * | 2009-05-22 | 2010-11-25 | Bernard Farkas | User-Customized Subject-Categorized Website Entertainment Database |
US20110116416A1 (en) * | 2009-11-18 | 2011-05-19 | Dobson Eric L | System and method for geographically optimized wireless mesh networks |
US8839128B2 (en) | 2009-11-25 | 2014-09-16 | Cooliris, Inc. | Gallery application for content viewing |
US9367564B2 (en) | 2010-03-12 | 2016-06-14 | Exxonmobil Upstream Research Company | Dynamic grouping of domain objects via smart groups |
US8521748B2 (en) | 2010-06-14 | 2013-08-27 | Infobright Inc. | System and method for managing metadata in a relational database |
US8417727B2 (en) | 2010-06-14 | 2013-04-09 | Infobright Inc. | System and method for storing data in a relational database |
US9608941B2 (en) * | 2011-02-07 | 2017-03-28 | Google Inc. | Methods and systems for clustering emails using email addresses |
CN102253967B (zh) * | 2011-06-03 | 2013-03-27 | 用友软件股份有限公司 | 数据查找系统和数据查找方法 |
US10078819B2 (en) * | 2011-06-21 | 2018-09-18 | Oath Inc. | Presenting favorite contacts information to a user of a computing device |
CN103049444B (zh) * | 2011-10-12 | 2016-09-28 | 阿里巴巴集团控股有限公司 | 一种数据信息分类结构的存储方法和系统 |
US9558278B2 (en) | 2012-09-11 | 2017-01-31 | Apple Inc. | Integrated content recommendation |
US9218118B2 (en) | 2012-09-11 | 2015-12-22 | Apple Inc. | Media player playlist management |
US10140372B2 (en) | 2012-09-12 | 2018-11-27 | Gracenote, Inc. | User profile based on clustering tiered descriptors |
US9047368B1 (en) * | 2013-02-19 | 2015-06-02 | Symantec Corporation | Self-organizing user-centric document vault |
US9792289B2 (en) * | 2014-11-07 | 2017-10-17 | Semandex Networks Inc. | Systems and methods for file clustering, multi-drive forensic analysis and data protection |
RU2611960C2 (ru) * | 2015-03-31 | 2017-03-01 | Общество С Ограниченной Ответственностью "Яндекс" | Способ организации в кластеры точек интереса и сервер для его осуществления |
CN108460049B (zh) * | 2017-02-21 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 一种确定信息类别的方法和系统 |
RU2666331C1 (ru) * | 2017-04-04 | 2018-09-06 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система для создания оффлайн страницы результатов поиска |
US20190228378A1 (en) * | 2018-01-24 | 2019-07-25 | Microsoft Technology Licensing, Llc | Intelligent targeting of files needing attention |
US11074408B2 (en) | 2019-06-01 | 2021-07-27 | Apple Inc. | Mail application features |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122405A (en) * | 1993-08-27 | 2000-09-19 | Martin Marietta Corporation | Adaptive filter selection for optimal feature extraction |
US5801699A (en) * | 1996-01-26 | 1998-09-01 | International Business Machines Corporation | Icon aggregation on a graphical user interface |
US5899992A (en) * | 1997-02-14 | 1999-05-04 | International Business Machines Corporation | Scalable set oriented classifier |
US6415282B1 (en) * | 1998-04-22 | 2002-07-02 | Nec Usa, Inc. | Method and apparatus for query refinement |
US6742003B2 (en) * | 2001-04-30 | 2004-05-25 | Microsoft Corporation | Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications |
US6732149B1 (en) * | 1999-04-09 | 2004-05-04 | International Business Machines Corporation | System and method for hindering undesired transmission or receipt of electronic messages |
US6564197B2 (en) * | 1999-05-03 | 2003-05-13 | E.Piphany, Inc. | Method and apparatus for scalable probabilistic clustering using decision trees |
US6606613B1 (en) * | 1999-06-03 | 2003-08-12 | Microsoft Corporation | Methods and apparatus for using task models to help computer users complete tasks |
US6539374B2 (en) * | 1999-06-03 | 2003-03-25 | Microsoft Corporation | Methods, apparatus and data structures for providing a uniform representation of various types of information |
RU2177174C1 (ru) * | 2000-05-12 | 2001-12-20 | Серебренников Олег Александрович | Способ поиска в базах данных с разметкой данных |
US6578032B1 (en) * | 2000-06-28 | 2003-06-10 | Microsoft Corporation | Method and system for performing phrase/word clustering and cluster merging |
US7519605B2 (en) * | 2001-05-09 | 2009-04-14 | Agilent Technologies, Inc. | Systems, methods and computer readable media for performing a domain-specific metasearch, and visualizing search results therefrom |
US6920448B2 (en) * | 2001-05-09 | 2005-07-19 | Agilent Technologies, Inc. | Domain specific knowledge-based metasearch system and methods of using |
US6910026B2 (en) * | 2001-08-27 | 2005-06-21 | Verity, Inc. | Method and apparatus for determining classifier features with minimal supervision |
US6944612B2 (en) * | 2002-11-13 | 2005-09-13 | Xerox Corporation | Structured contextual clustering method and system in a federated search engine |
-
2004
- 2004-01-26 US US10/764,738 patent/US7257571B2/en not_active Expired - Fee Related
-
2005
- 2005-01-24 AU AU2005200286A patent/AU2005200286A1/en not_active Abandoned
- 2005-01-25 ZA ZA200500736A patent/ZA200500736B/xx unknown
- 2005-01-25 CA CA002494410A patent/CA2494410A1/en not_active Abandoned
- 2005-01-25 RU RU2005101735/09A patent/RU2368948C2/ru not_active IP Right Cessation
- 2005-01-25 MY MYPI20050278A patent/MY145961A/en unknown
- 2005-01-26 JP JP2005018656A patent/JP4101239B2/ja active Active
- 2005-01-26 TW TW094102362A patent/TW200529063A/zh unknown
- 2005-01-26 BR BR0500784-4A patent/BRPI0500784A/pt not_active IP Right Cessation
- 2005-01-26 KR KR1020050007142A patent/KR101029403B1/ko active IP Right Grant
- 2005-01-26 CN CNA2005100509243A patent/CN1648903A/zh active Pending
- 2005-01-26 EP EP05100494A patent/EP1557774A3/en not_active Withdrawn
- 2005-01-26 MX MXPA05001072A patent/MXPA05001072A/es not_active Application Discontinuation
-
2006
- 2006-01-04 HK HK06100089.6A patent/HK1080164A1/zh unknown
-
2007
- 2007-08-13 US US11/838,126 patent/US20080021896A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN1648903A (zh) | 2005-08-03 |
KR101029403B1 (ko) | 2011-04-14 |
RU2368948C2 (ru) | 2009-09-27 |
US7257571B2 (en) | 2007-08-14 |
US20080021896A1 (en) | 2008-01-24 |
CA2494410A1 (en) | 2005-07-26 |
ZA200500736B (en) | 2006-10-25 |
EP1557774A3 (en) | 2007-07-04 |
MXPA05001072A (es) | 2005-10-05 |
HK1080164A1 (zh) | 2006-04-21 |
US20050165825A1 (en) | 2005-07-28 |
BRPI0500784A (pt) | 2005-08-30 |
TW200529063A (en) | 2005-09-01 |
EP1557774A2 (en) | 2005-07-27 |
KR20050077036A (ko) | 2005-07-29 |
JP2005235196A (ja) | 2005-09-02 |
AU2005200286A1 (en) | 2005-08-11 |
MY145961A (en) | 2012-05-31 |
JP4101239B2 (ja) | 2008-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2005101735A (ru) | Автоматическая кластеризация запросов | |
JP2005235196A5 (ru) | ||
CN110292775B (zh) | 获取差异数据的方法及装置 | |
US8019758B2 (en) | Generation of a blended classification model | |
CN108460082B (zh) | 一种推荐方法及装置,电子设备 | |
CN103718178B (zh) | 利用从结构化文档中提取的特征来改善搜索关联性 | |
CN107085583B (zh) | 一种基于内容的电子文档管理方法及装置 | |
WO2007078814A2 (en) | Apparatus and method for strategy map validation and visualization | |
US8140595B2 (en) | Linked logical fields | |
CN104794242A (zh) | 一种搜索方法 | |
WO2010120465A2 (en) | Testing efficiency and stability of a database query engine | |
CN106294661A (zh) | 一种扩展搜索方法与装置 | |
CN108959580A (zh) | 一种标签数据的优化方法及系统 | |
CN111737608B (zh) | 企业信息检索结果排序方法及装置 | |
CN111310032A (zh) | 资源推荐方法、装置、计算机设备及可读存储介质 | |
US20190347295A1 (en) | Display apparatus and display method | |
CN105975508B (zh) | 个性化元搜索引擎检索结果合成排序方法 | |
KR101030250B1 (ko) | 데이터 처리방법 및 데이터 처리 프로그램 | |
EP2112608A1 (en) | Defragmenting indexes in a relational database | |
KR20120057786A (ko) | 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템 | |
US10394826B1 (en) | System and methods for searching query data | |
Huang et al. | Rough-set-based approach to manufacturing process document retrieval | |
Wadhvani et al. | A Topic-driven Summarization using K-mean Clustering and Tf-Isf Sentence Ranking | |
CN109213830A (zh) | 专业性技术文档的文档检索系统 | |
CN110825735B (zh) | 数据表处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20130126 |