RU2005101735A - Автоматическая кластеризация запросов - Google Patents

Автоматическая кластеризация запросов Download PDF

Info

Publication number
RU2005101735A
RU2005101735A RU2005101735/09A RU2005101735A RU2005101735A RU 2005101735 A RU2005101735 A RU 2005101735A RU 2005101735/09 A RU2005101735/09 A RU 2005101735/09A RU 2005101735 A RU2005101735 A RU 2005101735A RU 2005101735 A RU2005101735 A RU 2005101735A
Authority
RU
Russia
Prior art keywords
properties
elements
cluster
interface
property
Prior art date
Application number
RU2005101735/09A
Other languages
English (en)
Other versions
RU2368948C2 (ru
Inventor
Анджей ТУРСКИ (US)
Анджей ТУРСКИ
Лили ЧЕНГ (US)
Лили ЧЕНГ
Мэттью МАКЛОРИН (US)
Мэттью МАКЛОРИН
Ричард Ф. РАШИД (US)
Ричард Ф. РАШИД
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Publication of RU2005101735A publication Critical patent/RU2005101735A/ru
Application granted granted Critical
Publication of RU2368948C2 publication Critical patent/RU2368948C2/ru

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B62LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
    • B62BHAND-PROPELLED VEHICLES, e.g. HAND CARTS OR PERAMBULATORS; SLEDGES
    • B62B5/00Accessories or details specially adapted for hand carts
    • B62B5/04Braking mechanisms; Locking devices against movement
    • B62B5/0485Braking mechanisms; Locking devices against movement by braking on the running surface, e.g. the tyre
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60BVEHICLE WHEELS; CASTORS; AXLES FOR WHEELS OR CASTORS; INCREASING WHEEL ADHESION
    • B60B33/00Castors in general; Anti-clogging castors
    • B60B33/04Castors in general; Anti-clogging castors adjustable, e.g. in height; linearly shifting castors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Claims (28)

1. Компьютеризированный интерфейс для представления данных, содержащий анализатор свойств, чтобы определять распределение элементов по меньшей мере для двух свойств кластеров, и организатор, который образует новые кластеры, частично основанные на распределении элементов.
2. Система по п.1, в которой свойства кластеров связаны с одним или более элементов данных, элементы данных хранятся по меньшей мере в одной из локальной и удаленной ячеек запоминающего устройства.
3. Система по п.2, в которой элементы данных включают документы, файлы, папки, изображения, аудио файлы, видео файлы, код, сообщения и компьютерное представление внешних объектов, включающих людей или местоположения.
4. Система по п.2, в которой свойства кластеров связаны по меньшей мере с одним из: тип элемента, дата или время создания, люди, связанные с элементом данных, месторасположение, категория и свойство, определяемое системой, приложением, администратором или пользователем.
5. Система по п.1, в которой анализатор свойств определяет кластер по типу элемента и затем определяет следующий кластер, основанный на другом свойстве.
6. Система по п.1, в которой анализатор свойств задает оценку кластеризации для различных свойств элементов и выбирает свойство с наивысшей оценкой.
7. Система по п.6, в которой оценка кластеризации вычисляется умножением в следующем уравнении: оценка = n_элементов в кластере 1* n_элементов в кластере 2*...
8. Система по п.6, в которой оценка кластеризации основывается на биномиальном распределении следующим образом: оценка = (N_суммарное)!/((n_элементов в кластере 1)!* (n_элементов в кластере 2)!*...).
9. Система по п.1, которая также содержит интерфейс пользователя, чтобы по меньшей мере отображать результаты кластеров, получать выборку запросов и получать информацию о свойствах, отображать информацию, относящуюся к элементу данных в кластере.
10. Считываемая компьютером среда, имеющая хранящиеся на ней считываемые компьютером инструкции для реализации анализатора свойств и организатора кластеров по п.1.
11. Система для результатов автоматической кластеризации запроса, содержащая средство для извлечения свойств множества элементов, средство для определения оценки для множества элементов, основанной на свойствах, и средство для связанных с элементами данных автоматической кластеризации, основанной на определенной оценке.
12. Способ автоматической кластеризации запроса, содержащий этапы на которых связывают одно или более свойств с множеством элементов данных, определяют распределение элементов данных, основанное на свойствах, и автоматически объединяют в кластеры элементы данных, основываясь на определенном распределении.
13. Способ по п.12, по которому распределение определяется по меньшей мере из одного из следующих уравнений:
оценка = n_элементов в кластере 1* n_элементов в кластере 2*...
оценка = (N_суммарное)!/((n_элементов в кластере 1)!* (n_элементов в кластере 2)!*...).
14. Способ по п.12, который также содержит этап обработки N элементов и M свойств.
15. Способ по п.14, который также содержит по меньшей мере один из этапов: инициализация M хэш-таблиц, итерация по N элементам и, для каждого элемента, итерация по M свойствам.
16. Способ по п.15, который также содержит этап вычисления значения хеш-функции для каждого свойства.
17. Способ по п.16, который также содержит этап вычисления оценки кластеризации для каждого свойства, используя данные из соответствующей хэш-таблицы.
18. Способ по п.12, который также содержит этап автоматического упорядочивания кластеров, основанный на предопределенной пороговой величине.
19. Способ по п.18, который также содержит этап предложения альтернативного группирования кластеров.
20. Способ по п.18, который также содержит этап упорядочивания кластеров, основанный на определенных пользователем свойствах.
21. Графический интерфейс пользователя, содержащий один или более элементов данных и соответствующих свойств, хранящихся в базе данных, один или более объектов отображения, созданных для элементов данных, компоненту ввода для выбора элементов данных и соответствующих свойств, и компоненту отображения, чтобы представлять объекты отображения, частично основываясь на автоматизированном анализе свойств.
22. Интерфейс по п.21, который также содержит управляющие элементы для взаимодействия со свойствами.
23. Интерфейс по п.22, в котором свойства применяются для вложенного запроса результатов.
24. Интерфейс по п.22, в котором свойства включают по меньшей мере одно из: тип, месторасположение, категория, личность, дата, время и параметр, определяемый пользователем.
25. Интерфейс по п.22, который также содержит компоненту, чтобы косвенным образом учиться на действиях пользователя.
26. Интерфейс по п.22, который также содержит по меньшей мере один полусвернутый список или группу.
27. Интерфейс по п. 26, который также содержит управляющие элементы для расширения списка или группы.
28. Интерфейс по п.27, в котором по меньшей мере один большой кластер свойств представлен в сжатом виде, использующим полусвернутый список.
RU2005101735/09A 2004-01-26 2005-01-25 Автоматическая кластеризация запросов RU2368948C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/764,738 US7257571B2 (en) 2004-01-26 2004-01-26 Automatic query clustering
US10/764,738 2004-01-26

Publications (2)

Publication Number Publication Date
RU2005101735A true RU2005101735A (ru) 2006-07-10
RU2368948C2 RU2368948C2 (ru) 2009-09-27

Family

ID=34634626

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005101735/09A RU2368948C2 (ru) 2004-01-26 2005-01-25 Автоматическая кластеризация запросов

Country Status (14)

Country Link
US (2) US7257571B2 (ru)
EP (1) EP1557774A3 (ru)
JP (1) JP4101239B2 (ru)
KR (1) KR101029403B1 (ru)
CN (1) CN1648903A (ru)
AU (1) AU2005200286A1 (ru)
BR (1) BRPI0500784A (ru)
CA (1) CA2494410A1 (ru)
HK (1) HK1080164A1 (ru)
MX (1) MXPA05001072A (ru)
MY (1) MY145961A (ru)
RU (1) RU2368948C2 (ru)
TW (1) TW200529063A (ru)
ZA (1) ZA200500736B (ru)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8448069B2 (en) * 2004-04-23 2013-05-21 International Business Machines Corporation Object set property viewer
US8090698B2 (en) 2004-05-07 2012-01-03 Ebay Inc. Method and system to facilitate a search of an information resource
JP4533007B2 (ja) * 2004-06-09 2010-08-25 キヤノン株式会社 画像管理装置、画像管理方法、及びプログラム
US9552141B2 (en) 2004-06-21 2017-01-24 Apple Inc. Methods and apparatuses for operating a data processing system
US7693860B2 (en) * 2005-03-18 2010-04-06 Microsoft Corporation Method and system to associate cell and item metadata
CN101208667B (zh) * 2005-06-22 2012-01-11 日本电气株式会社 调试系统及方法
US7739314B2 (en) * 2005-08-15 2010-06-15 Google Inc. Scalable user clustering based on set similarity
US8234293B2 (en) * 2005-09-08 2012-07-31 Microsoft Corporation Autocompleting with queries to a database
KR100713534B1 (ko) * 2005-09-08 2007-04-30 삼성전자주식회사 이동 통신 단말의 사용자 데이터 검색 방법
US7792847B2 (en) * 2005-09-09 2010-09-07 Microsoft Corporation Converting structured reports to formulas
US8843481B1 (en) * 2005-09-30 2014-09-23 Yongyong Xu System and method of forming action based virtual communities and related search mechanisms
US7805433B2 (en) * 2005-10-14 2010-09-28 Microsoft Corporation Multidimensional cube functions
US20070168323A1 (en) * 2006-01-03 2007-07-19 Microsoft Corporation Query aggregation
WO2007088893A1 (ja) * 2006-02-01 2007-08-09 Matsushita Electric Industrial Co., Ltd. 情報分類装置および情報検索装置
KR100725411B1 (ko) * 2006-02-06 2007-06-07 삼성전자주식회사 컨텐츠 검색을 위한 사용자 인터페이스, 사용자 인터페이스제공 방법, 및 컨텐츠 검색 장치
US20070239682A1 (en) * 2006-04-06 2007-10-11 Arellanes Paul T System and method for browser context based search disambiguation using a viewed content history
US8214360B2 (en) * 2006-04-06 2012-07-03 International Business Machines Corporation Browser context based search disambiguation using existing category taxonomy
KR100806115B1 (ko) 2006-05-02 2008-02-21 인하대학교 산학협력단 다중레벨 dbms에서 질의 분류 컴포넌트의 설계 방법
US20070260600A1 (en) * 2006-05-08 2007-11-08 Mita Group Information discovery and group association
CN101122910A (zh) * 2006-08-07 2008-02-13 鸿富锦精密工业(深圳)有限公司 存储装置及打开其所存储文件的方法
WO2008034213A1 (en) * 2006-09-18 2008-03-27 Infobright Inc. A method and system for data compression in a relational database
US8266147B2 (en) * 2006-09-18 2012-09-11 Infobright, Inc. Methods and systems for database organization
US9817436B2 (en) * 2007-01-07 2017-11-14 Apple Inc. Portable multifunction device, method, and graphical user interface for displaying user interface objects adaptively
JP4412342B2 (ja) * 2007-03-30 2010-02-10 ソニー株式会社 コンテンツ管理装置、画像表示装置、撮像装置、および、これらにおける処理方法ならびに当該方法をコンピュータに実行させるプログラム
US20090228826A1 (en) * 2008-03-04 2009-09-10 Microsoft Corporation Group filtering of items in a view
US7860866B2 (en) * 2008-03-26 2010-12-28 Microsoft Corporation Heuristic event clustering of media using metadata
WO2010060179A1 (en) * 2008-11-28 2010-06-03 Infobright Inc. Methods for organizing a relational database by using clustering operations
US20100299603A1 (en) * 2009-05-22 2010-11-25 Bernard Farkas User-Customized Subject-Categorized Website Entertainment Database
US20110116416A1 (en) * 2009-11-18 2011-05-19 Dobson Eric L System and method for geographically optimized wireless mesh networks
US8839128B2 (en) 2009-11-25 2014-09-16 Cooliris, Inc. Gallery application for content viewing
US9367564B2 (en) 2010-03-12 2016-06-14 Exxonmobil Upstream Research Company Dynamic grouping of domain objects via smart groups
US8521748B2 (en) 2010-06-14 2013-08-27 Infobright Inc. System and method for managing metadata in a relational database
US8417727B2 (en) 2010-06-14 2013-04-09 Infobright Inc. System and method for storing data in a relational database
US9608941B2 (en) * 2011-02-07 2017-03-28 Google Inc. Methods and systems for clustering emails using email addresses
CN102253967B (zh) * 2011-06-03 2013-03-27 用友软件股份有限公司 数据查找系统和数据查找方法
US10078819B2 (en) * 2011-06-21 2018-09-18 Oath Inc. Presenting favorite contacts information to a user of a computing device
CN103049444B (zh) * 2011-10-12 2016-09-28 阿里巴巴集团控股有限公司 一种数据信息分类结构的存储方法和系统
US9558278B2 (en) 2012-09-11 2017-01-31 Apple Inc. Integrated content recommendation
US9218118B2 (en) 2012-09-11 2015-12-22 Apple Inc. Media player playlist management
US10140372B2 (en) 2012-09-12 2018-11-27 Gracenote, Inc. User profile based on clustering tiered descriptors
US9047368B1 (en) * 2013-02-19 2015-06-02 Symantec Corporation Self-organizing user-centric document vault
US9792289B2 (en) * 2014-11-07 2017-10-17 Semandex Networks Inc. Systems and methods for file clustering, multi-drive forensic analysis and data protection
RU2611960C2 (ru) * 2015-03-31 2017-03-01 Общество С Ограниченной Ответственностью "Яндекс" Способ организации в кластеры точек интереса и сервер для его осуществления
CN108460049B (zh) * 2017-02-21 2021-10-19 阿里巴巴集团控股有限公司 一种确定信息类别的方法和系统
RU2666331C1 (ru) * 2017-04-04 2018-09-06 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для создания оффлайн страницы результатов поиска
US20190228378A1 (en) * 2018-01-24 2019-07-25 Microsoft Technology Licensing, Llc Intelligent targeting of files needing attention
US11074408B2 (en) 2019-06-01 2021-07-27 Apple Inc. Mail application features

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6122405A (en) * 1993-08-27 2000-09-19 Martin Marietta Corporation Adaptive filter selection for optimal feature extraction
US5801699A (en) * 1996-01-26 1998-09-01 International Business Machines Corporation Icon aggregation on a graphical user interface
US5899992A (en) * 1997-02-14 1999-05-04 International Business Machines Corporation Scalable set oriented classifier
US6415282B1 (en) * 1998-04-22 2002-07-02 Nec Usa, Inc. Method and apparatus for query refinement
US6742003B2 (en) * 2001-04-30 2004-05-25 Microsoft Corporation Apparatus and accompanying methods for visualizing clusters of data and hierarchical cluster classifications
US6732149B1 (en) * 1999-04-09 2004-05-04 International Business Machines Corporation System and method for hindering undesired transmission or receipt of electronic messages
US6564197B2 (en) * 1999-05-03 2003-05-13 E.Piphany, Inc. Method and apparatus for scalable probabilistic clustering using decision trees
US6606613B1 (en) * 1999-06-03 2003-08-12 Microsoft Corporation Methods and apparatus for using task models to help computer users complete tasks
US6539374B2 (en) * 1999-06-03 2003-03-25 Microsoft Corporation Methods, apparatus and data structures for providing a uniform representation of various types of information
RU2177174C1 (ru) * 2000-05-12 2001-12-20 Серебренников Олег Александрович Способ поиска в базах данных с разметкой данных
US6578032B1 (en) * 2000-06-28 2003-06-10 Microsoft Corporation Method and system for performing phrase/word clustering and cluster merging
US7519605B2 (en) * 2001-05-09 2009-04-14 Agilent Technologies, Inc. Systems, methods and computer readable media for performing a domain-specific metasearch, and visualizing search results therefrom
US6920448B2 (en) * 2001-05-09 2005-07-19 Agilent Technologies, Inc. Domain specific knowledge-based metasearch system and methods of using
US6910026B2 (en) * 2001-08-27 2005-06-21 Verity, Inc. Method and apparatus for determining classifier features with minimal supervision
US6944612B2 (en) * 2002-11-13 2005-09-13 Xerox Corporation Structured contextual clustering method and system in a federated search engine

Also Published As

Publication number Publication date
CN1648903A (zh) 2005-08-03
KR101029403B1 (ko) 2011-04-14
RU2368948C2 (ru) 2009-09-27
US7257571B2 (en) 2007-08-14
US20080021896A1 (en) 2008-01-24
CA2494410A1 (en) 2005-07-26
ZA200500736B (en) 2006-10-25
EP1557774A3 (en) 2007-07-04
MXPA05001072A (es) 2005-10-05
HK1080164A1 (zh) 2006-04-21
US20050165825A1 (en) 2005-07-28
BRPI0500784A (pt) 2005-08-30
TW200529063A (en) 2005-09-01
EP1557774A2 (en) 2005-07-27
KR20050077036A (ko) 2005-07-29
JP2005235196A (ja) 2005-09-02
AU2005200286A1 (en) 2005-08-11
MY145961A (en) 2012-05-31
JP4101239B2 (ja) 2008-06-18

Similar Documents

Publication Publication Date Title
RU2005101735A (ru) Автоматическая кластеризация запросов
JP2005235196A5 (ru)
CN110292775B (zh) 获取差异数据的方法及装置
US8019758B2 (en) Generation of a blended classification model
CN108460082B (zh) 一种推荐方法及装置,电子设备
CN103718178B (zh) 利用从结构化文档中提取的特征来改善搜索关联性
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
WO2007078814A2 (en) Apparatus and method for strategy map validation and visualization
US8140595B2 (en) Linked logical fields
CN104794242A (zh) 一种搜索方法
WO2010120465A2 (en) Testing efficiency and stability of a database query engine
CN106294661A (zh) 一种扩展搜索方法与装置
CN108959580A (zh) 一种标签数据的优化方法及系统
CN111737608B (zh) 企业信息检索结果排序方法及装置
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
US20190347295A1 (en) Display apparatus and display method
CN105975508B (zh) 个性化元搜索引擎检索结果合成排序方法
KR101030250B1 (ko) 데이터 처리방법 및 데이터 처리 프로그램
EP2112608A1 (en) Defragmenting indexes in a relational database
KR20120057786A (ko) 검색 결과 내에 첨부된 정보 데이터베이스에 기초한 검색 리스트 및 검색어 순위 제공 방법 및 시스템
US10394826B1 (en) System and methods for searching query data
Huang et al. Rough-set-based approach to manufacturing process document retrieval
Wadhvani et al. A Topic-driven Summarization using K-mean Clustering and Tf-Isf Sentence Ranking
CN109213830A (zh) 专业性技术文档的文档检索系统
CN110825735B (zh) 数据表处理方法及相关设备

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20130126