RU2005114666A - Способ и система для определения подобия объектов на основании гетерогенных связей - Google Patents

Способ и система для определения подобия объектов на основании гетерогенных связей Download PDF

Info

Publication number
RU2005114666A
RU2005114666A RU2005114666/09A RU2005114666A RU2005114666A RU 2005114666 A RU2005114666 A RU 2005114666A RU 2005114666/09 A RU2005114666/09 A RU 2005114666/09A RU 2005114666 A RU2005114666 A RU 2005114666A RU 2005114666 A RU2005114666 A RU 2005114666A
Authority
RU
Russia
Prior art keywords
type
similarity
objects
intra
functions
Prior art date
Application number
RU2005114666/09A
Other languages
English (en)
Other versions
RU2419857C2 (ru
Inventor
Бэньюй ЧЖАН (US)
Бэньюй ЧЖАН
Гуй-Жун СЮЭ (US)
Гуй-Жун СЮЭ
Хуа-Цзюнь ЦЗЭН (US)
Хуа-Цзюнь ЦЗЭН
Вэй-Ин МА (US)
Вэй-Ин МА
Чжэн ЧЭНЬ (US)
Чжэн ЧЭНЬ
Original Assignee
Майкрософт Корпорейшн (Us)
Майкрософт Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Майкрософт Корпорейшн (Us), Майкрософт Корпорейшн filed Critical Майкрософт Корпорейшн (Us)
Publication of RU2005114666A publication Critical patent/RU2005114666A/ru
Application granted granted Critical
Publication of RU2419857C2 publication Critical patent/RU2419857C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9558Details of hyperlinks; Management of linked annotations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Complex Calculations (AREA)

Claims (37)

1. Способ генерации измерений подобия между объектами, осуществляемый в компьютерной системе, при котором каждый объект относится к одному из множества типов, тип имеет внутритиповую связь, а пара типов имеет межтиповую связь, содержащий следующие операции: для каждого типа в том случае, когда подобие этого типа основано на внутритиповой связи, обеспечивают функцию внутритипового подобия для каждой такой связи, являющуюся мерой подобия между объектами этого типа, в том случае, когда подобие этого типа основано на межтиповой связи, обеспечивают функцию межтипового подобия для каждой такой связи, являющуюся мерой подобия между объектами этого типа на основании подобия объектов другого типа, и обеспечивают функцию подобия, являющуюся мерой подобия между объектами этого типа, на основании любых функций внутритипового подобия и любых функций межтипового подобия для этого типа, и для каждой связи обеспечивают данные, определяющие эту связь между объектами, относящимися к этой связи, и одновременно решают обеспеченные функции подобия на основании связей, определяемых обеспеченными данными.
2. Способ по п.1, в котором функция внутритипового подобия для типа задана в рекурсивной форме на основании функции подобия этого типа.
3. Способ по п.1, в котором функция межтипового подобия для типа задана в рекурсивной форме на основании функции подобия другого типа.
4. Способ по п.1, в котором функция подобия для типа представляет собой линейную комбинацию функций внутритипового и межтипового подобия для этого типа.
5. Способ по п.4 в котором каждой функции внутритипового подобия и функции межтипового подобия присвоен весовой коэффициент.
6. Способ по п.5, в котором сумма весовых коэффициентов функций внутритипового и межтипового подобия для упомянутого типа равна единице.
7. Способ по п.1, в котором функции внутритипового и межтипового подобия решают путем итерационного вычисления значений подобия для объектов на основании функций подобия.
8. Способ по п.7, в котором функции подобия имеют решения в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, имеет сходимость.
9. Способ по п.7, в котором функции подобия имеют решения в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, является меньшей, чем пороговое значение различия.
10. Способ по п.1, в котором типы объектов содержат web-страницы и запросы, а межтиповая связь между запросом и web-страницей основана на указаниях мышью ссылке на web-страницу из запроса.
11. Способ по п.1, в котором типы объектов содержат web-страницы и запросы, внутритиповые связи для web-страниц основаны на входящих и исходящих ссылках, а межтиповая связь между web-страницей и запросом основана на указаниях мышью по ссылке на web-страницу из запроса.
12. Машиночитаемый носитель информации, содержащий команды для управления компьютерной системой для генерации измерений подобия между объектами, где каждый объект относится к одному из множества типов, способом, содержащим обеспечение для каждого типа функции подобия, являющейся мерой подобия между объектами этого типа на основании внутритиповых подобий между объектами того типа, когда для этого типа определено внутритиповое подобие, и межтипового подобия между объектами этого типа на основании подобия объектов другого типа, когда для этого типа определено межтиповое подобие, обеспечение для каждой связи данных, определяющих эту связь между объектами, относящимися к этой связи, и решения обеспеченных функций подобия на основании связей, определенных обеспеченными данными.
13. Машиночитаемый носитель информации по п.12, в котором функции подобия заданы в виде системы линейных уравнений.
14. Машиночитаемый носитель информации по п.12, в котором функция подобия задана в рекурсивной форме на основании подобий объектов различного типа.
15. Машиночитаемый носитель информации по п.12, в котором функция подобия задана в рекурсивной форме на основании подобия объектов этого типа для различных связей.
16. Машиночитаемый носитель информации по п.12, в котором функция подобия для типа представляет собой линейную комбинацию внутритиповых и межтиповых подобий для этого типа.
17. Машиночитаемый носитель информации по п.16, в котором каждому из внутритиповых и межтиповых подобий присвоен весовой коэффициент.
18. Машиночитаемый носитель информации по п.17, в котором сумма весовых коэффициентов внутритиповых и межтиповых подобий для упомянутого типа равна единице.
19. Машиночитаемый носитель информации по п.12, в котором функции подобия решаются путем итерационного вычисления значений подобия для объектов на основании функций подобия.
20. Машиночитаемый носитель информации по п.19, в котором функции подобия имеют решения в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, имеет сходимость.
21. Машиночитаемый носитель информации по п.19, в котором функции подобия имеют решения в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, является меньшей, чем пороговое значение различия.
22. Компьютерная система для вычисления оценки подобия для объектов, где каждый объект относится к одному из множества типов, а каждый тип имеет межтиповую связь с другим типом, содержащая компонент для каждого типа, реализующий функцию подобия, которая обеспечивает оценку подобия для пар объектов этого типа на основании межтипового подобия между объектами этого типа и объектами другого типа, при этом межтиповое подобие задано в рекурсивной форме на основании оценки подобия для пар объектов другого типа и межтиповых связей между парами объектов, и компонент, вычисляющий решение для функций подобия на основании межтиповых связей, определенных для набора объектов, путем итерационного вызова компонентов, реализующих функцию подобия до тех пор, пока не будет получена сходимость оценок подобия.
23. Компьютерная система по п.22, в которой функции подобия заданы в виде системы линейных уравнений.
24. Компьютерная система по п.22, в которой тип имеет внутритиповую связь между объектами этого типа и в которой функция подобия дополнительно основана на внутритиповых подобиях между объектами этого типа на основании внутритиповых связей между объектами.
25. Компьютерная система по п.24, в которой внутритиповое подобие для типа основана на межтиповых подобиях между объектами этого типа и другого типа.
26. Компьютерная система по п.24, в которой функция подобия задана в рекурсивной форме на основании внутритиповых подобий объектов для различных внутритиповых связей.
27. Компьютерная система по п.24, в которой функция подобия для типа представляет собой линейную комбинацию функций внутритипового и межтипового подобия для этого типа.
28. Компьютерная система по п.27 в котором каждой из функций внутритиповой и межтипового подобия присвоен весовой коэффициент.
29. Компьютерная система по п.28 в которой сумма весовых коэффициентов функций внутритипового и межтипового подобия для упомянутого типа равна единице.
30. Компьютерная система по п.22, в которой оценки подобия сходятся в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, является меньшей, чем пороговое значение различия.
31. Компьютерная система по п.22, в которой функции подобия имеют решения в том случае, когда мера различия, основанная на значениях подобия от одной итерации до следующей итерации, является меньшей, чем пороговое значение различия.
32. Способ вычисления подобия между объектами, осуществляемый в компьютерной системе, содержащий следующие операции: идентифицируют связи между объектами различных типов, определяют подобие между объектами первого типа на основании подобия между объектами другого типа, имеющими идентифицированную связь с объектами первого типа, получают данные, определяющие связи между объектами первого типа и другого типа, и вычисляют подобие между объектами первого типа на основании определения подобия и распознанных связей.
33. Способ по п.32, в котором определение подобия содержит определение общего подобия, которое может быть основано на внутритиповых и межтиповых подобиях.
34. Способ по п.32, в котором подобие между объектами первого типа и подобие между объектами другого типа заданы в рекурсивной форме.
35. Способ по п.34, в котором вычисление содержит итерационное вычисление значений подобия для объектов первого типа и объектов другого типа до тех пор, пока не будет получено решение за счет сходимости значений подобия.
36. Способ по п.32, в котором значения подобия для объектов заданы линейным уравнением для каждого типа.
37. Способ по п.36, в котором при операции вычисления линейные уравнения решают одновременно.
RU2005114666/08A 2004-05-14 2005-05-13 Способ и система для определения подобия объектов на основании гетерогенных связей RU2419857C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/846,949 2004-05-14
US10/846,949 US7376643B2 (en) 2004-05-14 2004-05-14 Method and system for determining similarity of objects based on heterogeneous relationships

Publications (2)

Publication Number Publication Date
RU2005114666A true RU2005114666A (ru) 2006-11-20
RU2419857C2 RU2419857C2 (ru) 2011-05-27

Family

ID=34939829

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005114666/08A RU2419857C2 (ru) 2004-05-14 2005-05-13 Способ и система для определения подобия объектов на основании гетерогенных связей

Country Status (10)

Country Link
US (1) US7376643B2 (ru)
EP (1) EP1596314B1 (ru)
JP (1) JP5147162B2 (ru)
KR (1) KR101130533B1 (ru)
CN (1) CN1728147B (ru)
AU (1) AU2005202016A1 (ru)
BR (1) BRPI0503220A (ru)
CA (1) CA2507365A1 (ru)
MX (1) MXPA05005219A (ru)
RU (1) RU2419857C2 (ru)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135698B2 (en) * 2004-06-25 2012-03-13 International Business Machines Corporation Techniques for representing relationships between queries
US7779001B2 (en) * 2004-10-29 2010-08-17 Microsoft Corporation Web page ranking with hierarchical considerations
US8762280B1 (en) * 2004-12-02 2014-06-24 Google Inc. Method and system for using a network analysis system to verify content on a website
US7509320B2 (en) * 2005-12-14 2009-03-24 Siemens Aktiengesellschaft Methods and apparatus to determine context relevant information
US8332386B2 (en) * 2006-03-29 2012-12-11 Oracle International Corporation Contextual search of a collaborative environment
US8768932B1 (en) * 2007-05-14 2014-07-01 Google Inc. Method and apparatus for ranking search results
US20090198666A1 (en) * 2008-02-01 2009-08-06 Winston Ronald H Affinity matching system and method
US8321803B2 (en) * 2008-06-19 2012-11-27 International Business Machines Corporation Aggregating service components
CN101615178B (zh) * 2008-06-26 2013-01-09 日电(中国)有限公司 用于建立对象层次结构的方法和系统
US20100211533A1 (en) * 2009-02-18 2010-08-19 Microsoft Corporation Extracting structured data from web forums
US9443209B2 (en) * 2009-04-30 2016-09-13 Paypal, Inc. Recommendations based on branding
US9286411B2 (en) * 2009-06-25 2016-03-15 International Business Machines Corporation Retrieval of relevant objects in a similarity
JP5306461B2 (ja) * 2009-06-30 2013-10-02 インターナショナル・ビジネス・マシーンズ・コーポレーション グラフの類似度計算システム、方法及びプログラム
US8266149B2 (en) * 2010-12-10 2012-09-11 Yahoo! Inc. Clustering with similarity-adjusted entropy
US9460390B1 (en) * 2011-12-21 2016-10-04 Emc Corporation Analyzing device similarity
CN103218358A (zh) * 2012-01-18 2013-07-24 百度在线网络技术(北京)有限公司 一种Diff打分方法以及系统
US9292793B1 (en) * 2012-03-31 2016-03-22 Emc Corporation Analyzing device similarity
US20140067443A1 (en) * 2012-08-28 2014-03-06 International Business Machines Corporation Business process transformation recommendation generation
CN108738036B (zh) * 2017-04-14 2021-06-18 广州杰赛科技股份有限公司 移动通信的关键用户提取方法和系统
CN107766498B (zh) * 2017-10-19 2022-01-07 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108256070B (zh) * 2018-01-17 2022-07-15 北京百度网讯科技有限公司 用于生成信息的方法和装置
US11586824B2 (en) * 2019-10-07 2023-02-21 Royal Bank Of Canada System and method for link prediction with semantic analysis
TWI742446B (zh) * 2019-10-08 2021-10-11 東方線上股份有限公司 詞句庫擴展系統及其方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6421675B1 (en) 1998-03-16 2002-07-16 S. L. I. Systems, Inc. Search engine
JP2001160067A (ja) * 1999-09-22 2001-06-12 Ddi Corp 類似文書検索方法および該類似文書検索方法を利用した推薦記事通知サービスシステム
JP3678985B2 (ja) 2000-08-25 2005-08-03 日本電信電話株式会社 ウェブページ間の類似度自動判定方法、装置及びそのプログラムを記録した媒体
US7440943B2 (en) 2000-12-22 2008-10-21 Xerox Corporation Recommender system and method
US7251648B2 (en) * 2002-06-28 2007-07-31 Microsoft Corporation Automatically ranking answers to database queries
JP2006528383A (ja) * 2003-07-23 2006-12-14 ユニバーシティ・カレッジ・ダブリン,ナショナル・ユニバーシティ・オブ・アイルランド,ダブリン 情報検索

Also Published As

Publication number Publication date
KR101130533B1 (ko) 2012-04-12
CA2507365A1 (en) 2005-11-14
KR20060047858A (ko) 2006-05-18
US20050256833A1 (en) 2005-11-17
EP1596314B1 (en) 2013-07-17
MXPA05005219A (es) 2005-12-06
JP2005327299A (ja) 2005-11-24
BRPI0503220A (pt) 2006-01-10
AU2005202016A8 (en) 2005-12-22
RU2419857C2 (ru) 2011-05-27
CN1728147A (zh) 2006-02-01
EP1596314A1 (en) 2005-11-16
CN1728147B (zh) 2010-09-08
AU2005202016A1 (en) 2005-12-22
JP5147162B2 (ja) 2013-02-20
US7376643B2 (en) 2008-05-20

Similar Documents

Publication Publication Date Title
RU2005114666A (ru) Способ и система для определения подобия объектов на основании гетерогенных связей
JP2005327299A5 (ru)
Christofides et al. The optimum location of multi-centres on a graph
CN103927346B (zh) 基于数据量的查询连接方法
Böckenholt et al. Canonical analysis of contingency tables with linear constraints
US10942923B1 (en) Deep learning for optimizer cardinality estimation
CN109829337A (zh) 一种社会网络隐私保护的方法、系统及设备
Harris et al. Internet-type queues with power-tailed interarrival times and computational methods for their analysis
CN104834754A (zh) 一种基于连接代价的sparql语义数据查询优化方法
CN109036546A (zh) 用于临床领域时序知识图谱的链接预测方法及系统
Lund et al. A sine-collocation method for the computation of the eigenvalues of the radial Schrödinger equation
CN106980677A (zh) 面向行业的主题搜索方法
US9152688B2 (en) Summarizing a stream of multidimensional, axis-aligned rectangles
US20090177623A1 (en) Query optimizer with join cardinality estimation which mitigates the effects of skew
CN109638811B (zh) 基于模型等值的配电网电压功率灵敏度鲁棒估计方法
CN104699679B (zh) 一种确定社交网络平台中用户属性的方法和系统
Soltvedt et al. A cost model for data discovery in large-scale IoT networks of smart cities
CN111107604B (zh) 无人平台信息感知网络的快速优化方法和装置
KR20190057524A (ko) 분산 환경 데이터베이스 상에서의 융합형 개미집단 알고리즘 기반 질의 최적화 방법
US20210191932A1 (en) Bi-gram cardinality estimation in a graph database
De Frutos et al. A generalized least squares estimation method for VARMA models
Dudina et al. Queueing system MAP/M/N/N+ K operating in random environment as a model of call center
CN107018027A (zh) 一种基于贝叶斯估计和共同邻居节点度的链路预测方法
CN109982295A (zh) 业务模板的推送方法及业务模板的推送器
CN110162400B (zh) 复杂网络环境下实现mas系统中智能体合作的方法和系统

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20130514